《一种高性能嵌入式云计算平台架构.docx》由会员分享,可在线阅读,更多相关《一种高性能嵌入式云计算平台架构.docx(6页珍藏版)》请在优知文库上搜索。
1、O引a近年来,云计算、大数据、人工智能等技术高速发展,为社会带来了巨大的经济价值,并且深刻地改变改变若当今社会.然而,这些技术构建的底层硬件和操作系统是x86等通用处理器或非实时操作系统,很难直接应用在对体积、功耗、高低温等极端环境下.军用武器电子装备,尤其是航空电子装备和航天载荷等,对环境适应性和处理实时性有非常高的要求,因此不得不大量基于现场可编程逻辑门阵列(Fie1.dProgrammab1.eGateArrayfFPGA)/信号处理(Digita1.Signa1.Process,DSP)等嵌入式处理器构建系统,而目前广泛采用的模块综合化集成方法,虽然能够获得较独立式装备更高的集成度和资
2、源利用率,但集成难度大、复杂度高、周期长.为使武器电子装备适应下一代信息化战争的对抗需求,需要庞大的计算能力作为支撑,采用模块综合化的方式已经很难对超大规模计箕系统进行集成,迫切需要提出一种新的系统架构.本文提出的高性能嵌入式云计算的处理平台架构就是诞生在这个技术背景下.嵌入式资源虚拟化采用二层资源调度的方式,将高速实时数据分析应用运行在容器虚拟机集群中,第1层资源调度为通过容器虚拟机集群管理底层的嵌入式硬件资源,将计算资源和内存资源封装为容器虚拟机,在容器虚拟机中运行NodeManager及ResourceManager,同时,容器虚拟机占用的计算、内存等资源可弹性分配与设置;第2层资源调度
3、是通过资源管理调度高速实时数据分析分布式应用.在容器虚拟机集群中,可以运行多个资源调度集群,形成弹性可犷展的分布式计算集群,从而在容器虚拟机集群中部署专用加速应用,如图1所示.91功能应用在容器虚拟机集群中部窗检架专用加速分布式应用需要通过云加速平面中的FPGA/DSP,实现实时专用加速算法.在通过容器虚拟机集群部署专用加速应用时,通用数据处理镜像直接运行在容器虚拟机上.各类专用算法镜像,在镜像运行到容器虚拟机上后,再将特定的加速算法,Off1.oad到FPGA/DSP加速资源上。加速算法之间通过实时高带宽低时延网络交互数据.2分布式计算框架设计在总体方案设计过程中,首先对硬件组成进行逻辑上的
4、分析,得出图2如所示的硬件组成逻辑图。根据图计算的理论和方法,在总体方案设计上,将并行计算平台分为若干软件配置项,主要分为调度类的配置项与计算类的配置项,各配置项分别完成并行计算中与之相关的任务。882嵌入式并行计算硬件遗娥2.1 框架总体结构并行计算框架主要包括通用调度域和实时计算域两个维度.通用调度域包含系统控制器(MaSter)、任务驱动器(DriVer)、节点控制器(Agent)、执行器组管理器(WorkerMgr)几个功能模块;实时计算域中包含多个执行器,承担实质的实时讨算任务,如图3所示.图3并行计I1.框架结构内部遗辍关系2.2 多核DSPMapReduce计算模型DSP的执行器
5、框架包含:Tisystembios操作系统、FpidIO通信中间件、实时数据集管理等基本组成部分;并在此基础上,框架封装了基本的roundRobin、mergeto等基本贷子。用户自定义MaP函数、Reduce函数等功能,与框架进行集成,形成一个可运行在dsp处理核上的算法,进入分布式框架的算法库进行管理5算法产生过程如图4所示.04DSP执行81柩架形成算法2.3 实时计算图远程并行加载技术实时计算图的运行过程就是计算图中多操作到硬件资源的部署过程,如图5所示。大规模计算图或者多计算图并行运行时,这些图的运行靠要将计算图中的多操作并行部罟到计算域中通用的计算资源中去.三5计WaB中多援作到硬
6、件资源的校射针对上述需求,计算图远程并行加载关键技术是一种基于远程过程调用(RemoteProcedureCa1.1.,RPC)网络远程调用框架,通过节点控制器和执行器组管理器分层部署策略,将计算图中的多个操作部署到硬件资源域中的大规模数量的计算核上的应用技术.该技术能够实现多DSP核,甚至单核上多线程,以及多FPGA分区等多种计算粒度的程序部署。2.4 执行器Worker高性能通信技术执行器(Worker)可能部署于不同计算节点的计算核上,也可能部署于同一个计算节点的不同计算核上.为实现每个计算图中各个执行器(Worker)通信与位置无关,并满足执行器(Worker)间通信的高效性和实时性,
7、执行器(Worker)之间采用统一的虚端口进行信息交互,突破了基于本地共享内存与SRIO总线共享内存模型进行统一的内存映射通信技术,如图6所示.3心5X九E96横间通侑Worker通信本文针对当前军事电子装备中嵌入式计算资源与装备功能深度绑定,无法实现计算资源云化共享的问题,提出了轻量级计算资源云化方法,实现了高动态复杂任务的快速份解和跨平台灵活部署。针对商用并行计管系统难以满足实时性需求的问题,提出了分布式系统分域处理的理论和方法,将分布式系统分为通用调度域和实时计算域两个维度,计算资源和分布式任务的管理和维护部罟到通用调度域,并行计算任务算法部署到实时计算域中,实现了调度平面与加速平面的协同运行,实时平面响应时间达到US级.针对MaPReduce、SPark等大数据处理框架由于功能复杂、资源需求高,导致难以适应嵌入式计算资源的问题,提出了轻量级图计算实现方法,使平台具备支持大规模信号级并行计算的能力,支持计算节点数大于256,计算核大于1024,并发任务数不低于128个.