《为什么说CXL能重构数据中心.docx》由会员分享,可在线阅读,更多相关《为什么说CXL能重构数据中心.docx(13页珍藏版)》请在优知文库上搜索。
1、在过去几十年中,CPU一亘是计算系统中的绝对核心,甚至连存储、网络等子系统的能力都是CPU说了算.比如,一个CPU能移支持多大的内存,CPU都是有严格要求的。甚至同样一颗CPU,只是支持不同的内容,都能卖两个价格.而且更要命的是,随着大内存等应用场景需求大IS,想要扩展内存容,你只能通过买CPU的方式才能扩展内存容量,想要在内存上做点手脚”那是被限制的死死的.但人算不如天算,在Inte1.按部就班的挤牙育的时候,没想到大数据A1.视觉渲染、基因分析以及EDR仿真等需求的突然爆发,给了NVIDIA的GPU带了巨大增长空间.眼看着GPU越卖越多,NVIDIA的市值甚至远远超过了Inte1.,于是英
2、特尔“挥刀自宫”,让充满黑科技意味的傲腾业务和3DXpoint走向终错,取而代之的是开始向CX1.架构发展.I推出CX1.,Inte1.是为了什么?上文中提到,在当前的系统架构中,内存子系统面临诸多挑战。如下面左图所示,CPU技术的发展使得核心数量实现了比较快的增长,内存通道数增速却相对较慢。但从发展趋势来看,每个CPU核心所拥有的内存通道反而是在下降.sMenKxyISan1.naetiWg%ofsystemPowerandcostIncrfovngcorcountsdrivwmemorydemandIncrwrngbarMdtbandcapacityMemoryisrxxabietocha
3、nne1.s(cost.POWefTheSystemMemoryCha1.1.enge Memorypnce(CosVbit)isIUtduetoKJfen9cha1.1.enges Memorypowersc)gwithspeed这会带来很多问题,很多CPU核心因为不能充分得到数据来处于满负荷的运行状态,会导致整体计算效率下降。是可忍孰不可忍,这么明显的问题为何Inte1.在增加核心的时候也增加内存通道呢?其实并不是英特尔不想,而是爱扯到了多方面原因。首先在CPU设计方面,内存控制器是在CPU里的,如果熠加内存通道.则意味若会增加CPU的功耗,芯片面积也会变大,PCB走线距离增加,为了保证信
4、号的完整性,对于PCB本身也提出更高要求,所以,如果增加内存通道,CPU的成本和功耗都会增长。另外,从服务器整机的层面来看.在主板上增加内存DIMM槽,插上更多的内存后,整机的成本也会不可避免地增长,即使内存成本降低,也不会无限度的降低下去,最终会导致整体成本的上升.所以,不能随意的无限度地通过增加内存通道来解决问题。既然增加内存通道这条路走不通,那有没有其他方式可以解决内存互联网问题呢?这个答案当然是肯定的,为了解决内存子系统的问题,几种不同的传输和内存语义协议逐渐出现-UBM的OPenCAP1.内存接口协议、Xi1.inx的CCIX协议、NVIDIA的NV1.ink协议、思普企业版的Gen
5、-Z协议,都是为了解决内存池化方面的问题.虽然这几种协议方式与后来的CX1.协议其实类似.但这些明显挖英特尔“墙角”的方式并没有得到Inte1.的积极响应。店大何止欺客,店大甚至可以决定产品的走向.但眼看着GPU卖的越来越多,Inte1.有点坐不住了,于是在2019年3月份Inte1.推出了CX1.(ComputeExpress1.ink)协议接口,其与CAPI酷似,也是将CX1.协议封装到PCIE链路层数据包中传送,并在CPU端的PCIE总控后端按照事务标识分流CX1.专属事务给CX1.处理逻娼处理.为何Inte1.突然会突然妥协,让出这部分利益,推出CX1.协议昵?借用DOn1朱朋博老师的
6、一句话:撷置争议,共同开发.商人总是寻求利益最大化,既然大内存需求趋势已经来袭,堵不如疏,不如把GPU、DPU等用作一把刀,来与NVIDIA形成某种制衡,当然,如今的NVIDIA也加入了CX1.联盟,但是所谓“此路是我开.要在此路过,留下买路财反正我建了通往内存的高速路,你GPU怎么走都得听我的.通过这种方式,也能进一步制衡GPU的发展,一如文宣开头Inte1.对内存的制约,想支持几个GPU,还得通过我的CPU说了算.值得注意的是,第四代英特尔至强可扩展处理器每一颗处理器支持最多4个CX1.设笛,支持CX1.Type1.和CX1.Type2.)ICX1.协议具体能干啥?从2019年发布CX1.
7、1.0/1.1,到2020年11月发布CX1.2.0,如今Inte1.已经发布了CX1.3.0,它的功能一直在发生着变化.首先我们来看下CX1.是什么?CX1.要如何解决问题呢?如今,CX1.有CX1.io,CX1.memory和CX1.cache三个协议:CX1.ApproachCX1.1.inkCX1.CacheZCX1.MemorytargetsnearCPUcachecoherent1.atency(ceAcce1.erationwithMemoryPvouoOC1.oOO.CMfWAccderatorNICCacheUmoPnrtocdt GM1.O1.to FPGACI1.udw
8、Dem*C1.1.nwmory ConvutMnAccdefaUxCacheCX1.Unit全回CPUCX1.Unk回CPUType3DeveMemoryfkfenTyPeIDeViCe主要的应用场景是高性能计算里的网卡(PGASNIC),它支持一些网卡的原子操作,主要利用的t办议就是CX1.i。和CX1.CaChe。Type2Device主要指的是带有内存的加速器,包括GPU、FPGA等加速器,它使用的协议包括用来做链接的CX1.io,做cache一致性的CX1.cache,用来做内存扩展的CX1.memory.Type3Device主要用作内存的BUffer,做内存的扩展.它主要利用CX1
9、.io和CX1.memory的协议.如图所示,CPU除了可以用本地的DDR内存,还可以通过CX1.去扩展远端内存,远端内存可以是一个大的内存池,这里的内存可以共享给不同的CPU来用.CX1.2.0规章实现了机架级别的资源池化.CX1.2.0:ResourcePoo1.ingatRack1.eve1.,PersistentMemorySupportandEnhancedSecurityCX1.SwitchIm1.mHfjtii-11GnzIZD.ResourcePoOIing/disaggregation Managedhotp1.ugf1.owstomoveresources 1.ype1yp
10、e2deviceassignedtoonehost 1.ype3devke(memory)poobngatrack1.eve1. Direct1.oad-store,1.ow1.atencyaccess-simi1.artomemoryattachedinaneighboringCPUsocket(vs.RDMAoverretwork)Persistencef1.owsforpersistentmemory,FabricManager/APIformanagingresources Security:authentication,encryption Beyondnodetorack-1.ev
11、e1.connectivity!DisaggregatedsystemwithCX1.optimizesresourceuti1.izationde1.ivering1.owerTCOandpowerefficiency云计算强调资源可以像水和电一样按需获取,云计算的技术潮流下,追求不同资源之间的松耦合,为的是提高使用效率,为了提高使用效率,要实现的是相同资源的池化。随着技术的发展,未来的服务器不再是传统意义上的服务器,它不再具有现实的形态,用户从云服务商那里申请云主机的时候,主机的CPU是从CPU池里拿出来的,内存是从内存池里拿出来的,CPU池和内存池通过CX1.连起来的.使用从资源池里拿出
12、来资源组成逻辑上的服务器,这就是资源解精和资源池化在未来能带来的变化.CX1.2.0规范在资源池化方面有所强化,同时,也还增加了CX1.switch功能,它可以在一个机架内通过一套CX1.交换机构建成一个网络.2022年,新发布的CX1.3.0规范又新熠很多特性.CX1.3.0Enhancements Bandwidthdoub1.ingwith64GT/satO-Iatencyadd Protoco1.enhancementswithdirectpeer-to-peertoHDMmemory Composab1.esystemswithSPine/1.eafarchitectureatrac
13、k/podCX1.3.0FabricArchitecture Interconnectedspineswitchsystem 1.eafswitchNICenc1.osure 1.eafswitchCPUenc1.osure 1.eafswitchacce1.eratorenc1.osure 1.eafswitchmemoryenc1.osure首先,CX1.3.0PCIe6.0规范,它的速率从32GT提升到了64GT,在相同的链路时,带宽翻倍。并且,1.atenCy也没有任何变化。第二,CX1.3.0新增了对二层交换机的支持,也就是1.eafspine网络架构,如此便可以更好地对资源进行解森
14、和池化,做更多的资源池,比如CPU资源池、内存资源池、网卡资源池和加速器资源池等,1.eaf与SPine之间通过Fabricmanager软件构建各种拓扑和各种路由方式.OvefTmeCx1.beaXreZcrtmmemoryportTodayMemOfyCtpMJ*rtp3r)nvrtCX1.CapacityandBandwidthExpansionwithCX1.-AttachedMemory Commonp1.atformacrosssegments Decoup1.ingcomputefromtraditiona1.D1.MMmemorybvxhMdth/CdPKity NUMAdomainswe1.1.estab1.ished Sca1.ab1.ebandwidth(WidtMreqU