《AI算力需求分析.docx》由会员分享,可在线阅读,更多相关《AI算力需求分析.docx(26页珍藏版)》请在优知文库上搜索。
1、Al算力需求分析一、营销调研的步骤营销调研的过程,通常包括五个步骤:确定问题与调研目标、拟定调研计划、收集信息、分析信息、提交报告。(一)确定问题与调研目标为保证营销调研的成功和有效,首先要明确所要调研的问题,既不可过于宽泛,也不宜过于狭窄,要有明确的界定并充分考虑调研成果的实效性。其次,在确定问题的基础上,提出特定调研目标。(二)拟定调研计划设计能够有效地收集所需要的信息的计划,包括概述资料来源、调研方法和工具等。由于收集第一手资料花费较大,调研通常从收集第二手资料开始,必要时再采用各种调研方法收集第一手资料,也可以从企业外部的商业公司购买有关资料。调查表和仪器是收集第一手资料采用的主要工具
2、。抽样计划决定三方面的问题:抽样单位指确定调查的对象,抽样范围指确定样本的多少,抽样程序则是指如何确定受访者的过程。接触方法是指如何与调查对象接触的问题。(三)收集信息在拟定调研计划后,可由本企业调研人员承担收集信息的工作,也可委托调研公司收集。面谈访问必须争取被访问者的友好和真诚合作,才能收集到有价值的第一手资料。进行实验调查时,调研人员必须注意使实验组和控制组匹配协调,在调查对象汇集时避免其相互影响,并采用统一的方法对实验进行处理和对外来因素进行控制。(四)分析信息从已获取的有关信息中提炼出适合调研目标的调查结果。在分析过程中,首先要明确这些信息数据是依据何种尺度进行测定、加工的,然后借助
3、多变量统计技术将数据中潜在的各种关系揭示出来,还可将数据资料列成表格,制定一维和二维的频率分布,对主要变量计算其平均数和衡量离中趋势。(五)提交报告二、调研人员向营销主管提出与进行决策有关的主要调查结果。调研报告应力求简明、准确、完整、客观,为科学决策提供依据。如能使管理决策减少不确定因素,则此项营销研究就是富有成效的。多维数据整算力需求重要数据量快速增长。不同数据间的重要性相差较大,例如:医疗类数据重要于流媒体数据,不同数据运行出现问题所造成的影响亦不同,例如私用PC宕机造成文件丢失和自动驾驶数据错误造成人员伤亡。IDC预计未来关键数据量增速将高于数据量总体增长,2025年需要安全防护的企业
4、经营/医疗记录等数据占比将达87%。单个数据的价值下降,多维数据整合方可挖掘深度价值,进一步催生算力需求。当前数据指数级增长的同时,数据类型也更加多元化,在交通、工业、商业运营等领域,少量、单一化的数据的价值较低,只有将大量、多维度的数据进行综合分析才能产生应有的价值。例如交管领域对于黑车的识别,需要将车辆行驶轨迹、车辆图像识别、人像识别与对比、车牌登记数据比对等多维度数据进行分析才能准确筛选。对于庞杂的不同类型数据(尤其非结构化的)统一分析与存储的需求催生了数据湖概念,同时随着云计算技术的深入应用,带来资源集约化和应用灵活性优势的云原生概念也产生,大规模集群计算需求旺盛。全球超级数据中心占比
5、快速提升,算力进一步集中。近五年全球数据中心任务量增长135%,大数据挖掘与应用、人工智能深度学习需求旺盛,随着摩尔定律逐渐走向极限,超级数据中心成为数据中心主要增量。根据CiSCo数据,全球超级数据中心打造服务器数量占所有数据中心搭载服务器比例由2016年的27%提升至2021年的53%。三、数据经济发展要素按照IDC总结,全球计算数据的创建与使用总结为三个阶段1980年以前:数据集中在数据中心存储与处理,即使可通过远程访问,终端计算能力低下,也无法对数据进行深度计算,数据均为商用。1980-2000:摩尔定律显威,PC兴起,数据的产生、处理与存储更多流向终端,同时出现了音乐、电影和游戏的数
6、字娱乐产业。2000至今:无线宽带普及推动数据进入云端,将数据与特定的物理设备脱钩。社交与流媒体的兴起使得数据中心更多承担数据交互与集中计算任务,而在不断交互过程中数据量高速增长。数据量呈现指数级增长,企业端占比不断提升。根据中国信通院,到2035年,全球数据量将达2142ZB(ZB:Zettabyte,IZB约十万亿亿字节),是2020年所创建数据量的45-46倍。而由于进入云时代,数据在本地存储的需求逐步减少,企业在云端可为客户提供实时的数据和服务。数据逐渐成为经济发展的重要生产要素。基于云能够快速访问的数据运用方式,数据日益影响企业和日常生活,例如商业航空旅行、自动驾驶、医疗应用、控制系
7、统和遥测技术等社会生产力紧密相关的数据占比持续提升。IDC预计到2025年,娱乐相关的消费型数据占比将从2012年接近60%下降至30%左右,余下约70%将是非娱乐化的图像/视频、生产力数据、工业生产等嵌入式数据。四、数字经济经济增长动力算力已成为数字经济时代的关键生产力要素。在传统的西方经济学理论中,驱动社会经济发展的生产要素包括了劳动、资本、土地、企业家的才能等。而在一系列新兴信息数字技术的兴起与广泛应用的数字经济时代中,与计算能力的形成直接相关的算力资本投入(数据、算力、算法),如同农业时代的水利、工业时代的电力,已成为数字经济发展的核心生产力,是国民经济发展的重要基础设施。国务院印发的
8、“十四五”数字经济发展规划中也明确提及到2025年我国数字经济核心产业增加值占GDP比重将从2020年的7.8%上升到10%,数字经济将为经济社会持续健康发展提供持续动力。截至2021年底,全球数据中心算力总规模达521EFLOPS(EFL0PS:每秒进行1018次浮点运算)。中美两国算力规模分别约为161EFLOPS和140EFL0PS,占全球总算力份额约为31%和27%o计算力和GDP增长显著相关。根据IDC等机构的研究,全球平均来看,他们构建的“计算力指数”每提升1个点,国家数字经济和GDP将分别增长3.5%。和L8%。同时,“计算力指数”越高,对GDP的拉动作用越显著。五、人工智能算力
9、时代Al行业快速发展,智能算力需求提升。根据使用设备和提供算力强度的不同,算力可分为基础算力、智能算力与高端算力三大类。随着深度学习技术的快速发展,以及互联网和云计算时代海量数据和高效计算能力的支撑,计算机视觉技术、语音技术、自然语言理解技术等人工智能技术取得了突破性进展,并解锁多个行业的人工智能场景,驱动了人工智能行业相关的计算量快速增长。根据中国算力白皮书(2022年)的数据统计,2021年全球智能算力总规模达113EFL0PS,占全球总算力规模的22虬伴随人工智能技术的复杂性不断增加,人工智能计算能力的需求将呈指数级增长。Al三要素相互耦合,共同生成Al模型。一个传统的Al模型包括训练和
10、推断(预测)两大部分。训练环节指将训练数据(通常为现有的历史数据)输入进算法中,通过Al芯片(GPU、FPGA等)提供算力支撑,以及数据工程师的分析调参,最后生产满足特定功能的AI应用模型。推断环节指通过向训练完成的AI应用模型中输入实际应用场景中的新数据,并生产对应的推断结果。在这一过程中,数据、算法和算力扮演着同等重要的角色,三要素的耦合关系是探索Al未来发展道路的重要基础:数据是Al模型的“汽油”:数据是一切人工智能的基础。数据因其可具象性强,也是最容易被理解的竞争壁垒(特斯拉在自动驾驶数据的积累、科大讯飞在智慧教育的题库数据积累等)。未来数据的突破口在于1)数据积累的行业下沉(智能化渗
11、透率的提升,传感技术的升级等);2)现有数据的打通(实现将不同行业,政府与企业间的数据互联互通);因此,在特定行业具备数据积累先发优势和跨行业数据整合能力的公司有望形成保持领先。算力是Al模型的“发动机”:算力是最容易被直观量化的指标(英伟达每年推出的新GPU参数),但也是目前最大的瓶颈。算力的瓶颈并不体现在算力的绝对大小,而在于实现该算力的成本。特别是在算法场景众多、迭代速度较快的Al领域,如何设计出同时满足通用性和高算力的Al芯片仍是当下炙手可热的话题。因此,具备由单一芯片模式往融合异构多芯片模式发展能力的公司有望率先受益。算法是Al模型的“大脑”:算法是Al实现技术跃迁的根本,也是最难以
12、被直观理解的部分。从AlexNet重新复兴神经网络到TranSfOnner开启大模型时代,人工智能的每一次里程碑事件都伴随着算法层面的突破与创新。往后展望,一个好的算法除了能更好的完成设定的任务外,还需具备1)更强的通用性(激活更多的可用数据);2)更优化的计算原理(减少算力的负担)。因此,在Al领域具备科研资源和资金实力的公司将有望拔得头筹。六、Al算力需求GPU是当前主流数据中心端Al计算架构。按技术架构分类,Al芯片可分为图形处理器(GPU),现场可编程门阵列(FPGA).专用集成电路(ASIC).类脑芯片。GPU起初强调图形处理,随着强大的并行计算能力被发掘,逐步进入通用计算领域;FP
13、GA以半定制化为特征,注重于服务垂直领域;ASIC则是针对客户应用场景需求进行定制;类脑芯片尚处于起步阶段。从市场规模来看,2021年服务器GPU全球市场规模达到71.5亿美元,2019-2021年复合增速66%,占服务器整体市场规模比例快速提升;同期FPGA全球市场规模为7.9亿美元,相比2020年基本持平;而ASIC主要用于终端推理。中期看GPU仍将是数据中心端AI训练等加速计算的主流芯片,充分受益于智能算力高景气。七、数字经济时代新基建大数据时代,算力与数据增长齐头并进。根据中国算力白皮书(2022年)的数据,2021年我国算力总规模达到140EfloPS(每秒一万四千亿亿次浮点运算,包
14、含通用算力、智能算力、超算算力,边缘算力暂未纳入统计范围),全球占比约为27%,近五年年均增速超30%o展望未来,工信部印发的“十四五”信息通信行业发展规划指出2025年我国数据中心算力总规模将增长到300EFL0PS,CAGR达22%;另一方面,伴随5G、人工智能、物联网等技术的应用普及,数据流量增长速率也在不断加快。根据IDe的预测,全球数据总量在2020年将达50ZB,而这一数据到2025年有望达到175ZB,CAGR达28%。与此同时,根据中央网信办的数据统计,2019年度中国移动互联网数据接入量为1,655.50亿GB,预计2024年将达到5,680.90GB,CAGR也高达28%。
15、因此,在当前数字经济大时代下,适度超前建设以数据中心为首的新型基建具有明确的战略意义。八、传统计算架构革新Al算量需求急剧增加,传统架构难以满足。根据摩尔定律,集成电路上可以容纳的晶体管数目大约每18个月增加一倍,而Al训练算量自2012年开始以平均每3.43个月翻倍的速度实现指数增长。在芯片制程达到个位数纳米级的当下,传统芯片算力提升速度难以赶上计算量增速。下游应用的高景气度和不断衍生的智能化需求,推动芯片革新。中国云计算市场规模增长迅速,2021年达到3229亿元,近5年CAGR达44.6%。云计算作为人工智能云端训练芯片的主要应用场景,推动了芯片架构迭代。九、市场需求测量(一)不同层次的
16、市场市场作为营销领域的范畴,是指某一产品的实际购买者和潜在购买者的总和,是对该产品有兴趣的顾客群体,也称潜在市场。潜在市场的规模,取决于现实顾客与潜在顾客人数的多少。购买者身份的确认,一般依据三个特性,即兴趣、收入和购买途径。兴趣指购买需求和欲望,是采取购买行为的基础。收入决定支付能力,是采取购买行为的条件。市场规模是兴趣与收入两者的函数。购买途径决定购买者能否买到所需产品。有效市场是指对某种产品感兴趣、有支付能力并能获得该产品的顾客群体。同样的产品,往往因购买者必须具备某一特定条件才能获取,如规定到一定年龄者才能购买汽车。有效市场中具备这种条件的顾客群体,构成该产品的合格的有效市场。企业可将营销努力集中于合格有效市场的某一细分部分,这便成为企业的目标市场。企业及竞争者的营销努力,必能售出一定数量的某种产品,购买该产品的顾客群体,便形成渗透市场。(二)市场需求某一产品的市场总需求,是指在一定的营销努力水