《计算机行业专题分析报告:AI崛起算力先行.docx》由会员分享,可在线阅读,更多相关《计算机行业专题分析报告:AI崛起算力先行.docx(15页珍藏版)》请在优知文库上搜索。
1、计算机行业专题分析报告AI崛起,算力先行1政策+技术双重驱动,智能算力需求高增1.1政策支持算力基础设施高质量发展算力分为通用算力、智能算力和超算三种。其中智能算力即人工智能算力,是面向人工智能算法模型训练与运行服务的计算机系统能力。通常由GPU、ASIC、FPGA.NPU等各类专用芯片承担计算工作,在人工智能场景应用时具有性能更优、能耗更低等优点。我国算力发展规划政策相继出台,制度保障有力有效。近年来,工信部加强规划引领、政策指引,与各方协同配合、多措并举,着力构建高质量算力供给体系,不断提升算力基础设施综合能力,取得积极成效。2021年,工信部出台新型数据中心发展三年行动计划(2021-2
2、023年),持续优化全国算力整体布局。国务院发布关于印发“十四五”数字经济发展规划的通知、数字中国建设整体布局规划也提出要加快构建算力、算法、数据、应用资源协同的全国一体化大数据中心体系、系统优化算力基础设施布局C2023年10月,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合印发算力基础设施高质量发展行动计划,明确2025年,算力规模超过300EFLOPS,智能算力占比达到35%,东西部算力平衡协调发展。在此基础上,各地市人民政府相继出台多项政策举措,大力支持算力产业发展,全国上下已形成积极推动算力产业快速健康发展的良好局面。以成都为例,2022年
3、5月10日,“东数西算”国家一体化大数据中心成渝枢纽节点样板工程、西南地区最大的人工智能计算中心成都智算中心正式上线。成都智算中心包括人工智能算力平台、城市智脑平台和科研创新平台三大平台,项目总投资109亿元。2023年1月,成都市发布围绕超算智算加快算力产业发展的政策措施,通过推动以存储为主的老旧小散数据中心向存算一体高能级数据中心改造、建立以“算力券”为核心的算力中心运营成本统筹结算分担机制等措施,推进建设全国一体化算力网络国家枢纽节点。1.2ChatGPT掀起Al大模型热潮,拉升算力需求ChatGPT引起Al大模型热潮,Al算力需求高增。2022年11月30日,OpenAI发布了Chat
4、GPT聊天机器人程序,2023年3月,发布新一代语言模型GPT-4,自此Al进入“大模型时代”。与此同时,国内大模型也陆续正式上线。8月31日,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8家企业/机构的大模型,位列首批通过生成式人工智能服务管理暂行办法备案的名单,正式上线开始面向公众提供服务。据百度官方平台数据显示,文心一言开放首日下载量破百万,回答了3342万个问题。Al大模型在垂直领域应用空间广阔。与此同时,Al大模型的衍生应用也层出不穷,医疗健康、游戏开发、教育、法律、金融等各个领域均有相应的垂直领域生成式人工智能应用。例如在办公软件方面,微软将人工智能大语言模型技术引入
5、Office应用程序,推出Al助手Microsoft365Copilot,帮助用户提高办公生产力;医疗方面,香港中文大学(深圳)和深圳市大数据研究院团队训练并开源了名为HUatUoGPT(华佗GPT)的新型医疗大模型,主要应用于医疗咨询和情感陪伴,包括患者培训、健康咨询、就医分诊等。我国算力规模持续壮大,智能算力保持高速增长。从基础设施侧看,数据中心、智能计算中心、超算中心加快部署。随着全国一体化算力网络国家枢纽节点的部署和“东数西算”工程的推进,我国算力基础设施建设和应用保持快速发展,根据工信部数据,截至2022年底,我国基础设施算力规模达到180EFloPS,位居全球第二。根据2022-2
6、023全球计算力指数评估报告显示,IT支出每投入1美元,可以拉动15美元的数字经济产出,同时也可拉动29美元的GDP产出。换言之,国家的计算力指数每提高1点,数字经济将增长3.6%o,GDP将增长1.7%o根据2023智能算力发展白皮书显示,全球智能算力的总体情况呈现快速增长趋势。截至2022年底,全球算力总规模达到650EFLOPS,其中,通用算力规模为498EFLOPS,智能算力规模为142EFLOPS,超算算力规模为IOEFLOPS。智能算力规模同比增加了25.7%,占比达21.9%JDC预测,全球Al计算市场规模从2022年的195.0亿美元增长到2026年的346.6亿美元,年复合增
7、长率将达到15.5%o图4近两年全球算力总体情况(EFLOPS)作为数字经济时代的重要生产力,2022年我国算力核心产业规模已达到1.8万亿元。算力规模方面,截至2022年底,中国算力总规模为180EFLOPS,排名位居全球第二。其中,通用算力规模为137EFLOPS,智能算力规模为41EFLOPS,超算算力规模为2EFLOPSo中国智能算力正处于高速增长阶段,智能算力规模同比增加了41.4%,占比达22.8%,超过全球整体智能算力25.7%的增速。目前,互联网行业依然是人工智能应用渗透度和投资最高的行业,金融、政府、电信、制造等领域也在加速渗透。未来,智能算力的发展具有六大趋势:一是人工智能
8、加速渗透,多样化场景催生多元化算力需求;二是政策驱动,智能算力低碳发展成硬性要求;三是边缘智能应运而生,边缘计算与人工智能融合发展;四是智算中心建设加速,以应对高质量算力需求;五是模型规模不断扩展,海量多元化数据急需巨量化算力;六是自主学习能力提升,推动算力实现更高层次的智能。2AI服务器需求旺盛,算力租赁市场潜力大2.1 中国Al服务器水平位于世界前列中国算力网络产业链上游为软硬件及设备;中游为算力网络及平台,包括Al计算、边缘计算、IDC服务、网络设备、网络平台、算力安全等;下游应用于互联网、政府、服务业、电信业、金融业、制造业、教育等领域。上游服务器厂商:典型服务器厂商包括海外厂商戴尔、
9、惠普等服务器厂商,国产服务器厂商浪潮信息、新华三、超聚变等,其中海外服务器厂商在全球市场份额领先。国内服务器市场方面,根据IDC发布的2022年中国服务器市场跟踪报告,2022年中国服务器市场份额排名前三位的分别是浪潮信息(28.1%)、新华三(17.2%)和超聚变(10.1%)o与整体服务器市场相比,中国Al服务器水平位于世界前列。主要玩家有浪潮、联想、新华三、华为等厂商,海外厂商为戴尔、HPE.IBM等。2022年,浪潮Al服务器全球市场份额连续3年位居第一。2022年中国Al服务器市场中(按销售额),浪潮市场份额占比约为47%,排名第一。其次分别为,新华三、宁畅、安擎、坤前、华为,占比分
10、别为11%、9%、7%、6%、6%o以海光和昇腾为代表的国产Al服务器快速发展。国产服务器以海光和昇腾为代表,华为与包括宝德、华鳏振宇、神州数码等众多主流厂商合作,内容涵盖昇腾Al训练服务器、推理服务器。中科曙光服务器搭载海光DCU,神州数码、拓维信息、四川长虹基于华为“蛆鹏+昇腾”生产Al服务器。随着国产化替代以及技术迭代,未来国内市场华为系Al服务器占比有望提升。中游IDC服务商:产业链中游的IDC服务提供商包括基础电信运营商以及第三方IDC服务商,传统IDC业务包括机柜租赁、带宽服务及增值服务,在Al算力需求高增背景下,算力租赁模式兴起,传统IDC服务商或者增加算力租赁业务,部分企业则通
11、过新建智算中心提供算力租赁服务,其中包括云赛智联、鸿博股份、恒润股份、中贝通信等多家企业。2.2 大算力高成本,算力租赁前景广阔Al大模型预训练数据量呈现指数级增长。GPT模型最早的版本可追述到2018年,OpenAI发布的GPT-1模型参数量为1.17亿,19年2月发布的GPT-2参数量为15亿,而20年5月的GPT-3,参数量达到了1750亿,对应的预训练数据量也呈现指数级增长,从5G增长至45TB,GPT-3所需要的算力达到3640PFIOPs-dayChatGPT的算力需求场景可以根据实际应用进一步拆分为预训练、Fine-tune和日常运营三个阶段。预训练阶段通过大量无标注的文本数据来
12、训练模型的基础语言能力,得到基础大模型,例如GPT1、GPT-2和GPT-3oFine-tune阶段在基础大模型的基础上,进行监督学习、强化学习和迁移学习等二次或多次训练,以优化调整模型参数量。日常运营阶段基于用户输入信息,加载模型参数进行推理计算,并实现最终结果的反馈输出。据OpenAI,训练一次13亿参数的GPT-3XL模型需要的全部算力约为27.5PFIops-day,训练一次1746亿参数的GPT-3模型需要的算力约为3640PFloPs-day据Lambda,使用训练一次1746亿参数的GPT-3模型所需花费的算力成本超过460万美元,假设单位成本固定,单位算力成本约为1264美元/
13、(PFlop/s-day)o国内大模型单次预训练成本近亿元。中国人工智能大模型地图研究报告显示,目前,中国10亿参数规模以上的大模型已经发布了79个,在全球占比很高。假设国内参数2000亿规模的大模型有30个,预训练算力成本约为125000PFloPs-day,训练时间以10天为例,则需要搭载8片A100/H800的服务器(单机可提供5PFIops16PFIops的Al计算性能)不少于2500台/780台,预计服务器成本约20-25亿元。而随着模型普及度不断增加,日常运营的算力需求也将显著增加。表4国内大模型训练算力需求测算芯片类型算力需求(PFIop/s-day)单个服务器算力运算时间所需服
14、务器数量(台)AlOO1250005P10日2500AlOO1250005P20日1250H80012500016P10日780H80012500016P20日:.C;i-二.一k、.匚390OpenAKScaIingLawsforNeuralLanguageMOdeIs指出,每个token的训练成本通常约为6N,其中N是大模型的参数数量,而每个token的推理成本通常约为2No我们假设国内2000亿参数大模型日活用户达到5000万的数量有10家,每人平均1000字,单日合计5000亿字(约100oO亿tokens),则单日算力需求约为4.0E+23flops,假设高峰需求可达到5倍2.0E+
15、24flops(23148PFIop/s-day),需要A100/H800服务器4630台/1447台,对应服务器成本约30-40亿元。Al应用的高成本高能耗,使得中小企业产生大量算力租赁需求。Al大模型的训练和运营带来的算力需求有望推动Al服务器出货量快速上升。从上游芯片供应情况来看,英伟达2023Q2业绩显著超预期,营收同比+101%,环88%,其中数据中心业务营收同比+171%,环比+141%,验证了开发生成式Al和大语言模型领域算力需求爆发。与此同时,Al服务器的高成本高电耗特点,使得算力租赁需求应运而生。大型互联网企业、Al龙头企业具备较多的GPU算力芯片储备,多数通过自建满足算力需
16、求,而中小企业在开发Al垂直类小模型过程中则产生算力租赁需求。同时,像高校科研院所、政府的智慧城市项目也有算力租赁需求。2023年5月,上海市发布上海市加大力度支持民间投资发展若干政策措施,明确提出“鼓励民间资本投资新型基础设施”,表示将推动“补需方”改革,支持高校、科研机构、国有企业通过政府采购、租用等方式使用民间投资的数据储存和算力资源;推动政府部门租用民间投资专用算力支持大语义学习、元宇宙、时空底图等专业场景应用。截至目前,已有具备算力实力的厂商正在加紧进行智算中心的布局,或通过与算力公司合作运营的形式进入算力赛道,部署算力租赁业务。3重点公司分析浪潮信息:Al服务器市占率全球第一浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,Al服务器领先优势明显