《2023人工智能行业大模型创新应用白皮书.docx》由会员分享,可在线阅读,更多相关《2023人工智能行业大模型创新应用白皮书.docx(64页珍藏版)》请在优知文库上搜索。
1、北京市人工智能行业大模型创新应川白皮0(2023年)二o二三年十一月目录一.全妹夫程男於腐整体态必二.国内外大模型行业应用概述(一)DC仆大撵唤行量应用符况I二)我IS/#t型行先应用31Il三.北直市大程壑行亚应用情况1)(一)北京市大模里产业发履情况.iil,I三)大林中行业应用典型寰例2.金融犊城2J,卷象Jf衿阳瑟.,-.国1-*碌*i:里也智里城市。t53(四)北京市大捏型行业应用击炼的报脱59浩四、下一步iSt61id”:TirH打1打工综述作为新一抡科技革命和产业变革的核心引案,人工智能正在为经济社会发展持续注入新动能,今年以来,大横型技术引领着人工智能领域迈入新发展高度,在世界
2、范围内受到广泛关注.大模型对于人工智能厂商和企业用户而言,是一个重要发展机遇.人工智能厂商方面,谷歌、微软、Meta,亚马逊等全球科技巨头将大模型视为重要发展机遇,积极投入并且大动作魏发。我国众多厂商也投身大模型领域,包括百度、阿里、腾讯等互联网大厂,科大讯飞、商汤科技、旷视科技等垂直于Al领域的厂商,以及智诺华章、百川智能,MiniMax等大模型初创企业.市场上也不乏高校、研究机构的身影,清华大学,中国科学院自动化所、北京智源人工智能研究院等发布了各自的大模型成果.企业用户方面,大模型在企业便1的应用速度之快超乎想象.2023年初,企业管理层对大模型的话JS还停曾在大模型是什么,是不是概念炒
3、作.短短半年,大模型已经从饭后谈济走向薄地应用。大企业管理层关于大模型的对话变得比之前复杂很多,他们希望了解到大模型能为企业发展带来哪些变革,大模型的应用路径是什么,如何提升大模型的投济回报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸引的人群位愈发广泛,不仅吸引&爪CTn等技术管理者的关注,(F0、20等非技术类看理者同样期待大模型在业务中发挥价值。这些转变表明,大模型的变革之力正日益得到产业界的认可.从传统行业到高科技行业,从行业黑马到行业龙头,诸多企业开始论证或试点应用大模型,期望在客户运营、软件开发、菅铺推动等领域有所提升,进而靖强市场竟争力。一、全球大模型发展整体态势(一)大模型
4、推动智能寸I3T,打开Al技术发展上网人工智能大模型,是指通过在海量数据上依托强大算力济源济行训练后能完成大星不同下游任务的模型.在技术层面上,大横型的.采用调训练+指今*调+人类反债的强化学习的训练范式。首先通过贪训练技术将深度学习网络在海量数据上进行自监督训练,然后利用指令数据进行有监督指令微调,提升模型对人类指令的迫随能力,最后,基于由人类价值标注数据训练得到的奖励模型所提供的奖励信息进行强化学习,控制大模型的输入符合人类价值判断。在大模型使用时,通过设计提示进行即时学习可以进一步提升大模型完成各类任务的能力.规膜化是使大模型强大的重要原因,研究表明当模型规模足婚大的时候,会涌现智能能力
5、,具备处理新的、更高层次的特征和模式的能力,能舒为一系列下游任务带来更好的任务效果.大模型不断扩大的规模由“量变引发质变,模型通用认知能力不断提升.大模型能力的迅速发展不仅有助于人类完成规定动作,还可能帮助人类去研究和发现未知领域,突破人类过去没有突破过的极限.大模型的技术变革呈现数据巨量化、模型通用化、虚用娥城中心化的特点.整个发晨历程可划分为三个阶段.2013-2018年的深度学习阶段,主要还是基于传统的针对特定任务的专用模型+大量标注数据方式,在监督学习的机制下训练得到一个个专用小模型,但是在词向后的自监督学习中,使用大规模数据进行预训练的方法已初见瑞倪,2017i、AfitrMf的提出
6、为基础架构带来了规横化构势和盘膜化运算的潜力.Tmn也)g鬻决丁RNN和LSTM中许可化训练和长距离依依问JK,解决了CNN的局部归纳偏差问JR,能婚容纳更多的麻数规模,并且具备更强的语义特征提取能力、长更棘征城获能力、综合特征提取能力2018年-2022年的预训练阶段,基于“海量无标注数据。在自监督学习机制下获得预训练大模型,诵过少量标注数据微调后得到领域专用模型.自监督学习机制的成功使得可利用的数据愈发巨置化L从标注数据拓展到无标注数据.Bert胃力汽UI的强训练数h量升大3到S信,成为自然语言理解任务中的条准模型。自此,预训练+微调的学习范式成为主流。在通用大模型上通过少量标注数据微调,
7、即可适用于一系列下磐在存,2022年下半年以来的大语言模型阶段,丘训练大模型的诵用能力愈发强大,引入指今二督训练使得模型能更好地追随人类指令完成各种任务,并提升了在下游任务上的泛化能力,通过人类反馈学习让机器与人类价值对齐成为可肌(二)大模型变革内容生产和技术服务模式,无限生产推动生产效率颠腹式提升内容生产方面,生成式大模型率先在内容创作,图像生成、数字人、游戏等娱乐媒体领域广泛应用,内容生产效率和质量显著提升,内容生产模式从辅助人到“暮代人演变.Gartner雉WI至2023vl20%It容彼七成式七模型所创建:至2025年底,生成丈大模型产生的数据挣占所育敌据的10%技术服务方而,大模型的
8、无限生产能力*塑企业生产引*L*着大模型能力的不新提升,AIAgent成为重要发展趋势,未来,大横型将不仅仅是一种生产工具,更多是作为企业合作者,持续为企业注入生产动能。(一)大模型作为新的根基础设此,庭露Al麓成变*;大模型实现模型生产从作妨式”到流水线的升级.大模型出现以前.。模型是“定制化、场景化的开发方式,针对特定应用场景需求训练一个个小模型,模型难以复用和积累,导致AT落地的高门程、高成本与低效率.大模型实现基础模型底座的标准化开发和泛在化应用,解决成本困境。通用大模型通过从海脑的、多场景、多领域的数据中学习共性知识,成为具有通用性和泛化能力的模型底座.基于通用大模型底座可搭建各行业
9、的垂类大模型,可以有效缩减垂类大模型训练所需要的算力和数据量,缩短模型的开发周期,提升垂直领域的应用开发效率.OpenAI以GPT4J-模型为底座,通过快速增量训练和个性化微调的方式,允许用户通过葡易对话界而自定义定制GPT,支持开发者果用私有数据对GPT进行个性化微司,他大模SI更易于访问和开发,产品形态更加丰富,以满足更广泛的市场需求。(四)中黑是大模型技术领域的主要区啜制%哀棒型市场竟争持续深入2023年5月发布的中国人工曹健大模型Jt图研究报告指出,美国和中国发布的通用大模型总数已占全球发布量的80%,美国方而,形成了ODenAl+微软kMetal谷歌等多个“阵营”,OpenAI市占.
10、图经GPT4底座横型完善上层开龙者生态,Meta而过开源LLaMa等大横型,引镇了全球大模型开源浪潮.及国方而,大模型再次诠择中国速度.发至2023年10月,我国10亿拿款规模以上的大模型厂商及高校Bt所共计254袁,.,汽箔F20余省市/地区.中国工程院院士郑纬民指出,美国作为全球科枝霸主,一直引领人工智能领域发展前沿,整个大模型的产业布局全面领先,在研发能力、人才储备、硬件设施及融资环境方面占据优势,相较而言,中国占据海量数据济源和应用场最优势,但顶尖的AT人才缺乏,在基础理论、原创模型第颠再型、阶沃型技术方面仍缺乏引领能力.产业基础层的整休实力较弱,高质量数据积累不足,在高端慈片、关谯基
11、础软件等领域受制于美国.二、国内外大模型行业应用概述(一)国外大模型行业应用情况美国大模型商业化应用进展全球领先,商业化进展迅it.一是网络、存储等基础设施建设完备,技术发展成熟,为大模型广泛应用打下良好某础。二是具备充足的用于大崔型训练推理的高端芯片,算力充沛。三是大模型技术领先,以OpenAI为代表的大模型公司对美国大横型在全球取得*先地位和广泛落地起到重要推动作用.OPenAl作为全球人工智能顶尖研究机构,以GPT4为底座,为个人、开发者和企业大模型应用持续赋能,其近期推出的GPTStOre为大模型应用带来爆发式增长.据不完全统计.美国大横型应用已经覆盖医疗、金融.房地产、媒体、军*、1
12、候强测等拿域,加微软将GPT4能力集成多office等办公软件中,提高办公效率和用户体歌:惟根士丹利也接入GPT4能力,优化财*管理*也注程:房地产及分Ii曜虹信忆对觎的大模型工具可根据用户提示自动生成房屋图值以及进行房源匹配:报纸出版商Gannett将大横敌集E出版系统中,简化运菅,帮助记者摆脱日常整琐任务、解放生产力。欧盟、英国、加拿大、新加坡、日本、印度等国家和地区的大模型应用尚处于前期尝试阶段,仅个别头部企业开始应用.在英国,会计,法律等行业的国际知名企业在部署大模型.如普华永道已在英国员工测试使用尽职调查.识别合规问题、审批交易等功能,未来将面向全球推广:英国最大律h*务所之一麦克法
13、兰宣布,与法律领域生成式Al企业HarVey达成技术合作,将在法律咨询.法律内容生成/查询、客户服务等领域全而应用生成式AL在日本,7-11,利店将大模型用于产品创意和规划,提升产品研发效率:本田汽车格大模型用于汽车设计.在印度,教育科技企业撒时3:Wm於藤考鼻AlakhAI平台.该平台将施励学生进行小组学习、解决学术和生活问题、提供支持和鼓励,甚至创建个性化的学习计划,1Sl外部分大模4应用案例国家魏条曲.1普密;,:.-43人的模式集成在Hft的多:Word、Excel.“-MnF.Outlook、Teams2023-,-U.二;I,.(LLM)BIoonbertGFT4kiKfltSSv
14、vWiiBJhnX*YA*耳现有仲公融KIPf,例情,-J,名室体IW别.新胡分举Io同等笨.PaIantir劫1工瑞喷下本美国KlTTW11HIT31FftWWHJfftW3tW化后勤保障E理.美国SCaIeAl公司与*(0HfM大学履合研爱HennC、,2丑BI又I工I卜V0j.INIE八-I.LoAMU孑.itrfcU*4.麻将泵IBM和NASANugfin(Face上开源全球,大的地直电同大-PriIhvl.PrithVi由NAM鼻住*4催烫等卫星:Ec敦播.在IHM的ntsox.*i1!用上一训练.微漕而成.PriIhyi主尊用于f测大候壹化.洪水映射.跟踪森林;:OpenAI亡盯七1.%方注雁电皆翌金Uw匿皆M融KqMkBondGPT+开:.UFHealth;M:龄倒意yWTF由期4也J2-4-丹Ail上新技术栗动的AlpUi1上力,-4r,.;:Ll核油之达常年F,J株同望我Hopla田求疝”强M&匿:W盘Hopia寸?英国+疗E叉冗次占魂&OpenAI方症U漏港*据J臬飘点光tasks,国家凄工凡自自喻臬九3FClhaus.F.在*宣J国W备?.设计师可在几秒仲内设计整NIE)传用圣61玄州J船解HX涵电、AJw,L:瓜.:工心妇TfliMlrj工强京廷T-T成置:卧以口日本三,Elev