《GenAI技术落地白皮书(2024).docx》由会员分享,可在线阅读,更多相关《GenAI技术落地白皮书(2024).docx(17页珍藏版)》请在优知文库上搜索。
1、目录Contents核心观点11.GenAI构建企业竞争新优势22 .大腿的选择33 .大模型的培育74 .大模型的使用io5 .GenAI技术落地策略总结。核心观点生成式人工智能(GenerativeArtificia1.Inte1.1.igence.GenAI)即将迎来全面爆发,各行各业必须为此做好准备.本报告从企业视角出发.聚焦技术,阐述GenA1.在企业落地B寸的关解考贵点,提出了“选-育-用”方法论,覆盖了从模型和技术路线的选择,到如何培育适合企业的大模型,并将其广泛应用在企业流程实现全面创新的全生命周期,为企业规模化GenA1.落地提供指导.核心观点如下:1 .企业应充分了解不同产
2、品服务、技术解决方案背后的技术难度、成本及其筑达到的效果,结合自身的技术实力、资金储备以及业务目标,作出合适的选择;特别是面向不同应用场景时,可以采取不同的产品服务模式而不呼艮于单T三.2 .选:企业霜要结合自身情况选择构建GenA1.能力的技术路线:深度研发大模型,或者基于现有大模型进行工程化适配,或者直接使用大模型服务.后两条路线适合大多数企业,此时要做好大模型的选择,形成自己的大模型池。面对具体的应用场景,选择大模型的关键是在成本、效果和性能的“不可能三角”间进行权衡和取舍。3 .育:定制适应企业的大模型诧要基于基址大模型进行工程化适配,按照技术难度从小到大和投入成本从少到多,主要包括提
3、示词工程、检索增强生成和微潮三种方式.其中,微调会改变部分大模型参数,微调后还可以通过知识蒸镭、剪枝、量化等手段“压缩”大模型达到灵活的适应性,需要较高的技术门槛.4 .用:广泛应用GenA1.需要解决基础设施问题。相比传统的自建或租用数据中心方式,使用云基础设施或者采用云托管大模型的方式能够节约时间成本、降彳氐现金流压力.企业可以通过Agent将大模型的能力与企业应用紧密集成,基于GenAIoPS做好跨团队紧密协作、消除流程断点,从而加速GenA1.应用上线,并根据效果及时更新。此外,需要始终关注GenA1.应用的信任、风睑和安全管理,构筑可信任的基石。11fi三三1 .Ger1.AI构建企
4、业竞争新优势GenA1.是一种先进的人工智能技术,它能够基于已有的数据和知识生成全新的内容.这种技术的发展得益于深度学习、大数据和计算能力的发展,特别是大型语言模型(1.arge1.anguageMode1.s,1.1.Ms)等基轴模型的进步.GenA1.将逐渐改变人们与机器交互的方式,为各行各业带来前所未有的创新机遇.当前,GenA1.正处于熔炸性增长阶段,ChatGPT的火埠更是印证了这一点,它展现了GenA1.在交互性、实用性和创造性上的巨大潜力。工业界和学术界都在积极投入资源,探索如何利用GenAI实隧首提效、体险提升以及业务创新.市场上涌现出各种基于GenA1.的应用,比如自助式数据
5、分析、定制化内容创作、个性化推荐、自动化客户服务以及辘助设计与研发等.与此同时,GenA1.的伦理、安全和合规等潜在问题也日益凸显,如何保障GenA瑾)可持续和负贡任发展成为各界广泛关注的问踵。打造GenA1.能力,已经成为企业全面迈向智能化、构建市场竞争优势的必然选择.GenAI可以推动产品创新,通过快速生成设计和创意,加速产品开发流程;提升成本效益,利用自动化内容生成,将人力从市直性工作中解放出来,更专注于发挥创造力;解氐数据分析的门槛,人人都成为数据分析师,从而实现科学决策,为企业提供精准的决策支持;改善用户体验,根据用户行为和偏好,实现高度个性化的产品和服务;基于GenA【能力打造A晾
6、生应用,带来颇覆性的体验和价值.企业构建GenA1.能力,是一个涉及战略、组织、文化和技术等多个维度的综合问震。本研究将聚隹技术层面,分析GenAI在企业业务场景中全面落地的关键考量因素,提出“选-育-用”的GenA1.落地方法论,从选择技术路线和基础模型入手,培育好适合企业的定制化大模型,并将其高效、安全地应用在企业的方方面面,从而助力企业充分发挥GenA1.能力,构建独一无二的竞争优势,带来可观的商业价值.11fi三三2 .大模型的选择2022年11月3。日ChatGPT的面世,拉开了GenAI发展的新篇章.短时间内,GenA瞰得了日新月异的发展,目前市面上已经出现众多各具特色的产品服务:
7、产品门类繁多一有适合多种通用任务的基础大模型,还有各类适应特定行业或场景的行业大模型和场型大模型;服务模式多样既可以像私有云一样本地化部署,还可以如公共云那般按用量付贽,甚至能够类似混合云那样博采众长、多措并举.面对如此众多的市场选择,企业应当如何确定最适合自己的GenAI服务呢?我们建议,企业首先根胭自身的业务需求和成本预算来选择技术路线,然后权衡模型的效果、性能等因素选择合适的大模型,特别是当企业在面向多个业务场景需求时,可以不局限于单一大模型产品服务甚至技术路线,而是根据不同场景的特殊需求和市场上相应产品服务的成熟性和契合度,分别选择最合适的产品服务.21大模型技术路线企业使用大模型服务
8、的技术路线,主要包括深度研发大模型、基于现有基础大模型进行工程化适配、直接使用大模型服务三种.表1GenAI主要技术路战的优劣势比较大榜型技术招线技术难度上城周期可定制%:不同的工程化适配方法在成不、技术械、上域周期KI定阻化能力方面存在差异,此处为与另网条拉术珞坟相比的平均水平.11fi三三1深度研发大模型深度研发大模型,是指企业从。到1完全自主研发或者基于开源模型做深度定制得到大模型,这一过程涵益侵型设计,数据准备、环境准备.模瓢I绦模型沼和优化等多个阶段.深度研发大模型可以计对企蛀的耳体场耍需求进行优化设计,理论上可以更为聚集地解决特定问题,从而拥有更好的表现.企业在研发过程中蒙震充分的
9、模型技术细节,拥有较高的自主性,从而不受外部供应商的限制.但足杲度研发往往需要发入巨大的研发成本,包括计袋资源、稀缺技术人员的好费等.从启初自研到上线应用的W间湾度长达数月甚至以年计,并且需要持续投入,以确保在快速的技术迭代中不掉队.由于技术体系复杂.研发难度大,企业可能面啮嗔型性能不理出、项目延期或失效等风睑.总体而言,深度研发大嗔型是成本最高、难度最大、周期谡长的一条技术路径,除非足期有高密度AI人才、资金充足的企业,否则并不推荐.2基于现有揄出大模型进行工程化适配基于现有基础大模翌进行工程化适配,是指企业在已有的大模型基砒上,针对具体应用场景进行的技术调筐和优化工作,以更好地适应企业场景
10、,这一过程不仅涉及技术上的适配,还需要综合考IB成本.住能.安全.可维护住等因猖.对于用户来说,常用的工程化适配方式包括提示词工程(PromPtEngineering)、检索Ifi强生成(Retneva1.-AugmentedGeneration,RAG)和模型撤调(Fine-tuning).企业还可以通过知识蒸馋、剪枝、量化等手段减少大模型的叁数规搅,降低推理的计算*,提高大模型的响应速度.选取这一技术路线无需为基础大模圭的训您付费,从而显著减少开发成本,同时可以优化大磔在特定任务较域的输出,在特定任务上得到更好效果的预期较忌,该路线尽管有一定的技术门监,但不箕太高,经过一定培训的技术人员即
11、可塞坦,因此适合于几乎所有的企业用户.特别是当市面上现有的大模型产品和服务无法直接满足企业的特定需求时,基于现有基设大模型进行工程化适配几乎成为企业的必然选择.3直接使用大模型服务企业还可以直接采购已经训练好的大嗔型去解决业务问融.一些模型服务商提供将自家模型郃售在客户环境的能力,更多模型服务商和云平台合作,采用云托管的方式,这种方!崛用随取,按需使用,进一邮低了使用大模型的门嘏直接使用大模型服务无需投入大量资源,有效降低使用成本.企业不需要深入了解技术细节,业务团队可以快速上手,直接将大模型柒成到现有系统中,迅速享受到大模型的红利.部分第三方服务提供商针对市场观摸较大的行业或通用性较强的业务
12、场景推出了特定领域的专用大模型产品,例如在智能客服、信息检索、代码生成等领域,这进一步邈升了大模型的使用效果和用户体电.直接使用大模型服务的方式适合于大多数企业,特别是成本预算有限、技术能力欠缺的中小技企业.另外,随若基础模型能力的不断提升,以及该方式可以与提示词工程.RAG等工6化适防期结合,使得云爱AP1.调用的方式被越来越多的企业空视SI基础大模型的选择在企业构建GenA1.能力的三条技术路线中,除了不适用于多数企业的深度研发,无论是对基础大模型进行工程化适配,还是大模型的直接使用,具中最关处的环节就是基础大模型的选择.在这一过程中,需要综合考后各种因素,包括企业的业务场景需求、成本预算
13、、员工技术水平,模型的生成质量、泛化能力、响应速度等,但本质上,选择大模黝员务的关犍是在成本、效果和性能构成的“不可能三角间进行权衡和取舍,S1.大模型将三角训练成本成本推理成本J部罟、运维及升级成本内容有用性内容合规性内容隹确性成本指的是企业大模型落地的蛉体药用,包括大模型的训练成本.推理成本以及部署.运维和升级成本等.企业有时仅关注有形成本:例如GPU购置费用、消耗的电超,或从第=方服务商购买模型服务的费用;而会忽略无形成本,包括为实现大模型服务而配置的人力成本,以及大模契在郃舌.训练或调试阶段消耗的时间成本等.企业在核算J三1.,需要考量总持有成本,特别是不要忽圈无形成本.按成本从高到低
14、f为深度研发大模型、微调.RAG.提示词工程、亘接调用.效果指的是大模型生成内容的质员,包括内容的准璃性,是否存在幻觉问速,或是否会生成不合适的内容.大模型效果可以基于3H”原则进行评价:1)He1.pfu1.:内容可用有帮助,不要废话连篇.泛泛而谈;2)Harm1.ess:内容合规无害处,符合伦理规范和监管要求;3)Honest:内容正确无幻觉,不要一本正及地用第3,甚至给出错误信息,通常来说,大模型的参数烷模越大,生成效果酶.因此,当业务需求对生成内容质屐要求严苛时,应尽量选择参数区膜更大的蟆型.此外,目前市场上主流商业化模型的效果,大多优于同期同冬数规模的开源模型.住18指的是大模型服务
15、的酶,包括大模型的训练速度,推理时的响应速度、生成速度等,一般而言,大模型的参数观慢越大,则需要的训蝴间越长,即训缚速度越慢,而其进行推理服务时的需求响应速度和内容生成速度也越慢.因此,大酶的效果和性能不可兼得,当成本固定时,大模型的选择主要是在效果和性能之间迸行平衡和取舍,对于性能要求蛟高而对效果有一定容忍度的场景,可以选择参数规模相对较/J助初理.基础模型的选择是个综合性任务,除了做好成本、效果、性能不可能三角的权衡,还需要同时考虑一系列其他因素:例如集成难度,即模型服务与现有系统的集成豆杂度及其所需的技术投入;技术友好性,即技术人员的学习和使用摩度;模型犷展性,即模型的更新、升级频率和向
16、下兼容性;模型生态,包括模型系列的参数尺寸全面性及其背后的工具生态系统和合作伙伴网络等;服务商可靠性,包括限务商的口碑声誉、技术实力和服务能力以及客户成功案例等.这其中,企业需要金卜注息大模黝&务的合规性与安全性,以免影响业务的正岗开展甚至造成企业数据的泄露.在国内,提供基础大模型服务的供应裔除了需要遵守数据安全相关法规,还需要完成生成式人工智能的算法备案和服务备案。3.大模型的培育在大模型的三条主要技术路线中,基于现有大模型进行工程化适配是最受企业关注的一条路线:它在成本方面与直接使用大模型相持平,有一定的技术门槛但总体上难度不大,同时有哪解决基础大模型或行业大模型不能实现的一些业务特殊需求.工程化适配按技术