《2024·大模型应用实践报告.docx》由会员分享,可在线阅读,更多相关《2024·大模型应用实践报告.docx(35页珍藏版)》请在优知文库上搜索。
1、feni战略一致性,企业成功落地大模型的隐藏秘钥2024爱分析大模型应用实践报告05.2024报告编委报告指导人张扬爱分析岷合创始人&首席分析师报告执Sg人李迸宝受分析高级分析师外部专家(按姓氏拼音排序)林庆治飞算科技首席数据官滴普科技大模型产M总监张皎拓尔思佥购和产业大脑产品中心运昔总监特别鸣谢(按拼音排序)滴普科技DEEPEXI飞算科技Ca1.ExTech两造TRS目录1.报告综述2.市场洞察3.数据分析巾场4.知识库/智能客服市场(&关于爱分析产品服务法律声明CHAPTERO1.报告综述1 .报告综述人工智能大模型,是指通过在海员数据上依托避大算力资源进行训练后能完成大奴不同下游任务的模
2、型。大模里以其在模型精度和泛化能力等多个指标上超越佻统A1.模型的表现,以及赋能行百业的巨大潜力,成为当今世界各国人工智能技术发展的核心方向.大模型羟过近一年半的高速发展,己在政府、医院、学校、企业等各类衢求群体中建立初步认知。其中一郃分需求群体设立专项预算、开放业务场块,对大模型进行试点应用.通过试点应用,需求群体加深了对大模型能力和价值的认同感.进而普遍布里在未来继续增加相关预算,将大模型与实际业务进行更深入、史广泛的融合.大模型应用百花齐放,其中数据分析和知识乘/智能客服是企业在2024年关注度捅腐的是两个应用场景,成为企业落地大模型的重要抓手.调研数据品示,准需在2024年应用大模型的
3、企业中,有78%计划在数据分析场景落地,有70%计划在知识速/智能衣服场景落地,舰于此,本报告将流点研究数据分析和知识库/智能客服两个特定市场.图衣1:2024年大模型重点应用场景MRJt.VnVf1.ifenxEE:宠分析绘制CHAPTER02市场洞察2 .市场洞察通过时近百家大型企业的调研,爱分析归纳出大模型落地应用过程中普幽存在的挑战,它们遍布规划、立项、选型、实施和运营等全流程,本报告将选取三个重点挑栈诳行论述并提出蚱决方案,桃战1:大模型项目未与企业保持战0一致性一般情况下,大模型通常是由上至下推动的.H1.董那长或CEO等企业一把手宣布大模型必须落地的任务.该任务无论分配到哪个团队
4、,都会启动一个以大模鞭为主题的项目,并展开一系列汇报工作。在汇报过程中,企业一把手询问的首个问题往往是大模型项目与公司战略的关联。但是,在大多数汇报中,项F1.负诉人的回答仅局限于大模型技术和应用,例如“大模型+知识库”瞅予一规员工的能力提升、“大模型+数据分析”提必了业务人员使用数据的便捷性等.这些价侑与企业战略间并无必然联系,即大模型项目与企业战略之间没有必然联系,进而导致大模型项目难以顺利过审.某大型化学用品公司CIo向总钱理汇报2024年度IT项目规划和预算情况,但汇报并不顺利.重点问SS在于大模型原目的业务价值没有打动总经理.因此.爱分析建议首先要解决如何保持大模型项目与企业战略一致
5、性的问题.实际上,多数企业在2023年年末至2021年年初期间会做2024年企业战略规划.其中必然涉及到战略目标设定以及战略解码的过程。爱分析认为,大模型项目必须在战略解码的过程中找到自身的核心定位,或者说确定其与战略的紧率联系,这对于项目的顺利进行至关重要.下图为一个常见的战略解码过程,涵靛了从整体公司级战珞到管理层设定的KP1.目标,再到业务执行层的每个项目.无论是采用战略地图或者其他形式,行可以帮助企业进行战略裤码的工作.其主要作用是在整个战略解码的过程中,尤其是在i终的执行层(项目中,其正找到符合企业臼身情况的战略对齐,从而提升大模型项目的价值.图&2:战略解码过程示意图公司级管理层执
6、行国故略项目项目XH目ifenx某金融机构在每年年底和第二年年初时.布要对整个十四五规划诳行全方位回顾.在考虑十四五规划时,一个魏为关犍的战略是自主可控,这也被明确写入公司的十四五信息化战略规划之中.因此.大模型项目负贲人就是从十四五战略规划中出发,从中挑选出适合的项目.该金融机构最终选中的落地项目是“大模型+运维”,选择原因其实是它比较好地解粹了自主可控。这里的自主可控不局限于外资软件或堪础设施,更多的是对外部供应商的自主可控,在此过程中,大模型与运雉的联合价值显得支为武要,因为可以时金融机构现有自身内部能力迸行强化,也就是大模型可以提升公司内部运维人员的技能,例如通过知识阵、B1.以及其他
7、能力赋能内部运营的人员.运除人员在这个过程中,可以减少对云厂商或外资硬件服务器厂商等存在的面度依赖.从而以更好的程度体现出自主可控性.该项目从立项到实施都较为脱利.因为在项目之初便将整个公司的十四五故路规划中的自主可控性纳入其中.是一个非常优秀且值得借签的金融机构案例。挑战2:大模型业务收益难设定大模型项目负责人在设定业务收益时.头绪繁多.但缺乏找到行之有效的收益项.当前常见的大模型业务收益主要包括提升企业/处牌形、减少资本支出和运营支出、业务收入增加、提升客户满意度、提升员工人均产出.缩短流程时间、加快新产品上市节奏等.如果大模型项E1.负责人追求“多多益善-.而不是“有的放矢”,企业内部往
8、往难以就业务收益达成共识,进而导致项目推进困难.爱分析将提供一种易于操作且可行性较强的业务收益设定方式。在设定大模型业务收益时,需要从顶层开始进行考虑。这种策略的优势是从管理层出发,历经部门领3,直至执行团队,这是实现大模型落地的最佳路径。其背后原因在于,大模型本身需要获褥来自管理层的大力支持,以及在公司范困内推动这项J:作,那么计对管理层的大模型的应用赋能或探讨如何使这个模型为管理层带来价(无疑是更为有效的切入点.某主机厂计财在2024年落地大模型,在应用场提上W经过多次内部筛选,首先以面向管理层的场景作为首个目标.例如,在每月的经分会上,依托完全基于大模型生成的报表进行经分会的召开,报表主
9、要展示了一些核心的日常经营指标.再例如,由于该主机厂规模较大.对于管理层而言,年终述职报告便显得尤为必要,大多数领导可能需要花费长达一个月甚至更长的时间来撰写这份报告,因此,大模型项目团队根据日常运普分析中的一些核心基础数据生成报告拚助领导减轻年终报告的负担。由此可见,即使都是行数据分析,在面向管理层时整体的业务收益会更易得到认可。挑战3:提升数据分析结果的准确率数据分析是很多企业在2023和2024年落地大模型应用的首要场景,但生成结果的准确率较低.困扰着大模型项目负贲人.导致该困境的主要原因之一在于大模4!数据分析是基于i普吉交互的方式无法限制用户的提问方式,因此理解问趣和生成结果的难度偏
10、高。以下通过一些来自用户的真实问题具体说明。 含义清晰的单任务向咫嫉尚单。例如“坦近7天XX产品的订单总能是多少?”这个向SS大模型理解起来比较轻松,因为这是一个单任务,并且订单出、产品、时间等指标比较明确, 含义模糊的单任务问遨对于大模型而才.难度也不大.例如“XX产品今年然计卖了多少?”大模型开始发挥优势,因为大模型擅长将模糊语义对齐标准语义. 一些涉及多表数据处理的何时,开始给大模型增加难度,例如“今年XX品牌在IB内和国外的整体栉量是多少“国内外钠敬经常存在两张表,两个销城的字段都定义为Sa1.eS.一CoUn3如果对姆个SaIeS_count都做标注的忸况下,针对两张表做uniona
11、1.1.或者做关联的时候会导致生成的SQ1.结果不准确.这种情况采取的解决方案,玷把所右数据辿过数犯模组打货或预打宽,通过语义理解然后对齐到相应的指标字段. 不限制同四长度的灾杂问遨带来更大挑战.例如“kx品牌最近3个月国内销灵枝好的产品赴哪一款?每个产品平均每月销量是多少?”大模型需要先查询过去某品牌三个月每个产品的饰盘.再基于查彻的结果找到排序最好的几款产品,然后根据第二步任务结果找到排序最好的产品,计蚱平均每月的销量. 双杂且需要调用业算法的问题或为困难。例如“华北地区KX的效率月环比为什么下降了?”大模型不仅要查上个月的数据,还要计对前个月的环比数据作计算,并且判断是否下降,在此堪础上
12、,还要调用归因能力,归因的算法能力不是大模型木身所具备的,所以要通过插件化的方式让大模型去诩度,把之的的结果做参数解析填充到对应抽件里,并生成最终的结果。将上述每个问Sfi的难点进行总结,影响生成结果准确性的原因主要在于语义对齐和任务多样性两个方面.语义对齐毡指对齐用户口语化的查询和指标字段、维度字段、甚至是其它AP1.的输入参数.任务多样性是指用户在提一个红杂问题或者目标时,大模里肯定无法直接执行,因此需要把目标或更杂任务拆解成多个子任务后,每个子任务做仍同执行,再完成用户最终的提问需求.针对语义对齐的问题,可以通过语义增强配置的方式来解决。用户在提问时并不一定准确知道什么场景下该何什么指标
13、,而是进行场景描述,因此要把企业的业务数据做指标语义化相关的生成和配以,包括指标名称、业务口径、应用场景等.针对用户提问,基于相似度和索引找到对应指标.针对任务多样性,可以通过引入Agent方式来解决.加ent具备规划拆解能力,并且在此之后通过调用插件执行子fE务。比如,Mcn1.荔于指标交询会把指标、维度和时间三要素解析出来,填充到标准化的接口。Agent还会调用归因、预测、异常检测等算法。CHAPTER03数据分析市场3.数据分析市场数据分析有两个落地要点,一是如何借助大模型实现更准确的懑图理解和SQ1.生成,二是如何借助大模型实现深度分析,实现这两个要点,才能推动到大模型数据分析从“可用
14、”到“好用”。第一个落地要点是如何借助大模型实1;确的意图理解和SQ1.生成.传统的取数过程中,用户需要明确掌提SQ1.语言和相应的数据库结构来提取所需信息。版希疝2SQ1.技术兴起,用户只需使用自然语言描述需求,出后端系统将其咕换为适当的SQ1.语句,初化了查闻过程.,但.N1.2SQ1.技术仍有瞅陷,其自然语言处理能力较弱,在处理模裾自询和史杂意图色询方面存在挑战,例如,N1.2SQI.技术难以解决像“我想自询公司内部有多少本科以上学历的城工”这种问题,该模型可以正确识别“本科”一词,但难以理解“本科以上”这四个字.大模型为N1.KQ1.带来了更强大意图理解能力,在处理模糊、多义或更杂的用
15、户查询时.系统可以更准确地识别用户的真实需求.当然,在大模型出现之的.市场上也存在解决以上问题的方法.这是主要依辙项目化的方法,通过不断的配置和人工微询的方式来解决查询模板无法处理的问句.该方法导致项In交付周期长、成本投入大,并且长期需要运维人员持续维护.为保证准确率,目前主要采用限定查询边界的解决思略,具体而;行两种实现路径。一是从指标平台,这一点与前面提到的语义层颇为相似,是把常见的指标先基于宽表进行计算,如果再运用自然语言杳闻指标,其精确度公相对较窝H.基本上具备可控性。这种方式能终在一定程度上降低幻觉现象.二是将大模型与宽去或语义层相结合,运用宽表和数据源来构建语义层,继而在该语义层上进行相应的匹配和杳询。这类模式的具体操作方式是,先去精准地匹鼠到语义层,如果未能实现精准匹配,-俄会通过一个亿级别的小模型先去精准地匹能到宽表,然后基于宽&再用大模型去做理解.第二个落地要点是如何借助大雌实现深度分析.取数可以视为分析的前置动作,也UJ以视为浅层分析,其属广