《2024北京市人工智能大模型行业应用分析报告-北京市科学技术委员会.docx》由会员分享,可在线阅读,更多相关《2024北京市人工智能大模型行业应用分析报告-北京市科学技术委员会.docx(40页珍藏版)》请在优知文库上搜索。
1、大模型行业应用分析报告北京市人工智能北京市科学技术委员会、中关村科技园区管理委员会二。二四年四月目录编写说明-00-综述-05-一.大赛开放多维度场景及高质量数据,大模型企业奇招频出0(一跟务领域0*.赛题情况0*.企业解决方案亮点0(二途融领域-*1.,-兄”.0。,企业解决方案亮点*0(三产业升级领域赛题情况.企业解决方案亮点9(j,*e0*。一赛题情况一。.企业解决方案亮点/(五淡化教育领域*5。.赛题情况*5。.企业解决方案亮点一(六)8禁城市领域.赛题情况.企业解决方案亮点.二、北京市人工智能大模型行业应用情况分析-O0-(一应用特征-OO-。由浅入深,大模型穿越边缘场景,向核心场景
2、挺进0-.守正獭,央国企翔蹒技术,加快大模型在产业升级、金融等领域的落地步伐.百花齐放.大模型应用搭建难度下降.旬态行业大成为落地。5g.QQ-g9305g“。g新关键OO体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明5.保驾护航,大模型安全逐渐受到策视,为可持续发展提供保障(二应用挑战e算力需求持续增长,挈时大模型落地应用一知识产权、数据除私与大模型应用之间的最佳平衡点仍在探索中.大模型幻觉问题有所改菁,但距离规模落地尚有差距.部分大触!应用处于何用阶段.需求方和技术企业协同发力让回ff1.53S1.辆5.部分领域受监管影响,对大模型落地提出特殊要求(三应用研判.政务领域.金融领域。产
3、业升级领域。.医疗领域5.文化教育领域智赫城市领域结语致甜声明附录写说明编写说明大棋型是指通过在海量数据上依托强大算力资源进行训练后的完成大量不同下游任务的模型。大模型以其在模型精度和泛化能力等多个指标上超越传统A1.模型的表现,以及JR能千行百业的巨大潜力,成为当今世界各国人工智能技术发展的核心方向。大模型经过一年多的高速发展,已在政府、医院、学校、企业等各类需求群体中建立初步认知。其中一部分需求群体设立专项预算、开放业务场景.对大模型进行试点应用。通过试点应用,需求群体加深了对大模型能力和价值的认同感,进而普遍希望在未来继续增加相关预算,将大模型与实际业务进行更深入、更广泛的融合。在此背景
4、下,北京市科学技术委员会、中关村科技园区管理委员会会同有关部门和相关区举办了北京市人工智能行业大模型创新应用大赛,并依托大赛成果及前期工作积累编写本报告,致力于分析北京市大模型行业应用发展趋势,促进大模型价值传播和供需对接。限于煽写时间仓促、编写人员知识积累有限、整体场景应用尚不成熟等方面的影响,内容或有疏漏,敬请指正。综述d源市税粮布人工智IB,加速推动产业夏展I人工智能大模型经过过去一年的发展,行业应用开始出现井喷式增长,作力发展新质生产力的垣要引擎,人工智能正成为经济高质发展的最大增。北京市委市政府高度电视人工智能发展.0。年5月,北京市政府印发北京市加快建设具有全球影响力的人工智能创新
5、策源地实施方案(0-0。5年R,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发羽晾市促迸通用人工智能创新发展的若干措施b,强调开展大模型创新算法及关健技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。近年来,北京市积极布局人工智能产业发展要素,通过部署智能算力平台、建设数据基础制度先行区,发布中文互联网语料庠、设立产业投资基金、建设大模型产业集聚区等一系列举措,加速推动人工智能产业发展。截至目前,全市人工智能相关企业均900家,约占全国四成的年人工智能产业核心产值突破
6、500亿元。北京人工智签领域越新和产业链条完整,在基咄设施层面集聚了寒武纪、摩尔线程、昆仑芯等国内头部企业;核心技术及算法屋面拥有百度、智诣、百川智能、月之暗面、零一万物等代表性基础大模型,目前已备案上坡大度型5。款,全国第一;应用层面拥有猿力科技、中科闻歌、瑞莱智慧等行业大模型技术企业,相关产品已在教育、金融、政务等领域率先应用。北京市以行“大新亶用大赛为振手全力推动大模超技术应用落地为进一步加强重点领域大模型裳设,根据市委市政府整体部鲁,在市人工智能专班的统筹调度下,北京市科委、中关村管委会会同相关单位,国绕重点行业领域,研究建立全市行业大模型应用推进工作机制,并于eo年月举办北京市人工智
7、能行业大模型创新应用大赛,全力推珠模组技术应用落地。以期通过大赛,挖掘一批典型的行业应用案例,启发一批潜在试点单位拥抱大模型技术.梳理一批核心业务场景,开放一批行业核心业务数据,发现一批有潜力有实力的大模型技术企业,推动一批大模型供需之间的交流与合作。大赛设覆政务、金融、产业升级、医疗、文化教育、智点城市个赛道,分初赛和复赛两个阶段。初赛阶段类似“自由创作,针对参赛团队所申报的应用案例,BS绕商业价值和社会效益进行烁合评估:复赛阶段类似,命题作文”,结合试点单位真实业务需求,由试点单位出题,对通过初赛的大模型技术企业进行能力考核。历经数月,大赛从。个赛道00余家参赛单位中,征集应用案例。0余项
8、凝练应用场景5个.开放高质量行业数据上万条。本报告以大赛为切入点,展示了北京市大模班技术在各领域各行业的应用方向,根据不同领域对大模型应用趋势进行分析研判,并提出工作建议,力求向市场各类参与主体呈现北京市人工留能行业大模型创新应用发展态势.为未来决策提供参考。大模型企业奇招:出TO政务领域.赛题情况方向一为基于多形态知识的政务认知智能体系研究,由北京市政务服务和数据管理局提出,以构建高质政务数据知识体系为核心目标,需要参赛企业对全市海政务数据的实时动态挖掘、清洗.标记、转换,并打造大模型测试训练的蜕一平台接口。复赛所用训练及测试数据集由公积金、交管局等政务知识数据脱勖成.可供参赛企业带回,迸行
9、部署调试。该方向将有助于进一步提升政务服务数字化、智能化水平,在政务愁体场景布局中发挥大模型数据中台作用,从而支撑政务领域各项业务的大模型应用。方向二为基于依申请政务服务里项知识图谱的智能咨询,由北京市政务服务和数据管理局提出,以提升办事企业、群众在统政务咨询及申请办事的体脸为核心目标,需要参赛企业针对用户提出的依申请办事相关咨询问题进行精准回答,并锁定服务事项。复赛所用训练及潴试数据集由政务服务事项办事指南、事项说明等数据形成,可供参赛企业带回,进行部詈调试。该场景从形式上属于大模型智斓问答,是市政务服务和数据管理局面向大众群体的重要场景,需要大模型精准把控生成内容的同时保殴用户的良好体验。
10、方向三为面向政策分析场景的政策专业化标注,由北京市政务服务和数据管理局提出,以为政府办事人员提供政策分析问答、指导政策制定为核心目标,需要参赛企业对政策性文件进行条款拆解、理解并训探大箱型,获得准确的问答效果。复赛所用训练及测试数据集由专M新的政策原文数身形成,可供参赛企业带回,进行部詈调试。该场最需要大模型深度理解政策原文对其拆解及标注,并在政策制定的过程中给出参考意见,将有助于提升政策制定的效率及全面性。.企业解决方案亮点在提升回复准他率方面,参赛企业提出两个较为有效的解决方案。部分参赛企业通过外挂知识庠的检索增强(RAG历法来索引政策知识,从而提升大模型生成错果的准确性,弁且可行性较强,
11、但这种方案依赖知识库的知识储备和及时更新,在长期运维过程中不仅带来额外的人力成本也可能生成大量重复、过期的知其部分参赛企业利用大模型来对知识进行分析和存储,相比于外挂检索增强.这种通过大模型对知识迸行管理的方案虽然在短期内可能会因为大模型幻觉等问题在答案精准性上有所欠缺,但长期看,陨着基座大模型霞力不断提升,这类方案地够真正的理解数据,从而更好的更新和利用知识,在开展垂追领域微调后表现出更好的效果。参赛企业在提升用户体览方面也做出了多维度的尝试,从部署上,参赛企业在微调大模型后采用一体机的形式将大模型应用进行私有化部詈,为数据敏感的政务场景提供解决方案。在提升准确度的考虑上,接赛企业利用知识图
12、谙辅助大模型精准定位知识,并通过主动多轮质询用户的方式提升答案质量。s金融领域.赛题情况方向一为豆于A1.GC技术的智能审计合规研究,由北京银行提出,以提高审计工作效率和准确性为核心目标,需要参赛企业什对检查内容.利用大模型技术寻找并给出相关现象涉及的制度名称及相关原文,生成包含检查要点、检查方法等内容的审计合规方案。复赛所用训练及测试数据集由北京银行制度、监管政策以及历史问题库等内部审计合部相关知识形成,仅允许本地私有化部署。金融审计场景作为北京银行的核心业务之一,对审计结果的正确性要求很高,对大模型的检索能力及溯源能力提出较高要求。方向二为基于金融行业的营销引导式智能员工,由北京首创融资担
13、保有限公司提出,以错助业务人员迅速生成风险报告,评估企业风陵情况为核心目标,需要参赛企业对金融场景的数据进行理解并训炼大模型,最终生成包含产品特征、贷款担保资质、项目方案(预估放款金S1.担保费率同问我的解决方案。复赛所用训炼及测试数据集由企业画像、业务评审报告等文件数据形成,仅允许本地私有化部署。金殿担保同时具备金融性和中介性双重属性,为完成融资担保流程,担保公司不仅需要熟悉了解金融专业及法律规定,还需要具备一定的蓄销能力,因此本题目方向覆羞了金融领域的端到端需求,对大模型在金融领域的综合能力提出了较高的要求。.企业解决方案亮点外挂知识昨的检索,技术(RAG同于提开金!大B的回鲁M)MOMM
14、.RAG在使用语言大模型回答问题之前,从外部知识库中检索相关信息,为大模型回答提供外部知识支撑。金融领域业务具有较强的专业性,RAG技术的运用可以让大模型更好的应对知识图集型任务,不同企业在RAG的基础上可以对检索方式进行扩充,从而更准确的命中外部知识,提升回答的精准度。化对齐技术在金IMM发筹要作用.未经强化对齐的模型可能会输出不符合金融行业风格甚至计算错误的结果。金附领域对结果的合规性、专业性要求很高,利用强彳匕对齐技术的参赛企业在本次比赛中表现更好。1产业升锻领域.赛题情况方向一为基于多形态、多维度、多场景数据的企业成本智能化分析及预测,由中都物流有限公司提出,该题目方向以提升物流服务领
15、域企业成本分析和预测的智能化水平为核心目标,需要参赛企业基于企业成本相关的数据集、社会面的数据集开展大模型训练,形成企业成本颈测和分析的大模型智能工具。复赛所用训炼及窝试数据集由中都物流提供的线路成本、台账运营成本等数据脱敏形成、可供参赛企业羽数据带回,进行部署调试。该赛题以企业成本分析为核心目标,本身属于企业数字化转型的任要部分之一,大模型的分析及生成摘要能力.在此场景下有较好的应用空间.将有助于企业智能化决策.帮助企业把控成本。方向二为区于联通业务数据的运营商行业大模型研究,由联通(北京产业互联网有限公司提出,该题目方向以实现运营商业务数字化、办公智能化升级,提升运营商企业服务能力和效率为核心目标.需要参赛企业竹对用户提出的运营商领域相关咨询问题进行精准回答。复赛所用训练及利试数据集由与联通公司相关的媒体报道、产品和方案介绍等内客组成.涉及大数娓、云