《【亿欧智库】2023中国智驾大模型应用研究报告正式版.docx》由会员分享,可在线阅读,更多相关《【亿欧智库】2023中国智驾大模型应用研究报告正式版.docx(95页珍藏版)》请在优知文库上搜索。
1、卬国智能电前汽车”,CHINASMARTELECTRICVEHICLEmSERIESREPORT2023中国智驾大模型应用研究报告一二】幕了二:,一一二.1亿欧智库CopyrightreservedtoEOIntelligence,October2023(127607)(127607)强张库丫忆欧智库(127607)亿欧智库:亿政智库(127607)强张智欧MIMicscwsrv*K2 ISA* mMT亿(127607)强张智欧亿(127607)强张智欧亿开始在自动驾驶行业内盛行起来。至2023年,智驾相关大模型开始大量出现,如华为盘古大模型、百度文心大模型、毫末DriVeGPT等。基于上述背
2、景,为了更深入地了解智驾大模型的定义、技术应用现状、产业竞争格局以及遇到的挑战等,亿欧智库撰写了2023中国智驾大模型应用研究报告,并针对中国智驾大模型应用进行深入地研究和分析。2023中国智驾大模型应用研究报告核心观点“力(127607)(127607)(127607)目前,智驾大模型没有一个公允定义,并且产学研不同领域的专家对智驾大模型的定义也不一样,但结合各专家的观点来看,智驾大模型具备多模态输入、自监督学强强强一,一-atB库库库GBBtUJI.IW-SMW%-rE.MRM*MMtMtft.SlffMlMVSItlMMUI*V 欧欧欧亿亿亿练为车辆提供更有效的感知融合效果与实时建图方案
3、,最终让车端实现与人类司机行为和思维一致的感知、预测、规划等能力。 智驾大模型最重要的应用是数据闭环,相比于传统数据闭环而言,当前的数据闭环对自动驾驶系统赋能最多的主要是数据挖掘、自动标注、模型训练、仿真测试四个应用方向。从感知侧的数据采集开始,会先根据筛选器的设置来进行数据挖掘,随后通过自动化标注来对数据打标签,再对原模型反复训练并经过仿真测试后,最后对车端/模型进行优化,在经过反复地不断迭代循环后,使得整个数据闭环能力能够不断提升。 对于已布局或正将布局的企业,智驾大模型玩家主要可分为四类,其中新势力主机厂以自研为主,而传统主机厂持有保守观望的态度;科技企业凭借强大的Al技术背景和资本实力
4、,构建了以云服务为基础的垂直服务体系;Tierl以自研基于BEV感知的垂域大模型为主;芯片企业主要是优化芯片的开发生态,以便客户能在自家芯片(127607)(127607)(127607)遑强富XXvk9av*rzuMa.彳乙彳乙库曾R库智2023年,智驾相关大模型开始大量出现,如华为盘古大模型、百度文心大模型、毫末DriVeGPT等。亿欧智库:Al大模型发展历程性能(参数、层媾)语言类大模型CV类大模型通用类大模型(127607)强X-张库智得相关大楼5!智欧亿基于这!则的少M库3欧Z195020062014强(127607)富-张JSs导入IB/亿开发期GANGoogleOpenAIGPT
5、2,二工、NVDli.qpM小、G2)百度文心大模型阿里巴巴M6毫末DriveGPTUniADBEV+Transformer(127607)ThinkTwice微软FlorenceDALL强-E2202120222023时间8U77数据来源:亿欧智库20201.2.1数据端:基于BEV+Transformer的融合架构f可使大规模多模态数据更好地融合了亿欧智库(127607)(127607)(127607)从多传感器的融合趋势来看,目标级融合(后融合)是当前行业内主流的融合方案,虽然算法开发难度较低,但融合精度较低、关键信息易缺失,不适合未来融合趋势的发展。数据级融合(前融合)是行业发展的目标
6、,但技术壁垒高,短期内方案落地较难。所以,在不丢失关健信息的基础上,富富富张张张库存年智智智欧欧欧况。相反,基于BEV+Transformer的特征级融合方案,可以通过注意力机制提取目标物特征,并在鸟瞰图下脑补出完整的目标物信息,有利于提高整体感知融合精度。亿欧智库:多传感器的融合趋势变化亿欧智库:基于BEV+TranSformer架构的特征级感知融合方案优势目标级融合(后融合)优势:算法难度低、各传感器之间解耦性强劣势:关键信息容易丢失、整体融合精度低目标级融合方案采用的算法仍然是基于规则的运算,虽然方案整体的算法开发难度较低,但有效信息容息缺失.SS引出感知系统读报.鸿报等同SLa(127
7、607*1E.MfiMW劣势:算力消耗较高、时空同步难、运动*联误差大A数据级融合方案目前在行业内极少被使用,整体技术难度较高,在模型开发层面存在较多的棉霞特征级融合(中融合)之间融合效果较好gl公方MnMtt行*.优势:数据损失少、目标特征级信息使得不同传感器(127607现在5个摄像头(共8颗摄像头)中,但是每个摄像头可能只露出了卡车部分车体。对于传统规则算法(比如卡尔曼滤波),算法只会在出现卡车车体的摄像头内进行识别检测,强X张庠欧亿遮挡区域的目标,提高识别与融合精度。车轮、;瞬、车轮、油箱、窗户、车身、Transformer烟囱、窗户等烟囱、窗户等触机等融合效果好,容车身、轮子等特征级
8、融合(中融合)特斯拉在2021年的AIDAY,展示过一个大型卡车路过自车的场景,在某个时刻卡车同时出来源:亿欧智库高价值数据的比例低高价值数据通常指的是corner case (即长尾场景数据),随着L2级以上的自动驾驶功能 不断演进,越来越多的corner case会被挖掘出来,从而转换为common case,但是, 通过采集车收集回来的数据,由于数据最有限,使得ComerCaSe的比例会越来越低.(127607)b各类型数据的需求同步难Q27607)强强成熟导致了标注仍需依赖天工签:1/L高成本麻 诉、当前的演业的取蠢处正(存在大的手M工作比例,Ka斓标注环节,防标注肾法的不W欧K1.2
9、.1数据端:智驾大模型具备数据闭环的能力,解决主机厂在数据处理层面的痛点亿政智库(127607)(127607)(127607)自动驾驶产业在数据处理层面,面临着低效蔚口高成本的双重问题,比如cornercase的挖掘效率低、自动化数据处理程度低、数据标注和存储成本高等,这些因素阻碍了自动驾驶技术迈向高阶自动驾驶。然而,数据是驱动自动驾驶算法迭代的必要属性,能够利用好数据的公司,才可能进入K寓富nMrwrmc.库库库WW.ZjZZj欧ftK标注、模型训练、测试验证的一系列闭环流程,为主机厂进行降本增效。亿欧智库:自动驾驶在数据处理中面临的痛点地图数据采集成本高:在无图技术仍未成熟下,无论是重图
10、方案还是轻图方案,量产车的定位仍然需要高精地图或导肮地图的支持。据公开资料显示,地图精度达到10厘米级别时,每公里测量成本为10元,硒度达到1厘米级别时,每公里的测量成本则飙升至1000元. 数据标注成本高:(127607) 空末智行公布的图像数据标注成本约5元/张,而自动驾驶所需的数据体量约几十亿张,可见数据标注的成本非常高。富强 数据存储成本高:亿欧智库:数据闭环为主机厂带来的降本增效优势软件仿真模拟如何降本增效结果生成/分析车端模型部箸数据来源:公开资料、亿欧智库127607)曷Ota张net优化库亿IK降本,减少车端无效数据的采集/制定合理的数据存储方案/提升仿真测试的的场景覆盖度增效/优化车端采集数据的逻辑/提高自动化标注模型的效率/强化模型的训练和部署能力J优化工具链71.2.2算法端:高阶智驾功能存在一定挑战f智驾大模型可助力自动驾驶跳出恐怖谷”亿政智库(127607)(127607)(127607)自动驾驶系统存在着一个恐怖谷理论,即当自动驾驶能力从L2迈入L3后,将行成一个下陷的形态,此时人类对于自动驾驶技术的接受程度会降低,导致安全感急剧下降。其原因在于L3功能下,感知和定位的工作将会转移至车端,而驾驶员成为了辅助,促使系统需要具备较强的