互联网电商：大模型加速迭代聚焦AI应用落地正式版.docx

资源描述

《互联网电商：大模型加速迭代聚焦AI应用落地正式版.docx》由会员分享，可在线阅读，更多相关《互联网电商：大模型加速迭代聚焦AI应用落地正式版.docx（11页珍藏版）》请在优知文库上搜索。

1、行业报告一行业专题研究6L国联证券互联网电商大模型加速迭代，聚焦Al应用落地简述行业变化：基础大模型持埃升级演进，多模态成行业趋势。近期国内外Al基础大模型持续升级迭代，阿里、百度、微软、谷歌等头部大厂纷纷升级其基磔大模型，在多模态、长文本、逻辑思维等方面能力均显著提升，我们认为各厂商大模型能力持续升级，有望加速应用落地。底层架构的创新或引发新一轮变革。近期CMU和普林斯顿大学的研究者发布了全新Mamba架构，可以克服Transformer的致命缺陷：核心注意力层无法扩展到长期上下文。我们认为，底层架构的创新有望推动新一轮技术变革，提升Al应用落地效果。AAl应用逐步落地并商业化随着Al基础的

2、大模型的升级和优化，大量Al应用快速涌现，且已有较多应用进行了商业化。海外很多C端应用已经实现盈利，商业模式以订阅为主，应用更偏向于情感陪伴、Al绘画等泛娱乐应用。国内B端应用如智能客服、办公助理等也在快速落地应用，但C端现象级应用短抉。我们认为短期内Al应用主要在对准确性、专业性要求不高的场景，长期则有望向对准确性、专业性等要求更高的领域延伸，如教育、金融、医疗等场景。AAl视频生成领域逐渐突破Al视频生成是多模态领域最大的难题，因为融合了文本、图像、音频等多种媒介，因此在Al生成方面难度最大，当前Al视频生成技术仍处于早期阶段。但近期Al视频生成领域逐渐迎来突破，Runway的Gen-2、

3、Pika、字节的MagicAnimate、阿里的AnimateAnyone等产品表现亮眼，生成视频的流畅度、清晰度等均有较大升级。我们认为Al视频生成能力的提升，可广泛应用于电商、直播、影视等场景，助力相关公司降本增效。AlAgent有望加速应用落地AlAgent是具备环境感知、自主决策并执行的智能体，可以自主思考和调用工具从而完成既定任务，可以克服当前基础大模型存在的内容生成不准确、幻觉等问题，可以将用户从日常任务和重复劳动中解放出来，有望帮助处理几乎所有活动和生活各个领域的事务，对软件业和整个社会都将产生深远影响。“投资建议我们认为随着基础大模型的持续升级优化以及AlAgent技术的快速成

4、熟，Al应用有望规模落地，建议关注营销、游戏、教育等Al应用可快速落地的领域，具体标的上建议关注在Al应用积极布局且在数据、应用场景和应用生态方面积累丰富的公司如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒。风险提示：技术发展不及预期风险；竞争加剧风险；Al安全、隐私风险等。证券研究报告2023年12月08日投资建议：强于大市（维持）上次珑议：强于大市相对大盘走势作者分析师：陈梦瑶执业证书编号：S0590521040005邮箱:CmygI联系人：周砺灵邮箱：zhouIl相关报告1、互联网电两：谷歌Gemini正式发布，多项能力行业领先2023.12.07NM MBA .用其q*ywu. A

5、TMZMQR上Mn 会2 HlM.JU . M.m .1 JLCAJOn t ii1 .基础大模型持续升级演进头部科技大厂引领行业发展，多模态成行业趋势。由于Al大模型依赖庞大的算力资源、优秀的Al人才、丰富的数据等条件，海外逐渐形成了以微软/OPenAI、谷歌、Meta、AWS等科技巨头为代表的竞争格局。国内大模型厂商除了阿里、百度、华为、腾讯等头部大厂，科大讯飞、360、Minimax等一众厂商纷纷入局，竞争激烈。技术方面，大模型技术不断从文字、代码延伸至音频甚至视频领域，多模态成为主流大模型的典型特征。与OpenAI深度合作的微软行业领先，正在将OpenAI最新大模型GPT-4Turbo

6、集成到自身产品中，在多模态、长文档、知识库等方面全新升级，持续引领行业。北美时间12月6日，谷歌正式发布全新原生多模态大模型Gemini1.0,在推理、编程等多个方面行业领先。谷歌将在其相关产品中全面集成Gemini的能力，包括搜索、广告、Chrome、DuetAl等。Meta则押注开源大模型，LLaMA2已成为最优秀的开源模型之一，并衍生出过个应用和项目，但仍与OpenAL谷歌PaLM2大模型有差距。10月17日，百度发布文心一言4.0,理解、生成、逻辑、记忆四大能力都有显著提升。10月31日，阿里通义千问2.0发布，阅读理解、逻辑思维以及数据处理等方面的能力都有了显著的提升。我们认为各个厂

7、商大模型能力持续升级迭代，有望加速应用快速落地。图表1:典型Al大模型进展梳理maifct,A个憎c.资料来源：财联社、智东西、界面新闻、36起、金融界、机器之心Pro,澎湃新闻、界面新闻、新智元、华尔街见闻，国联证券研究所整理底层架构的创新或引发新一轮变革。TranSfOrmer是目前Al大模型的主流架构，但TranSfOrmer存在致命缺陷：TranSfOrmer模型中自注意力机制的计算量会随着上下文长度的增加呈平方级增长，导致核心注意力层无法扩展到长期上下文。近期CMU和普林斯顿的研究者发布了新的SSM架构Mamba,这种架构在语言建模上与Transformer能力相当，而且还能够线性扩

8、展，同时具有5倍的推理吞吐量，在语言、音频、DNA序列模态上都实现SOTAo我们认为，底层架构的缺陷直接影响大模型的效果和性能，底层架构的创新有望推动新一轮技术变革，加速Al应用落地。图表2：Mamba与Transformer吞吐量对比( / Suez) -ndc6noqA1248U 32 M 12Batch size46Trnforr 1 38Mamtoa 6.9Tnn*formr 6 7BInference throughput on A100 80GB (prompt length 2048)资料来源：Mamba:Linear-TimeSequenceModelingwithSeIect

9、iveStateSpaces,国联证券研究所2 .应用落地多点开花2.1 Al应用逐步落地并商业化随着基础大模型的持续升级和优化，大量应用快速涌现，其中海外应用起步较早，已经有比较多的Al应用进行了商业化落地。根据美国风险投资公司A16z提供的TOP50的Al产品榜单，海外很多C端应用已经实现盈利，商业模式以订阅为主，应用类型则更多偏向于情感陪伴、Al绘画等泛娱乐应用，如C端情感陪伴类应用Character.AlAl绘画应用Leonardo,ai0国内Al应用虽然起步较晚，但Al相关应用快速涌现，尤其是B端应用如智能客服、办公助理等，C端应用相对较少，类似妙鸭相机这样的应用短缺。我们认为，在A

10、l应用落地早期以对话机器人Chatbot和简单的工具应用为主，主要在创意设计、聊天互动等对准确性、专业性要求不高的场景，长期则有望向对准确性、专业性等要求更高的领域延伸，如教育、金融、医疗等场景。图表3:Al应用落地节奏复余任善:件等Ir 影制段计办公松件电育务眠疗It A国单任务资料枭源：澎湃新闻，36 &.国联证券研究所整理2.2视频生成领域逐渐突破Al视频生成是多模态领域最大难题。与文字、图片相比，视频是融合了文本、图像、音频等多种媒介的综合体，在表达、画面丰富性等方面具有较大优势。也正是因为视频内容的复杂性，导致在Al生成领域视频内容生成成为一大难题，目前文生视频技术仍处于早

11、期阶段。这与视频生成工具的底层原理类似，目前主流的文生视频主要包括犷散模型、生成对抗网络GAN以及Transformer模型，但扩散模型采样速度较慢，GAN存在训练不稳定的问题，TranSfOrmer模型质量高但计算成本大。同时在数据方面也面临较多问题，文生视频缺乏高质量数据集，且视频生成需平衡空间与时间信息，模型迭代方向集中在提高生成质量与连贯性。routsOutputCuts rt ryDiffusionimagePredicted noisej*J-因丁 rj切Ei3图表4:Al视频生成三大方案GNTranSfornWr资料来源：StableDiffusion.36Thalles

12、Silva,国嵌证券研究所Al视频生成逐渐突破，应用前景广阔。近期Al视频生成领域国内外进展迅速，Gen-2、PikaI.0、字节MagicAnimate、阿里AnimateAnyone等产品均有亮眼表现。11月3日，Runway视频生成工具Gen-2迎来重磅更新，在文生视频和图生视频中为结果的保真度和一致性带来重大改进，克服了早期版本生成视频内容不连贯、闪烁变形以及低清等问题，视频效果甚至达到4K超逼真的高度。11月29日，成立仅半年的Al初创公司Pika正式推出Al视频生成工具Pika1.0,支持从普通2D动画到实拍感的电影场景、3D动画的生成，还能够支持对视频实时编辑和修改，其中生成的视

13、频在光影、动作流畅度等方面甚至都不输好莱坞动画电影级别。近期阿里和字节也推出了自己的Al视频生成工具，阿里推出了AnimateAnyone,只需提供一个静态的角色图像（包括真人、动漫/卡通角色等）和一些动作、姿势（比如跳舞、走路），便可将其动画化，同时保留角色的细节特征（如面部表情、服装细节等）。字节则联合新加坡国立大学推出了MagicAnimate,同样是利用Al技术，将静态图像变成动态视频。我们认为，随看Al视频生成技术的不断优化，其应用前景广阔，可广泛应用于影视、游戏、电商等场景，助力相关公司降本增效。AliilmIQC AjIyuIIcPilui LU资料来琼：新智元、36且、量子便、

14、Arxiv.org.国联证券研究所2.3AlAgent有望加速应用落地AlAgent是具备环境感知、自主决策并执行的智能体，可以自主思考和工具调用从而完成既定目标。我们认为，在基座大模型能力不断优化完善的背景下，AlAgent有望成为应用落地的主要路线之一。因为大模型基于Prompt进行被动交互，而且Prompt的质量会直接影响大模型的回答效果，大语言模型应用落地仍面临诸多挑战，尤其是基础大模型仍不完善，存在生成内容不准确、存在幻觉等问题。而AlAgent可以基于目标任务主动思考并行动，还能调用外部工具，可释放LLM的应用潜能。AlAgent可以帮助用户从日常任务和重复劳动中解放出来，从而缓解

15、人类工作压力并提高任务解决效率，同时智能体可以独立地分析、计划和解决问题，不再需要用户提供明确的指令：在解放用户双手之后，智能体还解放了他们的思维，使他们能够从事探索性和创新性的工作，在前沿科学领域充分发挥他们的潜力。总之，Agent有望帮助处理几乎所有活动和生活各个领域的事务，对软件业和整个社会都将产生深远的影响。图表6:AlAgent工作原理资料来源：B.国联证券研究所AlAgent浪潮将至。AlAgent是近期社会关注和热议的方向，国内外厂商纷纷布局。阿里云推出模型调用工具魔搭GPT(ModeIScopeGPT),用户可以通过一键发送指令调用Mota社区中其他人工智能模型，从而实现模型的协作，完成复杂的任务：昆仑万维正式发布“天工SkyAgentsv平台，用户可以通过自然语言和简单操作，无需代码编程，即可在几分钟之内部署属于自己的AlAgents

展开阅读全文