《AI大模型技术的五个特征及五大启示.docx》由会员分享,可在线阅读,更多相关《AI大模型技术的五个特征及五大启示.docx(15页珍藏版)》请在优知文库上搜索。
1、AI大模型技术的五个特征及五大启示2023-07-14发布于:山西省ChatGPT是通用人工智能(AGl)发展的重要里程碑。通用人工智能(AGI)将引发新一轮数字技术竞争格局重构,也是大国产业竞争的制高点,必将对未来5-10年全球技术创新、企业竞争和国家博弈产生深远影响。从IT时代、互联网+时代迈向智能时代ChatGPT两个月内用户超过1亿,四个月用户超过10亿,成为历史上增长最快的互联网应用产品。GPT-4的功能在GPT-3.5的基础上进一步迭代,实现了4个跨越:从“文本理解”到“图像理解”,从“普通生”到“尖子生”,从“文科生”到“理科生”,从“对话理解”到“全文理解”,从“意图理解”到“
2、创意实现”。ChatGPT开启了一个新时代:从IOE主导的IT时代,到计算机及智能移动终端普及驱动人类迈向互联网+时代,到今天万物互联、万物智能及Al大模型开创的智能时代。智能算力的扩张是开启智能时代的风向标。5月25日英伟达市值暴涨2000亿美元,涨出一个AMD、两个英特尔。10年前英伟达市值相当于英特尔的1/6,今天相当于英特尔8倍,10年收益率超过100倍。5月30日英伟达市值超过1万亿美元。新一轮Al技术所产生的革命性影响是有目共睹的,正如5月3日Al教父级人物杰弗里辛顿(GeoffreyHinton)从谷歌离职后所表达的核心观点:“AI的崛起对人类的生存构成了威胁,与核武器的使用不相
3、上下”。5月16日OpenAI公司董事长SamAItman在出席美国国会听证会时说,对待Al应该参考核武器的监管方式。Al大模型技术的五个特征从技术变革的历史和产业演进的全局视角来看,Al大模型技术有五个特征:一是颠覆性:Al大模型具有颠覆性技术的潜质。GPT4编码能力已相当于谷歌年薪18万美元L3工程师;GPT4相当于中国月薪3万元的软件开发人员。未来,50%的软件代码将会被Al接管。今天的Al大模型像历史上的火药,正在从放烟花时代走向枪炮时代,实现从冷兵器到热兵器的跨越。二是涌现性:模型参数超过临界值,人工智能能力会实现突变。三是工程化:Al大模型一半是工程、一半是理论,Al大模型是工程化
4、的重大创新,其核心技术壁垒是数据、算法、算力等要素资源的精巧组合。OpenAI不只是一群科学家,更是一群动手能力极强的工程师。四是密集型:Al大模型是技术、资本、人才密集型产业。大算力、大数据、大模型决定了Al大模型竞争,这是一场大国的游戏、巨人的战场、工具的革命、生态进化的力量。五是通用性:通用目的技术(GPT)是对人类经济社会产生巨大、深远而广泛影响的革命性技术,如轮子、印刷、内燃机、电力、计算机、互联网等。AGl可能是人类历史上最伟大的通用目的技术,是人类社会第25个通用目的技术。这一轮的人工智能的突破,对于一个国家的数字技术创新有哪些启示?我认为有五个方面Q启示1:云计算+Al巳成为数
5、字时代的创新基础设施云计算不仅仅是一个商业的基础设施,更重要的是,它是一个创新的基础设施。前一段时间,有人会问“为什么中国没有ChatGPT?我说要想真正找到答案,这个问题问错了,正确的提问姿势是“中国为什么没有OpenAI?中国为什么没有Snowflake?中国为什么没有Palantir?”OPenAl于2015成立,估值290亿美元。因为ChatGPT,人们都了解了这家公司。但美国类似的数字科技公司还有许多OSnowfIake是巴菲特50年来首次参加IPo的公司,2020年上市的时候,销售额只有3.5亿美元,但市值超过了700亿美元。它只做了一件事,就是把数据库这件事情在公共云上重新做了一
6、遍。启示1:云计算+Al已成为数字时代创新的基础设施中国为什么没有chatGPT?这个问题问错了正确的问题是,中国为什么没有OPENAl?中国为什么没有SNOWFLAKE?中国为什么没有PaIantir?ChatGPT:数字创新森林中的两片叶子OpenAI帕兰迪尔 PaIantir (2004年)CEO: 战场或法的喊力, 相当于战术武器对付常规武器PaIantir市值最高4( 一不变筱鹏然snowflake*2012成立,2020年9月17日上市:700亿美元,最高IOoo亿美元用户增长2天内注册用户数达到100万, 两个月,月活1亿,估值290亿美元.创软件公司史上最大规模IPo纪录、全美
7、最大IP。基于云把数据库重新做了一遍.巴菲特50年来首次参加IPO.帕兰迪尔(PaIantir)是一家美国大公司数据,2004年成立,市值400亿美元。2023年1月华盛顿邮报有一篇文章说“俄乌冲突已演变为“算法之战”,算法公司已经成为一个新的军火商。帕兰迪尔CEO说,战场算法的威力,相当于战术武器对付常规武o当ChatGPT成为聚光灯的焦点,需要关注美国数字创新生态美国不仅有OPenAI、Snowflake,帕兰迪尔(Palantir),还有许多类似的创新公司,美国有100亿美元到IooO亿美元的公司有几十家。市值加起来大概有2万亿美元,中国类似的创新公司市值在100o亿美元左右。这些公司的
8、规模可能还比较小,不能和微软、谷歌、亚马逊比,但他们可能是未来的微软、谷歌、亚马逊,成为引领和参与全球竞争主力军。今天,我们把所有的聚光灯都聚焦在ChatGPT上。在我看来,ChatGPT只是美国创新森林里的一棵树上的两片叶子,今天我们把所有的聚光灯都聚焦在这片叶子上,把这片叶子都快烤黄了。我们需要思考的是:这棵树是什么样子?树根长成了什么样子?它有什么样的土壤?创新的森林生态是什么样子?只有我们把这片森林、这片土壤、这片树的规律都搞清楚了,我们才能找到这一轮数字技术创新的底层逻辑和规律。只有这样,我们政策才有针对性、前瞻性和可操作性。为什么美国会有这么多数字创新企业?原因有很多,但在我看来,
9、最重要的原因是美国有一个创新的基础设施,这个基础设施叫做公共云。今天人们更多认为公共云是一个商业基础,事实上,公共云是一个创新的基础设施,它在源源不断的蜉化、孕育、催生一批创新的企业。公共云是自由流动的大江大海,私有云是封闭孤立的小湖小泊云计算是数字技术孕育孵化的创新基础设施云上创新与美国差距仍在扩大公共云VS私有云公有云自由流动的大江大海私有云:封闭孤立的小湖小泊公有云是第二次大航海时代的土地,是孕育新技术、新企业的摇篮,如SNOWFLAKE中国GDP相当于美国70%美国SaaS市场规模为1198.7亿美元美国公共云算力规模的占比60%,欧盟50%云计算规模相当于美国30%中国SaaS市场规
10、模为49.5亿美元:少涉濯中国云计算占算力规模的28%-云计算是当下Ak软件、通信、大数据、芯片乃至自动化等新一代技术融合创新的大熔炉,是今天所有数字技术和自动化领域企业必须攻占的山头和技术形态演进的终极归宿,云计算是数字时代最重要的基础设施,中美在这一领域的差距巨大,并仍在扩大。中国的GDP相当于美国的70%,但中国云产业只有美国的30%。中国的SaaS市场规模不到50亿,美国有100O亿。更重要的是,今天我们都在讲“算力”,脱离大规模应用场景和需求、孤立讲“算力”会遮蔽我们对本质问题的理解,会误导我们对中美差距的认知。只讲“算力”基础设施,就像我们只讲“公路”基础设施一样,只讲一个国家的公
11、路里程是几万公里是不够的,人们需要知道高速公里、一级公路、二级公路、乡村小道是多长;就像我们只讲“铁路”基础设施一样,人们需要知道350公里的高铁、60公里的绿皮车有多少公里。公有云不仅有更高的算力资源输出和运行效率,更重要的是,它是第二次大航海时代的土地,是孕育新技术、新企业的摇篮。公有云对CPU的使用效率,大概可以相当于私有云的5-10倍。公共云是“350公里的高铁”、“高速公路”,私有云是“60公里的绿皮车”、“二级公路和乡间小道”。我们不仅要关注算力规模,还要关注算力以什么样的方式提供服务的。今天美国的算力有60%是以公有云的方式来提供,欧盟是50%,而中国只有28%。有人说,我们家财
12、大气粗,并不在乎算力的输出效率,不在乎资源利用效率,算力是“350公里的高铁”或是“60公里的绿皮车”并不重要,这对于一个单一企业也许是对的,但这种模式将国家统一算力市场碎片化,肢解了整个国家数字创新生态,遏制了数字技术创新步伐,削弱了国家数字生产力提升。如果说公共云是自由流动的大江大海,那么私有云就是封闭孤立的小湖小泊。只有在一个庞大的公有云体系上,在“大江大海”这样有深度、有广度的水域中,才能够孵化出新的技术和新的企业,比如OPenAI、Snowflake帕兰迪尔(Palantir)o即使中国有SnoWfIake公司的技术能力,这样的公司市值也非常有限,能整合的创新资源是有限的,因为“私有
13、云”就是封闭孤立的小湖小泊,无法孕育SnOWfIake这样的鲨鱼、鲸鱼Q这个问题背后的核心是,我们要认识到这一轮的创新是“公有云+AI”技术体系的创新,公有云是一个创新的基础设施。技术创新生态在人类历史上从没有像今天这样如此重要。今天,新一轮大国竞争,很大程度上体现为各类技术平台及其生态系统所承载的创新体系之间的竞争。启示2:数字时代反思基础研究与应用研究的关系这一轮的人工智能,对我们所有的从事创新事业的人来说,都要重新思考一个基本问题:什么叫做基础研究、什么叫做应用研究?基础研究跟应用研究之间是一个什么关系?当我们讲到这一轮的AGI,讲到Al大模型的时候,我们在思考一个问题:今天Al大模型的
14、基础理论来自于哪里?企业是Al大模型理论+工程化的主力军1972年IBM沃森实验室基于统计的语音识别的框架2017 年GooGLE大脑TranSfOrmer理论模型企业是Al大模型发现发明的主力军2022年1972年费里尼克 (Frederek Jelinek)美国工程院院士,在 IBM沃森实验室(IBM T.G.Watson Labs), 领导了语言识别实裟 室,提出了基于统计 的语音识别的推架.,WlljlC)PenAl工程大模型的涌现GoogleBERT(X)MetaLLaMA平台型技术创新体系基于数字技术平台,面向海量创新需求进行精准感知和同察,通过对全球创新资源的广泛连接、高效匹配和
15、动态优化,构建起多主体协作、多资源汇集、多机制联动的创新生态,进而形成新技术、新产品怎y透宓博孵化、规甑散、触舒网新0断体系-G女攸密中美爰距在三个实脸室(陈佳洱),大型科技企业是基础研究的生力军,并具备孵化世界先进水平的潜力.今天讲的Transformer理论模型也是来自于谷歌这样的公司。今天我们看到有一些科研院所也在参与,但是主流的工程化模型主要还是来自于企业。企业不仅Al是产业化、工程化的主力军,也是基础理论创新的主力军。伴随着Al大模型研究兴起、门槛提升,大学和研究所的主导作用不断弱化Q在数字技术创新的特定领域,当企业成为发明-发现的主力军时,需要思考什么是“科技转化”?为什么要“科技转化”。在新一轮Al创新体系,谷歌、Meta等这些科技企业,本身不需要去做传统的“科技转化”,因为在这些公司里,基础研究、应用研究和产品开发是一个有机的整体,是一个不断迭代的一个过程。大型科技企业是基础研究的生力军,并具备蜉化世界先进水平的潜力,而且无需“转化”。在云计算、人工智能、大数据、区块链等前沿数字技术领域,大型科技企业已经是数字科技创新的核心力量。反思“基础研究-应用研究”二元分割认知在数字时代,创新体系已经发生了变化。2021年5月,美国参议院通过了无尽前沿法案,这个法案的源头是1945年“曼哈顿工程”主管范内瓦布什,他给时任总统罗斯福写一个报告科