《2024基础模型的负责任开源-超越开源闭源的二元对立:负责任开源的内涵、实践与方案报告.docx》由会员分享,可在线阅读,更多相关《2024基础模型的负责任开源-超越开源闭源的二元对立:负责任开源的内涵、实践与方案报告.docx(71页珍藏版)》请在优知文库上搜索。
1、基础模型的负责任开源超越开源闭源的二元对立:负责任开源的内涵.实践与方案安远A1.北京大学人工智能研究院/北京大学武汉人工智能研究院北京通用人工智能研究院/A2024年4月执行#要1.开源片91巳成为包新的重要塞动垃一根据斯坦福格2024年A1.指数报告1,2023年全球息共发布了143个基础模型,比2022年发布的数翻了一倍还多,祖更高捌是开的。在这些新发布的模型中,有65.7%是开源的,相上之下,2022年只有44.4%,2021年只有33.3%的模型是开源的。根据全球开源社区HUggingFaCe的调研2,Uama1.利1.1.amaZ1.I在已值轴了3万个哥So多位专家预计,即将推出的
2、Uama340OB将会是“首GPT4级别的开源模型。2 .如何海开期1已成为短期内真的未解决议之一本报告从安全治的肥探讨开3的政策和实H在制定相关政策时,各国需要综合考虑促进创新生发、技术的安全性与可控性、隐私保护、知识产权、伦理与责任、国际合作与标准制定,市场竞争环境、教育与公众参与等多个董这些维度与各国的战略考虑及监管取向相结合,共同构成了开源A1.的治理政策框架。全球范ES内,许多国家和地区,包括欧盟、美国、英国、法国、中国以及其他全球南覆家,都在积极制定A1.相关政策,开源内也成为多事政策探索的铁心尽管这些政策旨在平衡技术发展与安全需求,在监管取向和具体条款的设计上存在显著差异,这部分
3、原因是由政策制定过程中缺乏关于血、收益及潸在影响的严谨证据。3 .前沿AI开源的主要争论领先的基础模型研发机构近年决定开源其模型或限制对其模型的访问,引发了关于是否以及如何开放能回增强的区础模型的争论。我们识别了两种主要士扬:*审慎开放的倡导者,他们担,谢沿A1.开源成为潜在不安全技术不彳逆,的,并主张在确保安全的星批上逐步推进开放;另KI1.是mIa开放的支寺者,他们认为前沿A1.开源是保时技术借任的一,径,强调开放性对于促进创新和透明度的重要性,并反对过度限制的做法。尽管在血与收益的评估、开源放、安保措施以及监管政策等方旃在分歧,(&两0认同开放住在推动技术利促建社会福祉*作用,以及沿A1
4、.开源的潜在O,主费在开W座果M必要的评答安全辖此外,从企业视f滑.有关开源和闭源的讨论和实践*少*1相宜利注的.StanfordHAI.-2024A1.IrKJeXReport.2024-04-15.2C1.emDe1.angue1-Uama3Isofficia1.1.ythefastestmode1.fromre1.easeto1trendingonHuggingFace-inJUStafewhours/.2024-04-13.4 .三U简单化的开放与封闭论虽然开放基册模型带来了发展与安全之间的紧张关系不可能完全消除,但我们IHnR单化的*接角,探索更丰富的夏布政策设计空间.将A1.模型简
5、单地划分为开源或闭源是一种过于简化的做法。开源A1.的概念尚未得到清晰定义,与开源软件不同,A1.模型的一源代图可能包括多种组件,这些组件的开放程度可以各异。此外,从“完全开放”到“完全封闭”的发布选项实际上是多样的,需要明确的标准和定义来权衡透明性、安全性和商业考根据多个f饯的安全和治理评测,我们依然程得到开放或封闭模型哪个:有明显优势的结论.综合模型安全性评制,开放模型和封闭模型均显就对各种攻击的脆弱性。A1.研发机构治理评测指出,懊向于开放模型的机构和倾向于封闭模型的机构各有所口)责任发布:更广义的负责任开源负责任开源之二:负贵任开源之一:在封闭发布中探索实现开源皆效收减的替代方IB俣进
6、开放发布从构建到使用的全流程负费任实践I三wff1.IIR的AP1.访国牧可用权,、代叫Q败露可用开MH度无筌闲RIM的枚.KSIOMtB可用例FUEintOPtCPT-4MIGoog1.e)(Inf1.ea1.on1.(OpcnM)GPT-35(OpcnA1.I1.1.ama2B1.ooM2CPTNkmIMfm(Bqkxnce)(E1.cuthMU)开放基砒覆里本报告的讨论苑制设定参考了斯坦福将基础模型研究中,曲.开放基础模型”概念图35 .推动*(量负责任开源的务实用开源是科学和创新的重要驱动A,但同时需要权衡其潜在,对未来更强的前沿A1.不同程度开源可能弓I入更X的潜在区。因此.我们建议
7、推动位责任开源,这包括两个层立:第一,促进开放发布从构便月的全g负责任实建议根据基础横型的痴周期H程阶段,设计构建和使肺段的负责任开源维度,并针对不同能那别的模型制定差异化的负责任开源要求。例如对于将数A1.模型,负责任主要体现在提施明度、晌保合规和促进创新。而1于能力2三:强的前沿模型,需要实施与模型的潜在聿相称的评测和安全端解措施3RishiBommasameta1.eConskferatKjnsforGoverningOpenFoundationMode1.s,2023-12-13,执行要第二,在封匍发布中爆家实惠开爆等效收款的代琮.建设开发者应考虑开源的曾佑案,在获得技术和社会效益的同
8、时,毁有太龙勺匚脸。包括为受信任的研究原提供结树匕访问,以帮助识别安全或道德缺陷,封励独遂三邠审核等。虽然产格Jt史上或1讨论的是“负费任发布,但我们希望通过突出负责任开源微念,推动开源A1.安全治理的讨论,并促进负责任开源实践的发展。4.岫四类序郦体和国际合作分期提出我本报告是为中国的研发机构、Ai开霖社区、AM三MK三*.A1.投K掠置助方耳的,其用是作为基酬模型的负责任开源的决策和实践的参考。我们的励相关机构和专家迸力探讨负责任开源的内涵,实施负责任的开源实践和方机SUn身在全球JM1.内开合*,通过负责任开源助俄展中国家提升A1.技术和治理能力,推动形成具有E共识的息地模型治理框架和标
9、准规范。开源A1.的负责任实蹑并非成不变,癌会随着技术发展和社会需求的变化而FBi演进。可以预口,未来开源与闭源的讨论将加深邓细化,可能会出现多创新的发布横和治理机制,以适应不断变化的环境和挑战。在这个过程中,各碱合作和对话将涿重要C术语定义本报mmuu负责任开(机学习Kf1.Uf1.关术语,主”斯坦福旭、ff*三ft: *Mf1.(FoundationMode1.):在规模广乏数据上训练的模型,使其可以适应广乏的下游任务:国内外学界通常简称为型。Ma开褰融开放相关术语,主”青俎福犬氏将研究机构: 开舞AI(OPen-SoUr8AI):概念尚未得到清晰定义,不同机构都脂来表示F同程度的“公开可
10、用;开放源代码促进会(OSI)等机构正致,才明确定义开源AI。 开放8t(0PenFoundationMode1.s):基础模型在发布时,其权重是S可的:不严格区分时,也会称为一开源基础模型开放模型“开源模型。 Mm*Mf1.(C06edFoundationMode1.s):基梯模型在发布时.其权茂不是广泛可用,可能受一定限制或完全封闭:不严格区分时,也会称为“闭源基础模型封闭模型”“闭源模型受限模型。 负责任开源(ReePOEweOpefvSource):开源项率维护者和贡献者在开源过程中遵循一定的道德和法律标准,物保技术的构建和发布对社会和个媳安全和有益的,这可能包括安全性、透明度、可访问
11、性、包容性、合规性、社区治理和转和创新影响等方面皿能那关术语,主摩AI安全峰会、沿m论坛: 沿AI(FmntierAJ):谶加通恻模型,能执行至的任务,并达到或貂过当今最先进模型的能力,最常必是基础模型,提供了最多的机遇但也带来了新的陶Etiift相关术语,主要”啜旭研究机构: 灾住CM(CateSfrophfcRfek):用可筋发物事件或过程,若发导致全球约10%或:三E多人口次生,或造成类似损害。致谢本报告的主要贯前者:安远A1.:琉(主要撰写人)、谢旻希、程远、段难文匕京大学人工皆爱研究院:杨耀东北京澄武汉大国能研究院:享凌云t京通用人工智能研究院:鼻思源感谢北京通用江智能研究院院口北京
12、格人E智能研究院院松我教授,北京将座能研究院人I智幡安全与治理中,法任、北京格武汉N:智修研究院副院口长平教授.给予的悉,格导和宝贵建议_。播谢安远A1.伙伴潘汉口张玲、王婚闻内容的贡献。酸车滥金11各EHI极度布相关神,开M分取向不同11.1 欧盟皆Ai法案3创全球倒全面U监管法.设独特开源骼免规定11.2 美国至AI彳油命令3关注广泛可滕模型权重所带来的挑战31.3 英国政策即谨慎对待开放与封闭之争,防范监管捕获G1.4 法国将开源A1.作为其“创新优先”发展A1.的核,液略之一71.5 中国工智能法的两份专家建议稿对开源问您做不同处理31 .G其他全球南苗家獭A1.匚磴与收益研究,以开放
13、科学应对全球发展111.7d122 仅开放VB题开放,沿A1.开的主要争论132.1 争论主要在于前沿A1.的黑曲失控挈132.2 立场一:审慎开放,防范端的开放US须标准更是152.3 寸扬二:褪开放,边际子的严谨证据仍相当有限132.4 两种的的异同点242.5 争论之外的源三:是否开源主要取决于商业考量252.G/JS2G3开V8用案,是说的工法273.1 不周于开源软件,开源AI的概念尚未得到清晰定义273.2 从完全开放到完全封闭1之间存在多种模型发布选项233.3 基础模型安全性评测:开放VS封闭模型均显础对各种攻击的脆弱性333.4 A1.研发机构治理评测:顿向于开放VS封闭模型
14、的机构各有所口383.5 负责任开源之一:促进开放发布从构建到使躺全流程负贡任实践433.6 负责任开源之二:在封闭发布中探索实现开源等效收益的替代像433.7 结534对推动负责任用!(的议404.1 基讹模型研发机构GO4.2 A1.开源社区G14.3 A1.治理、政策和限专家G24.4 A1.投资承资助方G34.5 负责任开源的国际合作G3V1.1各国积极发布基础模型相关政策,开源部分取向不同我认为,如何监管开源人I智能,是短期内最重要的未解决问题。i1.1.口库斯(GaryMarkus)Davx1.Harns.,Open-SourceA1.IsUnique1.yDangerous*,2
15、024-01-12.EuropeanPar1.iamenteAHificiaIInte1.1.igenceAct,2024-04-23(IMHW),0GanVOiPiCe.PowergrabbyFrance.GermanyandIta1.ytrv,eaterstoki1.1.EU,sA1.bi,2023-11-20.各国在制定开源A1.相关政策时,通常需要综合考虑促进创新筋.技术安全与可控性、隐私保护、知识产权、伦理与责任、国际合作与标准制定、市场竞争环境、教育与公众参与等多个7,这些维度与各国各地区的战略考虑或监管取向相结合,共同组成了对于开源A1.的治理政策框架。欧盟、美国、英国、法国、中国和其他全球南将国家和地区在开源A1.的治理上,虽然都希望能平衡发展与安全,但整体监管取向和具体条款设计有所不同。1.1欧CAI法案