《【中文版】Claude3技术报告.docx》由会员分享,可在线阅读,更多相关《【中文版】Claude3技术报告.docx(45页珍藏版)》请在优知文库上搜索。
1、CiaUde3真弊I:作品、十四行诗、俳句抽象的物i雕出OaUde3,T3多式联砂号系列Claude3Opus,我IijS强大的产品,Claude3Sonnet,它提供技能和速鲍结合,以及CIaUde3Haiku,我们最快且最便宜的型号,所有新飕都具有视觉功能,使它们僻处理和汾析图像数据。OaUde3系列?i基邮估中翻!出姆的能,并为推理数学和三S的测量树立了新标准.OaUde30PUS在GPQAULMMLURkMMMU新科坤聃目了,Oaude3HakuClaude2KfS三好,而Sonnet和OPUS则明显优于它.此外,这些触国唳语语言方西自咄更高的渐胜,磔更适合5中承诺的灾难性风险评估.1
2、简介逊野STOaude3系列斑,该耀田包里、数裳编码、多语言理解柳啖质方面树立了新的行业基告与其前身f,Claude3模型采用了各种Ul练方法,例如无治酱学习不晓去人工智能6.这些睡使用AmazonWebServices(AWS)和GOOgIeCloudPlatform(GCP)加锚刑Il练,核,WW刨舌PyTorch(7、JAX8和Triton9.CiaUde3系列的一个关键增强功能是具有文本输出的多簿端叭功能,允许用户上蟠像(施诔格、图表、照片以文本提示,以将吕更丰富的上TxW三)用例,如图1娜录B球li三5Ji三KlM(三(场为球确,俺将Oaude店门的自定义工饰程中.OaUde3Opu
3、sS智除耀,海理、数学和Si颤跄了新标造OPUS和Sonnet陪咄了瓦瞰微的内容创建、分析、琬欧准蹴绮fl处理科学查询方面的陋程度,这些飕旨在帮助企业颠筋自创匕i三2三三P6SM?创收、UxW)Qt三:IOT发Claude3Haiku是品4W、三,就还包括视翻熊整个Claude3系列码任翻!醐牙语和日日演语语言的流畅14方面匕啕i几代产品有T显制舐,从耐叮翻南睡和史广醴的Claude3雌系列由Anthropic开发并于2024年3月宣布,将谈们的消费者产品(QaUde.ai、ClaudePro)以及AnthropicAPLAmazonBedrOCk和GoogleVertexAI等企业解决方案中
4、提供.Claude3模型的知识截止日期是2023年8月.谢甦杰并不旌畸凶阴雨的研究,为了全面了雌询i剖屏卿估方法,我们三5蹴藤我116三笳蚊(颇D,评估中邮俄)1我们封寺JPEG/PNG/GIF/WebP,最大IOMB和8000x8000px.我们建议避免使用小或低分辨率的图像。人工智修统口0)、减少危翻刈队语言模型in大型语言模型中的除自我纠正能力口2).衡量语言模型中主观全球视频表征口3)、前沿威购队人工智统全口4),以及我(i郑加I费任的T展政策以解决灾难性风险.除了我们的公共研究之外,我IiJ还致力于在行业,政府和民回社会之间分享研究结果和最佳螭,并定期与利S相关者接触,分享!J三11
5、S佳3侬.我(i硼里在继姗丽袖前沿慢型的过程中发布新的融2型号详情2.1 预期用途克劳德被训练成一名乐于助人、诚实且无害的助手.Claude模型长就想法进行开放式对话和协作,并且硒S码任务和处理文本时也表现出色无论是搜索、写作、编辑、概述还是总结.2Claude3系列的多模式功能可以卿视觉输入(例如图表、图形和照片)以支持M他用例和生产九克劳德蝴有一种乐于助人、健i嫡语气,可以对.个性进行指M用户将它们描述为感觉可购、适应性强且有吸引力.Caude使用用户输入的所有文本(提示)以及迄今为止在对话中生成的所有文本来预测下一个最有帮助的单词或标记。这意味着Claude-次演褥构造一组字符的响应,在
6、枪腱响应后,它无法回并编审响应,除非用户在后续提示中给它机会这样做.朝德也只能看到(并做出预i三其上下文窗口中出现的内容.它无法记住以前的单独对话,除非用户田S示中更新插入此类材料,也着甜丁开链接.2.2 意外用途这稣型不应在高风险情况下隼独使用,因为错误的答案可能会造成饬蒿例如,虽然相德模型可以支持律师或医生,但不应部署它优廉代替徒师或医生,并且任何响应仍应由人类审查。Claude模型目前不会搜索网络(尽管用户可以要求他们与直接共享的文档进行交互),并且模型仅使用截至2023年中期的数据回答问题.Claude模型可以连接到搜索工具,并经过彻底的训练来使用它们(通过网络或其他雌库),但除三闿胡
7、脂出,否则应假设Claude模型没有使用此功能.Claude模型具有多语言能力,但在资源匮乏的语言上表现较差(请参阅下面第5.6节中的多语言评估,了解更多详细信息).2.3 禁止用途我iW可接受使用政策(AUP)口5包含有关禁止使用案例的详细信息.这止的用途包括但不限于政治竞选或游说、监视、社会评分、刑事司法决定、执法以及与融资、就业和1据有关的决定。AUP还概述了商业用途在鹿矽保全要求,伤Itt腰辘室正在使用的人工智能系统并概述其功能和限制。AUP还详细说明了用陛用例需要实施人机参与8版AUP适用于图像和文本提示,所有Anthropic用户在访问QaUde模型之前必须阅读并明确承认AUP.我
8、HJ定期审查和更新AUP,以确保我们的产晶尽可能安全和值得信赖.2.4 防止滥用检测和减少对我n/术的禁止使用对于防止不良行为者滥用我们的模型生成滥用.欺骗或误导性内容至关求要.我们使用自动化系统实时检测发生的AUP违规行为.被标记为违反AUP的用户提示会触发我们的模型做出更加谨慎响应的指令。如果用户提示特2有9更多信邮睦议,们的文档:严朝有害的我们将完全阻止模型做出响应如果屡次违规我们可能会终止用户的QaUde访问权限2.5 训练数据ClaUde3楔型接受了俄至2023缶8月互联网上公开可用IS息的存有组合的Ul练以及来自第三方的非公开数冠数据标蓄服务和付费承包商提供的数铝以及我们内部生成的
9、数据我们采用多种效宪演理和过滤方法包括重烫故据删除和分类QaUde3模型套件尚未接受过用户或客户闿括免员用户ClaUdePro用户和MI客户涯交给我们的任何用户褒示或1出数福的训练当Anthropic通过抓取公共网页获取数据时我们会遵循有关robots.txt指令和网站运营商用来表明是否允许抓取其网站内容的反他信号的行业惯例根据我们的政策AnthBPiC的偃虫程序不会访问受密码保护的页面或登录页面也不会绕过验证码控制并且我们会对我们使用的数据进行尽职调直Anthropic透昭地运行其J行系统这意味着网站运营商可以轻松识别Anthropic访问并向Anthropic表明他们的偏好2.6 训练过程
10、糊德接受的训炼重点是乐于助人无害和减实,训练技术包括对大不同数据进行预训陈以通过单词预测等方法获取语言能力以及引发有用无吉、漫宴反应的人类反馈技术AnthropiC使用一种名为“宪法人工智能“口6的技术通过根据联合国人权宣言)等来源明确指定规则和原则在强化学习期间使克劳镑与人类价值观保持一致C通日ClaUde3模型我们在ClaUde宪法中添加了一顼额外原则以鼓励有生残疾人权利该原则源自我们对集体宪法人工智能(17的研究一些用于微调Claude的人类反馈数据与我们的RLHF19和红队研究一起公开口8一旦我们的模型经衬充分训练我们就会进行一系列安全评估我们的信任和安全团队还运行连续分类器来监控违反
11、我们AUP的有吉、恶意用例的提示隔)出请参阅下面的评估部分了解有关两者的更多信息2.7 发布决策和维护我们借鉴NlSTAI风除管理框架及其映射、测量、管理和治理子类别20的指导果取了许多具体步骤来负责任地开发和部署AI系统我ff塔楚地记录了我们的产品可以使用和不可以使用的方式以及使用我【口产品的限制和潜在风险我们定期通过交互师队评估我们的系统并根据产品性能和潜在安全风陶的基;隹进行评估为了管理潜在风险我们逐步推出我们产品的访问权限以确保其安全性和可靠性;结合使用自动监控潜在危害和违反我们AUP的行为,以及人工审核来审核我门分类器的准确性;并定期将我们的模型更新为针对新发现的风险和潜在漏洞进行强
12、化的版本.我们是非常通慎她对待我们产品和服务的媵终用户的敏感效讴和个人信息我切实施保留政策以确保我们对个人信息和锻感信息的存储与数讴需求相标例如监控和改进我们的信任和安全流程对于我们的消费产品和网站的使用我们的隐私政策21)分享了有关数据港私,使用和保留的更多详细信息我。.斑遵循负责任的扩展政策该政策指导我们开发和部罟功能不断增强的人工智能系统如下所述作为一家公益公司(PBe)我们专注于在组织的各个层面(包括我们的执行领导团队)安全开发和部事人工智能系统3安全我r用各种连接身份验证和授权技术来保护模型环境的安全以帮助确保其完整性;人们必须始终使用多重身份验证我们的高级模型受到两方控制的保护对A
13、l模型基册设施的访问权限是按用尸明确授予的并在每次访问尝试时进行验证所有有权访问托管我们服务的服务基础设施的帐户都受到严格的密码要求和多因素身份验证的保护每个旅户都配首有其所有者所需的最低权限级别其他防御层包括持续系统监控、24/7警报响应、端点强化、数据存储和共享控制、人员审查和物曝全强化在台婚到生产环境之前我们会非常谨慎顾闹任何代码更改包括代码审查,绘后我们与渗透测试人员合作颗随我们的检测系统并改善我们的防御态势4社会责任作为PBCAnthppic致力于在开发过程的每个阶段开发安全、负责任的人工智能系统与之前的模型相比ClaUde3模型对请求有更细致的理解能够识别真正的伤害并且拒陋!答无害
14、的提示的频率更少也就是说他。乃然会犯错误我门正在努力让耨德变得更加乐于助人、无害且诚实道德考虑也影晌了我们的AUPe界定了CIaUde的允许和不允许的用途)以及执行它的信任和安全流程4.1 宪法人工智能我们的核心研究重点是训练CIaUde模型变得有帮助、诚实且无害目前我们通过为模型提供宪法来做到这一点模型用来指导其输出的一组阳德和行为原则克劳德宪法中的大部分原则与我们在2023年5月发布的原则相同利用这部宪法模型被训练以避免性别岐视、种族主义和有毒的输出并避免帮助人类从事非法或不道德的活动,为了回应我们在集体宪法人工智能17方面的工作我们添加了一项由公共输入流程告知的额外原则该原则指示ClaU
15、de理解残理人士并为他们所用从而降低模型刻板印象偏见4.2 劳工AnthrOPiC与多个数据工作平台合作这些平台负责吸引和管理从事AnthrOPiC项目的数据工作者数据工作任务包括抵择苜选模型输出以训练人工智能模型以符合这些偏好;根据广泛的标准(例)如准确性有用性无害性等)评估模型输出;以及对抗性测试(即红队)我们的摸型以识别潜在的安全漏洞这些数据工作主要用于我们的技术安全研究其中的某些方面也用于我们的模型训练43可持续性我们抵消我们的排放(包括云计算使用产生的排放),并与优先考虑可再生施源和碳中和的云提供商合作。AnthrOPiC每年致力于完全抵雌口的运营碳排放与外部专家合作对我Irl公司范围内的碳足迹进行严格分析一旦则工完毕我们就会投资经过验证的碳信用额,以完全抵消我们的年度足迹我Ii邦信贷直接资助减排项目我们的目标是通过此类举措和抵消措施每年保持净气候彩响为零5核心能力评估我们对OaUde3系列进行了全面评估分析了他们在各个领域的能力趋势我们的评估包括几个大类:推:Iie城隹需麹学、科学和版雕理,测试模型得出逻,