智能音箱技术规范_SJT11840-2022.docx

上传人:王** 文档编号:948077 上传时间:2024-03-01 格式:DOCX 页数:22 大小:1.01MB
下载 相关 举报
智能音箱技术规范_SJT11840-2022.docx_第1页
第1页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第2页
第2页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第3页
第3页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第4页
第4页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第5页
第5页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第6页
第6页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第7页
第7页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第8页
第8页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第9页
第9页 / 共22页
智能音箱技术规范_SJT11840-2022.docx_第10页
第10页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《智能音箱技术规范_SJT11840-2022.docx》由会员分享,可在线阅读,更多相关《智能音箱技术规范_SJT11840-2022.docx(22页珍藏版)》请在优知文库上搜索。

1、ICS33.160.99CCSM72中华人民共和国电子行业标准SJ/T118402022智能音箱技术规范Technologyspecificationforsmartspeaker2023-01-01 实施2022-10-20发布中华人民共和国工业和信息化部发布前言IH引言IV范围2规范性引用文件15.1 概述5.2 智能4r-liIj及小受6.1 声6.2 i6.3附录A(术语和定义测试7.17.27.3智能化及音质性系统逻辑结构.12333444666771013圳市三诺数字科技有限公司、青岛 迪芬尼声学科技股份有限公 司、广州笙达电器有限公才:部电子第五研究所、草人:林顺达、球能科胜牡、

2、钟刁江强、王运Kl孙海原长症电子有限瑞森新谱科技第&钟、赵群、毕静王晶、胡科、i京声准*明英、卜云全、黄桅、易、何艳、然、汪S科瑞声科技股份有 讯科技有限公百 步者科技股份 技有限公司 盛电子有 业有限公 公司、安本、杭州车景声科技有限公Q学、中国科学院声学研究所、海德司、/华为终端(东莞)有限公司、北京云知声信勰逋限公司、广州:司、腾讯杵陵,化京)有限公俊、常理、胡永、毕静伟、I温卡徐沾伟、冯陕瞧本文件按照GBzr1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国音频、视频及多媒

3、体系统与设备标准化技术委员会(SAC/TC242)提出并归口。本文件起草单位:中国电子技术标准化研究院、中国电子音响行业协会、科大讯飞股份有限公司、歌尔股份有限公司、北京小米科技有限责任公司、北京小米移动软件有限公司、华为终端有限公司、深.州番禺巨大汽车音响设备有限公司、惠州团有限公司、国光电器股份有限公学科技有限公司、工业和信息化技股份有限公司、深圳市北*技有限公司、北京百度网)有限公司、深圳市漫、司、广州爱浪智能科:有限公司、吉林航1/、深圳市新峰龙工亚数码科技有限飞、曾庆法、熊刘轶、赵静、燕、张金国、威志、熊俊、箱尤、宋伟。智能音箱系统是包括智能音箱终端、云端、手机应用以及关联设备和资源

4、的系统。智能音箱是指具有语音交互功能、能够访问网络内容、享受网络服务的音箱设备。智能音箱集成了人工智能处理能力,能够通过语音识别、语音合成、语义理解等技术完成语音交互,成为消费电子领域的热点产品,而现行扬声器(音箱)的国家标准及行业标准未能覆盖智能音箱的技术指标。智能音箱音质层次不齐、语音交互性能良祷不齐、内容合规及信息安全等方面存在较大风险,所以蝇须加强端云一体化标准的制定;同时加强产品质量监管体系建设,引导智能音箱产业健康发展。术文件是对现行扬声器(音箱)等国家标准及行业标准的有益补充,同时促进GB/T12060.5-2011声系统设备第5部分:扬声器主要性能测试方法,GB/T14277-

5、2013声频组合设备通用规范及SJIT115402015有源扬声器通用规范等现行国家标准及行业标准的贯彻执行。智能音箱技术规范1范围本文件界定了智能音箱智能化等级分类,规定了智能音箱的系统架构、声频性能、语音交互、安全性,以及智能音箱智能化技术要求,描述了对应的测试方法。本文件适用于智能音箱产品及其系统的研发、设计和测试,其他采用语音交互技术的智能硬件产品也可参考使用。2规范性引用文件全能力要求3术语2008界定的以及下注3:注1:注2:GB GB GB GBSJ SJ智能音箱可关智能音箱利用云端明 语音交互.智能音.可以对关联设备进行范GB/T 列术语和定3.1 .0072017信息,文件;

6、不注I期的引用文件,其最期技术规范t务接口规范命安全规范20082()IaGB/T 341452017、件。下列文件中体 仅该日期对应白 文件。GB/TGB/T 44GBI121智能音箱具有语音交互:危性引用而构成本文件史*翘队部分:扬声器中,注日期的引用文件, 有的修改单)适用于本识航语音公成、自然语言理解等技术完成3.2智能音箱系统smartspeakersystem由智能音箱终端、云端、手机应用以及关联设备和资源组成的系统。3.3语音交互speechinteractionvoiceinteraction人类和功能单元之间通过语音进行的信息传递和交流活动。来源:GB/T36464.2201

7、8,3.1,有修改3.4语音识别speechrecognition将人类的声音信号转化为文字或者指令的过程。3.5语音合成speechsynthesis将给定的文本转换成与之对应的语音的过程。3.6自然语言理解naturallanguageunderstanding让计算机能够读懂自然语言中蕴含的含义及意图的过程。3.7语音唤醒speechwake-upvoicetrigger处于声频流监听状态的语音交互系统,在检测到特定的特征或事件出现后,切换到命令词识别、连续语音识别等其他处理状态的过程。3.8误唤醒falsewake-up语音交互系统处于声频流监听状态,无声频流或者声频流中没有出现唤醒所

8、需的特征或事件时,语音唤醒系统被唤醒的现象。3.9噪声noise语音采集过程中,对目标语音信号的识别、理解或处理的造成干扰的信号。3.10声纹voiceprint语音中所蕴含的、能表征和标识特定说话人的独有的特性或特征。3.11声纹识别voiceprintrecognition根据待识别语音的声纹特征识别该段语音所对应的说话人的过程.3.12传声器阵歹IJmicrophonearray由具有确定空间拓扑结构的多个传声器组成的,对信号的空间特性进行采样并处理的系统。3.13语音打断speechinterruption语音交互系统在播放声音的过程中,当语音采集设备检测到有效语音输入时,终端从播放声

9、音转到语音识别等其他处理过程。3.14隐私标签privacylabel厂商或者开放平台应用对其定义的涉及用户私f信息的数据进行标识的标签。4系统逻辑结构智能音箱使用语音交互功能时,其系统分为输入、处理和输出三个模块,可选择在本地、云端或融合实现,其中.a)输入版块包括传声器阵列、语音采集、语音唤醒和声纹识别,负责将语音输入转化为语音流,作为处理的输入。其中:1)传声器阵列负责对声频信号进行定向采集;2)语音采集包括对传声器阵列拾取到的声频进行降噪、去混响、回声消除等处理;3)语音唤醒负责声频流监听,并在检测到特定的特征或事件出现后,切换到语音识别状态;4)声纹识别(可选支持)负责对发音人声纹进

10、行获取、分析并输出反馈结果。b)处理模块包括语音识别、自然语言理解、业务逻辑。其中:1)语音识别负责将语音流转换为人类可识别的文本信息并直接输出,或转换为计算机可识别的文本信息并输出到自然语言理解;2)自然语言理解负责对语音识别提供的文本信息做自然语言解析;3)业务逻辑负责根据自然语言理解的结果,映射到相应的业务线,并依此向相关应用下达指令并提供反馈信息。c)输出模块包含语音合成和资源调用。其中:1)2)3)语音合成模块负责将业务逻辑反馈的计算机可识别的文本信息转换为语音流的输出;资源调用负责将业务逻辑反馈的信息与对应的应用资源进行匹配,并对外提供应用与服务的输出;语音合成和资源调用相互关联对

11、应,共同作为输出结果。智能音箱系统逻辑结构见图1。智能网络的应用I根据智育O身齐识别O拓扑5智能I,.y.vy.5.1概主应提供多种基于;同的等级。唤醒失效一语音合成:对应联设备调用输出能等寄朋5.2智能化及臂性能程翻级智能音箱指标;及分类如表2所示。指标级别语音识别字准确率%语音唤醒正确率%交互拒识率%平均响应时间SFfoS评分A级高噪859024.2高噪90小于10(只需W2.0低噪N90低噪95要做低噪)B级高嗓2802853.5高噪85小于15(只需2.5低噪85低噪90要做低噪)1的要求,智表2智能化等级分类智能化级别智能化及音质功能及性能要求I【级A)具备11级所有功能;B)满足全

12、部A级别指标要求(见表1)n级A)具备I级所有功能;B)满足全部B级别指标要求(见表1);C)具备远距离识别功能(不小于5m);D)具备降噪功能;E)支持智能家居控制协议;F)具备其他更智能化功能及性能;G)扬声器性能达到GB/T14277-2013的B类及以上I级A)具备语音交互功能,满足50%B级别指标要求(见表1):B)可连接云端声频媒体库;O至少具备Wi-Fi无线传输功能6技术要求6.1 声学性能要求产品的声性能参数及要求应符合SJ/T11540-2015中表2的要求。6.2 语音交互技术要求6.2.1 概述智能音箱的语音交互技术要求包括语音技术要求及交互技术耍求,智能音箱指标级别分为

13、A级和B级两类,具体见5.2。6.2.2语音技术要求6.2.2,1语音采集智能音箱应能够通过传声器或传声器阵列等具备语音采集能力的硬件设备对语音进行采集。6.2.2.2语音识别语音识别基本要求包括:a)识别引擎应支持连续语音识别;b)在低噪环境中,语音识别字准确率应不小于85%(B级)或90%(A级);c)在高噪环境中,语音识别字准确率应不小于80%(B级)或85%(A级)。6.2.2.3声纹识别智能音箱可具备声纹识别功能,实现对不同身份用户的差异化反馈,如:系统访问权限、系统响应内容等.6.2. 2.4语音打断智能音箱应具备交互过程中的语音打断功能,实现交互速度与自然度的提高。语音打断成功率

14、的计算方法见公式(D。Pi=x100%(1)式中:P1语音打断成功率;N交互内容中需要执行打断操作的次数;Ni被语音交互系统正确响应的次数。在声源距离待测样品1m距高处,语音打断成功率应不小于85%(B级)或90%(A级)。6.2.2.5语音合成应支持汉语普通话,宜支持多音色、混合语种和多语种,宜支持方言,宜支持个性化合成,汉语名词MoS评分应不小于3.5(B级)或4.2(A级)(满分5.0)。主要要求包括:a)宜支持多音色,应支持女声和男声,宜支持其他音色;b)应支持中英文混读,宜支持混合语种;c)宜支持多语种,应支持英语。6.2.2.6语音唤醒智能音箱应具备唤醒功能(语音唤醒或硬件按键唤醒),为了区分音箱发声与否状态下

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 汽车/机械/制造 > 电气技术

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!