声纹检测通用规范.docx

资源描述

《声纹检测通用规范.docx》由会员分享，可在线阅读，更多相关《声纹检测通用规范.docx（7页珍藏版）》请在优知文库上搜索。

1、ICS17.140.99CCSL70B34安徽省地方标准DB34/TXXXX-2023声纹检测通用规范Generalspecificationofvoiceprintdetection（征求意见稿）在提交反馈意见时，请将您知道的相关专利连同支持性文件一并附上。XXXX-XX-XX发布XXXX-XX-XX实施安徽省市场监督管理局发布本文件按照GB/T1.1-2020标准化工作导则第1部分：标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由科大讯飞股份有限公司提出。本文件由安徽省经济和信息化厅归口。本文件起草单位：科大讯飞股份有

2、限公司、浙江讯飞智能科技有限公司、安徽省质量和标准化研究院、合肥智能语音创新发展有限公司、合肥产品质量监督检验研究院、智音检测认证服务（合肥）有限公司。本文件主要起草人：声纹检测通用规范1范围本文件规定了声纹检测的术语和定义、检测准备和检测步骤。本文件适用于电机制造及电机组装设备（例如家电、汽车、仪器仪表等）的生产线异音检测。2规范性引用文件本文件没有规范性引用文件。3术语和定义下列术语和定义适用于本文件。31声纹voiceprint用电声学仪器显示的携带特征信息的声波频。注：本文件所指的声纹仅指在工业生产线发出的声音。3J声纹检测voiceprintdetection通过在产线集成声纹采集设

3、备，利用声纹识别、异音诊断等技术，对电机产品发出的声音进行标注和训练，以实现产品缺陷自动识别报警的自动化检测过程。标注label标注人员根据所收集的设备声音样本性质不同进行分类的过程。声音采集soundcollection采用拾音设备对被检测对象所发出的声音进行采集，形成声纹文件。15异音abnormaInoise具有缺陷的工业产品在运行时发出的异常声音。4检测准备d1标准声音采集4.1.1 总体要求多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。4.1.2 采集设备通过高保真麦克风设备采集音频样本。4.1.3 采集环境4.1.3.1应在低噪声环境下进行,确

4、保音频采集过程的环境噪音类型与产线部署过程的环境噪音一致,采集过程中避免出现其他人为异响。4.1.3.2环境噪声标准：A记权分贝值W30dB（八）4.1.4采集方式4.1.4.1麦克风设备与被采集对象应固定放置，确保采集音频稳定性。4.1.4.2麦克风设备与被采集对象距离固定在IoCm左右，采集方向应正对被采集对象发声位置，使采集的音频满足4.1.5中所规定的峰值幅度值范围，若不满足，可通过拉进拉远距离的方式进行调节。4.1.5采集音频参数4.1,5.1编码格式：PCM编码。4.1,5.2采样率：48Ko4.1.5.3量化精度：16bito4.1.5.4峰值幅度：2T8dBFS且W-3dBFS

5、4.1.6采集样本样本应覆盖所有对样本进行的标注类别（即正常类和异常类），样本时长和总量包括：a）单条样本时长：10s;b）样本总量：每个类别2500条。42标注4.2.1标注方法4.2.1.1在计算机上对标准采集到的声音样本进行标注，对样本所进行的标注包括两种标注类别（即正常类和异常类），每个样本应仅有一种标注类别。4.2.1.2检测人员使用计算机上的音频播放软件对待标注样本进行辨听，再进行标注结果记录，若无法判断是否为异常可注明无法判断。4.2.2标注格式标注完成后形成标注记录，存储于关系型数据库中，相关字段说明见表1。若待标注样本为正常声纹，则异常开始时间和异常结束时间一栏为斜杠符（/）

6、。表1声纹样本标注字段说明字段名称字段类型字段描述备注VoiceIdString音频IDMarkTimeLong样本时长单位：毫秒MarkPersonString标注人员编号录入人员编号AbnormalString声纹类型标签正常/异常/无法判断StartPointDouble异常开始时间单位：亳秒EndPointDouble异常结束时间单位：亳秒d3模型建立对检测人员标注为正常/异常的声音样本提取声学特征，利用卷积神经网络算法对声学特征进行建模，得到可区分正常和异常的声纹分类模型，用于进行后续声纹检测任务。5检测流程图检测流程图见图1。准得阶段依君阶段图1检测流程图6检测步骤61现场声音采集

7、6.1.1总体要求多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。6.1.2采集设备应符合4.1.2规定的要求。6.1.3采集环境应在生产线环境下进行，周围环境噪声的A记权分贝值W30dB（八）,采集过程中避免出现其他人为异响。6.1.4 采集方式应符合4.1.4规定的要求。6.1.5 采集音频参数应符合4.L5规定的要求。6.1.6 采集样本采集样本时长和总量如下：a）单条样本时长：10s；b）样本总量：10条。6.1.7 2模型判定6.2.1将现场采集的10条声音样本传输至计算机，使其分别通过4.3中可区分正常和异常的声纹分类模型，得到10条模型判定结果。6.2.2若其中5条以上（不包括5条）被判定为正常，则被检测对象判定为正常状态；若其中5条以上（不包括5条）被判定为异常，则被检测对象判定为异常状态；若其中5条判定为正常，5条判定为异常，应重新进行现场声音采集和模型判定流程，直至被检测对象判定为正常或异常状态。63检;则结果输出若被检测对象判定为正常状态，则计算机屏幕上显示“正常”字样；若被检测对象判定为异常状态，则计算机屏幕上显示“异常”字样，同时出现红色色块闪烁进行告警提示，检测结束。

展开阅读全文