《手语数字人》“浙江制造”标准征求意见稿.docx

上传人:王** 文档编号:1585231 上传时间:2024-09-20 格式:DOCX 页数:16 大小:105.83KB
下载 相关 举报
《手语数字人》“浙江制造”标准征求意见稿.docx_第1页
第1页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第2页
第2页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第3页
第3页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第4页
第4页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第5页
第5页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第6页
第6页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第7页
第7页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第8页
第8页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第9页
第9页 / 共16页
《手语数字人》“浙江制造”标准征求意见稿.docx_第10页
第10页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《《手语数字人》“浙江制造”标准征求意见稿.docx》由会员分享,可在线阅读,更多相关《《手语数字人》“浙江制造”标准征求意见稿.docx(16页珍藏版)》请在优知文库上搜索。

1、ICSOO00.中国标准文献分类号T/ZZBXXXXXXXX代替T/ZZBxxxxxxxx手语数字人Sign1.anguageDigita1.HumanXXXX-XX-XX发布XXXX-XX-XX实施浙江省质量协会发布目次而言II1范用12规范性引用文件13术谙和定义14缩略语15技术框架16域本要求27技术要求38测试方法49检验规则710标志、包装8H质量承诺S附录A(规范性附录)手语数字人原语集9附录B(烷范性附录)手语数字人关键点标定IO附录C(烷范性附录)手语数字人情感染13IA-刖百本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起隼规则3的规定起草。本

2、文件的某些内容可能涉及专利.本文件的发布机构不承担识别这些专利的责任。本文件由浙江省质t协会提出并归口管理.本文件由XXXXXXXX牵头组织制定,本文件起草单位:*有限公司。本文件主要起草人:*.本文件评审专家组长:XXXXX-本文件由XXXXXX负成解群.I1.手语数字人1葩困本文件规定了可提供从语音、文本或带有文本的图像进行手语翻洋的手语数字人技术要求与测试方法.主要包手语数字人基本技术框架、具体技术指标及测试方法.本文件适用于手语数字人的开发以及指导第三方测评机构对手语数字人的评估、验收等工作.2规楚性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款我中,注日期的引

3、用文件,仅该11期对应的版本适用于本文件:不注I1.期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T244352009中国手沿基本手势GH/T35273-2020估恩安全技术个人伯恩安全规范3术语和定义下列术语和定义适用于本文件.3.1数字人digita1.human%f现实世界设计、通过计算机生成、再借助真人或计尊胭动、在多模态输出设备呈现的虚拟人物,来源:YDT4393.1-20233.2手语数字人sign1.anguagedigita1.human能将语音或文本作为输入,并翻译成手语作为输出对用户展示的数字人。3.3原语primitive1.anguage手语数字人G典

4、型的动作集合,由这些动作进行加权加合可表达所有的手语动作.4技术框架手语数字人脸部、手部轮解应清晰,人物形象比富有细节且具有口实礴,不应出现明显的变形或感甘不适.手语数字人系统应包括输入模块、欣处理模块、手语同目翻洋模块、动作生成模块四个部分.技术框架见图1.次执行.图1手语数字人技术框架主要包括以下步骤:a)使用者通过文本对手语数字人输入要翻译的语句,或通过自然语吉对手语数字人说出衢要彷译的内容,或向户语数字人展示我有待翻译内容的图片.b)手语数字人通过语音识别(ASR),光学字符识别(OCR)技术将持蝴谛内容转换为待融谛文本。c)手语数字人通过专用分诃技术提取出手谱需要表示的关键词汇,并调

5、整关键词汇的顺序使其符合手语友达的顺序.d)从手语动作库中选取与关键词汇最接近的动作,并进行动作间的连货处理,形成手语动作序列.c)根据恃踹译文本进行语义识别与情感计算,形成面部嘴型与表情序列.f)使用渲染技术展示完整的手谙翻译动作.并展示给用户.5风险控制5.1 用户个人信息安全的基本原则应符合GB/T352732020的规定.5.2 手语数字人动作应严格按照GB/T24435-2009的规定,不应表达带有攻击性、歧视性的手势.6基本要求6.1 设计研发6.1.1 应采用三堆建模、测试数据库等手段,根据客户要求开展产品设计及工艺优化,6.1.2 应采用动画制作软件、谊染设计等相关工具,实现手

6、谱数7人仿真模拟.6. 1.3设计时手语动作现范应符合GB/T2-1435-2009的规定.6.2 原材料及部件应采用不低于500套的手语动作集数据座.每套动作集的数敏应不低于20个.6.3 工艺及装备6.4 检验检测应具备手语数字人完好性、精细度、多模态怆入方式、流畅度、换面准确率、多模态输出方式等项目的出厂依蕤能力.7技术要求7.1 形象7.1.1 完好性指手用数字人形象的完好程度,手语数字人应形象完好,不得出现下列任意一种情况. 存在严重的变形:一一存在产至的穿插: 存在没焊接的点: 存在破面. 其他破损情况。注:此处的按”将指将切模工中的多个顶口结介成个点的过程,7.1.2 精细度指手

7、语数字人形象的精细程度.具体指标见表1.表1手语数字人精细度评价指标折标名称满足蛰求人物模型曲面Sk1.it覆25(X10人物砧图分疥率对2像米/英寸人物产部模型点数(唯手)分2000人物Ff1.J骨制数Irt(条手)20映射分辨率N了20p7.1.3形双舒适性指手语数字人形象让用户生理上感到舒适的程度,手语数字人形象应自然,不应出现明显的感官不适。7.2 交互指标7.3 2.1平均交互响应时间指从用户发出指令到手语数字人响应的平均时间,分为语音识别平均响应时间、文字识别平均响应时间和翻洋平均响应时间,语音识别平均响应时间应小于0.5s,文字识别平均响应时间应小于1s,翻洋平均响应时间应小于1

8、s.7-3多模态输入73.1多模态输入方式指手谱数字人支持的幼人形式.包括语音、文本和带有文本的图像等.手谱数字人应至少支持上述I种形式.74多模态输出1 .4.1视频合成实时率手语数字人的视频合成实时率,即视频合成耗时与输出视频时长比值。手语数字人视频合成实时率应不高于12 .4.2流畅度指手语数字人生成视频的流畅度,通过视频帧率,OPFPSfft(单位:帧/秒来评估。手语数字人流畅度应不低于21帧/秒,不应出现R顿等情况.3 .4.3画面完整性指手语故字人生成固定帧数视频时画面的完祭性,手语数字人不应出现跳帧情况,7 .44多模态输出方式指手语数字人支持的怆出方式种类.手语数字人多模态输出

9、方式应包括:手机、电视、投影、止D显示、VR、AR显示。7.5手语翻译7.5.1 手语动作规范程度指年个手语动作是否符合GB/T24435-2009中国手语基本手势S(亦可以是国家通用手语常用词表所述的动作要求,使用关键点平均误差衡Jft手谱动作规范程度,关犍点平均误差应不低于IOCnu7.5.2 手语动作与情感匹配率指手语数字人的情博是否准确传递出自然语言所表达的情感,本文件将情感分为六类,包括中性、愤怒、恐惧、高兴、悲伤、惊讶,手语动作情礴IK配率应不低于50%。8测试方法8.1测试环境设定冽试环境设定见我2.表2测试环境设定模块维度参敝环境参数屏格尺寸22英寸-60英寸,16:9辨邨分的

10、中!OHOpIM络状况M络延迟平均任F200g去包率平均低于0.1%运行环境内存3三16G显存覆24G8.2形象8 .2.1完好性使用文本使手语数字人随U1.生成五段不低于K)S的视城,目视检查每段视频应符合7.1.1的要求.9 .2.2精细度通过审点手语数字人的产品说明书、技术文档等材料,获取人物模型曲面数最、人物贴图分辨率、人物手部模型点数,人物手部骨胳数呆、映射分辨率,应符合71.2的要求,10 2.3形敛舒适性使用文本使手语数字人防机生成八段不低于IOS的觇频,目视检查每段视频.应符合7.1.3的要求.11 3交互指标12 3.1平均交互响应时间平均响应时间定义为:fX式中:T平均响应

11、时间:Tsi系统开始反馈的时间点,单位为杪(s;Ti1.用户输入信&法束的时间点,雅位为秒),按照式(D计算平均响应时间,均应符合7.2.1的要求,8.3.1.2文字识别平均响应时间给定五个测试文木长度区间(W8、832、32128、128-512,512),按照式(D计算平均响应时间,其中句子长度的计数上,中文等以字符(character)为基本单位,英文符号等西文以单词为计数单位.均应符合7.2.1的要求.8.3.1.3翻译平均响应时间给定五个测武文本长度区间(W1.27、1281023、10244095、409616383、16383).按一式(3)计算响应时间实时系数,其中句子长度的计

12、数上.中文等以字符(character)为基本单位,英文符号等西文以单词为计数单位,均应符合7.2的要求.84多模态输入8. 4.1多模态输入方式材料审杳:通过审置手语数字人的产品说明书、技术文档等材料,评估其支持形式:技术验证:分别给定文木、语音、带文本的图像作为输入,并杳看其输出,均应符合7.3.1的要求.8.5多模态输出851视叛合成实时率视频合成实时率定义为:R=攵(2)式中:R觇频合成实时率:J视频合成耗时,单位为秒(三);f输出视频时长,单位为秒(三);使用文本使手语数字人随机生成五段视频,每段视频长度区间满足:W5、515、1530、3060.5=60.单位为杪(三)。按照式(2

13、计算视频合成实时率,每段视频均应符合7.4.1的要求.8.5.2 流畅度使用文本使手语数字人生成二段不低于5S的觇频,获取每段视频的FPS值,均应符合7.4.2的要求。8.5.3 画面完整性使用文本使手语数字人随机生成五段不低于IoS的觇频,目视检点好段视频,均应符合7.13的要求。8.5.4 5.4多模态输出方式材料审左,通过申杳手语数字人的产品说明书、技术文档等材料,评估其多模态输出方式,均应符合7.4.4的要求。1. 6手语翻度8. 6.1手语动作规兆程度测试方法如下:a)对待评测手语数字人进行关键点标定,具体标定位置见附录B;b)对待测评手语数字人整出的动作进行归一化,使其尺度、版转方

14、向等与测试集保持一致,归一化操作的具体方法为:1)使待测评手语数字人和京语测试集的数字人处于T-PoSe的姿态,分别计算待测评手语数字人相对原语测试集数字人的宽度和柘度方向的缩放尺度:2)将待测评手语数字人的关键点在宽度和高度所对应的坐标轴分别乘以相应的缩放尺度;C)采用附录A所示的原谱集作为测试数据集,让待测评手讲数字人逐一做出相应动作:d)计算单个动作待测评手语数字人与测试集所有原语关键点之间的误差,计算公式为:三4JWP式中:EM待测评手语数字人与测试集所有关雄点之间误差:sp1.待测评手语数字人第1个用语关键点在空间中的坐标;印f原语测试架第E个原语关键点在空间中的坐标.|.|空间中向录的模。e)对溯试柒所有动作的误差取平均,得到平均误差,应符合7.5.1的要求9. 6.2手语动作与情感匹配度使用附录3所示的评测数据比,手语数字人在测试集上的华感与标签匹配,记正确,否则记错误。情感评估准确率计算公式为:(-1)ACC1g,XSTt式中:ACCe情感计算准确率:NSi情博测试正确个

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 信息产业

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!