《智能语音应用开发工作手册汇总项目1--11自动语音识别:让机器人能听懂---焦点畅谈:定制康养智能机器人.docx》由会员分享,可在线阅读,更多相关《智能语音应用开发工作手册汇总项目1--11自动语音识别:让机器人能听懂---焦点畅谈:定制康养智能机器人.docx(26页珍藏版)》请在优知文库上搜索。
1、项目一自动语音识别:让机器人能听懂一、项目目标:学习完本项目后,将自己掌握情况填入表L7,并对相应项目目标进行难度评估,评估方法:为相应项目目标后的进行涂色,难度系数范围1-5。表L7项目目标自测表项目目标目标难度评估是否掌握(自评)(1)了解自动语音识别的概念。(2)了解自动语音识别的应用。(3)了解自动语音识别的发展历程。(4)熟悉自动语音识别的技术现状和发展趋势。(5)理解自动语音识别的原理。(6)理解自动语音识别的评估指标。(7)能够编写程序,调用自动语音识别接口,实现自动语音输入。(8)能够对语音识别效果进行评估。二、项目分析通过学习自动语音识别相关知识,调用百度Al开放平台的自动语
2、音识别能力,实现智能语音输入功能,请结合分析将项目具体实践步骤(简化)填入图1.25横线处:图1.25项目分析步骤图二、知识抽测1 .看图L26连线并简单概括其含义WHHnHnW - IOlllABC狭义自动语音识别广义自动语音识别二图1.262 .计算下面语音识别结果的字错误率值。语音:昨天比今天天气好很多文本:昨个比今个温度好WER=三、任务一创建应用在学之前,了解的百度账号都有什么功能?学习完任务一后,又发现了哪些功能?用绘画的方式描述下“我眼中的百度账号”,填入到表1.8中。表1.8我眼中的百度账号学之前的百度账号学之后的百度账号四、任务二智能语音输入对于语音识别的步骤进行排序填入。中
3、,将具体步骤引用函数进行连线,并解释函数作用。五、任务三语音识别评估将下列短文录制成音频,计算出字错误率及句错误率。音频资料:扁担长,板凳宽,板凳没有扁担长,扁担没有板凳宽。扁担要绑在板凳上,板凳偏不让扁担绑在板凳上。识别结果为字错误率:WER=100X二/%=句错误率SER = 100 存在期的句子个数总的句子个数项目2语音合成:让虚拟机器人能说话一、项目目标:学习完本项目后,将自己掌握情况填入表2-8,并对相应项目目标进行难度评估,评估方法:为相应项目目标后的进行涂色,难度系数范围1-5。表2-8项目目标自测表项目目标目标难度评估是否掌握(自评)(1)了解语音合成的概念。(2)了解语音合成
4、的应用。(3)理解语音合成的工作原理。(4)理解语音合成的评价指标。(5)能够编写程序,调用语音合成接口,实现文本转语音。(6)能够对语音合成效果进行评分。二、项目分析通过语音合成相关知识的学习与辨析,调用百度Al开放平台的自动语音合成能力,实现智能语音输入合成,请结合分析将项目具体实践步骤(简化)填入图2.11横线处:图2.11项目分析步骤图六、知识抽测如图2.12所示,请同学们结合语音合成图及概念,发挥想象,用画的方式表示出来。ABC图2.12语音合成图示七、任务一创建应用APIKey和SeCretKey是调用百度Al开放平台接口的重要信息,在了解其含义后,请用便于自己理解的方式描述二者作
5、用(文字、绘画、标记等方式不限),填入到表2-9中。表2-9我眼中的百度账号APIKeySecretKey八、任务二小说在线合成如图2.13所示,在。中挑选出项目一、项目二均调用的库函数,将其写入到横线中,并解释说明其含义。九、任务三利用MOS评分完成四类真人发声朗诵参数的选择将下列短文录制成音频(原音频),利用Al平台进行语音识别并生成文字资料,再利用语音合成,生成真人发音音频(现音频),对比原音频与现音频之间的区别。音频资料:扁担长,板凳宽,板凳没有扁担长,扁担没有板凳宽。扁担要绑在板凳上,板凳偏不让扁担绑在板凳上。项目三让虚拟机器人能识人十、项目目标:学习完本项目后,将自己掌握情况填入表
6、38,并对相应项目目标进行难度评估,评估方法:为相应项目目标后的进行涂色,难度系数范围1-5。表3-8项目目标自测表项目目标目标难度评估是否掌握(自评)(1)了解声纹识别的概念。(2)了解声纹识别的类型。(3)了解声纹识别的工作原理。(4)理解声纹识别的评估指标。(5)能够编写程序,调用声纹识别接口,实现声纹识别。二、项目分析通过学习声纹识别相关知识,调用NeUHUb京东人工智能开放平台的声纹识别能力,实现智能识别门禁系统功能,请结合分析将项目具体实践步骤(简化)填入图3.15横线处:图3.15项目三分析步骤图十一、知识抽测3 .看下图3.16填写属于声纹识别哪种类型?是主人声音吗?记录主人声
7、音记录用户声音是谨的声音?图3.164 .声纹识别系统一般由预处理、特征提取、模型训练和对比分类识别等几部分组成。请完成图3.17空缺部分。图 3.17十二、任务一创建应用本次学习使用的是NeuHub京东人工智能开放平台,大家找一找京东Al开放平台都开放了哪些语音技术能力?并填写在下表中3.9中。表3.9京东Al平台开放语音技术十三、任务二智能门禁系统对于智能门禁系统的步骤进行排序填入。中,将具体步骤引用函数进行连线,并解释函数作用。十四、使用Al(或变声器)声音注册和使用录制音频验证识别结果如何?将结果记录在下表3.10中。表3.10智能门禁验证结果表验证次数AI+AIAI+录音录音+AI1
8、2345项目4语音唤醒:让端侧机器人苏醒一、项目目标:学习完本项目后,将自己掌握情况填入表4.4,并对相应项目目标进行难度评估,评估方法:为相应项目目标后的进行涂色,难度系数范围1-5。表4.4项目目标自测表项目目标目标难度评估是否掌握(自评)(1)了解语音唤醒的定义。(2)了解语音唤醒的应用。(3)了解语音唤醒技术的发展阶段。(4)理解语音唤醒的评价指标。(5)能够利用开放Al平台获取唤醒词资源。(6)能够部署SDK实现语音唤醒。二、项目分析通过学习语音唤醒的相关知识,调用国内Al开放平台实现语音唤醒,请结合分析将项目具体实践步骤(简化)填入图4.29横线处:项目分析图4.29项目分析步骤图
9、三、知识抽测下面是语音唤醒的概念,请同学们用绘画的方式描述一下对语音唤醒的理解。语音唤醒,也称为语音关键词检测,作用是在连续的语音流中实时的检测到一组特定的关键词的技术过程,而特定的关键词称为唤醒词。四、任务一注册/登录讯飞开放平台在前面项目我们使用了百度Al开放平台,今天注册并使用了讯飞开放平台,那么两种平台的功能有怎样的体会呢?请将使用后的感受写入表4.50表4.5使用后的感受百度Al开放平台讯飞开放平台五、任务二评估语音唤醒词质量如图4.30所示使用唤醒词测试工具,测试出C)中评分最高的三个唤醒词,写在横线处。在学习完APl与SDK后,请根据自己理解写出二者区别。APISDK七、任务四部
10、署SDK实现语音唤醒使用图4.30中榜一的唤醒词进行20次测试,计算该唤醒词的错误接受率、错误拒绝率。错误接受率FAR =错误拒绝率FRR原本错误却被接受唤醒的样本数wo%所有原本错误输入的样本数X0原本正确却被拒绝唤醒的样本数XI。=所有原本正确输入的样本数项目五让端侧机器人能比十五、项目目标:学习完本项目后,将自己掌握情况填入表5-6,并对相应项目目标进行难度评估,评估方法:为相应项目目标后的进行涂色,难度系数范围1-5。表5-6项目目标自测表项目目标目标难度评估是否掌握(自评)(1)了解文本相似度的概念。(2)了解文本相似度的计算方法。(3)了解文本相似度的应用。(4)能够编写程序,调用
11、文本相似度接口,实现智能客服智能问答。二、项目分析通过学习文本相令I度相关知识,调用百度Al开放平台的自动语音识别和短文本相似度能力,实现智能客服智能回答,请结合分析将项目具体实践步骤(筒化)填入图5.8横线处:图58项目五分析步骤图十六、知识抽测5 .结合所学理论知识完成下面5.7表格表5.7三种计算方法优缺点对比计算方法优点缺点基于字符串基于语料库基于世界知识6 .文本相似度在各种产品应用场景中都有普及,并且都已经取得的很好的效果。常见应用有、十七、任务一创建应用本次项目需要使用两个应用自动语音识别和短文本相似度,请将使用的APIKey和SecretKey填入到表5-8中。表5-8应用AP
12、IKey和SecretKeyAPIKeySecretKey自动语音识别短文本相似度十八、任务二语音识别对于语音识别和短文本相似度的步骤进行排序填入。中,将具体步骤引用函数进行连线,并解释函数作用。十九、任务三智能客服答案搜索结合自己设置的场景,设置智能问答数据库,填写在下表5-9中。表5-9智能问答数据库问题答案二十、任务四智能客服系统测试运行代码与智能客服系统对话,将对话的结果记录在表5.10中表5-10对话结果表问题智能客服系统答案正确答案是否一致项目六语音翻译:让端侧机器人会议二H、项目目标:学习完本项目后,将自己掌握情况填入表6.1,并对相应项目目标进行难度评估,评估方法:为相应项目目
13、标后的进行涂色,难度系数范围1-5。表6.1项目目标自测表项目目标目标难度评估是否掌握(自评)(1)了解语音翻译基本原理。(2)了解语音翻译面临的主要挑战。(3)了解语音翻译的发展历程。(4)掌握语言翻译的评价方法。(5)能够理解翻译程序中函数的作用。(6)能够对语音翻译效果进行评估。二、项目分析通过学习机器翻译相关知识,借助百度Al开放平台进行语音识别,同时借助百度Al开放平台实现文本翻译技术进行语音翻译,最终实现机器翻译,请结合分析将项目具体实践步骤(简化)填入图6.1横线处:二十二、知识抽测7 .级联语音翻译系统是由五部分组成,将空白处补全。源语言音频一一源语言文本一一目标语言文本8 .使用BLEU测评标准对翻译出来的机器译文与人工译文计算1-gram的匹配度。机器译文Itisanicedaytoday人工译文:Todayisaniceday;Pl=二十三、任务一创建应用