《人工智能基础及应用(微课版) 习题及答案 第9章 语音信号处理中的应用.docx》由会员分享,可在线阅读,更多相关《人工智能基础及应用(微课版) 习题及答案 第9章 语音信号处理中的应用.docx(2页珍藏版)》请在优知文库上搜索。
1、习题109-1什么是语言和语音?9-2人的说话过程可分为几个阶段?9-3人体的发声器官包括哪些?9-4语音信号产生的机理?9-5什么是掩蔽效应?9-6语音信号产生模型包括哪几部分?9-7语音识别系统的分类?9-8语音识别系统包含有哪几部分?9-9常见的语音增强方法有哪些?参考答案9-1语言是人们进行信息交流的产物。从结构方面看,语言是一种由声音和词义相结合而形成的符号系统;从功能方面看,语言是人们进行信息传达,实现人与人思维和逻辑交流的工具。语音、词汇、语法是语言的三个基本要素,这三者的有机结合构成了语言的基本内容。语音是由人类发音器官发出的,能承载并传达一定的语义信息,通过人耳接收后能够使人
2、理解其含义的声音。9-2人的说话过程大致可分为五个阶段。(1)想说阶段;(2)表达阶段;(3)传送阶段;(4)接收阶段;(5)理解阶段。9-3人类能够发出语音自下而上所依靠的发音器官包括有肺部、气管、喉管、咽道、鼻腔、口腔和嘴唇。它们相互配合构成了一个完整的发音系统。它们按照发音功能的不同可以分为声道和声门,其中位于喉部以上的部分被称为声道,声道的形状是随着发出声音的不同而变化的,喉的部分被称为声门。9-4人们在说话的时候,由于腹部肌肉收缩导致横膈膜向上移动,从而对肺部产生挤压,使得肺部的空气被挤出并形成气流,气流顺着气管向上运动至咽喉。闭合的声门受到下方气流的冲击而打开,当气流结束后又自动闭
3、合。同时,当气流通过气管和支气管经过咽喉时,收紧的声带由于气流的冲击超声振动,不断的张开和闭合,使声门不断向上传送出气流。这时候气流被声门不断截取形成具有周期性的脉冲信号。另外,声带也是一个振动装置,通过振动产生不同频率的声音信号。声音信号被进一步调制后经过咽喉、口腔或者鼻腔。口腔的开合、舌头的活动和软腭的升降等发音动作,形成了不同的声道构形,从而发出不同的语音。最后,由嘴唇开口处将语音辐射出去。9-5掩蔽现象是一种常见的心理声学现象,是由人耳对声音的频率分辨机制决定的。它指的是在一个较强的声音附近,相对较弱的声音将不被人耳觉察,即被强音所掩蔽。较强的音称为掩蔽者,弱音称为被掩蔽者。掩蔽效应分
4、为同时掩蔽和异时掩蔽两类。同时掩蔽指掩蔽现象发生在掩蔽者和被掩蔽者同时存在时,也称为频域掩蔽。异时掩蔽的掩蔽效应发生在掩蔽者和被掩蔽者不同时存在时,也称为时域掩蔽。异时掩蔽又分为前掩蔽(pre-masking)和后掩蔽(POSt-masking)两种。若掩蔽效应发生在掩蔽者开始之前的某段时间,则称为前掩蔽;若掩蔽效应发生在掩蔽者结束之后的某段时间,则称为后掩蔽。9-6传统的基于声道的语音产生模型包括激励模型、声道模型和辐射模型。这三个模型分别与肺部的气流和声带共同作用形成的激励、声道的调音运动及嘴唇和鼻孔的辐射效应一一对应。9-7语音识别系统可根据不同的分类标准进行不同类型的划分:(1)根据说话人说话方式及特点的不同,可以把语音识别系统划分为孤立词语音识别系统、连接字语音识别系统和连续语音识别系统三种类型。(2)根据对说话人语音特征的依赖程度可以划分为特定人语音识别系统和非特定人语音识别系统。(3)根据词汇量的大小来划分则可以分为小词汇量、中词汇量、大词汇量以及无限词汇量语音识别系统。9-8语音识别系统包含有预处理;(2)特征提取;(3)训练;(4)识别四个部分。9-9(1)谱减法;(2)自适应滤波算法;(3)基于小波变换的方法;(4)维纳滤波法等。