《第3章语音信号的模型.ppt》由会员分享,可在线阅读,更多相关《第3章语音信号的模型.ppt(41页珍藏版)》请在优知文库上搜索。
1、3.2语音信号的无损声管模型 3.1 声在声管中的传播特性 3.4无损声管模型的传输函数3.3级联无损声管与数字滤波器的关系3.5语音信号的数字模型3.6语音信号的共振峰模型3.7语音信号的非线性模型(略)第第3 3章语音信号的模型章语音信号的模型语音模型化,便于数字处理。语音模型化,便于数字处理。对模型的要求:对模型的要求:精确描述语音产生过程、尽可能地简单,精确描述语音产生过程、尽可能地简单,便于处理和实现。便于处理和实现。已提出许多种不同的语音信号模型。已提出许多种不同的语音信号模型。线性模型:线性模型:广泛使用广泛使用级联无损声管级联无损声管模型和模型和共振峰共振峰模型。模型。理论基础
2、:理论基础:发音过程中声道处于运动状态,这种运动与语音信发音过程中声道处于运动状态,这种运动与语音信号相比号相比变化缓慢变化缓慢,故可用,故可用时变时变的的线性系统线性系统来来模拟模拟。更精细分析时,发现语音中也存在较大的非线性现象,更精细分析时,发现语音中也存在较大的非线性现象,某些应用需考虑这些因素对所研究问题的影响。某些应用需考虑这些因素对所研究问题的影响。非线性模型:非线性模型:有多种,有多种,调频调频-调幅模型调幅模型受到广泛关注。受到广泛关注。本章讨论:本章讨论:级联无损声管模型级联无损声管模型、共振峰模型共振峰模型、调频调频-调幅模型调幅模型第2章数字语音处理基础 第第3 3章语
3、音信号的模型章语音信号的模型3.1 声在声管中的传播特性 物理学的定律是描述声道中声音的物理学的定律是描述声道中声音的产生产生和和传播传播的基础。的基础。包括:包括:质量守恒质量守恒、动量守恒动量守恒、能量守恒能量守恒的基本定律,的基本定律,热力学热力学、流体力学流体力学的定律等。的定律等。空气是一种流体空气是一种流体,也是声音赖以传播的介质。,也是声音赖以传播的介质。应用物理原理,可得描述发音系统中空气运动应用物理原理,可得描述发音系统中空气运动偏微分方程组偏微分方程组。精确的方程精确的方程表达表达和和求解求解都是都是极端困难极端困难的,需的,需简化假设条件简化假设条件。因因周密的声学理论周
4、密的声学理论必须考虑以下各种影响:必须考虑以下各种影响:(1)(1)声道形状的声道形状的时变性质时变性质;(2)(2)声道壁的声道壁的热传导热传导和和粘滞摩擦损耗粘滞摩擦损耗;(3)(3)声音在嘴唇处的声音在嘴唇处的辐射辐射;(4)(4)声道壁的声道壁的柔度柔度;(5)(5)鼻腔的鼻腔的耦合耦合;(6)(6)声道中的声道中的激励激励。目前,没有全面考虑各因素影响的声学理论,目前,没有全面考虑各因素影响的声学理论,应用中对这些因素给出应用中对这些因素给出适当的说明适当的说明或者给出或者给出定性的讨论定性的讨论。第2章数字语音处理基础 3.1 声在声管中的传播特性 图图3.13.1:语音产生过程的
5、最简单的语音产生过程的最简单的物理模型物理模型。假设:假设:声道被看成是声道被看成是不均匀截面不均匀截面的声管;的声管;沿管轴传播的声波是沿管轴传播的声波是平面波平面波;在流体中或管壁上不存在在流体中或管壁上不存在热传导热传导和和粘滞损耗粘滞损耗。根据假设及守恒定律,根据假设及守恒定律,Portnoff证明声波满足证明声波满足偏微分方程组偏微分方程组:式中,式中,p,u 为声管内为声管内 x 位置处位置处 t 时刻的时刻的 声压声压和和体积速度体积速度,p=p(x,t),u=u(x,t);A 为声管内为声管内 x 位置处位置处 t 时刻的管的时刻的管的横截面面积横截面面积,A=A(x,t);为
6、声管内空气的为声管内空气的密度密度;c为声的为声的传播速度传播速度(空气中声速空气中声速340m/s)。第2章数字语音处理基础 3.1 声在声管中的传播特性 图图3.1语音生成过程的物理模型语音生成过程的物理模型 A(x)声门 嘴唇(a)A(x)0 l x(b)0 l x(c)2(/)1()pu AxtupAAxctt给定声管的边界条件和面积函数后,可求得方程组的给定声管的边界条件和面积函数后,可求得方程组的闭式解闭式解。解的解的表达式表达式非常非常复杂复杂,但可以,但可以采用数值解采用数值解。应用中,某一特定时刻,应用中,某一特定时刻,面积函数面积函数可看成可看成不随时间变化不随时间变化。可
7、借助于可借助于各种合理各种合理的的近似近似和和简化简化来使方程的求解成为可能。来使方程的求解成为可能。并由此得到并由此得到语音信号的模型语音信号的模型(后续讨论该问题)。(后续讨论该问题)。声管中声管中声传播特性声传播特性与传输线中与传输线中电流传播特性电流传播特性有很强的有很强的类比关系类比关系。表表3.13.1:声学量声学量与与电学量电学量之间的之间的类比关系。类比关系。第2章数字语音处理基础 3.1 声在声管中的传播特性 表表3.1声学量与电学量之间物理量的类比声学量与电学量之间物理量的类比声学量声学量电学量电学量声学量声学量电学量电学量压力压力 p电压电压 v特性声阻抗特性声阻抗 Z0
8、=c/A特性电阻抗特性电阻抗 Z0体积速度体积速度 u电流电流 i声激励角频率声激励角频率电激励角频率电激励角频率声感声感/A电感电感 L单位长度声阻抗粹单位长度声阻抗粹Z=j/A复阻抗复阻抗 Z声容声容A/(c2)电容电容 C单位长度声导纳单位长度声导纳 Y=jA/(c2)复导纳复导纳 Y第第3 3章语音信号的模型章语音信号的模型3.2语音信号的无损声管模型 无损声管模型无损声管模型(行波型模型行波型模型):由多个):由多个不同截面积不同截面积的的无损耗无损耗 管子管子串联而成的系统。是最简单的声道模型。串联而成的系统。是最简单的声道模型。图图3.2:10级的级的无损声管级联模型无损声管级联
9、模型。语音信号的某一语音信号的某一“短时短时”期间,声道可表示为期间,声道可表示为形状稳定形状稳定的的管道管道。该该“短时短时”期间,管截面期间,管截面 A 是是常数常数。偏微分方程以写成:。偏微分方程以写成:若第若第 m 段管子处,段管子处,A(x,t)=Am,u(x,t)=um,p(x,t)=pm,上式可以写成,上式可以写成 第2章数字语音处理基础 3.2语音信号的无损声管模型 图图3.210级无损声管级联级无损声管级联声门声门 嘴唇嘴唇A1l1A2 l2A3l3A4l4A5l5A6l6A7l7A8l8A9l9A10l10101iill2,puuApxAtxct2,;1,2,mmmmmmp
10、uuApxAtxctm解偏微分方程组,得:解偏微分方程组,得:式中,式中,lm第第 m 节声管的节声管的长度长度;和和 第第 m 节声管中的节声管中的正向行波正向行波和和反向行波反向行波。在两个不同截面积的声管联接处,在两个不同截面积的声管联接处,行波表达行波表达如如图图3.3。连续条件:连续条件:第第 m 和和 m+1 节声管节声管 联接处的联接处的声压声压和和体积速度连续体积速度连续。设第设第m节声管左端点为坐标节声管左端点为坐标0点,点,右端点为右端点为lm,则有,则有 第2章数字语音处理基础 3.2语音信号的无损声管模型(,)()()0;1,2,(,)()();mmmmmmmmcxxp
11、x tututAccxlmxxux tututcc11(,)(0,),1,2,(,)(0,)mmmmmmpltptmultut()()mmuu图图3.3两个无损声管之间的节点两个无损声管之间的节点111111()()()()()()()()mmmmmmmmmmmmututututututututlmAmlm+1Am+1结合两式,可进一步求解,见下页重要表达式,后续求解要用到!令令声波声波通过长为通过长为 lm 的第的第 m 节声管节声管需要的时间需要的时间为为 ,由上页两式,得:由上页两式,得:解得:解得:式中式中km第第m节节点的节节点的反射系数;反射系数;km是是 在节点处在节点处 反射回
12、波反射回波 的的倍数倍数。图图3.4:两级声管的两级声管的流图流图。第2章数字语音处理基础 3.2语音信号的无损声管模型 11111()()()()1,2,()()()()mmmmmmmmmmmmmmccututututAAmutututut111()(1)()()()()(1)()mmmmmmmmmmmmmutkutk ututk utkut,(/)mmmlc111()(),(11;1,2,)mmmmmmkAAAAkm 图图3.4两个无损声管节点信号流图点两个无损声管节点信号流图点111 ()()()()mmmmmmutututut 1+km-km km 1kmmm+1mm+1111 ()(
13、)()()mmmmmmutututut()mmut()mmut3.2.1嘴唇端嘴唇端N 段段无损声管无损声管,声门声门处为处为第一段第一段,嘴唇嘴唇处为处为第第 N 段段。声学理论:声学理论:嘴唇处的嘴唇处的声压声压和和体积速度体积速度间存在间存在正弦稳态关系正弦稳态关系,即,即 式中,式中,ZL嘴唇处的嘴唇处的辐射阻抗辐射阻抗,或,或辐射负载辐射负载。假定假定ZL()=ZL是实数,令是实数,令N=LN/c,联立上式和,联立上式和8页偏微分方程页偏微分方程 组的解,得:组的解,得:即:即:式中,式中,kL嘴唇处的嘴唇处的反射系数反射系数,嘴唇处的嘴唇处的体积速度体积速度为:为:图图3.5:级联
14、无损声管在级联无损声管在嘴唇处嘴唇处的的流图流图。第2章数字语音处理基础 3.2语音信号的无损声管模型()()()()NNNNLNNNNNcututZututA111()()LNLNLkcAZcAZ()()NNLNNutk ut(,)(1)()NNLNNultkut(,)(,)NNLNNP lZ Ul该式与电学的该式与电学的欧姆定律欧姆定律相对应相对应(声压声压对应对应电压电压,体积速度体积速度对应对应电流电流)图图3.5级联无损声管级联无损声管在嘴唇处的流图在嘴唇处的流图()()NNNutut1+kLkL NN()()(,)NNNNNututult3.2.2声门端声门端声门可以看成是控制送入
15、声道气流的声门可以看成是控制送入声道气流的阻碍阻碍。电模拟:电模拟:声门处存在一个声门处存在一个内阻抗内阻抗(感性感性阻抗),阻抗),阻抗值阻抗值为声门处为声门处声压声压与与气流体积速度气流体积速度之之比,比,即:即:ZG=RG+j LG,RG和和LG是是常数常数。图图3.6:声门端的声门端的电模拟图电模拟图。由图得:。由图得:式中,式中,U1(0,)声门处的声门处的体积速度体积速度u1(0,t)的的Laplace变换;变换;P1(0,)声门处的声门处的声压声压p1(0,t)的的Laplace变换;变换;UG()等效体积速度源等效体积速度源uG(t)的的Laplace变换。变换。第2章数字语音
16、处理基础 3.2语音信号的无损声管模型 11(0,)(0,)()GGPUUZ图图3.6声门对应等效电路图声门对应等效电路图 I1 ZG IG U1如果如果ZG是实数,令是实数,令m=1,x=0,则由上页式和则由上页式和 8 页页偏微分方程组的解偏微分方程组的解,有:,有:解得:解得:式中式中 kG声门处的声门处的反射系数反射系数,图图3.7:声门端声门端级联无损声管的级联无损声管的流图流图。第2章数字语音处理基础 3.2语音信号的无损声管模型 11111()()GGGkZcAZcA111111()()()()()GGcutututututA Z11()0.5(1)()()GGGutkutk ut图图3.7级联无损声管在声门处的流图级联无损声管在声门处的流图111()()()GutututkG1112Gk111()()utut将将两级声管级联两级声管级联、声门端声门端和和嘴唇端嘴唇端与与声管级联声管级联的结果合成,的结果合成,可以画出基于声管理论的整个可以画出基于声管理论的整个流图流图。图图3.8:无损声管模型图无损声管模型图。图图3.8是是无损条件下无损条件下的结果;的结果;若考虑空气