《语音信号处理讲稿第8章.ppt》由会员分享,可在线阅读,更多相关《语音信号处理讲稿第8章.ppt(25页珍藏版)》请在优知文库上搜索。
1、第第8 8章章 语音增强语音增强 本章主要讨论的问题:本章主要讨论的问题:1.语音增强基本概念 2.语音增强的原理和方法1.语音增强基本概念 语音增强的一个主要目标:从含有噪声的语音信号中提取尽可能纯净的原始语音。目前,语音识别系统大多是工作在安静(无噪声)的环境中,噪声环境对语音识别系统造成严重影响。因此,语音增强可以作为语音识别的预处理手段。2.语音增强的原理和方法 语音增强方法有多种,大致分为三类:基于语音产生模型 如:线性滤波法、梳状滤波法、自相关法 基于语音模型和噪声模型 如:维纳滤波法、卡尔曼滤波法 基于噪声特性(短时谱估计)如:频谱减法、自适应噪声抵消法2.语音增强的原理和方法
2、基于语音产生模型 1)线性滤波法 主要利用了语音的产生模型(语音知识),也用到噪声的统计知识(即对于受加性稳态白噪声干扰的语音来说,语音的频谱可以根据语音的产生模型近似地用含噪语音来预测得到)。但这些知识都是一种近似。因此,在低信噪比,且噪声不是白噪声(如有色噪声)时,效果不理想。2.语音增强的原理和方法 在线性滤波法中,噪声频谱用期望值来近似。在得到语音和噪声近似的频谱后,可得到滤波器,即)()()()(NSSH2.语音增强的原理和方法 2)梳状滤波法 它利用了语音的频谱特性,即谐波性(如元音、浊音)。对谐波性语音信号产生较大干扰的是周期性噪声,这种周期性噪声可以用梳状滤波器予以抑制,采用数
3、字信号处理方法来实现。缺点:必须已知语音的基频;没有考虑到谐波被噪声干扰的情况;对辅音的增强不理想(辅音不一定存在谐波性)。2.语音增强的原理和方法 梳状滤波器可在时域实现,表达式如下:其中,L为基频周期;M为常数;x(n)是滤波器输入信号序列;y(n)为输出信号序列;Ck为系数,随信号周期而变化。输出信号y(n)是输入信号x(n)的延时加权和的平均值。当延时与周期一致时,这个平均过程将使周期性分量得到加强,而其他非周期性分量或与信号周期不同的其他周期性分量受到抑制或消除。梳状滤波器也可以在频域实现。MMkkkLnxCny)()(梳状滤波法的原理图2.语音增强的原理和方法 3)自相关法 利用语
4、音时域波形特征,即利用语音信号相关性来滤除噪声,增强语音信号。在语音信号中,元音和浊音具有明显的周期性,其相关函数也具有周期性,而噪声一般无规则,其相关函数从R(0)开始很快衰减。因此,含噪语音的相关函数基本上就是噪声中语音的相关函数。缺点:自相关信号校准较困难,滤波时信息的损伤较大;对辅音的增强不理想,因为辅音几乎不存在周期性;此外,在低信噪比时,语音信号相关性减弱,增强效果不理想。2.语音增强的原理和方法 基于语音模型和噪声模型 1)维纳滤波法 假定线性滤波器的输入为有用信号和噪声之和,两者均为广义平稳过程且已知它们的二阶统计特性,他根据最小均方误差准则(滤波器的输入信号与需要信号之差的均
5、方值为最小)求得最佳线性滤波器的参数。2.语音增强的原理和方法 维纳滤波器的缺点:维纳滤波器要求输入过程广义平稳且输入过程的统计特性已知。一般情况下,语音是非平稳的。它没有完全利用语音的生成模型。因此,它不适合于非平稳噪声干扰下的语音增强。卡尔曼滤波器可以弥补上述两个缺陷。2.语音增强的原理和方法 2)卡尔曼滤波法 卡尔曼滤波法建立在噪声模型和基于语音LPC生成模型基础上,假定噪声和语音都是一个由高斯白噪声驱动的、具有适当阶数p的自回归AR模型,弥补了维纳滤波器的上述两个缺陷。2.语音增强的原理和方法 自回归AR模型是一种全极点模型,即 式中,p为阶数,ak为LPC系数。因此,由H(z)=1/
6、A(z)可构成全极点滤波器。pkkkzazA11)(2.语音增强的原理和方法 设语音为s(n),则有 其中,u(n)为激励源,g为增益因子。当s(n)为清音时,u(n)为宽带噪声;当s(n)为浊音时,u(n)为间隔为基音周期的脉冲串。当不存在背景噪声时,由序列s(n)求各声道参数ak的过程,即是典型的线性预测(LPC)分析。pkknguknsans1)()()(2.语音增强的原理和方法 在卡尔曼滤波器中,语音s(n)和噪声n(n)分别假定为p阶和q阶的AR模型如下:其中,(n)、(n)是零均值、方差分别为2、2 的高斯白色序列。被加性噪声污染的含噪声语音信号x(n)可描述为 x(n)=s(n)
7、+n(n)纯净语音信号s(n)是不可接近的,只能从唯一可测量的信号x(n)中估计出其最佳值s(n)。qjjpjjnjnnbnnnjnsans11)()()()()()(2.语音增强的原理和方法 卡尔曼滤波法的缺点:a.当信噪比较低时,语音与非语音信号的判别存在困难。b.用有限的自回归过程代替噪声和语音的产生过程,存在近似。c.用非语音段的噪声参数替代语音段的噪声参数,也存在近似。d.当信噪比较低时,噪声必然会对语音参数的估计产生影响,语音参数估计难以保证足够的精度。e.整个过程计算复杂性较大,难以实时实现。2.语音增强的原理和方法 基于噪声特性(短时谱估计)基于噪声特性的短时谱估计方法,是一种
8、经典的方法,可以从含噪语音信号中直接估计出原始语音。此外,由于人耳对语音相位的感受不敏感,所以,通常将估计的对象集中在短时谱幅度上。常见的语音短时谱估计方法有两种:频谱减法和自适应噪声抵消法。2.语音增强的原理和方法 1)频谱减法 它利用噪声的统计平稳性以及加性噪声与发音不相关的特点。其主要思想是:含噪语音在噪声平均功率以上的部分就是语音功率,其余则是噪声功率。缺点:忽略了噪声和语音的随机特性,对提高语音信噪比十分有限,而且会引起语音的失真。在低信噪比时,效果不理想。2.语音增强的原理和方法 在频谱减法中,假设噪声信号的采样值为n(n),语音信号的采样值为s(n),含噪语音信号的采样值x(n)
9、为 x(n)=s(n)+n(n)其傅里叶变换为 X()=S()+N()则频谱减法滤波器为 S()=X()-N()谱相减法的原理框图,如图所示。谱相减法的原理框图谱相减法的原理框图2.语音增强的原理和方法 2)自适应噪声抵消法 a.自适应噪声抵消法的特点 优点:该方法的语音增强效果最好。它比其他方法多用了一个参考噪声作为辅助输入,从而获得了较全面的关于噪声的信息,达到更好的降噪效果(特别是在辅助输入噪声与语音中的噪声完全相关时)。当在输入过程的统计特性未知(“学习”过程)时,或是输入过程的统计特性变化(“跟踪”过程)时,自适应滤波器能够调整自己的参数,以满足某种最佳准则(如最小均方准则、最小二乘
10、准则等)的要求。缺点:参考噪声在某些情况下难以获得。2.语音增强的原理和方法 b.影响自适应噪声抵消性能的两个因素:a)参考输入中含有信号成分。b)基本输入和参考输入中含有非相关的噪声成分。2.语音增强的原理和方法 c.自适应噪声抵消法的工作原理 自适应噪滤波器通常采用FIR滤波器,其系数可以采用最小均方(LMS)法进行估计,以便使如下误差信号的能量最小:NkkknrWndnsnvndnsne1)()()()()()()(2.语音增强的原理和方法 其中,y(n)=s(n)+d(n)为第一通道输入的含噪语音,s(n)为纯净语音,d(n)为平稳加性高斯噪声;v(n)是含噪信号滤波后的结果;r(n)是第二个通道采集到的噪声信号;Wk为滤波器系数;N为FIR滤波器的抽头数。只要噪声与话音相互独立,使误差e(n)的平均值最小,就能得到最接近于含噪语音中的噪声复制品。但若采集到的噪声与语音相关,则滤波器系数只应在语音间歇期间进行刷新。带自适应滤波器的噪声抵消器原理图,如图所示。带自适应滤波器的噪声抵消器原理图