《变声器设计方案样本.docx》由会员分享,可在线阅读,更多相关《变声器设计方案样本.docx(7页珍藏版)》请在优知文库上搜索。
1、MAT1.AB变声器的设计刖三随着生活水平的提高,科技的不断进步,很多人为了娱乐,从而希望改变自己的声音;还有如今的许多的访问节目为了保护被访问者,都对声音进行了相应的处理。本设计经过编写MAT1.AB程序,修改相关声音参数,使其频率发生相应的变化,在输出时达到变声。I变声原理在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。其中男生、女生和和童声的基频、共振峰的关系如图1所示;基音周期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声,实现男声到女声的变换。人群基频分布(Hz)共振峰频率分布男声50,180偏
2、低女声160,380中童声400,1000偏高图12提取参数基于短时自相关法的基音周期估值进行自相关的计算,经过MAT1.AB编程采用自相关算法能够实现基音周期的估值,即对语音信号进行低通滤波,然后进行自相关计算。在低通滤波时,采用巴特沃斯滤波器。2.1.1构建巴特沃斯低通滤波器根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数N为5,3dB截止频率国ICC=-D/。I算出IQC为o.175,归一化低通原型系统函数为1G(P)二7?p+b/+b:P+b2p+blp+bc其中%=1.OoOq-二3.2361b2=5.2361,b3=5.2361,b4=3.2361招词P
3、二带人白(P)鬲,得到低通滤波器,/7sd+4QCs+yfS3+力+bj,Js+bpC;根据设定的滤波器编写MAT1.AB程序,当信号经过低通滤波器后,对原始信号滤波产生结果如图2所示,低通滤波后,保留基音频率,然后再用2kHz采样频率进行采样,采样序列为x(n),后进行下一步的自相关计算。2.1.2语音信号的短时自相关函数定义语音信号的自相关函数如下:N-k-1用(八)=(n)x11(n+k)n=O其中k为信号延迟点数;国为语音信号;N为语音帧长度。经过低通滤波之后,取160个样点数,帧长取10ms,对每帧语音求短时自相关,取得自相关最大点数,自相关函数在基音周期处表现为峰值,这些峰值点之间
4、的间隔的平均值就是基音周期,从而估计出基音周期,可是由于图中存在野点,编写MAT1.AB程序除去野点算出对应基音周期如图3所示,设基音周期值为PT,调动PT,接近女声,设新的为PTl;2.21.PC倒谱法提取共振峰经过线性预测分析得到合成滤波器的系统函数为:其中h(n)为冲击响应,El为预测系数。下面求h(n)的倒谱Wn),首先根据同态分析方法有质1.)=Iog1.因为H是最小相位的,即在单位圆内是解析的,因此说国能够展开成级数形式,即OOz)=Eh(n)z1,就是说国的逆变换%)P7aiz1 二1OO,令式左有()()=是存在的,设)=,将式两端同时对口求导,得到:OOE就)z-一二n=1/
5、-2aiz-/E筋()在本实验中,取预测阶数为10,语音的样点数为160,按照上式可直接从预测系数同求得倒谱邈,这个倒谱是根据线性预测模型得到,即称为1.PC侄|谱。编写MAT1.AB程序,实现如图4所示,谱的峰值基本上对应于共振峰频率,用GT表示共振峰;修改共振峰,使共振峰接近女声范围,新的为GTl;图43线性预测语音信号的合成根据线性预测的基本思想,用过去M个样点值来预测现在或未来的样点值:M=Eaiy(n-1)i=1邈为预测信号,同为预测系数,y(n)为取样信号,预测误差叵:M(n)=y(n)一=乂)-Eaiy(n-i)i=1这样就能够经过在某个准则下使预测误差应应达到最小值的方法来决定
6、唯一的一组线性预测参数0(i=l-,M)把语音信号的某一帧内的短时均方预测误差定义为:M-/M?)-Eaiy(n-i)EgM=EI1.:/1为使E1质最小,对味偏导,并令其为零,有:扒)-Eaiy(n-i)Eli_1.ly(n-0j=l,oo,M上式表明采用最佳预测系数时,预测误差叵质与过去的样点值正交。由于语音信号的短时平稳性,要分帧处理,对于每一个样点值记为y(n),.,y(n+N-l),这段语音记为Yno对于语音段Yn,并记域,(上1=E(m-j)y11(m一/人对于语音段Yn,它的自相关函数为:N-IR。=Myn血-力R=Jj=l,.,M根据Yulewalker方程,能够解出样值,用这种方法定期地改变激励参数u(n)和预测系数同,并使用修改过后的基因周期和共振峰参数,就能合成出语音,合成语音样本如下:PEain-7)+Gu(n)S(n)=kZ可为预测系数,G为模型增益,u(n)为激励,合成样本s(n),P为预测器阶数;编写MAT1.AB程序,如下图:4GUI界面设计在MAT1.AB新建GUI,添加各部件。打开一段男生录制的声音,进行仿真实3佥,效果如下图所示。