《Praat客服语音标注.docx》由会员分享,可在线阅读,更多相关《Praat客服语音标注.docx(11页珍藏版)》请在优知文库上搜索。
1、语音转写操作手册一、用脚本打开语音文件I点击raatopenreadfromfile找到你打开的文件一打开一选中同一个文件名的两个文件一View&Edit:2QrI+2可以同时两层打点,AlBackspace可以删除时间点;做完以后Ctrl+S保存到根文件下面:请参看培训视频。二、起先标注语音文件时间边界定位:按Tab键可以播放语音,再次按B,Esc键可以停止播放语音可以放大波形;可以缩小波形。建议放大1-2标注。听音,在整段电话语音的基础上,依据语义和停忽然间等因素,在音频信号中每一句话的句首和句尾分别添加时间边界。添加时间边界的方法为:将鼠标移动到语音波形的相应位置,这时会出现一条虚线以及
2、圆圈,分别点击SPEAKER层和CoNTENT层对应的圆圈即可.或者干脆Ctrl+2可以自动同时在SPEAKER层和CONTENT层打上时间点.在整个语音文件中,SPEAKER层和CONTENT层的时间边界的数0是完全一样的,每一对时间边界也是完全相等的。请留意,SPEAKER层和CoNTENT层的时间边界必需保持一样。也就是说不管点击哪一层的时间边界,另外一层肯定是空心蓝色,而不是实心蓝色文件标注:G1.OBA1.层主要标注语音文件的些全局信息,包括说话人性别信息和语种信息(方言区)。标注格式如卜丁IspeakerJil空格W空格性别,空格2空格性别;空格language:空格川空格方言区,
3、空格2空格方言区例如:speaker:1male,2female;language:1一般话,2般话speaker:1male,2male;language:1一般话,2一般话speaker:1female,2female;(language):1一般话,2一般话speaker:1female,2male;language:1-*般话,2一般话SPEAKER层须要标注的是说话人信息,“说话人”取值为以下两种:1、2,分别表示说话人1、说话人2。(说话人1、2仅标注在文字段上,符号段不标注)假如是客服类对话,则SPEAKER层的“说话人”取值为1的语音,必需是话务员:用户的语音取值为2(客服肯定
4、是和用户有干脆对话,否则不算客服)假如第三个人是用户的状况:speaker:1female,2female,4female;(languageJ:1一般话,2一般话,4一般话CONTENT层须要标注的是该句对应的文字,假如是汉语交谈,则只能用简体汉字。对于语音中的数字部分需依据发音状况转换为对应的汉字,例如“27”一“二十七”:“我的电话是“我的电话是(与发音相同)”。CONTENT层正常语音的标注 假如此语段为某一个人的汉语对话语音,请在SPEAKER和CONTENT标注时间边界,SPEAKER层标注1或者2,CONTENT层输入相应的文本。 假如此语段为两个人交叉语音,关于的语音,即对于某
5、个人的一句话未完,另一个人的一句话已经起先的状况:请在SPEAKER层和CONTENT层标注时间边界,SPEAKER层不标注内容,CoNTENT层标注对于费加,必需是真实的。不能将大段的听不清语音和叠加混在一起。叠加段内的非叠加部分,前后最多不得超过1个字。至于由于添加校加的时间边界导致的半个语音(即切掉头或者尾)可用*或UNK来表示。*和UNK取决于是单段的听不清,还是在语音中听不清。 在整个语音中,需依据说话人的变换来增加时间边界。 假如同一说话人说话时间较长,则应依据其语义来增加时间边界,每个时间段的长度最多,但断句也不要太敬太短。每个Fl然语言段平均在5-6秒左右即可。 每个时间边界的
6、最佳位置在音频能量的最低点(即波谱图上黑色部分最淡的地方),假如仅有几个字包含不进来,那么建议舍弃这几个字 英文:【单词】对于语音中简洁的英文单词,在能听懂的状况下,干脆标出即可。特别符号用发音标注,不写特别符号。例如:“网址是三W点Sina点com:“二三八幺八三二艾特qq点com”:(不要写)“请以井号键结束”;(不要写#)【字母】每个字母中间用空格隔开。例如:good表示读音,good则表示I读音。例如:我的编号是fms幺三二 假如发音是表示应答的0其他的这种口头发音,也须要用的汉字标注。比如哦,啊,唉等.CONTENT层短暂噪音的标注短暂噪音是指特别短暂的突发的声音,全部此类标注都是中
7、括号与语音内容的组合,不要标注时间边界。1听不清的一个字/英文单词干脆在句子中标注例如:二三八幺八UK二清嗓子5系统提示音,即系统播出的语音提示:IPROMPT系统自动播放的语音内容,而非说话人的语音内容(其次层不用标说话人)例如:IPROMPTJ欢迎致电我公司现在由一号客服代表为您服务CONTENT层持续噪音的标注持续噪音是指比较长的一段声音,全部此类标注都是单独的噪音类型,须要标注中拈号和时间边界,SPEAKER层不标注内容1明显的静音段Q于500m1)MSI1.(假如空白段没有任何声音,可以空着,后期技术处理)1TertGfidOOOOOOXK0010M.BW2各种坨圾声音:1)连续的拍
8、桌子2)连续的敲击声3)持续的各种环境噪音(氏于50OmD3连续的笑声:1.AUGH4持续的音乐声:MUSIC 唱歌声(有歌词和旋律) 哼唱(没有歌词,但有旋律) 口哨声 可能是别人唱歌、演奏,也可能是背景的电视、收音机发出的音乐和歌声口哨声包括持续时间较长的彩铃声5录音及电信系统引起的噪声:SYSTEM包括电话按键音dimf、电话忙音be叩、录音系统的其他噪音等,都是通信系统主动发出的声音,而不是摘机、挂机或T扰带来的咔啦或毗毗杂音。一般会用的噪音符号:HHensj,|1NKI.SONANT,1.AUGH,PROMPT,SYSTEM)修改标注,去除端点:点中端点,all_backspace移
9、动端点:干脆用鼠标拖动修改文字:点中语音段,在编辑框中修改保存ClrI+S保存到你文件的根书目下面;三工具自查CheCktoOl1 先进入程序安装文件夹,安装perl和Python程序。留意perl安装运用默认路径C:Perlbinperl.python安装运用默认路径C:Python27python2 点击l_Textgrid_modifytmp已完成语音放tmp里面一退出来一步点击run3 把1.TeXtgriC1.mOdify中tmp的语音全部曳制到一2_checktool的ImP中一run看出错的地方,如:intervals50,说明第50段语音有错,将对应文件的textcheck打开,查找到intervals50,查看是什么错误,最终在里面做修改,保存即可(改一个借误保存一次),再重复上面的操作改下一个错误,直到最终没有报错为止。