联 系 我 们
联系方式:
电话:32037227
传真:020-32037227
客服1:18024065506
客服2:15384492842
地址:广州市天河区棠东广棠西路8号F栋3楼
友 情 连 接
www.ajiuxin.com
业内资讯  
【 字体: 】【打印此页】  
语音合成技术发展历程 (二)

发布日期:[2017-11-17 16:41]    共阅[]次
 第二代嵌入式语音合成引擎(2004年):大语料库裁减技术
 为了改进第一代语音合成技术,人们想到了大语料库的合成方法。在第一代合成技术中,人们没有考虑到每一个音节在不同语句环境下其实发音表现是有区别的,每个音节只有一个候选单元,拼接起来很生硬,因此造成了语句的不连贯性。
而在大语料库的合成方法中,为了解决不同情况下汉字的发音不同的问题,人们就将语料库进一步完善,将汉语音节在不同情况下的发音候选单元尽量多地保存在音库中,在合成时先进行韵律环境分析,然后从音库中挑选出最合适当前语境的音节候选单元进行拼接。因此音库尺寸越大,其包含的不同情况下的不同发音就越多,也就越贴近自然人的发音。目前,专业级的语音合成系统,如讯飞的电信级、服务级语音合成系统,均采用了大语料库甚至超大语料库的算法,每个音库的尺寸可以达到几个G的规模,理论上可以逼近原发音人的效果。
  但在嵌入式环境,显然不可能容纳这么大的音库,必须进行裁减。这一代的嵌入式语音技术就是基于各种统计决策算法,从大语料库系统中挑选出最有代表性的若干音节并保存,裁减掉其他候选音节。从而一方面降低了系统尺寸,另一方面在一定程度上保证了较好的合成效果。
大语料库技术的缺陷在于,如果要不断提升合成效果,就只有不断增加语料库中音节候选单元的个数,相应地系统尺寸就不断增大。
 
   责任编辑(广州九芯电子科技

 
【 字体: 】【打印此页】 【返回】【顶部】【关闭】  

Copyright (c)2004-2008 广州市九芯电子科技有限公司 rigths reserved. 
备案号:粤ICP备11029813号-1