欢迎光广州市九芯电子科技有限公司网站!

全国服务热线:400-8616-826

您的位置: 首页>>新闻中心>>行业资讯

咨询热线

400-8616-826

语音合成技术发展历程 (二)

作者:admin时间:2017-11-17243 次浏览

信息摘要:

广州市九芯电子科技有限公司是一家专注于语音科技研究的高新技术企业,主要提供语音IC、语音芯片、语音模块、语音提示器、语音报警器、叉车限速器、汽车限速器等业务服务....

 第二代嵌入式语音合成引擎(2004年):大语料库裁减技术
 为了改进代语音合成技术,人们想到了大语料库的合成方法。在代合成技术中,人们没有考虑到每一个音节在不同语句环境下其实发音表现是有区别的,每个音节只有一个候选单元,拼接起来很生硬,因此造成了语句的不连贯性。
而在大语料库的合成方法中,为了解决不同情况下汉字的发音不同的问题,人们就将语料库进一步完善,将汉语音节在不同情况下的发音候选单元尽量多地保存在音库中,在合成时先进行韵律环境分析,然后从音库中挑选出合适当前语境的音节候选单元进行拼接。因此音库尺寸越大,其包含的不同情况下的不同发音就越多,也就越贴近自然人的发音。目前,专业级的语音合成系统,如讯飞的电信级、服务级语音合成系统,均采用了大语料库甚至超大语料库的算法,每个音库的尺寸可以达到几个G的规模,理论上可以逼近原发音人的效果。
  但在嵌入式环境,显然不可能容纳这么大的音库,必须进行裁减。这一代的嵌入式语音技术就是基于各种统计决策算法,从大语料库系统中挑选出有代表性的若干音节并保存,裁减掉其他候选音节。从而一方面降低了系统尺寸,另一方面在一定程度上保证了较好的合成效果。
大语料库技术的缺陷在于,如果要不断提升合成效果,就只有不断增加语料库中音节候选单元的个数,相应地系统尺寸就不断增大。
 
   责任编辑(广州九芯电子科技

 
返回列表 本文标签:

Copyright © 2022 广州市九芯电子科技有限公司 All Rights Reserved. 粤ICP备16001794号 XML地图

400-8616-826