刘浩杰
- 作品数:7 被引量:26H指数:3
- 供职机构:中国科学院声学研究所更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于Word Lattice结构的语音识别置信度算法被引量:2
- 2006年
- wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前后向算法高效计算lattice中每个弧的词后验概率及以其为基础计算每个词的置信度的算法。
- 付跃文陈国平刘浩杰
- 关键词:语音识别置信度WORDGRAPH
- 汉语韵律词F0曲线的优化被引量:1
- 2006年
- 汉语韵律词内部音节重音的强弱对总的F0曲线的特征有很大影响。本文参考生成F0曲线的数学优化模型[1],提出了对由孤立单音节调型曲线串接而成的汉语韵律词的F0曲线的连续性、平滑性、曲线形状、平均值进行整体优化的x2估计方法,实现了在重音作用下的F0曲线的优化。在谐波+噪声合成系统上实验研究了汉语三音节韵律词的64种不包含轻声的调型组合和10种结尾为轻声的调型组合的F0曲线的优化效果,展示优化过程中三个控制参数———平滑因子(smooth)、音节重音强度(stress)、音节F0形状失真度(Distor-tion)对F0曲线整体形状的控制效果和参数取值的有效范围。非正式的听觉实验表明合成语音的自然度有明显提高。
- 刘浩杰杜利民
- 关键词:计算机应用中文信息处理语音合成
- 基于MMSE准则的基频模型被引量:3
- 2005年
- 在声调与语调相互作用理论的基础上,该文利用最小均方误差准则有效地提取了连续语流基频曲线的高音线及低音线,从量化的角度证实了高音线及低音线对连续语流基频曲线的作用及其区别。该文还对声调与语调相互作用的数学模型做了初步探讨,建立了基频曲线的双线调节及调中值模型,为合成系统基频灵活有效地调整提供了新的手段,提高了语音合成系统的自然度。
- 刘浩杰杜利民
- 关键词:语音信号处理最小均方误差准则
- 语音合成技术的发展与展望被引量:15
- 2007年
- 阐述了语音合成的内涵和框架,对语音合成技术的算法和韵律研究现状做了系统的总结,分析了该领域目前所面临的问题。并介绍了基于谐波噪声内核的合成系统的实现。最后对高质量语音合成系统的属性做了阐述,对未来的发展做了展望。
- 刘浩杰杜利民
- 关键词:语音合成
- 短时傅立叶变换在阵列声波信息提取中的应用被引量:4
- 2005年
- 在阵列声波资料处理的过程中,一般都通过时域或频域方面来提取信息,没有将时域和频域组合成一个域,从而不能更好的服务于实际。采用短时傅立叶变换则能够将时域与频域联系起来,从.而能够结合时域与频域的优势在阵列声波信息提取中得到更好的效果。本文研究了短时傅立叶变换方法原理,并对实际应用进行了分析。结果表明,短时傅立叶变换在阵列声波信息提取中是可靠的。
- 田鑫章成广江万哲刘浩杰
- 关键词:短时傅立叶变换信息提取阵列声波声波频域时域
- 汉语语音合成系统的基频建模和优化
- 基于规则的语音合成系统在可懂度方面已经达到可以接受的程度,在自然度方面离人们的期望还有一定的距离.基频建模是提高汉语规则语音合成系统自然度所面临的主要挑战之一.本论文以自然语流的真实基频为研究对象,分别从反演和正演的角度...
- 刘浩杰
- 关键词:语音合成韵律模型
- 文献传递
- 韵律块基频曲线的优化及规则被引量:2
- 2007年
- 汉语规则合成系统中,连续语流基频曲线(F0曲线)的生成并不是各个合成单元F0曲线的简单拼接,而是语音学功能单元的综合作用。该文提出了汉语韵律块基频曲线优化的正演思想,使韵律块内的基频曲线融入重音强度、形状失真度以及发音速度等语境和发音的个体信息,提高合成语音的自然度。基于这种优化思想,该文针对聚类后的单音节、二音节和三音节韵律块的基频曲线,利用最小均方误差准则通过反演提取了各个单元的优化相关参数(高音线、低音线、平滑因子、形状失真度、重音强度)。对音节在韵律块中的位置因素和声调因素对优化相关参数的影响的统计分析表明了参数提取结果的可靠性和基频曲线优化的合理性,得到了优化控制参数在规则合成系统中具体的应用规则。实际的听测实验表明,韵律块基频曲线进行优化前后,合成系统的清晰度分别为3.25和3.35,自然度分别为2.9和3.31。
- 刘浩杰杜利民付跃文