王作英
- 作品数:184 被引量:518H指数:11
- 供职机构:清华大学信息科学技术学院电子工程系更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金面向21世纪教育振兴行动计划更多>>
- 相关领域:电子电信自动化与计算机技术语言文字理学更多>>
- 线性判别分析在汉语语音识别中的应用被引量:5
- 2002年
- 该文实现了线性判别分析在汉语连续语音识别系统中的应用。通过将多帧原始特征联合后进行特征选择,特征之间的帧间相关性得到了有效的利用,从而提高了语音的识别率。实验结果表明,系统误识率下降16.90%。
- 谢达东吴及王作英
- 关键词:汉语语音识别特征提取
- 利用段长信息的改进连续语音识别算法被引量:9
- 1997年
- 以基于段长分布的隐含Markov模型为基础,提出了一种改进的帧同步束搜索连续语音识别算法,使段长信息在连续语音识别中得到充分有效的利用,并与原算法作了比较。在该算法的具体实现上,建立了状态的局部路径组和全局活跃路径两种数据结构,并采用了帧同步快速实时算法来处理局部路径的剪枝和跳转。说明了段长参数的估计方法。介绍了非特定人大词汇量连续语音识别的实验,实验结果表明,利用段长信息改进识别算法比原识别算法字的误识率降低了6%。
- 赵庆卫王作英
- 关键词:语音识别误识率参数估计
- 语音识别的动态规划和距离选用——特征空间轨迹匹配法与加权逆LPC距离
- 张世平陆大王作英
- 关键词:元音识别动态规划匹配网络
- 多模式汉语连续语音识别中视觉特征的提取和应用
- 本文讨论了多模式汉语语音识别系统的整体模型和视觉特征利用中的若干关键技术。我们给出了基于多流隐马尔科夫模型(Multi-stream Hidden Markov Model,MSHMM)的听视觉融合方案,并对于用最小错误...
- 刘鹏王作英
- 文献传递
- 汉语语音识别中的有调拼音多候选问题
- 孙甲松王作英吴及
- 关键词:语音识别
- 用于语音处理的逆LPC距离
- 提出了一种新的用于语音处理的距离测度——逆LPC距离,文中还对已有的一些距离测度做了分析,并通过比较说明了逆LPC距离在频谱比较意义上更加合理。它没有其它LPC距离所带有的畸变性。它还具有对称性及计算简单等优点。(本刊录...
- 张世平陆大王作英
- 关键词:语音数据处理预测技术
- 连续语音识别中利用帧间相关性的研究被引量:2
- 2001年
- 尽管作为当前最为流行的语音识别模型,隐马尔可夫模型(HMM)由于采用了状态输出独立同分布假设,因此不能描述语音现象中固有的时间相关性。文章介绍了一个更为灵活的基于段长分布HMM(DDBHMM)的研究帧相关性的框架,并在此基础上提出了一个混合模型,采用一种将语音特征静态信息和动态变化信息分别描述又有机结合在一起的方式,以较小的计算代价更为合理地刻划了真实的语音现象。汉语大词汇量非特定人连续语音识别的实验表明,通过利用帧相关性识别系统的性能得到了明显改善。
- 欧智坚王作英
- 关键词:语音识别隐马尔可夫模型帧间相关性语音信号处理
- 语音识别中段长相关信息的利用被引量:1
- 2003年
- DDBHMM(DurationDistributionBasedHiddenMarkovModel)模型克服了经典HMM中段长为指数分布的缺陷,更加符合语音信号的物理实际,取得了很好的效果。该文对DDBHMM框架下的段长相关性进行了研究,介绍了相关性的训练算法和段长相关性用于快速识别的可行性,并将段长相关性运用于语速自适应,有效降低了由于语速问题引起的删除错误和插入错误。
- 李健王作英
- 关键词:语音识别
- 一种基于文本分类的语言模型自适应方法
- 本文介绍了一种基于文本分类的语言模型自适应方法.首先.我们用Kullback距离算法将语料文本分类为8个领域,并为每一个领域建立三元语言模型.但试验表明某些领域的语言模型的性能变差.为了解决这个问题,我们试图利用领域语言...
- 孙甲松崔晓东王作英
- 关键词:语言模型自适应文本分类语音识别系统
- 文献传递
- 连续语音识别系统中的One pass搜索方法被引量:4
- 2004年
- 文中介绍了在THSP系统上如何实现基于beamviterbi搜索的onepass方法 ,并且结合onepass方法的特点 ,对识别方式分别从声学层和语言层进行了一些改进。一方面 ,为了从声学层传递尽可能多的信息给语言层 ,提出了对三长度假设及静音处理方式的改进。另一方面 ,利用语言层知识来指导声学层剪枝。最后 ,文中就实验结果探究了基于beamviterbi搜索的onepass方法相对于twopass方法的优劣 ,并指出 ,在系统开销基本没有增加的前提下 。
- 何璠孙甲松王作英
- 关键词:搜索算法ONEPASS维特比