刘文举
- 作品数:73 被引量:271H指数:8
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术语言文字理学更多>>
- 一种发音稳定段辅助的语音识别优化解码方法及装置
- 本发明公开了一种基于发音稳定段的语音识别解码方法。针对语音识别解码过程复杂度较高的问题,本发明提出利用语音的稳定性信息改善解码过程中路径扩展的方式,达到降低解码复杂度的目的。本发明的方案包括下列步骤:对语音信号计算语谱图...
- 刘文举杨占磊
- 分段模型在解码假设检验中的应用
- 2004年
- 本文主要研究了分段模型 (以参数轨迹模型为例 )在解码假设检验中的应用。分段模型与传统的HMM相比 ,具有更加精确的建模能力。多年来人们一直致力于研究它对语音识别性能的提高 ,而忽视了其它方面的应用。本文提出了分段模型校验的方法 ,对HMM的识别结果进行二次处理 ,克服了传统方法在不同句子间不具有可比性的缺点 ,简单而有效 ;在此基础上 ,为了满足系统的特殊要求 ,训练Fisher分类器 ,选择分段模型而非HMM的N Best信息作为特征输入 ,验证了分段模型得分作为可信度指标时的优秀区分能力。实验结果表明 ,在第一类错误率为 5 %的情况下 ,最好的第二类错误率可以降到 2 5 2 6 5 %。这体现了系统良好的拒识性能。
- 张翼燕刘文举徐波
- 关键词:人工智能自然语言处理
- 基于高斯-拉普拉斯-伽玛模型和人耳听觉掩蔽效应的信号子空间语音增强算法被引量:6
- 2009年
- 针对信号子空间语音增强算法中的子空间选择和线性滤波器中噪声功率谱和拉格朗日乘子的估计问题,用高斯、拉普拉斯和伽玛模型描述了语音的分布,提出了利用目标语音概率最大化来确定信号子空间维度的方法。在噪声子空间上,利用条件概率估计出噪声功率谱。接着,为了合理地折中增强语音中的残余噪声和语音畸变,提出了一种基于人耳听觉掩蔽效应的拉格朗日乘子估计方法。实验证明,在多项语音质量评价指标上,所提算法都取得了更好的结果。所提的信号子空间算法比传统的信号子空间算法更有效地消除了噪声,使得恢复的语音具有更好的质量。
- 程宁刘文举
- 关键词:语音增强算法信号子空间听觉掩蔽效应人耳伽玛高斯
- 一种基于深度学习技术的自动口音分类方法及装置
- 本发明公开了一种基于深度学习技术的自动口音分类方法和装置,方法包括:对训练集中的所有带口音语音进行去除静音并提取MFCC特征;根据所提取的MFCC特征训练各种带口音语音的深层神经网络,以描述各种带口音语音的声学特性,其中...
- 刘文举陈明明张邯平高鹏董理科刘晓飞乔利玮王桐
- 基于声学相关特征与词典语法相关特征的汉语重音检测被引量:8
- 2011年
- 重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学相关特征以及词典语法相关特征进行建模,Boosting集成分类回归树充分利用了当前音节的特性.同时还对词典语法相关特征采用条件随机场方法建模,条件随机场很好地利用了当前音节的上下文特性.最后,将Boosting集成分类回归树模型和条件随机场模型加权组合获得识别率更高的混合模型.该混合模型克服了Boosting集成分类回归树模型的不足,实现了Boosting集成分类回归树和条件随机场的优势互补.实验结果表明该方法具有较好的分类效果,在ASCCD语料库上能够获得84.82%重音检测正确率.同时,与之前其他人的工作在相同的条件下(相同的训练集和测试集)对比,在正确率方面,该方法分别有4.01%和1.67%的提高.另外,该文中,对英语的重音检测和汉语的重音检测做了对比,并通过特征分析方法从另一个层面验证了一些语言学上的结论.
- 倪崇嘉张爱英刘文举
- 关键词:重音条件随机场神经网络分类回归树
- 基于韵律间断层级的汉语韵律间断分类被引量:1
- 2011年
- 针对韵律间断的层次性,提出了一种层次韵律间断分类方法。该方法能够充分利用韵律结构层次性,同时又能够充分利用来自声学、词典以及语法方面的特征,对不同类型的韵律间断进行分类。通过在具有韵律标注库ASCCD上的实验,该算法在综合测试集上达到平均78.25%检测正确率。
- 倪崇嘉张爱英刘文举徐波
- 关键词:层级结构
- 马尔柯夫类模型中NP问题的实用快速算法研究
- 刘文举陈道文李成荣卢绪刚高升张翼燕祝韶辉康永国
- 该课题研究两类马尔柯夫随机模型,即部分可观测马尔柯夫决策过程和隐马尔柯夫模型,在实际应用中的快速算法。前者研究中提出了双向生长和裁减决策树覆盖集的实用快速算法,进一步给出了在拼接两个方向决策树时,得到组成整个决策树时最佳...
- 关键词:
- 关键词:语音识别NP
- 一种改进的单声道混合语音分离方法
- 2009年
- 在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法,该方法在几乎不降低原方法分离性能的前提下,大大节约了算法运行所需的时间和资源消耗。
- 李鹏关勇刘文举徐波
- 关键词:语音分离计算听觉场景分析信噪比
- 一种模型互补的汉语重音识别方法及系统
- 本发明是一种模型互补的汉语重音识别方法及系统,首先由第一输入模块输入汉语语音、汉语文本、汉语语音中每一个汉字的切分边界,由分词、词性标注模块对输入的汉语文本进行分词和词性标注处理,得到汉语文本中每一个汉字的词典特征和语法...
- 刘文举倪崇嘉
- 文献传递
- 基于Sinusoidal+全极点模型的语音频谱平滑
- 本文提出了一种基于Sinusoidal+全极点模型的语音频谱平滑方法,该方法先对待平滑语音段的LPC参数进行插值,然后以这些插值得到的LPC频谱包络为目标,对待平滑语音段进行修改.实验结果显示,在拼接单元频谱差异较大的情...
- 康恒刘文举
- 关键词:语音合成
- 文献传递