国家重点基础研究发展计划(2004CB318106)
- 作品数:21 被引量:90H指数:5
- 相关作者:颜永红赵庆卫董滨付强潘接林更多>>
- 相关机构:中国科学院西安电子科技大学北京电子技术应用研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:电子电信理学自动化与计算机技术一般工业技术更多>>
- 基于听觉感知子带的自适应谷点形成算法
- 自适应谷点形成算法具有结构小巧,算法简单而易于实现,性能显著等特点。在噪声消除、语音识别前端和助听器的设计领域有较强的实用价值。本文介绍了一种基于听觉感知的自适应谷点形成算法,在利用分带减弱由窄带效应引起的系统性能下降的...
- 张恒付强颜永红
- 关键词:听觉感知子带
- 文献传递
- 基于频率调制信息的人工耳蜗语音处理算法研究被引量:4
- 2009年
- 在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。
- 杨琳张建平王迪颜永红
- 关键词:人工耳蜗语音处理噪声环境
- 用于电话语音识别系统的置信度估计方法的研究
- 2006年
- 提出了一种用于电话语音识别系统的置信度快速估计算法,此算法是在语音识别器帧同步束搜索的过程中基于状态图的同步估计算法,使用同识别器解码相同的声学模型进行置信度估计,此算法取得了比传统的两遍解码估计置信度算法更好的性能,而且计算复杂度较低,运行速度快,解决了计算置信度时使用模型的区分度与计算速度之间的矛盾。
- 董滨赵庆卫颜永红
- 关键词:置信度电话语音识别状态图
- 基于听觉感知子带的自适应谷点形成算法
- 2007年
- 自适应谷点形成算法具有结构小巧、算法简单、易于实现、性能显著等特点,在噪声消除、语音识别前端和助听器的设计领域中有较强的实用价值。介绍了1种基于听觉感知的自适应谷点形成算法,在利用分带减弱由窄带效应引起的系统性能下降的同时,较大程度地保护了语音成分不受伤害。
- 张恒付强颜永红
- 关键词:听觉感知子带
- 混合双语语音识别的研究被引量:2
- 2010年
- 随着现代社会信息的全球化,双语以及多语混合的语言现象日趋普遍,随之而产生的双语或多语语音识别也成为语音识别研究领域的热门课题。在双语混合语音识别中,主要面临的问题有两个:一是在保证双语识别率的前提下控制系统的复杂度;二是有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法,并将该方法与传统的基于声学似然度准则的聚类方法进行比较;针对双语语音中非母语语音识别性能较低的问题,提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。实验结果表明,通过上述方法建立起来的中英双语语音识别系统在有效控制模型规模的同时,实现了同时对两种语言的识别,且在单语言语音和混合语言语音上的识别性能也能得到有效保证。
- 张晴晴潘接林颜永红
- 关键词:语音识别系统混合语言双语聚类方法聚类算法控制系统
- 基于音色单元分布的音乐结构分析被引量:3
- 2010年
- 音乐的结构是音乐作品表达作者思想的一种重要形式,也是听众理解音乐作品内涵的有效途径。本文研究了基于音乐特征的音色单元建模方法,研究了在Fisher准则下,根据局部范围音色单元的分布,采用非监督聚类方法分析音乐的结构。实验结果证明了基于离散余弦变换的音色特征,用音色单元分布聚类算法进行音乐结构分析的有效性。
- 李相莲李明刘若伦颜永红
- 关键词:音乐作品音色FISHER准则离散余弦变换聚类方法
- 一个快速自动音乐记谱方法被引量:4
- 2010年
- 自动音乐记谱是音乐信号处理中的关键技术。本文描述了一个快速的自动复音音乐记谱方法。该方法采用回声器时频分析(RTFI)作为时频分析工具,主要由两个阶段组成,能量基的音符切分和多基频估计。本文所采用的多基频估计方法首先将RTFI能量谱按照谐音组合原理转换为基频能量谱,并基于基频能量谱采用简单的峰拾起方法对基频做初步估计;然后根据频谱不规律性和乐音谐音结构的基本假定,消除初步估计中的错误预测。
- 周若华颜永红
- 广播新闻语料识别中的自动分段和分类算法被引量:3
- 2006年
- 该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于单音素解码的分段算法。仿效说话人鉴别中的方法,文中提出了基于混合高斯模型的分类算法。该算法较好地解决了音频段的多类判决问题。在“新闻联播”测试数据中的实验结果表明,该文提出的自动分段和分类算法性能与手工分段分类性能几乎相当。
- 吕萍颜永红
- 关键词:语音识别
- 广播新闻语料自动识别系统
- 广播新闻类语料作为真实语音的主要来源之一,已成为语音识别的研究重点。本文针对广播新闻语料声学环境复杂多变的特点,构建了完整的广播新闻语料识别系统一ThinkIT-BNR系统。该系统包括:音频匹配、音频自动分段、音频分类、...
- 吕萍颜永红
- 关键词:音频分类说话人聚类
- 文献传递
- 音频信号截幅失真的检测与修复被引量:4
- 2009年
- 音频信号截幅失真的修复是信号修复工作的重要组成部分,目的是使得信号恢复完备性,以便于对其进行进一步研究。提出了一种音频信号截幅失真的检测与修复方法。首先通过研究截幅失真特性,描述了基于音频信号峰值大小而进行的检测算法,并创造性地将基于AR模型以及最小均方误差的LSAR算法应用于修复算法中。随后给出应用该算法后得到的实验结果,以及在截幅失真测试集上得到的信噪比及PESQ值改善的统计,由上述实验数据可以验证,该方法对不同采样率截幅失真的修复均有一定效果,达到了音频修复的要求,提高了音频质量。
- 刘春花付强杨家玮颜永红
- 关键词:AR模型