中国科学院战略性先导科技专项(XDA06030100)
- 作品数:12 被引量:38H指数:4
- 相关作者:颜永红李军锋国雁萌付强许春冬更多>>
- 相关机构:中国科学院北京理工大学国家互联网应急中心更多>>
- 发文基金:中国科学院战略性先导科技专项国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:电子电信更多>>
- 多领域系统融合在语音云系统中的应用
- <正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能...
- 陈梦喆张晴晴颜永红
- 文献传递
- 利用二重打分方法的激活词语音识别
- <正>0引言语音被认为是人与人之间交流最自然的方式之一,自动语音识别(ASR)也是一种重要的人机交互方式。几十年来,众多学者做了大量与语音识别相关的工作,其中的一个方向就是激活词语音识别,也可以称为激活词检测:向机器发出...
- 邢安昊黎塔颜永红
- 文献传递
- 基于N元文法的领域语法语料扩展算法
- 语言模型训练语料的数据稀疏性问题,一直是语音识别任务所面临的一个严重问题。基于领域语法扩展训练语料的方法,能够有效地缓解特定域语言模型训练数据稀疏性问题。本文在领域语法的基础上,提出了一种基于语言模型N元文法(Ngram...
- 梁宏黎塔
- 关键词:N元文法语言模型语音识别
- 文献传递
- 基于SVM的合成语音检测
- 斯超向量分类技术引入到了合成语音检测系统中,利用svm二分类起进行合成语音检测在保证检测速度的情况下可以达到一个较为优秀的效果。但由于训练数据标注问题,对性能还是一定影响。并且在更大的训练数据规模下,svm也很难进一步进...
- 杨朔计哲郭耀辉颜永红
- 关键词:自动化检测信号识别
- 基于DNN的声学模型自适应实验被引量:5
- 2015年
- 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能.
- 张宇计哲万辛张震葛凤培颜永红
- 关键词:语音识别
- 两扬声器配置下的串声消除系统参数优化设置被引量:1
- 2014年
- 针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
- 许春冬李军锋裘嫄夏日升颜永红
- 关键词:三维声音逆滤波
- 汉语连续语音识别系统中三音子模型的优化被引量:4
- 2013年
- 为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
- 齐耀辉潘复平葛凤培颜永红
- 关键词:三音子模型最大后验概率
- 一种小资源下语音识别算法设计与优化
- 在可穿戴设备和智能家居系统的实际应用中,语音识别引擎需要占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源的这种需求,本文在解码策略和拒识算法设计上均提出了改进方法。解码策略方面,通过修改垃圾音素的重入...
- 张鹏远计哲侯炜金鑫韩卫生
- 关键词:语音识别置信度
- 文献传递
- 具有选择注意能力的语音拾取技术被引量:4
- 2015年
- 随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.
- 王晓飞国雁萌葛凤培吴超付强颜永红
- 关键词:传声器阵列语音增强
- 基于DNN的声学模型自适应实验研究
- 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题。基于深度神经网络模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下。文章针对领域相关的自...
- 张宇计哲万辛张震葛凤培颜永红
- 关键词:语音识别
- 文献传递