国家自然科学基金(60872113)
- 作品数:40 被引量:197H指数:8
- 相关作者:杨俊安刘辉王一张琼陈雷更多>>
- 相关机构:安徽省电子制约技术重点实验室解放军电子工程学院电子工程学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金博士研究生创新基金更多>>
- 相关领域:自动化与计算机技术电子电信理学一般工业技术更多>>
- 加权邻域重构及其在声目标识别中的应用
- 2011年
- 针对流形学习方法用于声目标识别时易受噪声干扰的情况,提出一种加权邻域重构算法,采用加权迭代方式构造出带噪流形子曲面中最能反映该曲面变化趋势的曲线,通过拓展该曲线对带噪流形子曲面进行重构,利用新曲面计算低维嵌入.该算法在去除噪声的同时,最大限度地保持了原流形曲面的变化趋势,是一种适用于声目标识别的算法.在公开数据库和低空飞行目标实际数据中进行实验,结果表明在识别正确率及运行时间上,本文提出的算法相对于其他3种对比算法均取得了较好的效果.
- 王一邹继伟杨俊安刘辉白京路
- 关键词:声目标识别
- 一种适用于说话人识别的改进Mel滤波器被引量:9
- 2013年
- Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。
- 项要杰杨俊安李晋徽陆俊
- 关键词:说话人识别MEL倒谱系数语音信号
- 关联小波神经网络与高斯混合模型说话人识别被引量:1
- 2013年
- 针对GMM模型在进行说话人识别时对噪声敏感以及在分类方面存在的缺陷,提出了一种小波神经网络和GMM结合的说话人识别模型,把GMM输出的似然概率和小波神经网络的训练相关联,采用带动量的BP算法和EM算法对小波神经网络和GMM模型分别训练,使目标说话人模型似然概率达到最大,进而提高说话人识别的效果。实验结果表明,新模型兼具小波神经网络抗噪声性能、学习分类能力以及GMM对说话人特征的描述能力,在多种噪声背景下能有效的提高说话人识别效果。
- 项要杰杨俊安李晋徽杨瑞国
- 关键词:信号处理语音识别说话人识别小波神经网络高斯混合模型
- LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法被引量:9
- 2015年
- 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。
- 陈雷杨俊安王一王龙
- 关键词:连续语音识别说话人自适应
- 一种新的基于DBN的声学特征提取方法
- 2015年
- 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升深度置信网络的识别准确率,提出一种基于区分性和ODLR自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高模型的鲁棒性。利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别结果取得了22.2%的提升。实验结果表明所提出的特征提取方法有效性。
- 陈雷杨俊安王龙李晋徽
- 关键词:连续语音识别
- DSmT混合规则的高复杂度优化被引量:3
- 2010年
- 针对DSmT混合规则计算和存储复杂度高的问题,提出一种矩阵计算法。该算法对辨识框架的基本元素进行集合编码,从而简化混合规则的组合过程。实验结果表明,该算法使执行时间随辨识框架大小呈指数增加,随证据源数目和焦元数呈线性变化,能有效避免高复杂度。
- 陈凯杨俊安陈昊
- 关键词:复杂度
- 基于RNN汉语语言模型自适应算法研究被引量:4
- 2016年
- 深度学习在自然语言处理中的应用越来越广泛。相比于传统的n-gram统计语言模型,循环神经网络(Recurrent Neural Network,RNN)建模技术在语言模型建模方面表现出了极大的优越性,逐渐在语音识别、机器翻译等领域中得到应用。然而,目前RNN语言模型的训练大多是离线的,对于不同的语音识别任务,训练语料与识别任务之间存在着语言差异,使语音识别系统的识别率受到影响。在采用RNN建模技术训练汉语语言模型的同时,提出一种在线RNN模型自适应(self-adaption)算法,将语音信号初步识别结果作为语料继续训练模型,使自适应后的RNN模型与识别任务之间获得最大程度的匹配。实验结果表明:自适应模型有效地减少了语言模型与识别任务之间的语言差异,对汉语词混淆网络进行重打分后,系统识别率得到进一步提升,并在实际汉语语音识别系统中得到了验证。
- 王龙杨俊安刘辉陈雷林伟
- 关键词:循环神经网络语言模型在线自适应
- 连续语音识别中基于Dropout修正线性深度置信网络的声学模型被引量:4
- 2016年
- 大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。
- 陈雷杨俊安王龙李晋徽
- 关键词:连续语音识别过拟合DROPOUT
- 基于循环神经网络的汉语语言模型建模方法被引量:5
- 2015年
- 语言模型是语音识别系统的重要组成部分,目前的主流是n-gram模型。然而n-gram模型存在一些不足,对语句中长距信息描述差、数据稀疏是影响模型性能的两个重要因素。针对不足,研究者提出循环神经网络(Recurrent Neural Network,RNN)建模技术,在英语语言模型建模上取得了较好的效果。根据汉语特点将RNN建模方法应用于汉语语言建模,并结合两种模型的优点,提出了模型融合构建方法。实验结果表明:相比传统的n-gram语言模型,采用RNN训练的汉语语言模型困惑度(Per PLexity,PPL)有了下降,在对汉语电话信道的语音识别上,系统错误率也有下降,将两种语言模型融合后,系统识别错误率更低。
- 王龙杨俊安陈雷林伟
- 关键词:语音识别循环神经网络语言模型
- 一种基于内壳向量的SVM增量式学习算法被引量:2
- 2011年
- 本文针对支持向量机难以快速有效地进行增量式学习的问题,提出了一种基于内壳向量的支持向量机增量式学习算法。算法通过线性规划运算求得最可能包含支持向量的壳向量和内壳向量集合,在保证分类精度的前提下最大程度地缩小训练集规模,进而在新的训练集中快速训练支持向量机。将该算法应用于公开数据及低空飞行声目标分类识别,结果表明,新算法缩短了训练时间,且比现有其他算法具备更高的分类精度和稳定性。
- 王一杨俊安刘辉耿钦
- 关键词:支持向量机