杨琳
- 作品数:17 被引量:51H指数:4
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术理学更多>>
- 基于频率调制信息的人工耳蜗语音处理算法研究被引量:4
- 2009年
- 在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。
- 杨琳张建平王迪颜永红
- 关键词:人工耳蜗语音处理噪声环境
- 基于语支鉴别性的音素相关语种识别方法被引量:1
- 2014年
- 提出一种音素相关特征,并将语言学中语支的思想引入语种识别。结合音素相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法。通过对音素后验概率进行降维和均值方差规整,得到音素相关特征。使用因子分析技术将各语支变化量空间的低维变化量因子进行拼接得到音素层语支变化量因子,然后在语支内部和语支间分别对语支变化量因子进行支持向量机(SVM)建模。实验基于俄语音子识别器,在美国国家标准技术署(NIST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的方法与传统的ivector系统相比,在EER、minDCF和NIST2011年LRE评价指标上相对提升29.9%-54.6%。
- 王宪亮万玉龙杨琳周若华颜永红
- 韵律特征在概率线性判别分析说话人确认中的应用被引量:6
- 2015年
- 研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。
- 梁春燕杨琳周若华颜永红
- 关键词:线性判别分析说话人确认韵律特征MEL频率倒谱系数说话人识别
- 说话人识别中的总变化因子分析技术
- 2013年
- 研究并实现了总变化因子分析(Total Variability Factor Analysis)技术,该技术在对说话人进行建模的时候,不区分语音中的说话人信息和信道信息,而是将整个语音空间(总变化空间)进行建模,然后在这个空间上对训练和测试语音计算其相应的总变化因子向量(Ivector),来作为支持向量机(Support Vector Machine,SVM)建模和分类的特征。为了降低信道对识别的影响,我们使用线性鉴别分析(Linear Discriminant Analysis,LDA)降维技术以及类内协方差规整(Within-Class Covariance Normalization,WCCN)技术对Ivector进行信道补偿。实验结果表明同时使用WCCN和LDA对Ivector进行信道补偿要好于单独使用WCCN或LDA;并且与传统的联合因子分析系统(Joint Factor Analysis,JFA)相比,以作为评价指标,在男、女测试集上,等错率(Equal Error Ratio,EER)分别相对降低1.20%和9.27%。
- 杨琳黄远杨晶超汪俊杰索宏彬
- 关键词:说话人识别信道补偿
- 特定领域的汉语语言模型平滑算法比较研究被引量:7
- 2006年
- 为了完成特定领域的语音识别任务,利用有限的语料建立高性能的语言模型成为提高系统性能的关键。针对此问题,对特定领域的语言模型进行了研究。提出了利用高频新词来加强模型的领域特征的方法,采取了两种方案:一种是将高频新词直接加入原有字典,并在训练过程中增加这些新词的权重,使模型更能表达与领域相关的特征;一种是基于高频新词统计出一个和领域相关的小词表,并对这两种方案进行了比较研究。通过实验研究了适合汉语语言的平滑策略。最后,实验结果表明,对于特定领域问题,语言模型平滑算法对模型性能影响较大;采用适合汉语的Witten-Bell插值平滑,可以使识别率达到88.4%,比通用模型性能相对提高了18.18%。
- 杨琳张建平颜永红
- 关键词:语言模型语音识别字典
- 一种采用总变化量因子的语种识别方法及系统
- 本发明提出了一种基于总变化量因子的语种识别方法及系统,所述方法包含:步骤101)提取某语种若干段训练语音的声学特征,并依据全局背景模型和总变化量因子空间模型将提取的声学特征映射为总变化量因子,其中每一句话的总变化量因子是...
- 杨琳周若华颜永红
- 文献传递
- 基于语支鉴别性的音素相关语种识别方法
- 本文提出一种音素相关特征,并将语言学中语支的思想引入语种识别.结合音素相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法.通过对音素后验概率进行降维和均值方差规整,得到音素相关特征.使用因子分析技术将各语支变化...
- 王宪亮万玉龙杨琳周若华颜永红
- 关键词:语种识别
- 文献传递
- 单通道语音增强算法对汉语语音可懂度影响的研究被引量:18
- 2010年
- 考察了当前常用的几种单通道语音增强算法对汉语语音可懂度的影响。受不同类型噪音干扰的语音经过5种单通道语音增强算法的处理后,播放给具有正常听力水平的被试进行听辩,考察增强后语音的可懂度。实验结果表明,语音增强算法并不能改进语音的可懂度水平;通过分析具体的错误原因,发现听辩错误主要来自于音素错误,与声调关系不大;而且,同英文的辨识结果相比,一些增强算法对于中、英文可懂度影响差异显著。
- 杨琳张建平颜永红
- 关键词:语音增强算法汉语语音可懂度单通道听力水平噪音干扰
- 长时语音特征在说话人识别技术上的应用被引量:8
- 2010年
- 本文除介绍常用的说话人识别技术外,主要论述了一种基于长时时频特征的说话人识别方法,对输入的语音首先进行VAD处理,得到干净的语音后,对其提取基本时频特征。在每一语音单元内把基频、共振峰、谐波等时频特征的轨迹用Legendre多项式拟合的方法提取出主要的拟合参数,再利用HLDA的技术进行特征降维,用高斯混合模型的均值超向量表示每句话音时频特征的统计信息。在NIST06说话人1side-1side说话人测试集中,取得了18.7%的等错率,与传统的基于MFCC特征的说话人系统进行融合,等错率从4.9%下降到了4.6%,获得了6%的相对等错率下降。
- 张建平李明索宏彬杨琳付强颜永红
- 关键词:语音特征识别技术说话人LEGENDRE高斯混合模型多项式拟合
- 音子配列学语种识别系统中特征选择方法的研究被引量:1
- 2013年
- 将信息增益和加权log似然比特征选择方法应用于音子配列学语种识别系统中进行特征降维。在美国国家标准技术研究院2009年语种识别评测数据集上进行实验,分别使用信息增益和加权log似然比准则以及传统的互信息,X^2统计量方法对数量巨大的N-gram进行特征选择,从中选出最具有鉴别性的部分组成特征向量,并用分类器进行分类。结果显示,当根据信息增益和加权log似然比准则选取一定数量的特征时,系统性能与使用全部特征的基线系统相比略好;当选取的特征数量很少时,信息增益和加权log似然比方法的性能要优于传统的互信息和X^2统计量方法。实验表明,在音子配列学语种识别系统中,信息增益和加权log似然比方法均可以有效地去除冗余信息,降低特征向量的维数,并且能使系统性能得到一定的提高。
- 梁春燕杨琳汪俊杰张建平颜永红
- 关键词:语种识别信息增益N-GRAM