您的位置: 专家智库 > >

国家自然科学基金(61273268)

作品数:4 被引量:16H指数:2
相关作者:刘加蔡猛田垚何亮钱彦旻更多>>
相关机构:清华大学中国科学院大学中国科学院电子学研究所更多>>
发文基金:国家自然科学基金国家科技支撑计划更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 1篇会议论文

领域

  • 4篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇MLP
  • 1篇语言
  • 1篇语言学
  • 1篇语言学习
  • 1篇语音
  • 1篇语音识别
  • 1篇语种识别
  • 1篇神经网
  • 1篇神经网络
  • 1篇声学建模
  • 1篇数据选择
  • 1篇数据资源
  • 1篇说话人识别
  • 1篇说话人识别系...
  • 1篇迁移
  • 1篇误检
  • 1篇计算机辅助语...
  • 1篇计算机辅助语...
  • 1篇发音错误检测
  • 1篇辅助语言

机构

  • 4篇清华大学
  • 2篇中国科学院电...
  • 2篇中国科学院大...

作者

  • 4篇刘加
  • 1篇何亮
  • 1篇田垚
  • 1篇袁桦
  • 1篇蔡猛
  • 1篇钱彦旻
  • 1篇赵军红
  • 1篇史永哲

传媒

  • 2篇清华大学学报...
  • 1篇自动化学报
  • 1篇Journa...

年份

  • 1篇2016
  • 1篇2014
  • 3篇2013
4 条 记 录,以下是 1-5
排序方式:
基于深度神经网络和Bottleneck特征的说话人识别系统被引量:13
2016年
近来,一种结合语音识别中深度神经网络(deep neural network,DNN)模型和说话人识别中身份认证矢量(identity vector,i-vector)模型的方法被证明对说话人识别十分有效。为了进一步提升系统性能,该文提出使用基于说话人标签的DNN模型提取Bottleneck特征代替该模型中的短时频谱特征来计算充分统计量,从而使统计量中包含更多有利于说话人识别的信息。在美国国家标准与技术研究院说话人识别库2008年度女性电话对电话英语测试任务上进行的实验证明了该方法的有效性。相比原来的短时频谱特征,基于Bottleneck特征的说话人识别系统在等错误率和最小检测代价上相对减小了7.65%和5.71%。
田垚蔡猛何亮刘加
关键词:说话人识别
基于无监督迁移分量分析的语种识别
训练数据和测试数据之间由于信道等差异而引起的不匹配会严重影响语种识别的性能。而在实际应用中,通常我们只能获得少量的和测试数据匹配的标注数据(目标域数据),以及大量的和测试数据不匹配的标注数据(源域数据)。本文利用迁移学习...
徐嘉明张卫强刘加夏善红
关键词:语种识别
文献传递
Exploiting articulatory features for pitch accent detection
2013年
Articulatory features describe how articulators are involved in making sounds.Speakers often use a more exaggerated way to pronounce accented phonemes,so articulatory features can be helpful in pitch accent detection.Instead of using the actual articulatory features obtained by direct measurement of articulators,we use the posterior probabilities produced by multi-layer perceptrons(MLPs) as articulatory features.The inputs of MLPs are frame-level acoustic features pre-processed using the split temporal context-2(STC-2) approach.The outputs are the posterior probabilities of a set of articulatory attributes.These posterior probabilities are averaged piecewise within the range of syllables and eventually act as syllable-level articulatory features.This work is the first to introduce articulatory features into pitch accent detection.Using the articulatory features extracted in this way,together with other traditional acoustic features,can improve the accuracy of pitch accent detection by about 2%.
Junhong ZHAOJi XUWei-qiang ZHANGHua YUANJia LIUShanhong XIA
关键词:PROSODY
低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模被引量:2
2013年
为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保证整句话可靠性的同时很好保留了上下文信息,有利于跨词的三音子声学模型建模;还提出了基于音素覆盖率准则的数据筛选方法,在考虑假设标注句子置信可靠度的同时,尽可能选取训练样本中最为稀疏的音素单元,从源头再次克服低数据资源的困难,数据选择效率更高,性能进一步提升。实验表明:基于本文改进的无监督训练方法的词错误率比基线有监督训练方法的降低约相对8%,比传统无监督方法的也有绝对2%的减少,极大程度改善了低数据资源条件下的系统性能。
钱彦旻刘加
关键词:语音识别数据选择
基于JSM和MLP改进发音错误检测的方法被引量:1
2014年
针对发音错误检测的发音字典生成提出基于联合序列多阶模型(Joint-sequence multi-gram,JSM)和多层神经感知(Multi-layer perception,MLP)的方法.首先使用JSM模型对发音错误进行建模,将标准发音和错误发音组合为发音对,表示它们之间的对应关系,再使用N元文法来统计各发音对之间的关系,描述错误发音对上下文关系的依赖.最后使用MLP对发音对之间的关系进行重新建模,以学习到在相似的上下文条件下发生的相似的错误.实验证明使用MLP对高阶模型进行概率重估能有效的平滑概率空间,提高了发音错误检测的性能.
袁桦史永哲赵军红刘加
关键词:发音错误检测计算机辅助语言学习
共1页<1>
聚类工具0