您的位置: 专家智库 > >

张健

作品数:4 被引量:11H指数:2
供职机构:中国科学院声学研究所更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
相关领域:电子电信更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 4篇电子电信

主题

  • 3篇语种
  • 3篇语种识别
  • 2篇对数似然比
  • 2篇似然
  • 2篇F
  • 1篇信号
  • 1篇信号处理
  • 1篇语速
  • 1篇语音
  • 1篇语音信号
  • 1篇语音信号处理
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇时长
  • 1篇时语
  • 1篇识别方法
  • 1篇向量
  • 1篇向量机
  • 1篇SVM

机构

  • 4篇中国科学院
  • 3篇国家互联网应...
  • 1篇中国科学院新...
  • 1篇中国科学院大...

作者

  • 4篇张健
  • 3篇周若华
  • 3篇颜永红
  • 2篇包秀国
  • 2篇徐杰
  • 1篇王宪亮
  • 1篇索宏彬
  • 1篇万玉龙
  • 1篇袁庆升

传媒

  • 2篇清华大学学报...
  • 1篇网络新媒体技...
  • 1篇第十三届全国...

年份

  • 1篇2018
  • 1篇2017
  • 2篇2015
4 条 记 录,以下是 1-4
排序方式:
应用于语种识别的加权音素对数似然比特征被引量:4
2017年
语种识别的关键问题之一是提取语音信号中的语种鉴别性信息。近期,音素对数似然比(phone log-likelihood ratio,PLLR)的新特征被引入语种识别领域,并表现出了优异的性能。该文利用F比方法分析了PLLR特征向量各维的语种鉴别性大小,提出了加权音素对数似然比(weighted PLLR,WPLLR)特征,赋予PLLR特征中含有较多语种鉴别性信息的分量较高的权重。在美国国家标准技术署(National Institute of Standards and Technology,NIST)2007年语种识别测试集上的实验结果表明:相比于原PLLR特征,该文所提出的WPLLR特征在平均检测代价和等错率2个指标上都显著降低。
张健徐杰包秀国周若华颜永红
关键词:语音信号处理语种识别
应用于短时语音语种识别的时长扩展方法被引量:7
2018年
为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音;其次,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音;最后,送入语种识别系统进行识别。实验结果表明:所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能。
苗晓晓张健索宏彬索宏彬颜永红
关键词:语种识别语速
应用于语种识别的加权音素对数似然比特征
语种识别的关键问题之一是提取语音信号中的语种鉴别性信息。在最近的研究中,一个名为音素对数似然比(phone log-likelihood ratio,PLLR)的新特征引入了语种识别领域,表现出了非常优秀的性能。在本文中...
张健徐杰包秀国周若华颜永红
关键词:语种识别
文献传递
基于SVM一对多得分规整的语种识别方法
2015年
提出一种支持向量机(SVM)一对多得分规整的语种识别方法。通过对SVM得分进行规整,提高了各语种得分间的区分性,同时对分类效果较差的SVM分类器更鲁棒。仿真实验基于音素层特征的并行音素识别器后接向量空间模型(PPRVSM)的语种识别系统上进行,在美国国家标准技术署(NIST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的规整方法在语种识别性能评价指标EER和min DCF上相对提升2.6%-10.9%。
王宪亮袁庆升包秀国张健万玉龙周若华颜永红
关键词:支持向量机
共1页<1>
聚类工具0