您的位置: 专家智库 > >

国家自然科学基金(60970080)

作品数:4 被引量:8H指数:1
相关作者:杨莹春吕士楠吴洁敏陈力更多>>
相关机构:浙江大学中国科学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术语言文字电子电信更多>>

文献类型

  • 4篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 2篇语言文字
  • 1篇电子电信

主题

  • 2篇韵律特征
  • 2篇说话人识别
  • 1篇得分
  • 1篇情感
  • 1篇主观
  • 1篇主观体验
  • 1篇物理基础
  • 1篇相似度
  • 1篇邻居
  • 1篇REGULA...
  • 1篇FEATUR...
  • 1篇GMM
  • 1篇GTR
  • 1篇GRANUL...
  • 1篇EMOTIO...

机构

  • 4篇浙江大学
  • 1篇暨南大学
  • 1篇中国科学院

作者

  • 2篇吴洁敏
  • 2篇杨莹春
  • 1篇吕士楠
  • 1篇朱磊
  • 1篇陈力

传媒

  • 1篇中国语文
  • 1篇清华大学学报...
  • 1篇浙江大学学报...
  • 1篇Journa...
  • 1篇第九届中国语...

年份

  • 1篇2017
  • 1篇2014
  • 1篇2012
  • 1篇2011
  • 1篇2010
4 条 记 录,以下是 1-5
排序方式:
基于邻居相似现象的情感说话人识别被引量:1
2012年
根据语音学的研究,提出中性时发音相似的说话人,在情感状态下的发音人相似的假设——邻居相似现象,并通过定量和定性的分析验证了该假设,即在音素内容相同的情况下,同一说话人的中性模型和情感模型对应高斯分量的"邻居"基本类似.为了解决说话人情感变化时语音短时特征的分布与中性语音模型存在差异的问题,提出说话人情感模型合成的方法——将开发库中学习到的中性-情感变化规律移植到评测库中,根据说话人的中性模型合成出情感模型.从邻居相似现象的特性出发,根据KL距离选取该说话人中性下若干相似的邻居,根据基于邻居的方法和基于邻居变换的方法,合成出该说话人的情感模型.MASC库上的实验结果表明,该方法的识别准确率比传统的GMM-UBM算法提高了2.81%,与情感属性映射(EAP)方法相比识别率提高了1.3%.
陈力杨莹春
试论感情语调的超常韵律特征被引量:5
2011年
感情语调具有情韵特征,能传递感情信息。通过用不同模式朗读相同文本,提取感情语调和中性语调的韵律特征并测听对比发现,感情语调的音高、音长、音强等某项或多项出现超常现象。实验表明:这是读者主观体验和"因情求气"获得了承载感情信息的"气韵",也就取得了产生超常韵律的动能;再通过朗读形成的超常韵律特征,使听者感知和读者听觉反馈的心理、生理发生变化而接收到感情信息。感情语调的超常韵律就是情韵特征,因此声象和意象均可反复。研究还发现,在感情语调语意焦点重音边界以及短语或句末声断之后,有时进入感情状态的"气韵"还会继续延伸,所以"声断气连"会起到"此时无声胜有声"和"余韵缭绕"的效应。
吴洁敏吕士楠
关键词:主观体验
基于GMM托肯配比相似度校正得分的说话人识别被引量:1
2017年
该文提出一种基于Gauss混合模型(GMM)托肯配比相似度校正得分(GMM token ratio similarity based score regulation,GTRSR)的说话人识别方法。基于GMM-UBM(通用背景模型)识别框架,在自适应训练和测试阶段计算并保存自适应训练语句和测试语句在UBM上使特征帧得分最高的Gauss分量编号(GMM token)出现的比例(配比),然后在测试阶段计算测试语句和自适应训练语句的GMM托肯分布的配比的相似度GTRS,当GTRS小于某阈值时对测试得分乘以一个惩罚因子,将结果作为测试语句的最终得分。在MASC数据库上进行的实验表明,该方法能够使系统识别性能有一定的提升。
杨莹春邓立才
关键词:说话人识别
Mismatched feature detection with finer granularity for emotional speaker recognition被引量:1
2014年
The shapes of speakers' vocal organs change under their different emotional states, which leads to the deviation of the emotional acoustic space of short-time features from the neutral acoustic space and thereby the degradation of the speaker recognition performance. Features deviating greatly from the neutral acoustic space are considered as mismatched features, and they negatively affect speaker recognition systems. Emotion variation produces different feature deformations for different phonemes, so it is reasonable to build a finer model to detect mismatched features under each phoneme. However, given the difficulty of phoneme recognition, three sorts of acoustic class recognition—phoneme classes, Gaussian mixture model(GMM) tokenizer, and probabilistic GMM tokenizer—are proposed to replace phoneme recognition. We propose feature pruning and feature regulation methods to process the mismatched features to improve speaker recognition performance. As for the feature regulation method, a strategy of maximizing the between-class distance and minimizing the within-class distance is adopted to train the transformation matrix to regulate the mismatched features. Experiments conducted on the Mandarin affective speech corpus(MASC) show that our feature pruning and feature regulation methods increase the identification rate(IR) by 3.64% and 6.77%, compared with the baseline GMM-UBM(universal background model) algorithm. Also, corresponding IR increases of 2.09% and 3.32% can be obtained with our methods when applied to the state-of-the-art algorithm i-vector.
Li CHENYing-chun YANGZhao-hui WU
感情语调的超常韵律和反常韵律特征
承载感情信息的韵律特征叫情韵特征。感情语调是具有情韵特征、能传递感情信息的语调。提取感情语调和中性语调的韵律特征进行对比发现感情语调的某项或N项韵律会出现超常现象;表极端感情又会出现数值低于中性语调的平直呆板的反常韵律,...
吴洁敏朱磊
关键词:物理基础
文献传递
共1页<1>
聚类工具0