国家高技术研究发展计划(2006AA010104)
- 作品数:9 被引量:42H指数:4
- 相关作者:王仁华戴礼荣郭武朱维彬吕士楠更多>>
- 相关机构:中国科学技术大学中国科学院北京交通大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于均值超矢量聚类和特征映射的说话人确认被引量:1
- 2009年
- 在与文本无关的说话人确认研究中,特征映射是减少信道影响的最有效的方法之一。但是随着信道的复杂化,特征映射的效果很难体现出来。本文在混合高斯模型的均值超矢量上采用EM算法对信道类型进行聚类,然后通过特征映射的方法在特征参数域中减去信道的影响。在NIST SRE 2006数据库1conv4w-1conv4w任务上,采用本文方法的系统相对基线系统在等错误率上降低了18%。
- 郭武戴礼荣王仁华
- 关键词:说话人确认特征映射
- 基于基音周期与清浊音信息的梅尔倒谱参数被引量:4
- 2007年
- 提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。
- 郭武王仁华戴礼荣
- 关键词:说话人确认基音频率
- 新闻播报言语数据库构建及韵律标注
- 将篇章层面的文本转换为准确、生动的合成语音,涉及了语言计算、韵律建模、语音合成等一系列技术问题。而这些问题的解决,一方面需要制定一个更具科学性的韵律描述方案,用以做为语言学与声学间的信息交互接口,进而构建语音合成系统的语...
- 李晓红朱维彬何伟邹煜
- 关键词:韵律标注新闻播报
- 文献传递
- 说话人识别中的串行因子分析被引量:2
- 2009年
- 在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子.采用这种策略可有效解决因子分析中的饱和问题.在NISTSRE2006年核心测试数据库上等错误率能达到3.65%.
- 郭武戴礼荣王仁华
- 关键词:说话人识别
- 采用UBM更新量作为支持向量机特征的说话人确认被引量:6
- 2008年
- 在采用支持向量机的文本无关的说话人确认中,针对传统的均值超向量特征区分性不够明显的情况,该文提出采用相对背景模型的权重更新量以及均值更新量形成超向量,用这个超向量作为支持向量机的特征函数,在线性核函数的情况下,能够取得优于均值超向量和传统的Gauss混合模型-通用背景模型(GMM-UBM)的方法。在2006年美国国家标准与技术研究所说话者识别(NIST SRE)1conv4w-1conv4w数据库上,该方法相对于基线的GMM-UBM系统等错误率降低了22%。实验结果表明:权重参数在支持向量机中具有重要的作用,在不考虑与UBM的耦合性的情况下超向量能够取得更强的分类能力。
- 郭武戴礼荣王仁华
- 关键词:说话人确认
- 说话人识别中简化的信道因子估计
- 2008年
- 在与文本无关的说话人识别研究中,因子分析是减少信道影响的有效的方法之一,但是因子分析在估计信道空间时需要大量的数据以及复杂的EM(expectation maximization)运算,在测试的时候对数似然度函数的计算量非常大。该文采用主成分分析的方法来简化信道因子的估计过程,首先采用混合Gauss模型的均值超矢量估计出信道因子所在的空间,然后通过特征映射的方法在特征参数域中减去信道因子的影响。在美国国家标准与技术研究所(NIST)2006年1conv4w-1conv4w数据库上,采用该文方法的系统等错误率相对基线系统降低24%。采用本文中的信道因子估计和特征映射的方法,能够在保持高识别性能的前提下,大大简化运算的过程,对系统的实时实现有重要的意义。
- 郭武戴礼荣王仁华
- 关键词:说话人确认
- 采用高斯概率分布和支持向量机的说话人确认被引量:3
- 2008年
- 在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年 NIST SRE 1conv4w-1conv4w 数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降.
- 郭武戴礼荣王仁华
- 采用主成分分析的特征映射被引量:11
- 2008年
- 在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%.
- 郭武戴礼荣王仁华
- 关键词:说话人确认混合高斯模型
- 采用模型和得分非监督自适应的说话人识别被引量:3
- 2009年
- 在说话人识别的研究中,使用以前的测试语句信息对模型参数或者测试得分进行动态更新,使模型可以更精确地反映测试语句和说话人模型之间的关系,这种更新策略称为非监督模式,这方面的研究对实际的说话人识别系统具有非常重要的意义.本文除了采用非监督的说话人模型自适应更新方法之外,还提出了非监督的得分域自适应算法:首先采用双高斯函数对得分建立一个先验的得分模型,利用最大后验概率准则对得分规整的模型进行调整.在测试过程中,采用得分域和模型域的非监督算法可以互相补充,提高识别率,在NISTSRE2006年1训练语段-1测试语段数据库上,使用模型域和得分域非监督自适应的系统能够取得等错误率4.3%和检测代价函数0.021的结果.
- 王尔玉郭武李轶杰戴礼荣王仁华
- 关键词:说话人确认混合高斯模型
- 基于语义的语音合成——语音合成技术的现状及展望被引量:13
- 2007年
- 综述了语音合成技术的发展现状.指出并分析了目前系统存在的发音质量、韵律预测、表现能力等3个方面的问题.提出了将语义分析引入语音合成系统,使合成语音具有准确、生动的语义表现能力,并作为新一代语音合成系统的目标.探讨了实现这一目标所涉及的理论基础、技术实现、基础资源等研究内容.
- 朱维彬吕士楠
- 关键词:语音合成语义韵律