国家高技术研究发展计划(2007AA04Z223) 作品数:7 被引量:18 H指数:2 相关作者: 刘加 谢鹏 宋辉 韩超 邓妍 更多>> 相关机构: 清华大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 电子电信 更多>>
一种新的声纹确认的片上系统 2009年 实现了一个高性能、低成本、低功耗的声纹确认片上系统(SOC)。系统核心算法采用基于高斯混合模型以及通用背景模型(GMM-UBM)建模的说话人确认算法,采用了Mel倒谱系数(MFCC)作为说话人特征。此SOC系统不仅可进行声纹确认,而且包含说话人模型的训练,可实时更新说话人的人数和模型。系统的平均EER达到了0.0342。 毛鹏飞 刘加关键词:片上系统 MLLR特征的SVM语种识别算法 为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对... 钟山 刘加关键词:语种识别 支持向量机 文献传递 采用变步长算法的无双端检测回声消除系统 被引量:6 2010年 提出了一种新型无双端检测的自适应回声消除系统,在与传统的回声消除系统比较过程中,本系统表现出了良好的性能,不但结构简单,计算量也小。模拟双端通信实验表明,该自适应滤波器工作正常,回声消除性能好,减少了采用传统的回声消除算法中双端检测错误造成语音切音现象和回声消除不干净的状况。 谢鹏 刘加关键词:自适应滤波器 回声消除 基于微分麦克风阵列的自适应语音增强算法研究及DSP实现 被引量:8 2009年 自适应滤波是语音增强算法中的常用技术,而算法复杂度与收敛速度是设计各种自适应算法需要首要考虑的问题.本文提出一种用于片上的语音增强自适应滤波新算法.该算法分两步实现,首先,利用一阶微分麦克风阵列,获得噪声的实时估计;其次,对传统的仿射投影算法(Affine projection algorithm,APA)加以改进,得到计算误差向量的快速算法,并根据估计误差动态调整搜索步长以及仿射投影维数,对带噪语音进行自适应滤波消噪.在TMS320VC5509 DSP芯片上实现该算法.实验表明,算法的自适应滤波过程具有接近递推最小二乘算法(Recursive least squares,RLS)的快速收敛速度,以及类似最小均方误差算法(Least mean squares,LMS)的低算法复杂度. 宋辉 刘加关键词:语音增强 仿射投影算法 自适应滤波 噪声消除 语种识别中基于局部多样性建模的向量空间模型 被引量:1 2011年 针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,最后对不同的模型进行加权组合。为了有效地对不同模型进行组合,需要对模型的加权系数进行优化。对模型组合算法从理论上进行推导,在模型权重与分数线性融合系数之间建立起对应的数学关系,并提出采用逻辑回归方法对不同模型的权重进行估计。在美国国家标准技术局(NIST)2009年度语种识别测试库上的实验结果表明:所提方法不仅能够处理大规模的训练数据,而且相比传统方法识别性能也有了一定程度的提高,系统的等错误率在30 s、10 s和3 s的测试条件下分别下降了8.44%、5.91%以及3.45%。 邓妍 张卫强 刘加关键词:语种识别 向量空间模型 逻辑回归 段长在汉语识别系统后处理阶段的应用 针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结... 李曜 刘加关键词:语音识别 文献传递 子带仿射投影及子带双端检测算法的回声消除系统 被引量:2 2010年 文中提出了一种新的多相位子带自适应回声消除系统。在子带内进行自适应滤波对建模长度比较长的脉冲响应特别有效,同时由于仿射投影算法具有预白化的作用,它同样也具有改善滤波器收敛性能的功能。该系统集中了多相子带自适应滤波和仿射投影算法的优点,结合了子带内的双端检测算法,使得系统在临界采样的情况下能进行稳定有效的工作。实验表明:该系统对于语音信号和强相关信号都表现出了良好的性能。 谢鹏 刘加关键词:仿射投影算法 回声消除 一种面向保密通信的改进型MBE语音编码算法 2009年 随着军事通信的应用需求迅速扩展,如何有效地在信源端对语音信号进一步压缩,并且在复杂信道条件下实现高质量的低速率语音编码技术是一个重要研究方向。以MBE语音编码模型为基础,提出了一种改良算法,即在编码端利用信源冗余度,将对语音合成质量影响较大的参数进行检纠错保护,并在解码端采用谐波增强以改善终端语音合成质量。测试数据表明,在1%~3%的信道误码条件下,PESQ评分平均提高了近14%。 李炜 刘加关键词:语音编码 新型多模态人性化语音交互系统 被引量:2 2009年 面向服务机器人的语音交互需求,研究了一种新型的多模态人性化语音交互系统。该系统采用了连续语音流的关键词检测技术、说话人识别技术、基于传声器阵列语音定位技术和对话管理技术,能进行和谐的人机语音交互。多模态人性化语音交互系统通过这些技术综合利用使系统能知道"谁"在什么"时候"什么"地点"发出什么"指令"。基于人性化语音交互系统,机器人根据语音知道特定服务对象的需求,提供特定服务。 韩超 刘加关键词:说话人识别 传声器阵列