戴蓓蒨 作品数:42 被引量:103 H指数:6 供职机构: 中国科学技术大学信息科学技术学院电子科学与技术系 更多>> 发文基金: 国家自然科学基金 安徽省自然科学基金 江苏省“六大人才高峰”高层次人才项目 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
声码器半解码参数用于说话人身份确认 被引量:3 2005年 面向通信领域广泛使用的线性预测声码器,设计了一种不经过“解码-特征提取”过程,而直接由传输码流截取说话人特征的方法,并针对宽带自适应多码率声码器(AMRWB)建立了与文本无关的话者确认系统.系统采用基于概率统计模型的GMMUBM结构,以LPC倒谱作为主要的话者特征矢量,并加入基音衍生参数以提高确认性能.实验表明,该系统在运算速度提高一个数量级的情况下,达到了与基于重建语音的话者确认系统相接近的性能,且对码率失配具有良好的鲁棒性. 李晓先 戴蓓蒨 李辉关键词:话者确认 基音频率 基于HMM-UBM和短语音的说话人身份确认 被引量:2 2004年 提出了一种简单有效的与说话人有关的阈值设置方法 ,同时在确认系统中采用高斯混合模型(GMM)作为背景模型来模拟未知的冒认者的语音 ,在冒认文本多样化的情况下获得了比用隐马尔可夫模型(HMM)作背景模型更好的性能 .本文在此基础上实现了一个基于Internet的与文本有关的远程语音身份认证系统 ,在实验测试和应用测试中均获得了满意的确认性能 . 李霄寒 黄南晨 戴蓓蒨 姚志强关键词:说话人确认 基于GMM多维概率输出的SVM话者确认 被引量:2 2008年 提出一种结合统计模型与区分性模型优点的说话人确认方法:基于GMM多维概率输出的SVM话者模型的说话人确认.以目标说话人的GMM模型对一条语音的不同特征分量的概率输出作为特征参数,建立目标说话人的SVM模型.在NIST’05 8conv4w-lconv4w数据库上的实验表明该方法的有效性. 刘明辉 戴蓓蒨 解焱陆关键词:说话人确认 文本无关 结合谱减和缺失特征重建的鲁棒性话者识别 被引量:2 2009年 针对加性噪声影响下文本无关说话人识别系统性能急剧下降的问题,提出谱减和缺失特征重建相结合的方法。该方法将被噪声严重污染的频段称为缺失特征,采用谱减法对语音信号进行前端处理,并检测缺失特征;利用基于聚类的重建方法,由可靠特征估计缺失特征。在YOHO数据库上信噪比(SNR)为5~20dB的实验表明,相对于单独的谱减法和缺失特征重建方法,该方法的识别性能有显著提高。 王宁 陆伟 戴蓓蒨 李辉关键词:说话人识别 谱减 鲁棒性 基于TZ Normalization规整的话者确认阈值选取 被引量:6 2005年 针对说话人确认中,各目标话者模型输出评分分布不一致而导致系统确认阈值设置的困难,本文采取了通过评分规整确定系统最小检测代价函数(DCF)确认阈值的方法。在分析了已有的两种评分规整方法Z norm a l-ization和T norm a lization的基础上,提出了一种结合两者优点的组合规整方法——TZ norm a lization,并据此给出了一种阈值动态修正方法,有效地提高了系统的性能和阈值选取的鲁棒性。对历年的N IST(手机电话语音)评测语料库进行了实验,表明了该方法的有效性。 刘明辉 陈继旭 戴蓓蒨 李辉关键词:说话人确认 NORMALIZATION 基于多微商核函数的SVM话者确认 2011年 给出了一种基于多微商核函数(MDK)的结合高斯混合模型(GMM)和支持向量机(SVM)的方法,并应用于SVM文本无关话者确认。从GMM话者语音特征概率分布出发,用多阶微商描述GMM概率分布,将GMM和SVM结合的问题转化为用多阶微商建立SVM话者模型的问题。首先对说话人语音进行基于因子分析的参数域失配补偿,用GMM描述失配补偿后的话者语音特征的概率分布;然后对GMM求多阶微商;最后构建多微商核函数,建立多SVM话者模型。在NIST’01 2min-1min话者确认数据库上的实验表明,基于多微商核函数的SVM话者确认系统性能优于基于失配补偿的GMM系统,也比基于失配补偿的Fisher核函数SVM话者系统和基于失配补偿的Kullback-Leibler(KL)距离SVM话者系统有较大的提高。 许敏强 戴蓓蒨 刘青松 许东星关键词:话者确认 支持向量机 一种用于鲁棒性说话人确认的分段概率分布参数规整方法 2008年 目前与文本无关的话者确认系统大都是基于GMM-UBM模型结构的,为了精确的描述说话人语音特征空间的分布,模型混合度M通常都选的很大,因而模型训练需要大量的语音数据。本文提出了一种基于分段估计概率分布函数的规整方法,在概率分布的意义上降低特征参数偏离高斯分布的程度,从而可以用较低混合度的高斯混合模型对其建模。同时,这种映射也是一种无监督规整,因此可以提高系统的鲁棒性及其确认性能。在NIST'03数据库上的实验表明,在使用相同混合度模型的情况下,概率分布规整后的参数相对于变换前的参数系统性能可以提高11%左右。 解焱陆 刘青松 戴蓓蒨 李辉关键词:高斯分布 MFCC 说话人确认 声母发声特点参数的提取及其提高说话人确认鲁棒性的研究 被引量:2 2009年 本文针对语音信号中的声母语音更易受环境噪声污染而导致识别性能下降的情况,根据普通话声母发声位置特点,提出了一种对发声位置状态描述的发声特点参数(Articulatory Feature,简称AF),采用特征空间映射方法,由短时倒谱参数(MFCC)经MLP特征映射网络映射获取,MLP特征映射网络则由语言学先验知识事先训练得到。AF参数具有良好的噪声鲁棒性,并与MFCC参数具有互补性,由MFCC和AF组成的联合特征参数(MFCC-AF)可使系统确认性能的鲁棒性有明显的改善。在微软数据库上的基于GMM-UBM模型的与文本无关的说话人确认实验表明,对于声母语音,采用MFCC-AF参数使系统的鲁棒性有明显的改善:在干净、25dB、20dB条件下,较只采用MFCC参数的系统的EER分别相对降低了5.4%,14.12%,20.27%。 许东星 戴蓓蒨 许敏强 刘青松关键词:发声特点 多层感知器 文本无关 说话人确认 一种适于非特定人语音识别的并行隐马尔可夫模型 被引量:4 2004年 为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。 陈雁翔 戴蓓蒨 周曦 刘鸣关键词:非特定人语音识别 基于分类特征空间高斯混合模型和神经网络融合的说话人识别 被引量:6 2004年 该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合.在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。 黄伟 戴蓓蒨 李辉关键词:说话人识别 高斯混合模型 神经网络融合