国家自然科学基金(61271335)
- 作品数:28 被引量:75H指数:5
- 相关作者:杨震朱琦于云周伟栋郑宝玉更多>>
- 相关机构:南京邮电大学教育部东华大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划江苏省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 改进的正交匹配追踪语音增强算法被引量:8
- 2016年
- 本文根据语音信号在离散余弦变换(discrete cosine transform,DCT)域上的近似稀疏性,将压缩感知(compressed sensing,CS)应用于语音增强。提出了一种基于压缩感知的语音增强新算法。算法采用对语音信号具有一定鲁棒性的行阶梯矩阵,对含噪语音进行压缩观测,通过改进的正交匹配追踪OMP(orthogonal matching pursuit,OMP)算法重构语音信号,最后用低通滤波器对重构语音进行平滑滤波,实现语音增强。实验结果表明:本文所提语音增强算法在提高输出信噪比的同时,减少了重构时间,具有较强的鲁棒性。
- 周伟栋杨震于云
- 关键词:压缩感知离散余弦变换语音增强正交匹配追踪
- 基于压缩感知的自适应谱减法语音增强算法被引量:3
- 2015年
- 针对在压缩感知框架下,噪声的影响会被扩大这个问题,提出了一种新的基于压缩感知的语音增强算法。该方案利用压缩感知下的行阶梯观测矩阵能够保留大部分语音特性的特点,对观测序列进行谱减法消噪,再对得到的观测序列进行基于输入信噪比的自适应重构,最后通过低通滤波器对重构语音进行平滑滤波,除去高频成分。实验结果表明:提出的语音增强方法具有较强的抗噪能力,重构速度快,输出的信噪比高,鲁棒性能好。
- 于志文朱琦
- 关键词:压缩感知谱减法正交匹配追踪语音增强
- 基于神经网络的多维说话人信息识别研究
- 语音识别作为人机交互通信的关键技术,在各个领域都有广泛的应用。实际生活中的语音是一种包含说话人多种信息的复杂信号,然而目前绝大多数语音识别研究主要集中在识别单一信息,还没有能够同时识别说话人身份、内容、年龄、性别、情感等...
- 陈海霞
- 关键词:多任务学习
- 文献传递
- 基于压缩感知观测序列的语音信号基音周期提取被引量:2
- 2013年
- 语音信号的清浊音辨别及基音周期的提取是语音信号处理的重要组成部分。提出了一种基于压缩感知(CS)观测序列的语音基音周期提取方法,大大减少了基音周期提取的计算量。首先分析不同观测矩阵下观测序列的特征,选择了行阶梯矩阵作为所提方法的观测矩阵;然后对此观测矩阵下的观测序列做小波分解,对小波分解的低频系数采用自相关方法提取基音周期。仿真与分析表明,和传统方法比较,所提方法与传统方法基音检测准确度相当,且在语音含有高斯白噪声的条件下运行良好,但计算量仅约为传统方法的1/16。
- 曹杨
- 关键词:语音信号处理基音周期压缩感知自相关函数小波变换
- 基于稀疏表示的鲁棒性说话人识别系统
- 2015年
- 基于稀疏表示的说话人识别方法在无噪的环境下已经达到了理想的效果,然而在背景噪声下,此方法的识别性能大幅度下降。为了提高系统的鲁棒性,提出了一种新型的基于稀疏表示的鲁棒性说话人识别系统模型。此系统结合多状态训练和语音增强谱减法,在训练阶段和测试阶段同时利用语音增强技术,然后对增强后的语音进行多状态训练,以便提高训练特征数据集和测试特征数据集之间的匹配度。实验分析和结果表明,所提出的新型模型在所研究的白噪声和有色噪声下达到了很好的抗噪性能,具有很强的鲁棒性。
- 于云周伟栋
- 关键词:说话人识别谱减法
- 基于LPC和MFCC得分融合的说话人辨认被引量:4
- 2016年
- 实验室环境下,说话人识别研究已经取得很大进展,但是在实际生活中,说话人识别系统的性能受到环境噪声、健康状况等因素的影响很大。日常生活中,感冒是不可避免的。而感冒往往会诱发鼻腔的炎症,改变鼻腔的容积和形状,引起说话人声音的改变,导致说话人识别性能下降。文中研究测试者感冒时说话人识别系统的性能。为了有效利用不同特征参数得分的互补性,针对基于GMM模型的说话人辨认系统,提出了将特征LPC和MFCC分别应用于该系统,并将二者的得分归一化后进行融合计算。实验结果表明,对正常语音来说,与LPC特征系统相比,该方法能够有效提升辨认性能;对感冒语音来说,当高斯成分为16时,较之LPC特征系统,该方法提升辨认性能12.5%左右,较之MFCC特征系统,该方法也能提升8.5%左右的辨认性能。
- 单燕燕
- 关键词:说话人辨认
- 一种基于压缩感知的说话人识别参数分析被引量:2
- 2015年
- 本文为在传统的说话人识别理论研究中"较少的特征参数量不能与较高的识别率共存"的难题找到了一种解决方案。本文基于压缩感知的理论,利用行阶梯观测矩阵进行信号的投影,改变了传统的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)参数,从而提出了一种新的识别参数CSMFCC(Compressed sensing-MFCC)。该参数不仅使得参数存储量降低到少于原存储量的1/n(n为行阶梯观测矩阵的压缩比),而且明显提高了系统的鲁棒性。通过仿真实验证明了当压缩比n为4时,平均识别率能够提高到96%以上。
- 潘海琦杨震徐珑婷朱俊华
- 关键词:说话人识别压缩感知识别率鲁棒性
- 基于匹配追踪的语音压缩感知观测序列的正弦字典建模被引量:3
- 2014年
- 压缩感知技术是目前信号处理领域的研究热点。文中针对压缩感知技术实际应用于语音领域时压缩率不高的问题做了研究。首先介绍了压缩感知技术的理论,接着提出了适合建模的观测矩阵的选用标准。在行阶梯观测矩阵下,本文提出了观测序列的一种新模型——基于匹配追踪算法的正弦字典模型,该模型采用稀疏分解的方法对观测序列进行建模。仿真结果表明该建模方法有效地进一步压缩了观测序列,而不明显降低恢复语音的质量。
- 严菲杨震
- 关键词:压缩感知
- 基于场强地图的室内定位技术研究被引量:2
- 2020年
- 室内定位技术的发展,要求能提供快速建立、适应性强、成本低的定位系统。基于场强地图的室内定位技术,能大幅减少离线测试工作量。针对当前离线阶段存在预测场强不准的问题,提出了追踪共轭梯度法,能快速建立场强地图。在线阶段提出了加权差分坐标K最近邻法,结果表明该方法与传统方法相比,能使离线阶段的反演模型数据优化,使得在线阶段的定位匹配误差进一步减小,获得更高的定位精度。
- 王韦刚周蓉张云伟李韬
- 一种改进的室内三维定位方法与实验被引量:5
- 2019年
- 利用无线传感器网络进行室内定位的过程中,由于信号非视距传播而引起的误差存在,会明显地降低定位精度。为了减小非视距误差对室内定位的影响,文中提出一种新的室内三维定位算法。它将接收信号强度与到达时间结合进行定位,并利用二者测量信息的一致性以减小这种影响,从而提高定位结果的准确性。该算法首先获得节点的测量距离并进行校正,然后计算各测量距离对应的可信因子,最后根据所提出的目标函数求得目标节点的坐标。实验结果表明,所提算法比传统定位算法有更好的定位效果,能显著地提高定位精度。
- 王韦刚田龙彬张云伟
- 关键词:接收信号强度非视距