公共文化服务平台

A FAST SEARCH METHOD OF STEERED RESPONSE POWER WITH SMALL-APERTURE MICROPHONE ARRAY FOR SOUND SOURCE LOCALIZATION被引量：1: 2013年; The Steered Response Power(SRP)method works well for sound source localization in noisy and reverberant environment.However,the large computation complexity limits its practical application.In this paper,a fast SRP search method is proposed to reduce the computational complexity using small-aperture microphone array.The proposed method inspired by the SRP spatial spectrum includes two steps:first,the proposed method estimates the azimuth of the sound source roughly and determines whether the sound source is in far field or near field;then,different fine searching operations are performed according to the sound source being in far field or near field.Experiments both in simulation environments and real environments have been performed to compare the localization accuracy and computation complexity of the proposed method with those of the conventional SRP-PHAT algorithm.The results show that,the proposed method has a comparative accuracy with the conventional SRP algorithm,and achieves a reduction of 93.62%in computation complexity compared to the conventional SRP algorithm.; Zhao XiaoyanTang JieZhou LinWu Zhenyang

分块多特征自适应融合的多目标视觉跟踪被引量：10: 2015年; 为提高多目标视觉跟踪算法的实时性和稳定性,提出了分块多特征融合的目标跟踪算法。该算法融合底层颜色、纹理和边缘特征信息,以降低单一目标特征算法容易受复杂环境和目标形变的影响。建立分块目标多特征融合直方图模型,引入目标和背景区分度抑制背景分量,并且结合Kalman滤波器进行预测,在发生遮挡时根据置信度最大子块位置获取遮挡目标位置,实现目标稳定可靠的跟踪。实验结果表明:该算法对每帧图像的平均处理时间为36.2 ms,达到实时性的目的,且算法鲁棒性较强。; 施滢高建坡崔杰孙丽娟陈宇; 关键词：视觉传感多特征融合多目标跟踪 KALMAN滤波

基于保留部分频域镜像分量的声源定位算法被引量：1: 2016年; 针对传统的SRP-PHAT(Steered Response Power with Phase Transform)声源定位算法容易受噪声影响而导致定位性能降低的问题,提出一种频域补零且保留部分镜像分量的改进算法。该算法首先通过傅里叶变换将接收信号变换到频域,然后在高频端补零至20倍帧长,同时保留部分镜像分量。在此基础上计算麦克风对接收信号的互功率谱密度函数,作傅里叶逆变换得到相位变换加权的广义互相关(GCC-PHAT)函数。保留的镜像分量拓宽了信号频域,使GCC-PHAT函数的峰更为尖锐,累加后得到的SRPPHAT函数的空间谱峰也就更加尖锐,从而提高定位性能。实验表明,相比于传统算法,改进算法能显著提高定位成功率。; 蔡卫平刘瑞娟周琳; 关键词：相位变换声源定位

基于双耳语音分离和丢失数据技术的鲁棒语音识别算法被引量：10: 2019年; 鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(EquivalentRectangularBandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。; 周琳赵一良朱竑谕汤一彬; 关键词：空间听觉误识率

Action recognition using a hierarchy of feature groups: 2015年; To improve the recognition performance of video human actions,an approach that models the video actions in a hierarchical way is proposed. This hierarchical model summarizes the action contents with different spatio-temporal domains according to the properties of human body movement.First,the temporal gradient combined with the constraint of coherent motion pattern is utilized to extract stable and dense motion features that are viewed as point features,then the mean-shift clustering algorithm with the adaptive scale kernel is used to label these features.After pooling the features with the same label to generate part-based representation,the visual word responses within one large scale volume are collected as video object representation.On the benchmark KTH（Kungliga Tekniska H？gskolan）and UCF （University of Central Florida）-sports action datasets,the experimental results show that the proposed method enhances the representative and discriminative power of action features, and improves recognition rates.Compared with other related literature,the proposed method obtains superior performance.; 周同驰程旭李拟珺徐勤军周琳吴镇扬

矢量泰勒级数特征补偿的说话人识别被引量：6: 2013年; 将矢量泰勒级数(Vector Taylor Series,VTS)特征补偿算法应用于说话人识别,给出了卷积噪声方差的近似闭式解,构建了联合快速估计卷积噪声和加性噪声均值和方差的框架。该算法可在无需失配环境先验信息的前提下,直接从失配语音中估计出卷积噪声和加性噪声的均值和方差,实现对环境失配的补偿。实验结果表明,在信道变化较大的无线信道下,卷积噪声方差的补偿最高可降低误识率3.24%.提升了系统的识别性能。在存在加性噪声的无线信道下,与基于线性失真模型的特征映射算法和倒谱均值减算法相比,本文算法可分别最大降低49.65%和68.06%的误识率,适合于信道变化较大的失配环境补偿。; 吴海洋杨飞然周琳吴镇扬; 关键词：说话人识别泰勒级数矢量噪声方差无线信道

基于RFID和Android的固定资产管理系统被引量：6: 2016年; 为了提高企事业单位固定资产管理的工作效率,降低人工操作的复杂度和错误率,设计并开发了固定资产管理系统。系统选用Android智能手机作为客户端,通过蓝牙获取RFID数据采集端采集到的数据,对其进行解析分析并予以显示。同时系统的服务端选用My SQL作为远程数据库,并利用PHP API实现数据库访问和与客户端的数据交互,其中数据被封装成JSON格式,从而减小数据量,提高数据传输效率。测试结果表明,该固定资产管理系统操作过程简单快捷,能够存储较大的资产信息数据,一定程度上改善了固定资产的管理工作。; 唐至清高建坡孟思岐; 关键词：固定资产管理 ANDROID MY SQL数据库 PHP JSON

基于子带信噪比估计和软判决的鲁棒双耳声源定位算法: 2015年; 为了提高噪声和混响环境下的双耳声源定位算法性能,提出了一种基于子带信噪比估计和软判决的双耳互功率谱和耳间时间差估计算法.首先根据每帧中每个子带双耳声信号的自相关矩阵估计子带信噪比;其次,将子带信噪比映射为软判决值,并对双耳互功率谱进行加权;最后利用加权后的互功率谱估计耳间时间差,从而判断目标声源方位.仿真测试和实际环境测试均表明:与基于互相关函数、过零率的传统双耳声源定位算法相比,所提算法在噪声和混响的复杂声学环境下,显著提高了双耳声源定位性能.; 周琳赵小燕程旭李拟珺吴镇扬; 关键词：软判决

A Particle Swarm Optimization Algorithm with Local Sparse Representation for Visual Tracking: Handling appearance variations caused by the occlusion or abrupt motion is a challenging task for visual track...; Xu ChengNijun LiTongchi ZhouLin ZhouZhenyang Wu

一种基于粒子滤波的多声源跟踪算法被引量：1: 2014年; 研究了声源轨迹交叉情况下的两个声源跟踪问题。针对传统跟踪算法容易丢失较弱声源的缺点,提出一种基于粒子滤波的改进多声源跟踪算法。该算法在跟踪过程中估计声源之间的距离,当此距离小于0.3 m时,根据声源粒子的速度方向来调整粒子权重,引导粒子向各自声源的运动方向移动,从而避免较弱声源的粒子被较强声源的粒子"吸引",保持了粒子的多样性。仿真结果表明,在不同的交叉角度下,相比于传统算法,改进算法能大幅度减小对较弱声源的跟踪丢失率,并能有效提高两个声源的跟踪精度。; 蔡卫平徐健周琳; 关键词：粒子滤波

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(61201345)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(61201345)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈