骆健
- 作品数:4 被引量:14H指数:3
- 供职机构:武汉科技大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于RGb-D图像信息的物体识别研究
- 物体识别一直是计算机视觉及模式识别领域的核心课题之一。随着深度传感技术的迅猛发展,利用RGB-D图像信息来解决物体识别问题已成为计算机视觉领域的研究热点。本文以提取鲁棒性的特征为目的,从特征提取及表达、特征学习两个方面着...
- 骆健
- 关键词:鲁棒性
- 文献传递
- 基于多模态深度学习的RGB-D物体识别被引量:6
- 2017年
- 针对现有RGB-D物体识别方法存在图像特征学习不全面、类间相似的物体识别精度不高等问题,联合稀疏自编码(sparse auto-encoder,SAE)及递归神经网络(recursive neural networks,RNNs)提出多模态稀疏自编码递归神经网络(multi-modal sparse auto-encoder and recursive neural networks,MSAE-RNNs)的深度学习模型。SAE结合卷积及池化技术分别从RGB-D图像的RGB图、灰度图、深度图、3D曲面法线中提取低层次的平移不变性特征,作为多个固定树RNNs的输入,得到更加抽象的高层特征,融合后的多模态特征,采用SVM分类器进行分类。在RGB-D数据集上的实验结果表明,该算法的物体识别率达到90.7%,较其它算法提高了3%-9%,能很好完成RGB-D物体的识别。
- 骆健蒋旻刘星周龙
- 关键词:多模态递归神经网络
- 基于RGB-D图像核描述子的物体识别方法被引量:3
- 2017年
- 针对传统的颜色-深度(RGB-D)图像物体识别的方法所存在的图像特征学习不全面、特征编码鲁棒性不够等问题,提出了基于核描述子局部约束线性编码(KD-LLC)的RGB-D图像物体识别方法。首先,在图像块间匹配核函数基础上,应用核主成分分析法提取RGB-D图像的3D形状、尺寸、边缘、颜色等多个互补性核描述子;然后,分别对它们进行LLC编码及空间池化处理以形成相应的图像编码向量;最后,把这些图像编码向量融合成具有鲁棒性、区分性的图像表示。基于RGB-D数据集的仿真实验结果表明,作为一种基于人工设计特征的RGB-D图像物体识别方法,由于所提算法综合利用深度图像和RGB图像的多方面特征,而且对传统深度核描述子的采样点选取和紧凑基向量的计算这两方面进行了改进,使得物体类别识别率达到86.8%,实体识别率达到92.7%,比其他同类方法具有更高的识别准确率。
- 骆健蒋旻
- 多尺度卷积递归神经网络的RGB-D物体识别被引量:6
- 2017年
- 为充分利用RGB-D图像提供的潜在特征信息,提出了多尺度卷积递归神经网络算法(multi-scale convolutional-recursive neural networks,Ms-CRNN)。该算法对RGB-D图像的RGB图、灰度图、深度图及3D曲面法线图进行不同尺度分块形成多个通道,每个通道与相应尺寸的滤波器卷积,提取的特征图经局部对比度标准化和下采样后,作为递归神经网络(recursive neural networks,RNN)层的输入以得到更加抽象的高层特征;融合后的多尺度特征由SVM分类器进行分类。基于RGB-D数据集的仿真实验结果表明,综合利用RGB-D图像的多尺度特征,提出的Ms-CRNN算法在物体识别率上达到88.2%,与先前方法相比有了较大的提高。
- 骆健蒋旻刘星周龙
- 关键词:多尺度递归神经网络