孙晓刚
- 作品数:13 被引量:29H指数:3
- 供职机构:中国科学院成都计算机应用研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于K-L变换和模糊集理论的彩色字符图像分割被引量:2
- 2010年
- 根据彩色印刷字符图像的特点,在Lab颜色空间下提取a分量,将彩色图像转换为灰度图像。根据模糊逻辑和阈值分割方法将图像分为目标区域、背景区域以及模糊区域。用K-L变换组合邻域的区域隶属信息和灰度信息,将灰度域换成模糊域,在该模糊域上进行分割。经实践,该算法在工业环境中对复杂背景的彩色印刷图像可以得到较好的分割效果,其时间复杂度不高于传统的阈值分割算法,并且在分割的精确度上要优于传统的阈值分割算法。
- 肖劲飞王晓宇陈斌孙晓刚刘兵
- 关键词:模糊逻辑阈值分割K-L变换
- 基于多任务卷积神经网络人脸检测网络的优化加速方法被引量:5
- 2019年
- 针对人脸检测网络在安卓设备上速度较慢、检测效果不佳的问题,提出了基于多任务卷积神经网络(MTCNN)的优化加速的方法。一方面,更改Caffe框架的ATLAS数学库为OpenBLAS,利用多核来进行矩阵计算;另一方面,在网络结构上进行优化,通过对特征图进行多尺度的卷积再聚合操作、对不同层的特征图进行特征融合操作来提高网络的学习能力,同时对网络中的卷积核进行分解来减少卷积操作的计算量。在LFW和FDDB数据集上进行测试,实验结果表明:与MTCNN人脸检测算法相比,改进后算法的准确率提高了0.9%,耗时降低了64%,在3288安卓板卡上速度达到了9帧/秒。改进后的算法对遮挡、模糊人脸有更好的鲁棒性,并且在速度上有了很大的提升,在复杂场景下具有出色的检测效果。
- 姜尧岗孙晓刚林云
- 关键词:矩阵计算
- 复杂场景下的水表示数检测与识别被引量:6
- 2019年
- 目前自然场景下水表示数的统计工作由人工完成,但在大工作量的情况下人工统计容易出现统计错误和遗漏的情况,而且这一过程繁琐,耗时耗力。针对这种情况,提出一种基于深度学习的数字识别与检测算法。首先,使用旋转区域卷积神经网络(R2CNN)检测出文本框;然后,对该文本框区域使用基于注意机制(Attention)的文本识别算法预测出最终结果;最终,通过对不同深度的卷积神经网络(CNN)的速度和准确度进行对比,使用了一种准确有效的配置。结果显示训练好的网络模型可以应用于自然环境下的水表示数检测,能够达到实时检测的效果,并且优于其他检测识别算法的效果。不同数据下的结果验证了算法的有效性和鲁棒性。
- 康鑫孙晓刚万磊
- 关键词:文本检测文本识别
- 基于卷积神经网络和核相关滤波的物体跟踪算法被引量:3
- 2017年
- 针对核相关滤波算法(KCF)在物体跟踪过程中因难以适应物体尺度变化、非刚性形变,容易出现跟踪丢失或者混淆的现象,提出一种结合卷积神经网络(CNN)深度模型和核相关滤波来进行跟踪的方法。首先,利用线下大量样本训练得到一个卷积神经网络分类模型;其次,目标跟踪过程中在卷积神经网络模型提取到的特征空间中用核相关滤波训练得到一个回归模型;最后,利用得到的回归模型对下一帧中的目标位置进行预测。理论上证明了在卷积神经网络特征空间进行核相关滤波操作的合理性,并通过跟踪对比实验表明相比利用原始像素或者方向梯度直方图(HOG)特征,新的跟踪算法在背景复杂情况下的平均预测偏移降低为原来的34.25%,并且通过利用GPU加速能达到实时的效果。
- 李泽原孙晓刚林云
- 关键词:卷积神经网络目标跟踪
- 基于语义分割的活体检测算法被引量:2
- 2020年
- 为了提高人脸识别系统的安全性,防止手机、照片中的人脸图像伪装攻击,提出了一种基于语义分割的活体检测算法。首先,通过全卷积神经网络(FCN)对局部人脸区域进行语义分割,并提出了一种带方向的卷积核对网络进行优化。其次,训练了一个快速分类器对语义分割网络的结果进行分类。最后,对深度学习网络进行串联,形成一个端到端的活体识别框架。试验结果表明:本文检测算法在Casia活体数据集和私有数据集上表现突出,在实际项目中泛化能力突出。
- 林云孙晓刚姜尧岗康鑫解至煊钟勇
- 关键词:计算机应用防欺诈人脸识别
- 基于Simba的人脸识别方法被引量:1
- 2016年
- 针对主成分分析(PCA)、信息增益(IG)、置信度(Relief)等特征选择方法在人脸识别研究中存在的不足,提出用Simba算法对人脸特征进行提取,以期望达到更好的识别效果。该算法将特征定义为权重,通过比较权重值的大小来删除次要特征,得出强相关特征。为取得较高准确率,还运用了相关向量机(RVM)进行识别,通过在Matlab上实验,得出该方法在常用人脸识别库中确实具有较好识别率,后续简要分析了原因。此外,在研究浅层机器学习算法的同时,还关注了深度学习在图像识别方面取得的进展。
- 胡建园孙晓刚李振东
- 关键词:人脸识别主成分分析相关向量机
- 基于非局部算法的序列图像超分辨率重构被引量:2
- 2009年
- 提出了一种基于非局部算法的多帧图像超分辨率重构算法,该方法无需进行图像校正。为克服传统图像复原算法基于图像局部点领域的影响,指出可以使用非局部去噪模型的优越边缘保持性和去噪性来重构高分辨率图像。实验证明,该算法在低信噪比情况下,可以取得较好结果,有效解决了低信噪比条件下图像复原的一个难点。
- 吴晓明陈斌阮波孙晓刚
- 关键词:超分辨率复原序列图像
- 提高人体姿态估计网络效果的弱监督方法
- 2020年
- 监督学习通过从大量具有完整标签的训练示例中学习来构建预测模型,在各领域都取得了巨大的成功,但数据标注过程需要消耗巨大的成本,且标注要求越复杂,标注成本越昂贵。关注人体姿态估计网络的弱监督方法,在骨干网络之后增加高、低分辨率子网络,高分辨率网络通过位置特征的相关性加强多个关节点是一个整体的权重,低分辨率网络使网络在训练过程中可接受图像级粗粒度标签。所提方法仅需增加少量有人或无人两种简单标注的图片,即可让网络在目标场景下快速拟合其分布,达到更好的效果。在室内厂房环境、工地施工现场、驾驶室监控环境等不同场景下测试结果表明,所提方法均能达到不错的效果。
- 解至煊孙晓刚
- 关键词:多示例学习
- 图像分割中字符号码类目标的快速定位方法被引量:1
- 2004年
- 针对字符号码类目标,提出一种无需全图阈值分割和先验特征匹配计算的方法。先利用方向梯度块精确定位目标,再对目标区域作局部阈值分割,从而快速地得到高质量的目标信息。
- 刘平陈斌孙晓刚
- 关键词:图像分割阈值化
- 基于卷积神经网络的轮对超声波探头倾斜检测
- 2021年
- 在使用球机检测车底轮对超声波探头时,摄像头角度会导致目标探头出现仿射形变;此外,目标探头的密集排列会导致检测结果不准确。针对以上两点问题,提出了一种基于卷积神经网络(CNN)的旋转探头检测方法。提出了一种结合多尺度特征融合和注意力机制的特征提取网络和一种针对形变物体的表示法。在验证过程中,使用实际条件下球机采集的轮对探头数据对改进后的深度卷积神经网络(DCNN)进行训练与测试。测试实验结果显示,提出的检测方法对密集的以及形变的探头目标均具有良好的检测效果,召回率可以达到92.15%,平均准确率可以达到86.39%。实验结果表明,所提的改进方法能够自动全面地提取探头目标特征,解决了仿射形变和密集探头目标的检测问题;而且检测精度和速度均能够满足实际需要,在不同的目标尺度以及模糊情况下,具有更强的适应性和更高的鲁棒性。
- 伊佳琪孙晓刚
- 关键词:目标检测损失函数卷积神经网络