刘华咏
- 作品数:12 被引量:41H指数:4
- 供职机构:华中师范大学计算机学院更多>>
- 发文基金:湖北省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于视频聚类的关键帧提取算法被引量:8
- 2014年
- 关键帧可以有效减少视频索引的数据量,是分析和检索视频的关键。在提取关键帧过程中,为了解决传统聚类算法对初始参数敏感的问题,提出了一种改进的基于视频聚类的关键帧提取算法。首先,提取视频帧的特征,依据帧间相似度,对视频帧进行层次聚类,并得到初始聚类结果;接着使用K-means算法对初始聚类结果进行优化,最后提取聚类的中心作为视频的关键帧。实验结果表明该方法可以大幅提高关键帧的准确率和查全率,能较好地表达视频的主要内容。
- 刘华咏郝会芬李涛
- 关键词:关键帧特征提取层次聚类K-MEANS算法
- 一个基于内容的新闻视频浏览和查询系统:NewsBR被引量:3
- 2004年
- 提出了一个基于内容的新闻视频浏览和查询系统 News BR.这个系统是建立在非常准确的新闻故事分段和主题字幕文本提取之上的 .它的主要特征包括 :基于类别的新闻故事浏览 ,基于关键帧的视频摘要和基于关键词的新闻故事查询 .本文详细讲述了新闻故事的分段 ,主题字幕文本的提取和在此之上的基于内容的视频浏览和查询 .
- 刘华咏周洞汝
- 关键词:字幕提取
- 注意力增强的视觉Transformer图像检索算法被引量:1
- 2023年
- 基于深度哈希的图像检索方法往往利用卷积和池化技术去提取图像局部信息,并且需要不断加深网络层次来获得全局长依赖关系,这些方法一般具有较高的复杂度和计算量。本文提出了一种注意力增强的视觉Transformer图像检索算法,算法使用预训练的视觉Transformer作为基准模型,提升模型收敛速度,通过对骨干网络的改进和哈希函数的设计,实现了高效的图像检索。一方面,本文设计了一个注意力增强模块,来捕获输入特征图的局部显著信息和视觉细节,学习相应的权重以突出重要特征,并增强输入到Transformer编码器的图像特征的表征力。另一方面,为了提高图像检索的效率,设计了一种对比哈希损失函数,生成具有判别力的二进制哈希码,从而降低了内存需求与计算复杂度。在CIFAR-10和NUS-WIDE数据集上的实验结果表明,本文提出的方法,在两个不同数据集上使用不同哈希码长度的平均精度均值达到了96.8%和86.8%,性能超过多种经典的深度哈希算法和其他两种基于Transformer架构的图像检索算法。
- 刘华咏黄聪金汉均
- 关键词:图像检索
- 利用多模式分析进行基于内容的视频检索研究
- 该文首先通过对视频数据本身的特殊性及其管理的复杂性进行分析,指出基于内容的视频检索的难点,在全面深入地了解了国内外的研究现状的基础上,引出该文的研究的主要内容一利用多模式特征进行基于内容的视频检索研究.该文分析了基于内容...
- 刘华咏
- 关键词:新闻视频体育视频COM
- 文献传递
- 基于内容的新闻视频故事分段和检索被引量:2
- 2002年
- 首先定义了新闻视频数据库系统的基本结构,接着介绍了实现新闻视频故事分段和检索所运用的文字提取、语音识别等核心技术的基本思想。最后给出了典型的实验结果。
- 刘华咏周洞汝
- 关键词:文字提取语音识别视频数据库
- 基于内容提取视频关键帧
- 关键帧提取是基于内容检索的一个重要组成部分,提取的关键帧质量的好坏,直接影响检索的结果.本文介绍了目前几种典型的算法,并在对其进行分析比较的基础上,针对新闻视频提出了基于文字和图像信息提取关键帧的算法,取得了很好的效果,...
- 于俊清周洞汝徐骏刘华咏
- 关键词:关键帧基于内容检索视频镜头
- 文献传递
- 基于GPDM的形状建模算法
- 2007年
- 为了克服非刚体对象的形状建模中对象形状的非线性变化和高维状态表达带来的困难,通过分析有效解集合的分布规律,以提高紧致性和专用性为目标,设计了能提供正确约束的形状模型GPDM。从实验结果看出,该模型与传统的形状模型相比,它能提供更为准确的形状约束。
- 蒋旻刘华咏
- 基于分块KPCA集成的人脸民族特征提取研究被引量:3
- 2014年
- 为了实现人脸图像民族特征提取,提出了一种分块集成KPCA的特征提取方法。考虑到利用全局特征与局部特征的互补性能够更好地反映信息的本质,先以KPCA提取整体图像特征,然后使用KPCA对各个分块进行局部特征提取,再组合为民族特征,最后使用设计的Boosting-RBF分类器进行民族分类识别。实验以构建的少数民族人脸样本库为研究对象,对维吾尔族、柯尔克孜族、蒙古族、塔吉克族的人脸图像进行民族特征提取。实验结果表明:提取的人脸民族特征,可以对人脸图像进行较准确的民族分类识别。
- 刘文辉许瑞刘华咏马光春
- 关键词:民族识别径向基神经网络
- 基于音视频特征和文字信息自动分段新闻故事被引量:12
- 2004年
- 提出了一种新的基于音视频特征和文字信息自动分段新闻故事的方法。其基本思想是先对新闻视频进行镜头边界检测;其次,通过文字检测算法检测包含有主题字幕文本的帧来获得新闻故事分段的线索;接着用短时能量和短时平均过零率(ZCR)来检测新闻视频中存在的静音片段;最后,综合音视频特征和文字信息实现故事自动分段。在包含135,400帧的实验素材上获得了85.8%的准确率和97.5%的查全率,实验结果证明该方法是十分有效的。
- 刘华咏
- 关键词:新闻视频文字检测
- 基于改进分块颜色特征和二次提取的关键帧提取算法被引量:9
- 2015年
- 关键帧提取技术是视频摘要、检索、浏览和理解中的一项重要技术。目前关键帧提取算法存在一些问题,例如特征选择复杂、阈值选择难、自适应性不强等。为了更有效地提取视频关键帧,提出了一种基于改进分块颜色特征和二次提取的关键帧提取算法。首先,对视频帧进行等面积矩形环划分;其次,提取矩形环的HSV量化颜色特征,并由帧图像中心到外依次减小每个矩形环特征的权值以突出图像主体部分;然后,依据相邻视频帧间特征的显著性变化初步选取关键帧;最后,依据初次提取的关键帧在视频中的位置间隔大小进行二次提取优化关键帧。实验结果表明,该方法具有良好的适应性,同时能够有效避免因镜头有突然闪光或物体快速运动而提取过多的关键帧,最终提取的关键帧能够比较全面准确地表达视频内容。
- 刘华咏李涛
- 关键词:关键帧