江苏省自然科学基金(BK2010054)
- 作品数:10 被引量:88H指数:5
- 相关作者:杨育彬高阳商琳李宁郭乔进更多>>
- 相关机构:南京大学南京邮电大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 基于关键词的图像标注综述被引量:5
- 2011年
- 图像标注的目标是针对每幅图像,利用相对应的文本信息进行描述,从而能够对海量的图像数据进行有效的管理和检索。尽管图像标注已经被研究了若干年,然而它仍然是机器视觉和机器学习领域中一个非常具有挑战性的问题。各种各样的算法被用于图像的标注工作。对目前基于关键词的图像标注的一些常用的算法和模型进行了综述,包括传统的基于分类的方法、相关模型、主题模型、基于随机场的上下文信息的处理以及利用Internet上海量的数据来辅助图像标注等等。讨论了目前图像标注研究中遇到的一些具有挑战性的问题。
- 郭乔进丁轶李宁
- 关键词:图像标注机器视觉
- 3维模型局部高度研究被引量:6
- 2011年
- 提出一种新的3维模型的特征点检测算法。该算法可以作为其他许多3维模型处理技术的预处理操作(如模型简化、模型匹配、视点选择等)。与其他3维模型特征点检测算法相比,该算法具有两个特点:1)引入一种新的显著性度量方法——"局部高度",而不是传统的曲率。认为3维模型表面某点的视觉重要性(即显著性)是由它所在位置的凸起程度来刻画,而不是该点所在位置的弯曲程度所决定,因此,提出局部高度这种新的显著性度量方式。2)基于局部高度,引入Mean Shift算法这种非参数化的概率密度估计方法来对3维模型表面的局部高度分布进行聚类分析,然后计算出3维模型的特征点。实验结果表明,该算法能够很好地捕捉视觉上显著的3维模型特征点,且在不同分辨率下均有稳定的表现。
- 林金杰朱代辉杨育彬
- 关键词:特征点检测SHIFT
- 并行化的情感分类算法的研究被引量:4
- 2013年
- 在海量数据集上执行情感分类任务时,传统的单机情感分类算法的扩展性成为系统的瓶颈。在云计算平台Hadoop上,实现了情感分类任务中特征提取、特征向量加权和情感分类等算法的MapReduce化。在情感语料数据集上,对各种子步骤组合下情感分类算法的精度及每种算法的时间开销进行了对比分析。实验结果验证了实现的并行化情感分类算法的有效性,同时它为用户选择合适算法实现情感分类任务提供了有价值的参考信息。
- 余永红向小军商琳
- 关键词:情感分类HADOOP云计算MAPREDUCE
- 基于视觉一致性的图像检索被引量:4
- 2011年
- 提出一种新的彩色图像分割方法,将图像分割成具有明显视觉一致性的区域,这种一致性能够模拟人观察图像时的视觉感受,例如图像中的一片区域具有相同的颜色、纹理。对这样的一致性区域建立特征描述符,如颜色编码、连通系数、面积比例,其中颜色编码是通过将像素在HSI颜色空间中量化得到,进而为整幅图像建立特征描述;然后将这种特征描述用于图像的检索。实验结果表明,这种方法不仅能够很好地模拟图像所带给人的视觉感受,而且对具有视觉一致性的图像检索效果也有很好的表现。
- 贺广南杨育彬阮佳彬林金杰
- 关键词:图像分割图像检索
- 基于Hadoop平台的海量文本分类的并行化被引量:37
- 2011年
- 文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据。在Ha-doop分布式平台下实现了一简单有效的文本分类算法——TFIDF分类算法,即一种基于向量空间模型的分类算法,它用余弦相似度得到分类结果。在两个数据集上做了实验,结果表明,这一并行化算法在大数据集上很有效并可以在实际领域中得到良好的应用。
- 向小军高阳商琳杨育彬
- 关键词:文本分类并行化海量数据HADOOP
- 基于区域语义子概念分布的场景分类
- 2011年
- 大量的需求使得图像检索成为当前研究的热点。提出了对图像进行均匀分割、识别区域子概念并在此基础上对概念分布向量进行融合的场景分类方法。实验结果表明,这种方法提高了分类结果的P/R值,获得了很好的分类结果。
- 王灵江阮佳彬杨育彬
- 一种新的目标检测方法:Latent Dirichlet classification被引量:3
- 2012年
- 图像目标检测的任务是通过对图像分块或者分区域提取特征,进行学习和分类,从而检测出目标在图像中的位置.基于潜在迪利克雷分布模型,提出一种应用于目标检测的主题模型latentDirichlet classification(LDC),结合图像连续值局部特征和共生关系来进行目标检测.LDC模型将latentDirichlet allocation(LDA)生成的主题信息作为权重赋予样本,生成多份样本,然后利用多份样本训练多个分类器进行集成分类.实验结果表明利用LDC模型能有效提高检测精度.
- 丁轶郭乔进李宁
- 关键词:目标检测主题模型
- 一种基于MapReduce的频繁闭项集挖掘算法被引量:18
- 2012年
- 频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法.该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局频繁闭项集四个步骤.在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比.
- 陈光鹏杨育彬高阳商琳
- 关键词:云计算数据挖掘频繁闭项集MAPREDUCE
- LDA-CRF:一种基于概率图模型的目标检测方法被引量:4
- 2012年
- 目标检测和识别是计算机视觉和机器学习的研究热点.近年来,主题模型(如LDA等)在无监督的图像识别和定位等应用中获得了巨大的成功.然而,LDA忽略了图像区域之间的空间关系,并且不能处理连续值的视觉特征或特征向量.而条件随机场(CRF)能够利用图像区域之间的局部相关性来提高分类准确性.基于LDA和CRF提出了一种LDA-CRF模型.通过利用LDA生成的主题信息来辅助CRF的分类,同时结合图像区域之间结构化的类别信息来改进LDA的主题生成机制.实验结果表明,LDA-CRF模型的检测效果要优于CRF.
- 郭乔进李宁李宁杨育彬
- 关键词:LDACRF概率图模型
- 一种基于耦合对象相似度的项目推荐算法被引量:9
- 2014年
- 推荐系统根据用户的偏好为用户推荐个性化的信息、产品和服务等,能够帮助用户有效解决信息过载问题。基于内容的协同过滤算法缺少合适的度量指标用来计算项目之间的相似度。提出一种基于耦合对象相似度的项目推荐算法,即通过耦合对象相似度捕获项目特征频率分布相似性和特征依赖聚合相似度。首先从项目文本中抽取项目的关键特征,然后利用耦合对象相似度构建项目相似度模型,最后使用协同过滤的方法为活动用户推荐用户可能感兴趣的项目。在真实数据集上的实验结果表明,基于耦合对象相似度的推荐算法可以有效解决基于内容推荐系统的项目相似度度量问题,在缺失大量项目特征数据的情况下改进传统基于内容推荐系统的推荐质量。
- 余永红陈兴国高阳
- 关键词:协同过滤