北京市自然科学基金(4112046) 作品数:14 被引量:127 H指数:6 相关作者: 于剑 贾彩燕 柴变芳 林友芳 唐锐 更多>> 相关机构: 北京交通大学 石家庄经济学院 中国移动通信集团天津有限公司 更多>> 发文基金: 北京市自然科学基金 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 理学 建筑科学 更多>>
基于统计推理的社区发现模型综述 被引量:4 2012年 社区有助于揭示复杂网络结构和个体间的关系。研究人员从不同视角提出很多社区发现方法,用来识别团内紧密、团间稀疏的网络结构。自2006年以来,提出了一些基于统计推理的社区发现方法,它们可识别实际网络中更多的潜在结构,并以其可靠的理论基础和优越的结构识别能力成为当前的主流。该类方法的主要目标是建立符合实际网络的生成模型以拟合观测网络,将社区发现问题转化为贝叶斯推理问题。首先给出社区发现中生成模型的相关定义;其次按照模型中社区组成元素将已有统计推理模型分为节点社区推理模型和链接社区推理模型,并深入探讨各种模型的设计思想及实现算法;再次,总结各模型适用的网络类型及规模、发现的社区结构、算法复杂度等,给出一种选择已有基于统计推理的社区发现模型的方法,并利用基准数据集对已有典型统计推理模型进行验证及分析;最后探讨了基于统计推理模型的社区发现存在的主要问题和未来发展的方向。 柴变芳 贾彩燕 于剑一种基于流行度和中心度的内容网络社区发现方法 2013年 基于近年来发展的社区发现概率模型的可解释性,对现有的性能较好的基于节点中心度和流行度的社区划分链接模型PPL进行扩展,给出了一种新的可以结合节点内容的组合模型PPL-DC。该模型不但可解决节点属性的选择问题,并可充分利用节点间的链接关系。实验结果表明,新给出的PPL-DC模型优于单纯的链接模型及已有的链接和内容相结合的组合模型。 康钊宁 贾彩燕 柴变芳一种改进的标签传播快速社区发现方法 被引量:9 2013年 标签传播社区发现方法LPA(Label Propagation Algorithm,简称LPA)和已有的一些算法相比具有算法复杂度低、思想简单、不需要指定社区数量等优点,但相比于传统社区发现方法(如GN)也有准确率较低的缺点。文章提出了一种改进的、基于节点局部相似性的标签传播算法LPALS(Label Propagation Algo-rithm based on Local Similarity,简称LPALS)。实验结果表明,LPALS算法在提高准确率的同时也保证了算法具有较低的时间复杂度。 康旭彬 贾彩燕关键词:复杂网络 一种基于用户相似性的协同过滤推荐算法 被引量:15 2013年 个性化推荐技术研究用户行为,分析用户兴趣,主动为用户推荐合适的资源,较好地解决了互联网信息日益庞大与用户需求之间的矛盾。协同过滤算法中,基于邻居的方法和基于潜在因子的方法是目前应用于推荐系统最成功的技术。前者虽然简单易行,但精度有待提高;后者精度较高,但模型复杂,参数难以学习。提出了一种改进的基于用户相似性的协同过滤算法,通过修正用户相似性的度量方法,产生更合理的用户邻居,实现对用户的评分推荐。实验结果表明,所提出的算法相比基于潜在因子的方法简单易行;同时,相比基于邻居的方法,在一定程度上提高了推荐的精度。 程飞 贾彩燕关键词:推荐系统 协同过滤 高度重叠社区的社区合并优化算法 被引量:4 2011年 当原图转换成边图后,在边图上进行社区发现可以天然地得到重叠社区,然而得到的社区往往相互大面积重叠,甚至相互包含,导致社区模块性质量较低.针对这一问题,在得到边图下重叠社区发现算法结果的基础上,我们将进一步以优化重叠社区模块化质量函数为标准进行社区合并,以获得高质量的重叠社区.本文首先提出一种描述社区间重叠程度的重叠系数,并基于此进一步提出一种构建带权社区图的启发式方法,能够快速有效地完成社区合并的过程.在人工生成网络与真实世界网络上的实验,进一步验证了该算法能够在不削弱边图方法速度优势的前提下,提高高度重叠社区的模块性. 武志昊 林友芳 田盛丰 唐锐关键词:数据挖掘 边图 一种自适应的大间隔近邻分类算法 被引量:15 2013年 kNN分类算法虽然已经广泛地应用于模式识别的各个领域,但是如何对kNN进行改进仍然是一个研究热点.在各种改进方法中,大间隔近邻分类方法取得了较好的改进效果,但是该算法仍然有一些缺点,例如算法对所有测试样本选择的邻域大小(即k值)都是一样的.针对这一缺点,提出了将自适应选择k值引入到目标函数设定中的自适应大间隔近邻分类算法(ALMNN).该算法的主要步骤是:首先为每个测试样本计算一个k值,然后在每一类选取k个目标近邻,计算属于每一类的损失函数值,选择拥有最小函数值的类作为测试样本的类别.给出了ALMNN方法的算法描述,并且通过多个数据集的实验表明,提出的算法与传统的kNN,LMNN比较,可以在一定程度上提高分类的性能,减少了k值的选择对分类性能的影响,训练集的随机抽取对算法的分类性能影响较小. 杨柳 于剑 景丽萍关键词:损失函数 基于超边相关性的图像分类方法 被引量:2 2014年 传统基于超图的图像分类方法在构建超图时并未考虑各超边之间的关系,导致最终分类效果不理想.文中结合图像视觉信息和标注信息量化超边间相关性,提出一种基于超边相关性的图像分类方法,有效地将图像相关的标注信息作为判定图像类别的指标引入到图像分类中,进而对图像进行更准确的分类.在LabelMe和UIUC数据集上的实验验证该方法的有效性. 徐杰 景丽萍 于剑关键词:图像分类 融合内容和链接的网络结构发现概率模型综述 被引量:2 2013年 随着社会媒体的发展,许多在线网络产生大量内容,发现其潜在的结构便于人们了解网络的功能,进行更深层次的分析和预测.社区和主题是网络结构发现的两个重要依据,其分别利用网络链接和内容建模,但链接的稀疏和内容的不相关导致发现难以解释的社区和不准确的主题.融合内容和链接的概率模型成为解决此问题的主流方法,按目标不同将其分为主题发现、主题社区发现和社区-主题发现模型,分析典型模型的设计背景、基本原理及求解方法,并通过定性比较和实验分析探索其存在的问题,最后预测未来融合模型的可能研究方向. 柴变芳 贾彩燕 于剑 傅玥关键词:主题模型 一种有效的社会网络社区发现模型和算法 被引量:51 2012年 社会网络的社区发现存在划分效果较好的算法时间复杂度过高、现有快速划分算法划分质量不佳、缺乏表达和充分利用个体和链接属性信息的模型和机制等问题.针对这些问题,提出了一种边稳定系数模型和一种能表达个体间关系紧密度的完全信息图模型,在此基础上设计和实现了一种有效的社区发现算法.提出的完全信息图模型具有较高通用性,适用于需要融合个体和链接属性的社区发现算法.通过系列实验表明,所提出的以边稳定系数模型和完全信息图为基础的算法,对社会网络中的社区发现问题是有效的.算法不仅具有较快的速度,也能适用于带权与不带权的网络,得到的社区划分结果也具有较高的划分质量. 林友芳 王天宇 唐锐 周元炜 黄厚宽关键词:社会网络 信息融合 链接挖掘 基于BoF模型的图像表示方法研究 被引量:12 2014年 设计合适的图像表示是计算机视觉中最重要的问题之一。BoF特征表示方法非常流行,已经广泛应用于图像分类、对象识别、图像检索、机器人定位和纹理识别。BoF特征是将图像表示为无序的特征集合。这种方法虽然缺乏结构信息和空间信息,但概念简洁、计算简单,在某些应用上取得的效果甚至可以与当前最好的方法媲美。仔细研究了BoF模型,着重对BoF模型中的3个阶段:局部特征提取、特征量化和编码、特征汇集所涉及到的典型技术进行了讨论。最后在分析各类研究方法的基础上,总结了目前研究存在的问题及可能的发展方向。 梁晔 于剑 刘宏哲关键词:计算机视觉