刘世超
- 作品数:18 被引量:99H指数:5
- 供职机构:武汉大学计算机学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金湖北省自然科学基金更多>>
- 相关领域:自动化与计算机技术电气工程理学石油与天然气工程更多>>
- 基于深度游走模型的标签传播社区发现算法
- 2018年
- 针对传统标签传播算法准确率较低的问题,提出一种基于深度游走模型的改进标签传播算法。以社会网络作为深度游走模型的输入,通过深度随机游走的方式对网络中的节点进行采样得到随机序列,并基于Skip Gram模型对其进行神经网络训练。运用层次Softmax对Skip Gram模型进行求解,得到节点的特征向量后在邻居节点之间计算节点相似度,将其作为标签传播概率的权重进行标签的传播迭代,最终得到社区发现的结果。在6个真实网络数据集和合成数据集上进行实验,结果表明,与传统标签传播算法相比,该改进算法具有较高的准确率,尤其对于节点个数在100以上的真实网络,Q值提高10%以上。
- 冯曦朱福喜刘世超
- 关键词:特征向量节点相似度
- 一种基于混合相似性指标的网络动态链路预测方法被引量:5
- 2016年
- 社会网络中节点属性等外部信息的不可靠性及难获取性,使得社会网络的链路预测方法都集中在网络的拓扑结构信息上,并且常用的链路预测方法往往只利用了网络的局部拓扑信息.此外,社会网络的静态链路预测方法忽视了网络演化趋势信息,影响了预测精度.基于以上现状,结合节点间共同邻居相似性指标及偏好连接相似性指标,提出一种基于混合相似性指标的网络动态链路预测方法.该方法提出一种基于网络局部信息的混合相似性指标,为已存在链接分配一个影响力衰减因子并将其引入混合相似性指标进行计算,进而根据该混合相似性指标预测链路.实验结果表明用上述方法,预测精度得到了提高.
- 陈莎朱福喜阳小兰刘世超
- 关键词:社会网络链路预测
- 基于SkipGram模型的链路预测方法被引量:5
- 2017年
- 现有的基于节点相似性的链路预测算法,在提升预测准确度时往往无法兼顾计算复杂度。受自然语言概率图模型在词向量表征上的运用启发,提出一种基于SkipGram模型的链路预测方法。首先提出基于概率的随机游走方法,通过这种方法得到网络节点的采样序列;然后结合SkipGram模型将网络节点映射到一个低维向量空间来降低复杂度;最终以向量间的距离作为衡量网络节点间相似性的指标,进而完成链路预测。通过在6个具有代表性的真实网络中进行实验和比较发现,提出的模型在预测准确度上得到大幅提高。
- 赵超朱福喜刘世超
- 关键词:链路预测
- 上下文分解机的自适应更新策略
- 2016年
- 分解机模型已经被成功应用于上下文推荐系统。在分解机模型的学习算法中,交替最小二乘法是一种固定其他参数只求单一参数最优值的学习算法,其参数数目影响计算复杂度。然而当特征数目很大时,参数数目随着特征数目急剧增加,导致计算复杂度很高;即使有些参数已经达到了最优值,每次迭代仍更新所有的参数。因此,主要改进了交替最小二乘法的参数更新策略,为参数引入自适应误差指标,通过权重和参数绝对误差共同决定该参数更新与否,使得每次迭代时重点更新最近两次迭代取值变化较大的参数。这种仅更新自适应误差大于阈值的参数的策略不但减少了需要更新的参数数目,进而加快了算法收敛的速度和缩短了运行时间,而且参数权重由误差决定,又修正了误差。在Yahoo和Movielens数据集上的实验结果证明:改进的参数更新策略运行效率有明显提高。
- 姚杏朱福喜阳小兰郑麟刘世超
- 关键词:推荐系统
- 基于Web时间不一致的过时网页自动发现与排序方法
- 本发明提供了一种基于Web时间不一致的过时网页自动发现与排序方法,本发明方法基于网页具有时间生命性,建立网页多维时间向量,抽取网页的多维时间值,建立Web时间不一致模型,提出Web时间不一致推理和度量的新方法,构建解决W...
- 李石君甘琳杨莎刘世超刘咏宁李宇轩
- 基于标签传播概率的重叠社区发现算法被引量:59
- 2016年
- 发现高质量的社区有助于理解真实的复杂网络,尤其是动态地分析社区重叠结构,对社区管理和演化具有重要意义.文中提出一种基于标签传播概率的LPPB(Label-Propagation-Probability-Based)重叠社区发现算法,该算法首先为每个结点赋予一个独立的标签,然后根据结点的影响力大小将结点进行排序;在标签传播的过程中,综合网络的结构传播特性和结点的属性特征计算标签传播的概率,同时利用结点的历史标签记录修正标签更新结果;最后将传播后具有相同标签的结点划分为同一社区,社区间的重叠结点构成了社区重叠结构.作者在基准数据集和带时间维度的C-DBLP网络上进行实验,结果验证了该算法具有较高的准确性和稳定性,并且通过对重叠结构的动态分析,揭示了社区重叠结点的行为特性和C-DBLP网络处于高"耦合度"的发展趋势.
- 刘世超朱福喜甘琳
- 关键词:社交网络数据挖掘社会媒体
- 基于Skip-gram模型的社区查询算法被引量:3
- 2018年
- 社会网络的巨大规模和复杂结构使得探索整个网络的社区结构的代价变得高昂。因此,着眼于网络局部结构特征的社区查询有着重要的应用意义。常见的社区查询算法易将与查询无关的子结构合并到目标社区中。利用Skip-gram模型将序列化后的社会网络映射到连续的向量空间以求解节点之间的相似度,并结合节点的度这个属性特征修正了原有的社区尺度,以此作为标准进行节点聚类,从而得到查询节点所属的社区结构。经过在真实数据集上的实验,改进的社区查询算法的准确性和查询一致性较已有算法有了较大提高。
- 廖宇朱福喜刘世超
- 关键词:节点相似度
- 基于分类关联规则的微博情绪分析被引量:4
- 2016年
- 针对微博文本语法不规则、句子间文本联系不紧密的问题,提出一种基于分类关联规则的情绪分析方法。获得一篇微博中相邻句子间的连接词,分别采用KNN和SVM算法对微博中的每个句子进行情绪分析,获得对应的情绪标签;将获得的情绪标签和连接词转换为关联规则项集,通过关联规则挖掘算法获得相应特征;采用SVM算法对获得的特征进行情绪分类,得到整篇微博的情绪类别。实验结果表明,该方法在情绪分类上具有较好的效果。
- 刘思朱福喜阳小兰刘世超
- 关键词:情绪分析文本分类K最近邻算法支持向量机分类关联规则
- 复杂网络的重叠社区及社区间的结构洞识别被引量:6
- 2016年
- 大数据环境下如何有效地、准确地识别复杂网络的重叠社区是近年来学者关注的重点.本文提出一种基于多标签传播方式MLPS(Multiple Label Propagation Strategy)的重叠社区识别算法,该算法首先利用影响力最大化模型选取初始种子集合并赋予它们唯一的标签,然后采用结点间的相似性和影响传播特性共同作用于标签的传播迭代过程,迭代停止后将具有相同标签的结点划分为同一社区.通过合成网络和真实网络的实验验证了MLPS算法具有较高的准确度和模块度,且具有接近线性的时间复杂度.另外,在对MLPS算法输出的重叠结构进行分析的基础上,本文提出社区间的结构洞识别算法SHCDA(Structural Holes Between Communities Detection Algorithm),该算法通过分析重叠结构和重叠结点的位置特征,计算重叠结点作为结构洞的得分,最后输出top-k结构洞.本文在不同特性的数据集上进行实验,结果证明了SHCDA算法具有最好的准确度.
- 刘世超朱福喜冯曦
- 关键词:复杂网络
- CCD在老式仪表改造中的应用被引量:2
- 2009年
- 许多老式仪表均靠人眼读数,因此,许多工厂装有老式仪表的设备需要安排专人读表。系统在老式仪表原来的基础上,运用图像处理的方法对仪表进行简单改造,节省成本,实现实时监控、自动检测自动报警等多项功能。
- 董翔张清特日格乐刘世超
- 关键词:仪器仪表CCD摄像机图像处理边缘检测