国家重点基础研究发展计划(G2011CB302605)
- 作品数:5 被引量:39H指数:4
- 相关作者:张伟哲张宏莉张玥卢珺珈王佰玲更多>>
- 相关机构:哈尔滨工业大学国家互联网应急中心更多>>
- 发文基金:国家重点基础研究发展计划国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 识别网络论坛中有影响力用户被引量:11
- 2013年
- 网络论坛已经成为网络用户发布信息的重要渠道.在论坛中对热点话题的讨论影响着物理世界中人们的看法、观点以及国家政策法规的制定.由此提出一系列研究问题:如何计算用户影响力?不同主题不同时间下用户影响力如何比较?用户影响力发展趋势如何?根据幂律规律,大量用户形成"长尾",如何识别有影响力用户?以主题为单位,提取用户间回复关系,构建用户对话关联图,回复次数和回复长度形成用户行为特征,入度和出度形成网络结构特征.在Pagerank算法基础上,结合用户行为特征以及用户间关联网络特征,提出基于多属性的用户影响力排序算法(multiple attributes rank,MAR).并依据发表时间进行时间段切分,得到论坛上每日有影响力用户排行榜,进一步分析了有影响力用户演化趋势.以天涯网络论坛真实数据进行实验,从多角度评价有影响力用户以及MAR排序算法,得到一些有趣结论并对未来工作进行了展望.
- 张玥张宏莉张伟哲卢珺珈
- 关键词:网络论坛排序用户行为关联网络
- 基于幂律分布的网络用户快速排序算法被引量:5
- 2012年
- 随着网络论坛、博客、微博的发展,引出社会网络中的用户排序问题。将在线网络论坛中用户映射为节点,用户评论过程中形成的回复关系映射为有向关联图,其节点度符合幂律分布。且论坛中用户的主题发布行为和回复关系符合Pagerank算法的互增强和随机游走特性,因此选用Pagerank算法排序用户影响力。该文提出的研究问题:如何提高用户排序应用中数据的存储和运行效率。天涯网络论坛中80%以上用户入度为0,据此,根据入度是否为0划分为两个集合,对入度为0集合按出度构造链接表,设计了基于集合划分的高效排序算法SD-Rank。SD-Rank时空复杂性为O(V′),V′为入度非0节点集。对天涯网络论坛真实用户数据的实验结果表明:SD-Rank算法时空复杂性优于Pagerank算法。
- 张玥张宏莉张伟哲
- 关键词:幂律入度
- 基于BBS的热点话题发现与态势预测技术的研究被引量:13
- 2012年
- 网络论坛BBS是中国网民一个重要的信息传播渠道,而其中的热点话题自然就成为舆情调控和效果评估的首要目标。提出一个快速有效的用于挖掘网络论坛中热点话题并分析预测其发展态势的方法,利用统计的方法为同一版面下帖子的热度打分并排序,并使用相关的数学模型对热度较高的帖子的发展态势进行分析与预测。通过实验验证了该模型的可行性和有效性,为进一步研究复杂网络中热点话题的演化奠定了基础。
- 卢珺珈张宏莉张玥
- 关键词:BBS
- 基于异质网络的意见领袖社区发现被引量:9
- 2012年
- 针对意见领袖社区发现问题,通过将论坛中主题及其回复关系建模为异质网络,准确表示社区结构.提出意见领袖社区影响力概念及其量化方法,在此基础上设计了一种基于异质网络的意见领袖社区发现算法.通过采集天涯论坛的大量数据,验证了该社区挖掘方案能够较准确地挖掘论坛中的意见领袖社区.
- 张伟哲王佰玲何慧谭卓鹏
- 关键词:网络社区意见领袖异质网络
- 基于语料阶梯评价的互联网论坛舆论领袖筛选算法被引量:1
- 2012年
- 针对互联网论坛中舆论领袖筛选问题,提出了基于发帖网民的语料和基于网民的网络行为统计属性特征的互补性网络舆论领袖筛选模型.通过深入分析基于在线社区内容的"影响力扩散模型",提出了基于发帖网民语料的"阶梯式"评价法的全新算法.对基于统计属性特征评价方法的属性进行了重新定义,选取了更为合理的网络统计数据,增加了互补性的属性值,使评价方法更趋完善.通过与专家法人工筛选出的舆论领袖相比较,该模型筛选出舆论领袖的成功率在85%以上,模型具有较强的实用性和重要应用价值.
- 张伟哲张鸿刘欣然陈琳李东
- 关键词:网络论坛舆情舆论领袖