李勇
- 作品数:2 被引量:166H指数:2
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:中国人民大学科学研究基金国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于小数据的在线用户兴趣长程演化研究被引量:19
- 2015年
- 网络大数据中与Web用户行为相关的数据,例如在线点击数据和通讯记录等,为人们深度挖掘和定量分析人类兴趣动力学带来了机遇,这些在线行为数据被称为大数据时代的"小数据",有助于揭示许多复杂的人类社会与经济现象.Web用户行为建模时常见的前提假设就是人的行为符合Markov过程,用户下一行为仅依赖于当前行为,与过去的历史行为无关.然而,在线用户行为是一个复杂过程,常常依赖于人的兴趣,对于人类兴趣动力学的本质规律目前知之甚少.利用中国互联网络信息中心提供的30 000多名在线用户行为记录数据,基于块熵理论对在线用户行为进行分类研究,通过信息论分析方法,结合熵增曲线的离散导数和积分理论,分析在线用户点击行为的随机性和记忆性特征.研究表明,与常见的假设不同,Web用户的行为并不是一个简单的Markov过程,而是一个符合幂率的非周期无限长程记忆过程;进一步还发现,用户在线连续点击7个兴趣点,其行为的平均预测增益就可达到95.3%以上,可为大数据时代在线用户兴趣精准预测提供理论指导.
- 李勇孟小峰刘继王常青
- 社会计算:大数据时代的机遇与挑战被引量:148
- 2013年
- 信息技术的飞速发展,特别是物联网、云计算、社交网络、社会媒体以及信息获取技术的进步,数据正以巨大的速度迅速增长和积累,大数据时代已经到来.社会计算作为一种数据密集型科学,在收集和分析数据的广度、深度以及规模上都产生了巨大的影响,社会计算作为一种新的计算范式,产生了一个新的跨学科研究与应用领域,其广阔的研究内容与应用已引起了学术界和工业界的广泛关注.分析了社会计算产生的历史背景及概念、研究现状及大数据带来的机遇,综述了社会计算不同的研究领域,主要有2个发展趋势:一个面向社会科学,包括计算社会科学、计算社会学、社会网络分析等;一个面向技术应用,包括社交应用、娱乐应用、生产应用等,这2种发展趋势同时又相互影响.最后讨论了社会计算研究领域存在的挑战,包括跨学科合作与训练的问题、科学研究中大数据共享问题以及隐私保护.
- 孟小峰李勇祝建华
- 关键词:社会科学社会计算社会网络分析大数据