陈威
- 作品数:2 被引量:25H指数:2
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:中国人民大学科学研究基金国家自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- EDM:高效的微博事件检测算法被引量:21
- 2012年
- 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战。综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM)。还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件摘要的方法。与基于LDA(latent Dirichlet allocation)模型的事件检测算法进行实验对比,结果表明,EDM算法能够取得更好的事件检测效果,并且能够提供更直观可读的事件摘要。
- 童薇陈威孟小峰
- 关键词:特征选取
- ScholarSpace:面向计算机领域的学术空间被引量:4
- 2011年
- 针对目前国内学者在学术信息收集整理、学术主页建立与维护以及基于社会网络的学术交流中面临的问题,设计实现了面向国内计算机领域学者的学术空间ScholarSpace.ScholarSpace采用面向领域的DeepWeb数据集成技术,实现对Web上公开数据源中学术信息的自动集成和处理,并提供以作者为中心的学术信息检索.ScholarSpace由3部分组成,即文献集成系统SearchScholar,学术主页生成系统EasyScholar和学者间社交网络SocialScholar.EasyScholar基于SearchScholar开发完成,SocialScholar基于EasyScholar开发完成,而SocialScholar通过引入在线学术社交进一步提高SearchScholar的学术搜索质量和能力.3个子系统形成彼此促进的关系,构成了一个学术信息和资源汇集与分享的良性循环,为我国学者的学术交流提供便利.
- 陈威王仲远杨森张鹏孟小峰
- 关键词:学术空间社会网络WEB数据集成