教育部人文社会科学研究基金(11YJC870008)
- 作品数:2 被引量:14H指数:2
- 相关作者:洪娜安新颖赵迎光吴思竹侯丽更多>>
- 相关机构:中国医学科学院北京协和医学院更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:文化科学自动化与计算机技术经济管理更多>>
- 主题模型在主题演化方法中的应用研究进展被引量:9
- 2014年
- 【目的】对基于主题模型的演化方法进行梳理与分析,总结各方法优缺点及在情报分析领域的适用性。【文献范围】从Google Scholar、Web of Science中以"Topic/Theme Evolution"、"Time Topic Model"、"Dynamic Topic Model"为关键词/主题词进行文献检索,结合引文查询,经阅读后筛选出25篇作为本文的参考文献。【方法】采用文献分析法,对比各模型实现机制与功能特征,总结不同种类模型的优缺点及适用领域。【结果】目前的主题演化模型主要在可变主题数、支持在线分析、连续时间窗三个维度进行实现,大多数系统具备1—2个功能,基本可以满足情报分析的应用需求。【局限】对一些模型的具体实现分析不够深入。【结论】不同来源、不同粒度、不同时间窗的演化分析应该针对具体应用需求,结合模型特点使用相应的主题模型演化方法。
- 赵迎光洪娜安新颖
- 关键词:主题模型LDA
- 网络内容演化趋势影响因素分析——从词的生命周期和背景词簇环境中挖掘演化线索被引量:5
- 2012年
- 文章在细致调研相关研究的基础上,对文本流中词的生命周期和背景词簇环境进行分析,提炼出词演化过程中的现象以及网络内容演化趋势的影响因素,提出网络内容演化趋势预测的思路与方法,进一步设计了综合指标体系,为后续的实验研究打下基础。
- 洪娜钱庆李亚子吴思竹侯丽
- 关键词:词频决策树