国家教育部博士点基金(2007105)
- 作品数:2 被引量:2H指数:1
- 相关作者:陈恩红罗奇鸣林洋港权小军李梁更多>>
- 相关机构:中国科学技术大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种对象级搜索中的多查询合并算法
- 2008年
- 对传统搜索引擎使用的排序算法进行分析,将概率意义引入对象级搜索,提出一种在对象级搜索中合并多个查询结果的算法.通过归一化以及考虑概率意义与查询规模间的关系,该算法独立于生成结果列表使用的排序算法.实验结果证明该算法提高了查询结果的质量.
- 陈恩红李梁
- 关键词:搜索引擎
- 基于概率主题的文本层次分类(英文)被引量:2
- 2009年
- 概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有着广泛的应用.为此基于概率主题模型,提出了一种新的层次文本分类方法.该方法首先利用Gibbs抽样提取一系列主题,然后计算测试文档和每个类的基于主题的相似度.在20 News Groups数据集上的实验结果表明,该方法的分类性能明显超越支持向量机分类方法.
- 权小军林洋港罗奇鸣陈恩红
- 关键词:GIBBS抽样