湖南省教育厅科研基金(09C1163)
- 作品数:3 被引量:1H指数:1
- 相关作者:吴勇刘钰峰李仁发徐峰更多>>
- 相关机构:湖南机电职业技术学院湖南大学更多>>
- 发文基金:湖南省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 网络论坛的问答搜索技术研究
- 2011年
- 利用论坛的问题解答资源作为数据源建立了网络论坛问答检索系统,系统涉及到数据采集、数据处理、答案抽取、索引排序、问题映射等问题。重点研究了决定系统性能的答案抽取技术。在进行答案抽取时,使用Ranking SVM对回帖文档进行排序,得到问题对应的所有回帖的一个全序排列,进而抽取序列的前几项得到最佳答案。
- 吴勇
- 关键词:答案抽取RANKINGSVM排序
- 基于Ant-Tree算法的短文本聚类研究被引量:1
- 2011年
- 短文本由于词频过低,使用常规的聚类算法如K-means效果不理想,难得到可接受的准确度。而最近结合使用生物启发及聚类内部有效性测量改进的方法,能够有效改善短文本的聚类效果。针对短文本聚类,提出了改进Ant-Tree的算法。该算法引入了轮廓系数作为内部效度测量,对K-means算法获得的初始聚类划分计算轮廓系数值,根据各聚簇样本值大小排序,将排序结果应用于Ant-Tree算法的初始化步骤中,使Ant-Tree算法性能得到提高。实验结果表明,该算法准确度超过了其它的算法。
- 吴勇李仁发刘钰峰
- 关键词:K-MEANS
- 一种适用于短消息文本的聚类算法
- 2012年
- 针对短消息文本聚类,设计基于频繁词集和Ant-Tree的混合聚类方法。该算法利用基于频繁词集聚类算法处理文本数据的效率优势,生成初始聚簇,计算轮廓系数消除重叠文档,在此基础上再通过Ant-Tree算法继续精化,最终得到高质量的结果输出。而且聚类结果保留了描述信息和树状层级结构,提供了更广阔的应用。
- 吴勇徐峰
- 关键词:短消息聚类