您的位置: 专家智库 > 作者详情>许厚金

许厚金

作品数:2 被引量:12H指数:1
供职机构:燕山大学信息科学与工程学院更多>>
发文基金:电子信息产业发展基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇文本聚类
  • 2篇聚类
  • 1篇引擎
  • 1篇召回率
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇爬虫
  • 1篇网络
  • 1篇网络爬虫
  • 1篇文本聚类算法
  • 1篇聚类算法
  • 1篇PAGERA...
  • 1篇垂直搜索
  • 1篇垂直搜索引擎

机构

  • 2篇燕山大学
  • 1篇张家口教育学...

作者

  • 2篇许厚金
  • 1篇刘永山
  • 1篇邓成玉
  • 1篇刘永炎

传媒

  • 1篇计算机工程与...

年份

  • 1篇2010
  • 1篇2009
2 条 记 录,以下是 1-2
排序方式:
垂直搜索引擎及其关键方法研究
随着Internet的飞速发展,Web己经发展成为包含多种信息资源、站点分布全球的海量信息服务网络。搜索引擎正是一种帮助用户从信息海洋中找到用户所需要信息的工具。一些通用的搜索引擎力争索引Web中所有的网页,为用户提供各...
许厚金
关键词:垂直搜索引擎文本聚类网络爬虫PAGERANK算法
基于相似中心的k-cmeans文本聚类算法被引量:12
2010年
针对k-means聚类算法只能保证收敛到局部最优,导致聚类结果对初始聚类中心敏感的问题,提出了一种基于相似中心的文本聚类算法。首先,度量文档之间的相似性,然后按照文档之间的相似性递减排序,选择序列最前面的k个文档作为初始聚类中心,对于每个剩余的文档(没有被选为初始簇中心的文档)根据其与存在的簇中心的相似性,将其分配到相似性最大的簇中,更新簇均值,连续迭代,直至均值不变,从而得到更加稳定的聚类结果。实验结果表明,提出的算法在宏平均聚类精度和宏平均召回率上有显著提高,产生了质量较好的聚类效果。
许厚金刘永炎邓成玉刘永山
关键词:聚类
共1页<1>
聚类工具0