您的位置: 专家智库 > >

井佐原均

作品数:1 被引量:40H指数:1
供职机构:国立信息与通讯技术研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇支持向量
  • 1篇支持向量机
  • 1篇特征提取
  • 1篇特征提取方法
  • 1篇文本分类
  • 1篇向量
  • 1篇向量机
  • 1篇互信息

机构

  • 1篇上海交通大学
  • 1篇国立信息与通...

作者

  • 1篇申红
  • 1篇吕宝粮
  • 1篇内山将夫
  • 1篇井佐原均

传媒

  • 1篇计算机仿真

年份

  • 1篇2006
1 条 记 录,以下是 1-1
排序方式:
文本分类的特征提取方法比较与改进被引量:40
2006年
文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的χ2统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进。为了对这些特征提取方法进行系统地比较,选择了三种代表性的分类器对《读卖新闻》文本数据库进行了分类实验。实验结果表明χ2统计方法具有最好的准确率,各种改进的特征提取方法都能提高文本分类的准确率。
申红吕宝粮内山将夫井佐原均
关键词:特征提取文本分类互信息支持向量机
共1页<1>
聚类工具0