2025年1月23日
星期四
|
欢迎来到海南省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
井佐原均
作品数:
1
被引量:40
H指数:1
供职机构:
国立信息与通讯技术研究所
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
内山将夫
国立信息与通讯技术研究所
吕宝粮
上海交通大学电子信息与电气工程...
申红
上海交通大学电子信息与电气工程...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
支持向量
1篇
支持向量机
1篇
特征提取
1篇
特征提取方法
1篇
文本分类
1篇
向量
1篇
向量机
1篇
互信息
机构
1篇
上海交通大学
1篇
国立信息与通...
作者
1篇
申红
1篇
吕宝粮
1篇
内山将夫
1篇
井佐原均
传媒
1篇
计算机仿真
年份
1篇
2006
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
文本分类的特征提取方法比较与改进
被引量:40
2006年
文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的χ2统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进。为了对这些特征提取方法进行系统地比较,选择了三种代表性的分类器对《读卖新闻》文本数据库进行了分类实验。实验结果表明χ2统计方法具有最好的准确率,各种改进的特征提取方法都能提高文本分类的准确率。
申红
吕宝粮
内山将夫
井佐原均
关键词:
特征提取
文本分类
互信息
支持向量机
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张