张华伟
- 作品数:4 被引量:62H指数:1
- 供职机构:江西师范大学更多>>
- 发文基金:教育部科学技术研究重点项目江西省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于层次分类和集成学习的文本分类技术研究
- 随着Internet的迅速发展和日益普及,电子文本信息迅速膨胀,任何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息是当前信息科学和技术领域面临的一大问题。文本分类作为处理和组织大量文本数据的关键技...
- 张华伟
- 关键词:文本分类泛化性能群组决策搜索引擎文本数据库
- 文献传递
- 基于随机森林的文本分类模型研究被引量:62
- 2006年
- 随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将其同C4.5,KNN,SM0,SVM 4种典型的文本分类器进行了比较,结果显示它的分类性能胜于C4.5,同KNN,SMO和SVM方法相当.
- 张华伟王明文甘丽新
- 关键词:文本分类决策树泛化误差
- 基于随机森林的文本分类模型研究
- 随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,...
- 张华伟王明文甘丽新
- 关键词:文本分类决策树泛化误差
- 文献传递
- 基于团的Markov网络信息检索模型
- 在Markov网络检索模型中,通过对检索词子网络结构的分析可知,网络中的许多词构成完全图-团.在同一子团中的词构成一个形式概念.本文构造出一个从网络中提取团的算法,并且把基于词的检索扩展为基于形式概念的检索.实验表明,基...
- 甘丽新王明文张华伟
- 关键词:完全图MARKOV网络信息检索
- 文献传递