施聪莺
- 作品数:4 被引量:229H指数:1
- 供职机构:南京师范大学更多>>
- 发文基金:全国教育科学“十一五”规划教育部青年专项课题更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- TFIDF算法研究综述被引量:227
- 2009年
- 文本分类中特征项权重的赋予对于分类效果有较大的影响,TFIDF算法是权重计算的重要算法之一。在回顾TFIDF算法发展历史的基础上,考察了其固有缺陷,总结诸多学者对其的改进方法,并对TFIDF算法新的应用领域进行了概括,并通过实验验证相关改进算法,为读者更好地应用TFIDF算法提供参考。
- 施聪莺徐朝军杨晓江
- 关键词:TFIDF文本分类VSM
- 针对青春期少年的网络色情文本过滤技术研究
- 在互联网快速发展的时代,人们在充分享受信息共享所带来的便利的同时也饱受“不良信息”的困扰。处于生长发育最高峰的青春期少年,作为互联网的最大用户群体深受“不良信息”的毒害。由于学校及家庭性教育的缺乏,他们从网络上获取青春期...
- 施聪莺
- 关键词:青春期少年
- 文献传递
- 基于规则和Rocchio分类器的学前综合教育资源分类
- 在综合性网络资源服务中,若资源类型不属于同一分类体系则会造成资源的类别特征不显著且类别间的特征存在一定的交叉,此时若采用单一的分类器往往很难取得令人满意的分类效果。本文以学前综合教育资源分类为例,联合使用规则和Rocch...
- 施聪莺
- 关键词:学前教育网络资源服务
- 文献传递
- 基于规则和Rocchio分类器的学前综合教育资源分类被引量:1
- 2009年
- 以学前综合教育资源分类为例,联合使用规则和Rocchio两种分类方法,利用建立的新闻规则库识别新闻资源并标注,然后采用Rocchio分类器对剩余资源进行分类。实验结果表明:基于规则和Rocchio分类器的综合分类策略能大大提高综合性资源的分类效果。
- 施聪莺徐朝军杨晓江