杨延锟
- 作品数:2 被引量:0H指数:0
- 供职机构:东北石油大学计算机与信息技术学院更多>>
- 发文基金:黑龙江省普通高校骨干教师创新能力资助计划黑龙江省科技攻关计划黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于FVSM的核聚类算法在文本聚类中的应用
- 2010年
- 针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量。最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类。该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。
- 杨延锟许少华
- 关键词:文本聚类核聚类算法
- 面向油田信息服务的智能搜索引擎研究与应用
- 随着Internet和WWW的迅速发展,Internet上的资源日趋丰富,这使网络成为了全球最大的知识库,为信息资源的共享提供了平台,但同时也使贴近用户原意的信息查询变得困难。许多综合型的搜索引擎虽然功能非常强大,但当用...
- 杨延锟
- 关键词:油田信息专业搜索引擎文本分类
- 文献传递