王清毅
- 作品数:23 被引量:448H指数:11
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金安徽省高等学校优秀青年人才基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于数据聚类的关联规则挖掘方法研究
- 该文讨论了以支持度和可信度作为兴趣度量标准的关联规则的不足,在引进了数据聚类的概念之后,给出了基于数据聚类的关联规则的定义,提出了基于数据聚类的关联规则的挖掘方法,并显示了作者的实验结果。
- 王清毅范焱邹翔蔡庆生
- 关键词:数据挖掘关联规则
- 文献传递
- 用Naive Bayes方法协调分类Web网页被引量:92
- 2001年
- WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法 .经实验验证 ,与只用单种方法对超文本进行分类的方法相比 ,综合分类法有效地提高了分类的正确率 .
- 范焱郑诚王清毅蔡庆生刘洁
- 关键词:超文本信息检索WWW网页
- 目前数据挖掘算法的评价被引量:72
- 2000年
- 首先讨论了数据挖掘算法的评价标准问题,然后运用数据封装分析的方法评价了目前的分类算法,基于实验结果,对目前的关联规则挖掘算法进行了评价.
- 王清毅张波蔡庆生
- 关键词:数据挖掘数据封装数据库知识发现
- 大型数据库中的高效序列模式增量式更新算法被引量:18
- 2003年
- 提出一种称为FIMS(fastincrementalminingofsequentialpatterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题.主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次数和候选序列的生成,从而提高挖掘的效率.实验结果显示在更新数据量远小于整个数据库的大小时,FIMS算法的性能优于GSP算法4~7倍.
- 邹翔张巍蔡庆生王清毅
- 关键词:数据库增量式更新算法数据挖掘
- 一种用于文章推荐系统中的用户模型表示方法被引量:6
- 2007年
- 分析了现有文章推荐系统中基于关键词向量的用户模型表示方法存在的不足,提出了基于聚类兴趣点的用户模型表示方法。该方法可通过文章聚类形成兴趣点。由于传统的基于划分的聚类算法存在的不足,提出了基于复杂网络特征的文章聚类算法。实验结果表明该用户模型的表示方法较好地反映了用户多方面的兴趣,提高了文章推荐系统的性能。
- 赵鹏蔡庆生王清毅
- 关键词:聚类复杂网络推荐系统用户模型
- 线性关联规则研究被引量:2
- 2001年
- 首先讨论了布尔型关联规则的不足 ,然后提出了线性关联规则的概念 ,详细讨论了线性关联规则的挖掘方法 ,具体给出了线性关联规则的挖掘过程 ,分析了线性关联规则的作用 .还给出了实验结果 。
- 王清毅史东辉何兵蔡庆生
- 关键词:知识发现定量关联规则数据库
- 基于时序逻辑的时序数据库中知识发现方法
- 1999年
- 知识发现是一个众多学科诸如人工智能、机器学习、模式识别、统计学、数据库和知识库、数据可视化等相互交叉、融合所形成的一个新兴的且具有广阔应用前景的领域。目前国际上对知识发现的研究与开发进展很快。众多现实世界(如天气预报、电信、金融)的数据库中数据都是随时间变化的,即数据具有时序性。目前,时序数据库中的知识发现问题正逐渐引起KDD研究者的兴趣。
- 王清毅范焱蔡庆生
- 关键词:时序数据库知识发现时序逻辑
- 一种基于复杂网络特征的中文文档关键词抽取算法被引量:50
- 2007年
- 关键词抽取是自然语言理解领域中的重要技术之一.本文研究汉语语言所组成的自然语言网络中的复杂网络特性,并根据语言网络中的"小世界"特性和近两年复杂网络研究中部分新的理论成果,提出基于复杂网络特征的中文文档关键词抽取算法.该算法根据文档语言网络中单词结点的复杂网络特征值进行关键词抽取.实验结果表明,本文算法抽取关键词所获得的平均准确率要高于 TFIDF 关键词抽取算法所获得的平均准确率.
- 赵鹏蔡庆生王清毅耿焕同
- 关键词:复杂网络语言网络关键词抽取
- 电力调度数据挖掘后处理方法的研究被引量:7
- 2003年
- 关联规则是数据依赖关系的有效描述方法 ,是知识发现研究的重要内容 .然而 ,随着所挖掘数据库规模的增大 ,由传统数据挖掘算法所生成的大量关联规则常常令用户的使用与分析十分困难 .文中提出了一种新方法来解决这个问题并将其运用到电力调度数据挖掘系统中 .实验结果表明 ,该方法消除了大量冗余规则 ,并且使用户可以从整体上把握整个规则集 。
- 邹翔王清毅肖明军蔡庆生
- 关键词:知识发现数据挖掘关联规则
- 处理知识库中不一致性的超决定逻辑研究被引量:9
- 1998年
- 本文首先分析了现有的能够处理知识库中不一致性的逻辑的不足,然后定义了超决定结构、模型和语义的概念,具体描述了超决定语义的计算过程,从而给出了一种能够处理知识库中不一致性的逻辑。
- 王清毅陈恩红刘贵全蔡庆生
- 关键词:知识库人工智能