周水庚
- 作品数:130 被引量:1,062H指数:15
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学天文地球理学更多>>
- N-SHOQ(D):描述逻辑SHOQ(D)的一个非单调扩展被引量:13
- 2005年
- 描述逻辑SHOQ(D)给出了Web本体语言DAML+OIL的语义,但SHOQ(D)只能处理严格成立的完备知识,不能处理在实际情况中经常出现的不完备知识.对描述逻辑SHOQ(D)进行扩展,提出了能够处理不完备知识的非单调描述逻辑N-SHOQ(D).给出了N-SHOQ(D)的语法和语义,定义了N-SHOQ(D)中的蕴涵推理关系,研究了N-SHOQ(D)所具有的性质.N-SHOQ(D)为扩展DAML+OIL语言到能够处理不完备知识的情形提供了语义支持.
- 王淞昕王飞周水庚周傲英
- 关键词:语义WEBDAML+OIL描述逻辑非单调推理
- P2P信息检索系统的查询结果排序与合并策略被引量:16
- 2007年
- 基于P2P信息检索系统的特性,提出了一种完全分布式的查询结果排序与合并策略.首先分析当前P2P信息检索系统查询结果排序和合并问题的根源;接着提出一种完全分布式的查询结果排序与合并策略,包括元数据管理策略、查询结果的排序与合并的实现;然后用详细的实验证明了该策略的有效性.
- 凌波周水庚周傲英
- 关键词:P2P信息检索
- 基于数据取样的DBSCAN算法被引量:57
- 2000年
- 聚类是数据挖掘领域中的一个重要研究课题 .聚类技术在许多领域有着广泛的应用 .基于密度的聚类算法DBSCAN是一种有效的空间聚类算法 ,它能够发现任意形状的类并且有效地处理噪声 ,用户只需输入一个参数就可以进行聚类分析 .但是 ,DBSCAN算法在对大规模空间数据库进行聚类分析时需要较大的内存支持和 I/ O消耗 .本文在分析 DBSCAN算法不足的基础上 ,提出一种基于数据取样的 DBSCAN算法 ,使之能够有效地处理大规模空间数据库 .二维空间数据测试结果表明本文算法是可行、有效的 .
- 周水庚范晔周傲英
- 关键词:空间数据库数据挖掘DBSCAN算法
- 一种基于竞争重构学习的半监督异常检测方法
- 本发明属于机器学习技术领域,具体为一种基于竞争重构学习的半监督异常检测方法。本发明设计两个解码器对样本数据进行竞争重构,它们共享一个编码器以使得数据映射到同一个子空间中,在正样本的标签信息的辅助下,正样本解码器会对正样本...
- 周水庚田凯关佶红
- 文献传递
- 基于PPM方法的中文文本压缩
- 1概述文本压缩是文本存储和传输中普遍使用的技术。目前的压缩技术大多是针对英文文本的。本文将适合于英文压缩的PPM方法进行改进,使之应用于中文文本压缩时也能取得良好的效果。2基于PPM方法的中文文本压缩
- 魏藜周水庚周傲英
- 关键词:中文文本压缩数据结构
- 网络建模与随机游走
- 章忠志周水庚关佶红
- 网络科学(亦称复杂网络)是信息、物理、数学、生物等交叉学科的前沿研究课题。网络建模与随机游走是网络科学中两个十分活跃的研究方向,开展相关的研究对于理解网络生成机制、结构性质,以及网络上的疾病传播、搜索、运输等动力学过程有...
- 关键词:
- 关键词:网络建模随机游走
- 中文文本数据库若干关键技术研究
- 该文对中文文本数据库若干关键技术问题进行了有成效的探索,具体内容包括中文文本数据库模型、查询语言、检索模型、文档分类处理和语义相关检索以及中文文本数据库系统的体系结构与相关实现技术,取得了如下创新性研究成果:(1)提出了...
- 周水庚
- 关键词:文本数据库文本检索文本分类
- 文献传递
- 软件工程数据挖掘研究进展被引量:24
- 2012年
- 随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战;详细评述了在软件工程各个阶段,数据挖掘技术所能发现的信息/知识,以及获取这些信息/知识的意义、难点、步骤和方法,重点介绍了数据预处理和数据表示方法;对软件工程数据挖掘研究的发展趋势进行了展望。
- 郁抒思周水庚关佶红
- 关键词:软件工程数据挖掘数据表示数据预处理
- FDBSCAN:一种快速 DBSCAN算法(英文)被引量:54
- 2000年
- 聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类概念 ,用户只需输入一个参数 ,DBSCAN算法就能够发现任意形状的类 ,并可以有效地处理噪声 .文章提出了一种加快 DBSCAN算法的方法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 .实验结果表明 ,FDBSCAN能够有效地对大规模数据库进行聚类 ,速度上数倍于 DBSCAN.
- 周水庚周傲英金文范晔钱卫宁
- 关键词:大规模数据库数据挖掘聚类代表点
- 一个无需词典支持和切词处理的中文文档分类系统被引量:44
- 2001年
- 报道了一个无需词典支持和切词处理的中文文档分类系统 .其特点是利用 N - gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现了中文文档分类的领域无关性和时间无关性 ;采用开放的体系结构使文档分类系统易于功能扩充和性能完善 .测试结果表明该系统具有令人满意的分类性能 .
- 周水庚关佶红胡运发周傲英
- 关键词:中文信息处理INTERNET