钱榕
- 作品数:10 被引量:38H指数:4
- 供职机构:北京科技大学计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金国家科技成果重点推广计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 经济全球化背景下竞争情报系统的研究被引量:3
- 2005年
- 采用基于内在机理的知识发现理论KDTIM和具有自主知识产权的集成化组合构件式知识发现软件系统 (ICCKDSS) ,提出了“基于知识发现的通用型竞争情报系统” ,将传统竞争情报系统的以信息驱动的模式 ,提升到新的基于知识发现的以知识驱动的模式 ,使竞争情报系统达到智能决策支持的水平和学习的水平。
- 钱榕李欣杨炳儒
- 关键词:竞争情报系统经济全球化信息驱动自主知识产权智能决策支持
- 语言场理论及其在知识发现中的应用被引量:4
- 2005年
- 提出了基于认知物理学的语言场理论,给出其基本定义和定理;引入势函数等概念、公式,并把它们分别应用到知识发现的连续属性离散化、聚类两个方面,用以研究解决复杂信息的表示和处理问题。
- 杨炳儒钱榕张伟
- 关键词:知识发现
- Web文本聚类算法WTCA的研究与实现被引量:1
- 2007年
- 提出了一种新的Web文本聚类算法WTCA——基于自组织特征映射神经网络(SOM)的聚类算法。该算法分为训练SOM网络及聚类分析两个阶段,具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪音能力强。该算法应用到现代远程教育网,可以对各类远程教育站点上收集的文本资料信息自动进行聚类分析;从海量Web文本信息源中快速有效地获取重要的知识。
- 郑煜钱榕
- 关键词:WEB文本挖掘文本聚类自组织特征映射
- 朴素贝叶斯分类器一阶扩展的注记被引量:1
- 2008年
- 众多研究者致力于将朴素贝叶斯方法与原有的ILP系统结合,形成各种各样的多关系朴素贝叶斯分类器(MRNBC)。该文提出形成朴素贝叶斯分类器的一阶扩展的一般方法。现实中关系数据库广泛存在,可以直接作用于数据库表,而无须转换表示形式的MRNBC则是研究的重点,该方法主要基于关系数据库理论,分析了进行一阶扩展的关键问题。
- 徐光美杨炳儒钱榕
- 关键词:多关系数据挖掘朴素贝叶斯归纳逻辑程序设计关系数据库
- 一个基于链接分析的相关度排序算法及其在专题搜索引擎中应用被引量:7
- 2007年
- 对HITS(Hyperlink-Induced Topic Search)算法进行研究,克服其主体漂移和扩大化等缺点,改进并提出建立一个新的基于链接分析的Web检索结果的相关度排序方法,并把它应用到一个专题搜索引擎中。
- 郑煜钱榕
- 关键词:链接分析排序HITSWEB结构挖掘
- 面向语义的精简化多关系频繁模式发现方法被引量:2
- 2008年
- 多关系频繁模式发现能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。有别于主流基于归纳逻辑程序设计技术的方法,提出了基于合取查询包含关系的面向语义的精简化多关系频繁模式发现方法,具有理论与技术基础的新颖性,解决了两种语义冗余问题。实验表明,该方法在可理解性、功能、效率以及可扩展性方面具有优势。
- 杨炳儒张伟钱榕
- 关键词:多关系数据挖掘
- 多关系频繁模式发现研究被引量:8
- 2007年
- 频繁模式发现是数据挖掘的重要任务之一。现实数据通常存储于由多个关系组成的关系数据库中。传统的频繁模式发现方法只能直接完成单一关系中的模式发现,如果要完成多关系数据的挖掘,会产生操作复杂性和信息丢失等问题。多关系数据挖掘是当前数据挖掘研究中快速发展的重要领域之一。多关系频繁模式发现方法能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。本文首先归纳多关系频繁模式发现方法的发生历史背景,其次分析总结多关系频繁模式发现方法,最后提出了多关系频繁模式发现将来发展需重点解决的问题和面临的挑战。
- 张伟杨炳儒钱榕
- 关键词:多关系数据挖掘归纳逻辑程序设计
- 网页链接繁殖在搜索引擎资源发现中的应用被引量:1
- 2007年
- 为解决搜索引擎返回结果数量上的限制,扩展了元搜索技术,提出链接群落、链接繁殖的概念,并与生物群落进行了对比。链接繁殖的思想是首先将多个搜索引擎返回的结果作为起始信息源,利用预定义的繁殖规则,优化并整合搜索结果,对链接所指网页的链接进行分析,繁殖出更多的相关信息源。在分析不同的搜索引擎结果集时,系统根据不同搜索引擎直接与繁殖发现信息源的能力与质量,动态调整繁殖的链接的优先次序。经过实验验证,链接繁殖可以大大扩展通过搜索引擎发现主题信息源的数量。
- 陈爽钱榕陈福李素
- 关键词:主题发现元搜索链接分析
- 基于非结构化数据挖掘结构模型的Web文本聚类算法被引量:7
- 2008年
- 在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.
- 胡健杨炳儒宋泽锋钱榕
- 关键词:WEB文本挖掘文本聚类
- 智能专题化信息搜集Crawler被引量:5
- 2006年
- 介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑网页的全部内容,而通过提取网页的HTML描述中的重要标记,对Web网页进行内容和结构分析,从而判断爬行到的网页与主题的相关性,以提高信息搜集的效率和精确性。
- 钱榕徐新华郑莹杨炳儒
- 关键词:WEB挖掘神经网络