安徽省高校省级自然科学研究项目(2006kj055B)
- 作品数:15 被引量:72H指数:6
- 相关作者:郑诚吕刚张瑞陈娟娟陈涛更多>>
- 相关机构:安徽大学合肥学院更多>>
- 发文基金:安徽省高校省级自然科学研究项目安徽省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 流数据和传统数据存储及管理方法比较研究被引量:6
- 2009年
- 传统数据或静态数据是指来自关系数据库、数据仓库和事务数据库里面的数据,与之对应的流数据,是一种具有实时、快速和连续到达特点的动态数据。由于流数据的上述特点,使得应用于传统数据挖掘的技术和方法不能很好地适应流数据。对传统数据进行存储、查询和管理,使用成熟的DBMS完成,对流数据的类似操作,必须开发出具体的DSMS加以实现。提出了一个对流数据进行管理的系统框架,并在管理系统和存储方式两方面对两种数据进行综合比较。
- 李子杰郑诚
- 关键词:数据挖掘流数据
- 基于Lucene的语义检索系统被引量:15
- 2008年
- 在一种基于LUCENE的传统文本检索引擎之上,采用C/S架构模式的语义检索实验系统。用户可以根据需要,从客户端向服务器提交相应的查询信息配置,服务器根据此配置,通过本体导航与同义词查询2种查询扩展优化技术,对提交的查询关键词组进行查询、扩展等优化处理后,将经优化处理过的查询关键词组导入传统的文本检索引擎中,对文档资源进行匹配,将查询结果根据用户要求的排列,并依次返回给用户。通过用户与服务器的信息交互与对查询语句的查询扩展,该系统提高了查准率与查全率。
- 郑廷郑诚
- 关键词:文本检索同义词查询扩展C/S架构
- 应用模糊本体的广义关联规则挖掘算法
- 2009年
- 模糊集与本体结合的数据挖掘方法得到了广泛的关注。为了丰富数据挖掘效果以及数据挖掘得出的规则的完整性,本文在模糊本体的挖掘算法基础上,提出了模糊本体中叶子结点的相似度定义以及不同语义层次所含项目集的数目定义多重最小支持度,提出了基于模糊本体的广义关联规则算法。对比实验证明,基于模糊本体的广义关联规则算法的挖掘具有更强的可读性,获得的语义关联规则更加丰富,促进了在广义关联规则挖掘过程中使概念泛化更加合理,提高了算法效率。
- 吕刚王昆仑郑诚
- 关键词:数据挖掘模糊本体关联规则
- 本体映射中的概念相似度计算被引量:5
- 2008年
- 本体是概念、属性和关系的集合,本体映射是解决本体异构的最好方法。文中针对目前本体映射过程中概念相似度计算存在的问题,提出一种综合的相似度计算方法。先根据本体中两个概念名称的相似性,选出最相关的概念,减少相似度的计算,然后分别基于概念的属性、实例和关系来计算概念相似度,并进行综合得到概念相似度。在计算属性相似度时,先通过计算属性的信息增益来确定各个属性的优先级,最后只选取几个信息增益大的属性进行相似度的计算,从而减小计算量。
- 郑诚秦多荣
- 关键词:本体映射概念相似度属性相似度
- 基于加权的本体相似度计算方法被引量:8
- 2010年
- 为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法。通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响。利用JenaA PI、Lucene等开源工具包,提出了查询扩展方法。实验结果表明,提出的基于加权语义相似度计算模型与传统的计算法方法以及主观判断的方法相比,提高了相似度计算的准确性,效率有明显提高。
- 吕刚郑诚
- 关键词:本体语义距离语义相似度语义检索
- 改进的基于概念相似度的文本检索被引量:12
- 2010年
- 为提高信息检索的查全率和查准率,提出改进的本体语义相似度计算方法,利用本体中概念语义相似度对检索结果文档的分值进行重新计算,过滤掉与原始查询相关度较小的文档。给出定义查询扩展中的迭代参数,减少进行扩展的次数,提高查询效率。利用开源工具Jena,Lucene进行文本语义检索测试,验证该方法的可行性和有效性。
- 吕刚郑诚
- 关键词:语义检索本体语义相似度查询扩展
- 基于RDFS的数据结构描述被引量:1
- 2008年
- 资源描述框架(RDF)/资源描述框架模式(RDFS)是语义互联网架构中的技术。尽管XML/RDF数据库正迅速地发展,关系型数据库仍是目前企业级应用的首选。针对在应用中混合使用关系型数据库管理系统和RDF/RDFS的问题,该文提出了关系数据库表结构的RDFS定义方法以及在此基础上的数据获取方式,目的是在关系数据库与应用系统之间建立基于RDFS的抽象数据结构描述,实现数据结构的可配置性以及RDF数据的可访问性。
- 查琦郑诚陈涛
- 关键词:资源描述框架资源描述框架模式数据结构关系型数据库管理系统
- 基于本体的关联规则在电子商务中的应用
- 2009年
- 通过Web进行商务活动带来的便利和它所产生的交易速度已成为电子商务迅猛发展的关键推动力。对电子商务交易日志文件的挖掘可以得到关于群体客户行为和方式的普遍知识,从而改进服务,结合领域知识的关联规则挖掘问题一直是研究热点,通过利用领域本体整合关联关系提高挖掘效果。结合AROS算法,实验表明得到的规则更有意义。
- 吕刚郑诚
- 关键词:本体关联规则
- 关联规则挖掘中的隐私保护研究被引量:5
- 2008年
- 数据挖掘中的关联规则反映一个事件和其他事件之间依赖或相互关联的知识。随着大量数据不停地收集和存储积累,人们希望从中发现感兴趣的数据关联关系,从而帮助他们进行决策。随着信息技术的发展,数据挖掘在一些深层次的应用中发挥了积极的作用。但与此同时,也带来隐私保护方面的问题。隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果。为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法。针对关联规则挖掘中需预先给出最小支持度和最小置信度这一条件,提出了一种简单的事务数据库中事务的处理方法,即隐藏那些包含敏感项目的关联规则的方法,以对相关事务作处理,达到隐藏包含敏感项目的关联规则的目的。理论分析和实验结果均表明,基于事务处理的隐私保护关联规则挖掘方法具有很好的隐私性、简单性和适用性。
- 张瑞郑诚陈娟娟
- 关键词:隐私保护
- 利用共用本体构造本体映射
- 2008年
- 一些代理机语言使得代理机能够理解代理机之间传递的信息的内容和潜在含义。交互中用到的信息载体是本体,由于本体是多种多样的,而且不同的本体对于同一个事物的描述是不一样的,这就阻碍了代理机之间的交互,这个问题被称作交互问题。文中提出共用本体的概念,建立通用的本体体系,首先建立本体与通用本体之间的映射,然后构建两个或两个以上异构本体之间的映射。实验表明,此方法不仅能够解决结构异构问题,也能解决语义异构问题。
- 郑诚陈涛查琦
- 关键词:本体本体映射语义异构