周军锋 作品数:33 被引量:235 H指数:5 供职机构: 燕山大学信息科学与工程学院 更多>> 发文基金: 国家自然科学基金 教育部“新世纪优秀人才支持计划” 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 经济管理 社会学 理学 更多>>
F-Index:一种加速Twig查询处理的扁平结构索引 被引量:10 2007年 如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查询无关的元素,在处理深度嵌套的复杂结构XML文档时具有很大的优势.提出一种新的查询算法,能够有效处理过滤后剩余元素的匹配问题.基于不同数据集的实验表明,使用F-Index进行过滤可以极大地提高查询处理的性能. 周军锋 孟小峰 蒋瑜 谢敏关键词:查询优化 TWIG查询 结构索引 TDCOL:列式存储的XML关键字查询处理策略 被引量:1 2012年 针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查询处理算法TDCOL(top-down SLCA computation based oncol-umn storage)来提升系统的处理性能。对于给定查询Q={k1,k2,...,km}的每个公共祖先结点,TDCOL在保证仅处理一次的情况下即可得到所有满足条件的结果,因而将时间复杂度降为O(m′|LID1|′lb|Skmaxch(v)|),其中|LID1|是Q的最短倒排表中包含的不同ID值的数目,Skmaxch(v)是所有被处理结点的包含关键字的孩子结点集中的最大集合。最后通过比较各种指标,从不同角度对TDCOL算法的性能优势进行了验证。 周军锋 田姗姗 蓝国翔 陈子阳 郭景峰关键词:关键字查询 一种最优的静态路径编码存储策略 2011年 路径编码方案通过记录从XML文档根结点到当前结点的路径信息,可以快速判断结点间的各种位置关系.高效的编码存储策略可以在提高存储空间利用率的同时,减少系统的IO开销,从而进一步提升系统的整体性能.提出一种最优的静态路径编码存储策略,其基本思想是在存储编码中的数字时,每个编码中数字对应的前缀并非提前给定,而是根据其所在数字区间中数字的使用频率之和给定相应的前缀,因此可以充分利用每个不同数字的频率信息来降低所需的存储空间.最后通过实验结果验证了该方法的可行性及有效性. 陈子阳 周军锋关键词:存储策略 可扩展标记语言 TDTMS:一种面向XML数据的结果子树构建算法 2013年 构建结果子树是XML关键字查询得以完成的关键步骤之一.针对已有方法求解子树效率低的问题,文中提出一种自顶向下的子树构建算法——TDTMS.TDTMS以自顶向下、深度优先的方式求解满足条件的子树根结点,避免了已有方法求解SLCA结点时存在的公共祖先重复处理问题.对于给定的子树根结点,TDTMS以自顶向下、广度优先的方式构建子树,可以在建树过程中快速裁剪无用结点,从而获得了最小的时间和空间复杂度.最后通过实验验证了TDTMS在时间和空间两方面的性能优势. 周军锋 王博 田姗姗 陈子阳 郭景峰关键词:可扩展标记语言 关键字查询 一种优化的协同过滤推荐算法 协同过滤技术被成功地应用于个性化推荐系统中.随着电子商务系统用户数目和商品数目的日益增加,整个项目空间上用户评分数据极端稀疏,传统的相似性度量方法存在一定的不足.在引入项目评分预测思想的基础上,考虑到数据稀疏性带来的影响... 周军锋 汤显 郭景峰关键词:协同过滤 推荐系统 向量空间 文献传递 BiRch:一种处理k步可达性查询的双向搜索算法 被引量:12 2015年 针对现有方法低效或索引规模庞大的问题,提出一种双向搜索算法Bi Rch。当判断顶点u是否满足k步可达顶点v时,首先比较u的出度和v的入度,优先处理度小的顶点。其优点体现在使用较小的索引,同时避免由于u的出度过大所带来的效率下降问题;提出基于双向广度层数和双向拓扑层数的剪枝策略来辅助过滤,减少需要访问的顶点数量。基于19个真实数据集进行测试,实验结果从索引构建时间、索引大小、查询响应时间、处理顶点数量以及扩展性方面验证了所提方法相对于现有方法的高效性。 周军锋 陈伟 费春苹 陈子阳关键词:双向搜索 一种基于闪存的低能耗缓冲区管理算法 被引量:1 2015年 闪存以其低能耗、低延迟、小巧轻便及高抗震性等特点广泛应用于不同环境中以消除磁盘机械寻址所带来的高能耗及高延迟等问题。提出一种基于闪存硬盘(SSD)的低能耗缓冲区置换算法AFC。当需要选择置换页时,AFC使用基于代价的启发式来选择置换页。AFC的设计目标是基于用户设定的权值,在最小化能耗和最大化吞吐量之间取得平衡。对不同型号的闪存芯片进行了实验验证,实验结果表明,基于AFC来管理缓冲区数据时,可以显著降低系统的能耗。 汤显 周军锋关键词:闪存 能耗 缓冲区 DeweyTP:一种面向概率XML数据的编码方案 被引量:2 2013年 与普通XML文档相比,概率XML数据中节点的类型不唯一且节点的出现具有相应的概率。提出一种高效的编码策略DeweyTP,该编码策略为每个XML数据节点分配唯一的能够体现节点类型和路径概率的编码,来支持节点类型检测和路径概率提取,因而提升系统性能。最后通过实验从时间和空间两方面验证了DeweyTP编码的高效性。 陈子阳 刘佳 张刘辉 周军锋关键词:DEWEY编码 一种改进的检测重复记录的方法 1引言数据集成中很重要的一个问题就是检测重复元组,重复指的是对于同一数据,存在两个或多个相同的元组。例如:表1所展示的由不同数据源集成到的数据,从我们的经验来判断,应该表示的是同一实体,但由于书写格式不尽相同,计算机就将... 郭景峰 周军锋 张大鹏文献传递 XML数据流上基于关键字的多查询处理 试图将基于XML文档的关键字查询技术引入数据流环境中,在同时处理大量基于关键字的查询的基础上为用户返回有意义的数据片段.提出了一种基于有向无环图的索引来高效组织大量基于关键字的查询,用以降低查询匹配的代价;针对数据流的特... 周军锋 孟小峰 张新 黄静关键词:XML数据流 关键字查询 文献传递