塔娜
- 作品数:16 被引量:64H指数:3
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金清华大学基础研究基金资助更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于优化规则的图查询选择性估计方法
- 提出了一种新的针对图结构数据查询的选择性估计方法:基于优化规则的选择性估计方法.该方法适用于简单路径查询和复杂分支路径的结构查询,具有普遍意义.
- 钱乾冯建华廖雨果李国良塔娜
- 一种可扩展标记语言文档树中结点关系的判断方法
- 本发明涉及一种可扩展标记语言文档树中结点关系的判断方法,属于网络数据处理技术领域。首先对文档树进行编码:设定可扩展标记语言文档树的根结点的编码为1;若结点D是结点A的最左儿子结点,其编码是整数P,则结点D的编码为整数2P...
- 冯建华李国良周立柱钱乾廖雨果塔娜
- 文献传递
- 纯XML数据库语义缓存中视图的快速查找算法
- 1前言随着XML数据的应用范围和复杂度的快速增长,各种应用对XML数据的查询、定位和获取的需求不断增加,引发了对XML数据进行合理存储和快速查询的要求。
- 塔娜冯建华李国良林峰刘旭辉
- 文献传递
- TwigStar——快速处理XML Twig查询中含通配符*的算法
- XML Twig查询可以表示为一棵带标签结点的查询树,它支持对XML文档进行带有复杂谓词的结构或内容查询.整体(holistic)Twig查询算法已经被公认为XML查询处理的核心算法.很多学者提出了大量基于整体处理的XM...
- 李国良冯建华塔娜周立柱
- 关键词:TWIG查询XML
- 文献传递
- 将可扩展标记语言文档树转化为紧凑查询树的方法
- 本发明涉及一种将可扩展标记语言文档树转化为紧凑查询树的方法,属于网络数据处理技术领域。首先根据用户给定的关键字集合遍历可扩展标记语言文档树,删除树中不包含用户给定关键字的内容结点和孤立结点,得到可扩展标记语言文档查询树;...
- 李国良冯建华王建勇塔娜周立柱
- 文献传递
- 一种基于可扩展标记语言文档树的连接方法
- 本方法涉及一种基于可扩展标记语言文档树的连接方法,属于网络数据处理技术领域。首先设两棵可扩展标记语言文档树分别为T<Sub>1</Sub><r,V<Sub>1</Sub>,E<Sub>1</Sub>>和T<S...
- 李国良冯建华王建勇塔娜周立柱
- 文献传递
- 一种可扩展的XPath查询最小化算法框架
- 2008年
- XPath是XML的基本查询语言,XPath查询最小化对于提高XML数据库的查询性能具有重要意义。但是,由于XPath查询最小化是一个coNP完备问题,大部分已有的算法局限于处理简单的XPath片段。本文从一个新的角度入手,综合考虑完备性和高效性,提出了一个新的查询最小化框架,与已有算法"面向结点",即逐个删除冗余结点的解决思路不同,本文提出"面向树模式"的方式,即通过计算树模式的自同态映射,寻找目标结点集最小的自同态映射,进而求解最小等价查询树的方法。该方法具有较高的效率,而且在一定情况下是完备的,尤其是可以进一步扩展到更复杂的XPath片段。本文以此框架为基础,给出一个可以计算复杂查询模式的算法。
- 林峰冯建华塔娜李国良洪亲
- 关键词:XPATH查询自同态最小化
- 纯XML数据库研究综述被引量:54
- 2006年
- 虽然XML是一种专门为Internet所设计的标记语言,但是它已经成为Internet上数据表示和数据交换的标准。如何对XML文档进行有效管理与快速查询是当前学术界的研究热点,即所谓的XML数据库。主要对当前XML数据库的研究现状与发展趋势进行全面的论述与分析,并对其中尚未解决的挑战性问题进行了客观的评价与分析。
- 冯建华钱乾廖雨果李国良塔娜周立柱
- 关键词:扩展标记语言XML数据库NATIVEXML数据库存储策略查询优化
- XPath片断的包含与等价关系的判定
- 对XPath查询语句的包含和等价问题进行研究,引入了条件同态的概念,提出了一个基于条件同态的判定XPath模式树包含关系的算法.该算法不仅能够正确地判定现有的实用算法不能处理的一类包含关系,而且对常用模式树的判定是高效的...
- 廖雨果冯建华钱乾李国良塔娜
- 关键词:XPATH查询语句模式树
- TwigStar——快速处理XML Twig查询中含通配符*的算法被引量:3
- 2006年
- XMLTwig查询可以表示为一棵带标签结点的查询树,它支持对XML文档进行带有复杂谓词的结构或内容查询.整体(holistic)Twig查询算法已经被公认为XML查询处理的核心算法.很多学者提出了大量基于整体处理的XML Twig查询算法.但是目前已有的算法都只适合于Twig查询中不包含通配符*的情况.而当Twig查询中包含通配符*时,一种简单而直接处理的方法就是,把被查询文档中的所有结点元素都读到内存,把这些元素都看做通配符*所对应的元素,然后按照已有的算法进行查询处理.显然这种方法是不合理的,它会增加大量I/O开销.因此提出了一种有效地支持通配符*的查询处理算法.通过建立索引,它可以很好地处理含通配符*的查询,从而可以避免不必要的I/O开销.最后通过实验证明,算法要明显好于已有的算法.
- 李国良冯建华塔娜周立柱
- 关键词:TWIG查询XML