刘丽霞
- 作品数:3 被引量:25H指数:2
- 供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于数据源依赖关系的信息评价方法研究被引量:15
- 2012年
- 当前很多的数据管理应用都需要从多个数据源集成数据,每个数据源都会提供一组值,并且不同的数据源常常提供相互冲突的数据值.为了提供给用户高质量的数据值,关键是数据集成系统能够解决数据冲突问题,提取出正确的数据值.文中对已有的真值发现算法进行了分析与总结,通过考虑处理同一个值的不同表现形式和改进的选票算法,作者对现有方法给出了改进,改进后的方法可以更有效地在众多冲突数据中找出正确的数据值.
- 张志强刘丽霞谢晓芹潘海为方一向
- 关键词:数据源数据集成系统
- 基于Trie树的相似字符串查找算法被引量:10
- 2013年
- 基于Trie树的相似字符串查找算法是利用编辑距离的阈值来计算每个节点的活跃节点集,已有算法由于存在大量的冗余计算,导致时间复杂度和空间复杂度都比较高。针对这个问题,采用了基于活跃节点的对称性和动态规划算法的思想对已有算法进行改进,并对活跃节点集进行了修剪,提出了New-Trie-Stack算法。该算法避免了活跃节点的重复计算,以及已有算法在保存所有已遍历节点的活跃节点集时的空间开销。实验结果表明New-Trie-Stack算法在时间复杂度和空间复杂度上都有明显的下降。
- 刘丽霞张志强
- 关键词:TRIE树动态规划
- 基于数据源依赖关系的信息评价方法研究
- 当前很多的数据管理应用都需要从多个数据源集成数据,每个数据源都会提供一组值,并且不同的数据源常常提供相互冲突的数据值。为了提供给用户高质量的数据值,关键是数据集成系统能够解决数据冲突问题,提取出正确的数据值。文中对已有的...
- 张志强刘丽霞谢晓芹潘海为方一向
- 关键词:数据源数据集成系统
- 文献传递网络资源链接