艾静
- 作品数:8 被引量:11H指数:2
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种数据驱动的Wrapper自动生成与维护方法
- Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题。传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于W...
- 王仲远艾静孟小峰
- 关键词:数据集成数据驱动
- 文献传递
- Deep Web数据集成中的实体识别方法被引量:7
- 2006年
- 互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
- 凌妍妍刘伟王仲远艾静孟小峰
- 关键词:DEEPWEBWEB数据库数据合并
- 一种数据驱动的Wrapper自动生成与维护方法
- Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题.传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于W...
- 王仲远艾静孟小峰
- 关键词:数据集成
- 文献传递
- Deep Web数据集成中的实体识别方法
- 互联网上存在着大量可访问的Web数据库,不同Web数据库之间存在着内容上的重叠.来自不同Web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep Web数据集成中数据合并过程里一个必...
- 凌妍妍刘伟王仲远艾静孟小峰
- 关键词:WEB数据库数据合并
- 文献传递
- C-Rank:一种Deep Web数据记录可信度评估方法
- 针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S-R可信度网络,包含两种类型顶点及三种类型边。首先基于可信度传播的思想,利用顶点出度为每一个硕点...
- 艾静王仲远孟小峰
- 关键词:数据记录
- 文献传递
- C-Rank:一种Deep Web数据记录可信度评估方法被引量:4
- 2009年
- 针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S-R可信度网络,包含两种类型顶点及三种类型边。首先基于可信度传播的思想,利用顶点出度为每一个顶点计算其局部可信度值;再利用Record顶点入度及相邻Site顶点的可信度值,为该Record顶点计算权值;继而求得整个S-R网络的全局可信度值。实验证明,C-Rank方法能够合理而有效地评价数据记录的可信度,从而达到甄别虚假信息,为用户推荐可信数据记录的目的。该方法普遍适用于Deep Web的各个领域。
- 艾静王仲远孟小峰
- 关键词:深层网络
- C-Rank:一种Deep Web数据记录可信度评估方法
- 针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S-R可信度网络,包含两种类型顶点及三种类型边。首先基于可信度传播的思想,利用顶点出度为每一个顶点...
- 艾静王仲远孟小峰
- 关键词:深层网络
- 文献传递
- Deep Web数据集成中的实体识别方法
- 互联网上存在着大量可访问的Web数据库,不同Web数据库之间存在着内容上的重叠.来自不同Web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep Web数据集成中数据合并过程里一个必...
- 凌妍妍刘伟王仲远艾静孟小峰
- 关键词:WEB数据库数据合并
- 文献传递