王仲远
- 作品数:12 被引量:64H指数:4
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- ScholarSpace:面向计算机领域的学术空间被引量:4
- 2011年
- 针对目前国内学者在学术信息收集整理、学术主页建立与维护以及基于社会网络的学术交流中面临的问题,设计实现了面向国内计算机领域学者的学术空间ScholarSpace.ScholarSpace采用面向领域的DeepWeb数据集成技术,实现对Web上公开数据源中学术信息的自动集成和处理,并提供以作者为中心的学术信息检索.ScholarSpace由3部分组成,即文献集成系统SearchScholar,学术主页生成系统EasyScholar和学者间社交网络SocialScholar.EasyScholar基于SearchScholar开发完成,SocialScholar基于EasyScholar开发完成,而SocialScholar通过引入在线学术社交进一步提高SearchScholar的学术搜索质量和能力.3个子系统形成彼此促进的关系,构成了一个学术信息和资源汇集与分享的良性循环,为我国学者的学术交流提供便利.
- 陈威王仲远杨森张鹏孟小峰
- 关键词:学术空间社会网络WEB数据集成
- 一种数据驱动的Wrapper自动生成与维护方法
- Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题.传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于W...
- 王仲远艾静孟小峰
- 关键词:数据集成
- 文献传递
- 一种数据驱动的Wrapper自动生成与维护方法
- Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题。传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于W...
- 王仲远艾静孟小峰
- 关键词:数据集成数据驱动
- 文献传递
- 短文本理解研究被引量:49
- 2016年
- 短文本理解是一项对于机器智能至关重要但又充满挑战的任务.这项任务有益于众多应用场景,如搜索引擎、自动问答、广告和推荐系统.完成这些应用的首要步骤是将输入文本转化为机器可以诠释的形式,即帮助机器"理解"短文本的含义.基于这一目标,许多方法利用外来知识源来解决短文本中语境信息不足的问题.通过总结短文本理解领域的相关工作,介绍了基于向量的短文本理解框架.同时,探讨了短文本理解领域未来的研究方向.
- 王仲远程健鹏王海勋文继荣
- 关键词:知识挖掘概念化语义计算
- TaijiDB:一个双核云数据库管理系统
- 太极是一个中国古代哲学术语——即两种模式可以相对统一.利用基于云存储的主从结构和点对点结构各自的优点,融合两种结构,构建了一个双核的云数据库管理系统——太极.系统支持使用SQL语言对云数据库系统中的海量数据进行管理.
- 胡享梅赵婧孟小峰王仲远史英杰刘兵兵王海平
- 关键词:云计算
- 文献传递
- Deep Web数据集成中的实体识别方法被引量:7
- 2006年
- 互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
- 凌妍妍刘伟王仲远艾静孟小峰
- 关键词:DEEPWEBWEB数据库数据合并
- TaijiDB:一个双核云数据库管理系统
- 太极是一个中国古代哲学术语--即两种模式可以相对统一。利用基于云存储的主从结构和点对点结构各自的优点,融合两种结构,构建了一个双核的云数据库管理系统--太极。系统支持使用SQL语言对云数据库系统中的海量数据进行管理。
- 胡享梅赵婧孟小峰王仲远史英杰刘兵兵王海平
- 关键词:云计算
- Deep Web数据集成中的实体识别方法
- 互联网上存在着大量可访问的Web数据库,不同Web数据库之间存在着内容上的重叠.来自不同Web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep Web数据集成中数据合并过程里一个必...
- 凌妍妍刘伟王仲远艾静孟小峰
- 关键词:WEB数据库数据合并
- 文献传递
- Deep Web数据集成中的实体识别方法
- 互联网上存在着大量可访问的Web数据库,不同Web数据库之间存在着内容上的重叠.来自不同Web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep Web数据集成中数据合并过程里一个必...
- 凌妍妍刘伟王仲远艾静孟小峰
- 关键词:WEB数据库数据合并
- 文献传递
- C-Rank:一种Deep Web数据记录可信度评估方法被引量:4
- 2009年
- 针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S-R可信度网络,包含两种类型顶点及三种类型边。首先基于可信度传播的思想,利用顶点出度为每一个顶点计算其局部可信度值;再利用Record顶点入度及相邻Site顶点的可信度值,为该Record顶点计算权值;继而求得整个S-R网络的全局可信度值。实验证明,C-Rank方法能够合理而有效地评价数据记录的可信度,从而达到甄别虚假信息,为用户推荐可信数据记录的目的。该方法普遍适用于Deep Web的各个领域。
- 艾静王仲远孟小峰
- 关键词:深层网络