成瑜
- 作品数:4 被引量:16H指数:2
- 供职机构:东南大学计算机科学与工程学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 本体驱动的半结构化Web生物数据抽取被引量:8
- 2006年
- 提出由本体驱动,并根据文档结构和特征匹配来进行信息定位和信息抽取的方法,并实现了一个用户指导的交互式信息抽取原型系统。有效地解决了信息抽取中涉及的同义词,一词多义等语义问题,以及数据项不完整和排序不固定的问题。
- 成瑜何洁月
- 关键词:信息抽取本体生物数据
- 基于本体的Web生物数据获取技术的研究
- 随着互联网和生物信息的飞速发展,即时发现新的生物信息数据源来进行研究变得非常重要。传统的基于关键词的搜索引擎由于忽视了关键词本身所含的语义信息而得到较低的查全率和查准率,变得越来越不适应这种需求。此外Web已经发展成为一...
- 成瑜
- 关键词:信息检索交互式信息XML
- 文献传递
- 基于本体的生物信息数据源的发现被引量:8
- 2005年
- 随着互联网和生物信息的飞速发展,即时发现新的生物信息数据源来进行研究变得非常重要。传统的基于关键词的搜索引擎由于忽视了关键词本身所含的语义信息而得到较低的查全率和查准率,文中提出了基于本体的生物信息数据源发现的方法。通过本体描述的领域知识和反映文档信息的特征短语来语义扩充用户请求,从而提高了检索的查全率和查准率。
- 成瑜何洁月
- 关键词:语义WEB本体基因调控
- 一种有效的XML数据清洗方法被引量:1
- 2008年
- 研究XML格式的重复数据元素的特点,提出对于特定应用领域,在具体的上下文环境中主动学习XML重复元素的识别规则。通过结构转换,将结构不尽相同的XML数据映射成结构一致的数据,并通过学习不同层次数据元素间的依赖关系权重来获得匹配规则。根据学习得到的转换和匹配规则,采用哈希过滤的方法来提高检测重复XML元素的效率。该方法能够有效地解决XML重复检测面临的结构多样性的问题,理论分析和实验表明,该方法有较高的精度和效率。
- 韩京宇成瑜董逸生
- 关键词:哈希