您的位置: 专家智库 > >

龚书

作品数:5 被引量:7H指数:2
供职机构:北京交通大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金教育部科学技术研究重点项目中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 5篇自动化与计算...

主题

  • 5篇文摘
  • 3篇多文档
  • 3篇多文档文摘
  • 3篇语义
  • 3篇自动文摘
  • 3篇文档
  • 2篇语义模型
  • 2篇主题模型
  • 2篇维基百科
  • 2篇文本表示
  • 2篇基于语义
  • 2篇本体
  • 1篇语言处理
  • 1篇语义单元
  • 1篇语义分析
  • 1篇预处理
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇抽取

机构

  • 5篇北京交通大学

作者

  • 5篇龚书
  • 4篇瞿有利
  • 3篇田盛丰

传媒

  • 1篇计算机研究与...
  • 1篇南京大学学报...
  • 1篇北京交通大学...

年份

  • 2篇2013
  • 1篇2011
  • 2篇2009
5 条 记 录,以下是 1-5
排序方式:
基于语义的自动文摘研究综述被引量:4
2009年
基于语义的自动文摘方法能解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量.常用语义模型包括统计主题模型和语义知识模型.基于语义的自动文摘是对传统文摘技术基于语义模型的扩充,在自动文摘的预处理、文档转换、文档候选片段提取和文摘生成4个基本过程中使用各种语义分析方法.
龚书瞿有利田盛丰
关键词:自然语言处理自动文摘语义语义模型本体
基于语义的自动文摘研究综述
自动文摘是自然语言处理的一个分支研究领域。基于语义的自动文摘方法解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量。常用语义模型包括统计主题模型和语义知识模型。基于语义的自动文摘是对传统文摘技...
龚书瞿有利
关键词:语义语义模型主题模型本体自动文摘
多文档文摘语义单元自动去噪器的监督学习方法
2013年
多文档文摘的处理对象是存在噪音的文档集.现有文摘系统一般使用由人工设定阈值的固定阈值去噪器.但通过实验可见,不同文摘算法本身的抗噪能力各有高低,最优阈值随文档集、文摘算法、文本表示方法而改变,人工设定的固定阈值无法达到较好的通用性和去噪效果.为此,提出一种用于生成自动去噪器的监督学习方法,通过从人工文摘中自动获得标注信息,为语义单元提取多个特征,训练语义单元分类器而构成自动去噪器.可通用于不同文本表示所生成的语义单元,在不同多文档文摘系统的预处理阶段为任意文档集自动去除噪音语义单元.实验表明,该监督学习方法所生成的自动去噪器在不同文档集、文摘算法和文本表示方法下具有通用性,较好的去噪性能使各文摘算法的速度及所提取文摘的质量得到不同程度的提升.
龚书瞿有利田盛丰
关键词:多文档文摘文本表示预处理
基于维基语义的多文档文摘研究被引量:2
2011年
多文档文摘作为自然语言处理领域的重要技术之一,能从不同角度辅助用户实现高效的信息获取.由于文档集合内的内容往往来自不同的信息源,文本之间通常存在丰富而复杂的语义关系.常用的基于词的文档表示法,难以为文摘的语义分析过程提供充足而准确的数据信息.为此,我们提出使用维基百科——当今世界最大的在线概念语料库——为多文档文摘的提取提供语义支持.一方面,我们通过提取文档中的维基概念,生成准确一致的句子表示形式.另一方面,在计算句子特征时,我们利用维基词条的首段指导机器文摘的提取.我们首先通过计算概念在维基中的全局相关性和当前文档集内的局部相关性,获取概念的权重.然后在维基概念表示的基础上,为文档中的句子提取多种基于维基的特征,并最后用于文摘生成.在实验中,我们依次用各个维基特征独立生成文摘,并使用ROUGE(Recall-Oriented Understudy for Gisting Evaluation,面向召回率的要点评估)指标评价文摘质量.通过比较,实验验证了维基词条首段能较好的提升文摘质量.
龚书瞿有利田盛丰
关键词:自动文摘语义分析维基百科
抽取式多文档文摘的文本表示研究
自动文摘是自然语言处理的一个分支研究领域,本文主要研究其众多分支中最基础、也是一直被关注的基于抽取式的多文档文摘,对多篇文档提取一个由其中核心句子组成的简短文摘。多文档文摘的对象一般是围绕预定话题、经搜集而得的多文档集合...
龚书
关键词:多文档文摘主题模型维基百科
文献传递
共1页<1>
聚类工具0