万敏
- 作品数:6 被引量:52H指数:4
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 基于概念统计的英文自动文摘研究被引量:19
- 2002年
- 文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统。系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分布划分意义块,以意义块为单位抽取文摘,初步解决多主题文章的文摘结构不平衡问题。该文主要介绍概念层次树的构造,主题概念的抽取步骤,句子重要度的计算和意义块的划分算法。测试表明该文提到的方法比传统的基于词频统计的方法有更高的召回率与精确率。
- 万敏罗振声季姮高小云
- 关键词:主题概念向量空间模型计算机
- 面向非受限领域的综合式自动中文文摘方法被引量:12
- 2002年
- 讨论了一种面向非受限领域的综合式中文自动文摘方法。其基本思路是 :采用向量空间模型对篇章结构进行自动分析 ,建立基于语义相似度的段落关系图 ,获取段落的重要度信息 ,并使用标题或聚类的方法划分意义段 ;根据词的频度 ,句子位置、提示语等文本形式特征计算句子的权值 ,分别从各意义段中选取高权值的句子作为文摘句 ;对文摘句进行句法和语义分析 ,消除冗余 ,解决指代词悬挂、文摘不连贯等问题 ,最终组成一篇简洁、通顺。
- 郭玉箐万敏罗振声
- 关键词:自动文摘方法向量空间模型篇章结构分析中文信息处理
- 自动文摘系统中的意义段划分问题研究
- 意义段划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题.对有子标题的文章,本文总结了中文文章的各种子标题模式,根据标题进行意义段划分.对无子标题的文章,则建立以段落为基础的向量空间模型,根据段落相似度进行聚类实...
- 万敏罗振声郭玉箐
- 关键词:自动文摘向量空间模型聚类
- 交流感应电机检速再同步方法的仿真研究
- 万敏
- 关键词:同步启动感应电机
- 基于概念统计和语义层次分析的英文自动文摘研究被引量:27
- 2003年
- 传统的自动文摘方法基于词语统计抽取文摘句 ,未进行文本的语义分析 ,导致文摘精度不高。为了克服传统方法的缺点 ,本文提出了一种基于主题概念的自动文摘方法 ,以概念统计和层次分析为基础设计并实现了一个英文自动文摘系统。系统利用WordNet以概念统计代替传统的词频统计 ,基于主题概念构建向量空间模型 ,计算句子重要度。并且根据主题概念在概念层次树上的分布进行文本结构分析划分意义块 ,以意义块为单元抽取文摘 ,初步解决了多主题文章的文摘结构不平衡问题。本文主要介绍了概念层次树的构造 ,主题概念的抽取步骤 ,基于主题概念的句子重要度的计算和意义块的划分算法。测试表明 ,通过概念统计和语义层次分析的方法 ,我们设计了更理想的向量空间模型 ,系统生成的文摘精度较高 。
- 季姮罗振声万敏高小云
- 关键词:计算机应用中文信息处理主题概念向量空间模型
- 基于统计和语义分析的中英文自动文摘研究
- 万敏
- 关键词:自动文摘语义分析主题划分可读性