国家自然科学基金(61240036)
- 作品数:4 被引量:16H指数:2
- 相关作者:钟茂生谭龙熊李艳王小虎徐海洲更多>>
- 相关机构:华东交通大学江西师范大学更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金江西省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 汉语篇章主位推进模式自动识别方法被引量:2
- 2015年
- 为了实现篇章连贯性自动分析,针对语篇连贯应该具备"各句的主位和述位必须相互联系"这一条件,研究了汉语篇章主位推进模式自动识别方法。该方法使用LTP语言科技平台进行句法分析进而进行主位切分,使用词语相似度计算方法对主位、述位进行模式匹配。实验表明该方法能在一定程度上自动分析出句子间的主位推进模式,进而促进汉语篇章连贯性研究。
- 钟茂生王小虎
- 关键词:主位推进模式主位述位
- 基于有效词频的改进C-value自动术语抽取方法被引量:12
- 2013年
- 现有的中文术语自动抽取方法主要针对术语的高频特征与单元性指标,而低频术语和术语的术语性指标缺乏有效的处理方法。针对上述问题,将背景语料库引入C-value方法,提出词语领域分布度与有效词频的概念,通过计算候选术语的EC-value值来自动抽取术语,并结合术语簇识别与挖掘,改善低频术语抽取性能。通过计算机领域术语抽取实验,表明本文提出的改进方法(EC-value方法)能更有效地衡量术语的术语性,改善低频术语抽取性能。
- 熊李艳谭龙钟茂生
- 论证体篇章结构的形式化描述被引量:1
- 2017年
- 随着词语、句子等语言单位的语义表示和自动理解研究的逐渐深入,篇章一级的语义表示和自动分析理解也开始成为研究的焦点。由于篇章语义分析与篇章组织结构密切相关,自动准确地获取篇章的组织结构,有助于实现篇章级语义的自动分析。文章为实现论证体篇章组织结构的自动分析,在前人研究工作基础上,以中文论证体篇章为研究对象,研究论证体篇章组织结构的形式化描述方法,提出了论证体篇章中的基本论证结构EAS、递归论证结构RAS等重要概念,同时提出了一种层次结构的数字表示方法,并用实例分析方法来进一步解析如何对论证体篇章进行形式化。该研究工作为论证体篇章的层次结构分析和文本结构树的生成提供了理论依据,也为计算机存储和重构文本的层次结构奠定了基础。
- 钟茂生江超王琪
- 关键词:篇章结构形式化
- 基于主题和焦点的问句相似度计算方法被引量:1
- 2014年
- 问句相似度计算是基于常问问题库的问答系统的重点。现在的问句相似度计算准确率较低,为此,提出了一种基于主题和焦点的中文问句相似度计算方法。主题和焦点能够反映问句的主旨,识别出问句的主题能够更好地理解问句。其中抽取问句主题和焦点的方法能获取部分语义信息,而且比传统的根据疑问词进行语义分析的方法适用类型更广,同时在计算问句相似度时考虑了主题和焦点的影响。最后通过设计实验与其他方法进行比较,实验表明,该方法提高了准确率。
- 曾辉徐海洲钟茂生
- 关键词:问答系统向量空间模型