您的位置: 专家智库 > >

国家自然科学基金(60773173)

作品数:14 被引量:78H指数:6
相关作者:曲维光陈小荷李斌丁德鑫唐旭日更多>>
相关机构:南京师范大学北京大学陕西师范大学更多>>
发文基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 14篇期刊文章
  • 6篇会议论文

领域

  • 16篇自动化与计算...
  • 3篇语言文字
  • 1篇文化科学

主题

  • 7篇中文
  • 4篇信息处理
  • 4篇隐喻
  • 4篇中文信息
  • 4篇中文信息处理
  • 4篇自然语言
  • 3篇知识库
  • 3篇中文自动分词
  • 3篇自动分词
  • 3篇自然语言理解
  • 3篇汉语
  • 3篇分词
  • 2篇语料
  • 2篇语言处理
  • 2篇语义
  • 2篇随机场
  • 2篇条件随机场
  • 2篇歧义
  • 2篇歧义消解
  • 2篇自然语言处理

机构

  • 15篇南京师范大学
  • 5篇北京大学
  • 3篇江苏省信息安...
  • 2篇陕西师范大学
  • 1篇金陵科技学院
  • 1篇教育部
  • 1篇西北民族大学

作者

  • 12篇曲维光
  • 4篇于丽丽
  • 4篇陈小荷
  • 4篇丁德鑫
  • 4篇李斌
  • 3篇俞士汶
  • 3篇唐旭日
  • 2篇朱学锋
  • 2篇李惠
  • 2篇张霄军
  • 2篇李素建
  • 2篇贺胜
  • 2篇许超
  • 1篇徐涛
  • 1篇朱荷香
  • 1篇宋涛
  • 1篇董宇
  • 1篇贾玉祥
  • 1篇卢俊之
  • 1篇石民

传媒

  • 3篇中文信息学报
  • 2篇南京师范大学...
  • 1篇当代语言学
  • 1篇南京大学学报...
  • 1篇微电子学与计...
  • 1篇计算机应用研...
  • 1篇语言文字应用
  • 1篇计算机工程与...
  • 1篇文教资料
  • 1篇术语标准化与...
  • 1篇心智与计算

年份

  • 3篇2010
  • 9篇2009
  • 8篇2008
14 条 记 录,以下是 1-10
排序方式:
面向自动文摘的文本结构划分被引量:3
2008年
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
朱荷香曲维光卢俊之李素建邵艳秋
关键词:文本结构自动文摘向量空间模型
基于CRF模型的组合型歧义消解研究被引量:9
2008年
组合型歧义切分是汉语自动分词的难点之一.为此,利用CRF(条件随机场)模型,以歧义字段的上下文的词和词性建立特征模板,进行歧义消解研究.以1998年半年《人民日报》为语料,对常用的10个组合歧义字段进行消歧,平均消歧正确率达到96.35%,取得了良好的效果.实验表明,利用该模型能有效提高消歧正确率.
丁德鑫曲维光徐涛董宇
关键词:中文自动分词CRF
面向中文自动分词的可扩展式电子词典研究被引量:3
2008年
在中文自动分词及词性标注系统中,电子词典是系统的重要组成部分,也是影响系统性能的重要因素之一。介绍了电子词典应该具备的查询功能及常用的组织结构,给出了一种结构为系统词典+用户词典的可扩展式电子词典机制。其系统词典是基于首字Hash散列的逐字二分词典结构,用户词典采用基于首字Hash散列的链接表词典结构,具有很强的扩展性和实用性。
贺胜曲维光许超
关键词:词典结构自动分词HASH
计算语言学浅介被引量:5
2009年
计算语言学是文理交叉的新兴学科,以自然语言(汉语、英语等)的计算机处理(包括分析和生成)为研究内容,其最高境界是自然语言的机器理解,从而在人机之间实现自然语言的交互。本文简单介绍计算语言学和自然语言处理的研究对象、内容和当前的主攻方向。语言知识库是支撑自然语言处理研究的重要基础。本文也介绍了作者及其同仁在语言知识库建设方面所作的努力。最后,展望了自然语言理解研究的前景。
俞士汶朱学锋
关键词:计算语言学自然语言处理自然语言理解语言知识库
基于仙人掌模型的动词“吃”的隐喻分类体系被引量:1
2009年
动词“吃”是一个高频性的常用词,表示动物尤其是人类的基本生理功能。本文以动词“吃”组成的短语为隐喻考察对象,通过隐喻现象的形式化描写,探求语义规律.并基于隐喻性词义生成和演变的仙人掌发展模型,尝试构建动词“吃”的隐喻体系。
李惠曲维光
关键词:隐喻
超大规模语料库精加工技术研究被引量:4
2009年
在对现有词法标注器标注质量考察分析的基础上,本文提出语料库精加工的方法。利用这些方法,对从《人民日报》社购得的1998年上半年样例语料重新进行校对,从中排查并修改了5万余处切分和词性标注的错误或不一致,提高了样例语料的质量。本文提出的基于上下文词语相对词频比之和RFR_SUM的消歧模型,具有很好的分类效果。利用重新校对过的样例语料作为训练数据,再利用RFR_SUM模型对400余种常见歧义现象的消解进行训练,并将所得到的模型应用于超大规模语料的精加工,也取得良好的效果。
曲维光唐旭日俞敬松
名词转喻的自动理解
转喻是汉语文本中常见的语言现象。在主宾语位置上,名词会出现转喻用法。该用法往往是用凸显特征转喻本体,而凸显特征则蕴含在世界知识和人类主观体验之中,计算机自动识别转喻特别是找出转喻的本体难度很大。对此,我们提出了两点策略来...
李斌曲维光陈小荷
关键词:转喻词语相似度相关词
文献传递
基于词频和语义信息的组合型歧义消解
组合型歧义切分是汉语自动分词的难点之一。本文挖掘歧义字段上下文的相对词频信息和语义信息,建立语境计算模型。首先基于相对词频比,建立RFRUM模型,其次采用类似K近邻的分类思想,利用知网,建立语义相似度计算模型,最后尝试两...
丁德鑫曲维光于丽丽陈小荷李惠
关键词:中文自动分词语境信息语义计算
文献传递
基于词典的名词性隐喻识别
隐喻是用一个事物来类比另外一个事物的语言表达,在自然语言中非常普遍,要实现自然语言理解隐喻处理不可避免。本文针对最基本的隐喻类型——名词性隐喻,提出基于词典的识别方法。结合同义词词林的语义距离与HowNet的语义关系来识...
贾玉祥俞士汶
关键词:名词性隐喻词典语义距离语义关系
文献传递
“像”的明喻计算被引量:8
2008年
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。
李斌于丽丽石民曲维光
关键词:计算机应用中文信息处理
共2页<12>
聚类工具0