邱立坤
- 作品数:29 被引量:100H指数:6
- 供职机构:鲁东大学文学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 面向BBS的话题挖掘初探
- 本文提出一种在BBS环境下进行热门话题挖掘的算法.BBS以讨论为主的文体决定了同一话题的文章在词语向量上并不一定相似,单纯采用基于向量空间模型的聚类算法难以有效地完成话题挖掘的任务.因此,本文的话题挖掘在一般文本聚类算法...
- 邱立坤程葳龙志祎孙娇华
- 关键词:BBS文本聚类数据挖掘
- 文献传递
- 现代汉语未登录词词类和语义类标注研究
- 从理论上讲词是备用单位,因此词的集合应该是一个可以列举的集合,但实际上,有大量的词语没有被现有的词典所收录,各家词典所收录词语的差异也非常大,这意味着对任何一部词典来说都存在着大量的未登录词(未在词典中收录的词)。另外,...
- 邱立坤
- 关键词:现代汉语未登录词语义标注数理语言学
- 语义词典归类不当现象自动发现
- 2011年
- 平行周遍原则是陈保亚(1999)提出的一种用于区分词与短语的理论,将词语分为既平行又周遍、平行不周遍和不平行不周遍三类,既平行又周遍的是短语,不宜收入词典。由于汉语语义词典在收词时并未严格遵循平行周遍原则,因此依据现有语义词典可以自动地归纳出许多平行周遍规则或者平行不周遍规则。假定有两部语义词典,则可以归纳出两套平行(不)周遍规则,每一套规则都有各自的正例和反例。一个词典中某一规则的反例如果同时是另一词典中的正例,就意味着前一部词典中的词语可能归类不当。基于这一思路,该文提出一个基于平行周遍原则的语义词典归类不当现象自动发现方法,实验结果证明了这一方法的有效性。
- 邱立坤邵艳秋
- 关键词:语义词典
- 基于句式与句模对应规则的语义角色标注
- 大规模语义角色标注语料库的构建可以为计算机理解自然语言的语义提供有用的训练数据.本文主要研究服务于语义角色标注语料库构建的语义角色标注规则.在人工语义角色标注的基础上,分析句式和句模的对应关系,并总结出一套基于句式的语义...
- 何保荣邱立坤孙盼盼
- 关键词:句模句式语义角色标注
- 基于复杂网络视角的《现代汉语词典》与《国语辞典》常用动词释义元语言研究被引量:2
- 2016年
- 词典释义元语言作为一种特殊语言形式,具有重要的研究价值。本文以HSK汉语水平考试大纲中的动词为母本,选取《现代汉语词典》(第六版)和《国语辞典》(修订版)中共有的608个词条,以其在各自词典中的释义作为语料,构建字同现网络,以复杂网络的视角对其进行了多方位的研究,解释了其在小世界性、无标度性、居间中心性、层次性和匹配度等方面的特点,揭示了词典释义元语言字同现网络独特的复杂网络性质,拓宽了语言网络研究的领域和范围。
- 徐德宽何保荣邱立坤
- 关键词:动词释义元语言
- 基于句式与句模对应规则的语义角色标注被引量:5
- 2018年
- 大规模语义角色标注语料库的构建可以为计算机理解自然语言的语义提供有用的训练数据。该文主要研究服务于语义角色标注语料库构建的语义角色标注规则。在人工语义角色标注的基础上,分析句式和句模的对应关系,并总结出一套基于句式的语义角色标注规则,在测试集上达到78.73%的正确率。基于上述规则,可以在构建语义角色标注语料库时完成自动标注的工作,标注人员在此基础上进行人工校对,可有效地减少工作量。
- 何保荣邱立坤孙盼盼
- 关键词:句模句式语义角色标注
- 单音节名词(缀)的释义模式与三音节名词的语义结构关系
- 文章以2+1式三音节复合名词及其核心后字为主要分析对象。首先提取充当核心字的单音节名词或名词缀, 之后对单音节名词的释义模式进行分析。文章认为,定中式复合名词所表达的概念是核心字的下位概念,即两者之间是下位类与上位类的关...
- 邱立坤
- 关键词:释义模式复合名词
- 文献传递
- 面向深层语义表示的否定义表达规律探析被引量:2
- 2016年
- 否定义是深层语义表示中的一个重要组成部分。该文基于语料库的方法对现代汉语中的否定表达形式及其使用规律进行深入分析。首先,系统地收集否定表达形式,将之分为显性否定词、隐性否定词、否定结构三类,并讨论否定表达形式的非否定用法。其次,对否定表达形式的使用规律进行归纳与总结,涉及单动核结构、情态成分、述补结构、动词性并列结构、连谓结构、兼语结构等,重点分析多动核结构中否定对命题义的影响,并总结在深层语义标注框架下否定义的标注规则。最后,基于多领域句法树库考察否定表达形式的领域分布差异。
- 邱立坤黄焜何保荣亢世勇
- 关键词:现代汉语否定词
- 基于依存语法构建多视图汉语树库被引量:10
- 2015年
- 树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。
- 邱立坤金澎王厚峰
- 关键词:依存语法
- 基于语料库的汉语同义词语体差异定量分析被引量:9
- 2012年
- 通过分析语体差异大的同义词,可以了解语体之间的差异。本文采用定量分析的方法,计算出1343对具有显著口语、书面语语体差异的同义词。通过对这些词对的调查分析可知:词性上,语体差别最大的同义词中动词最多;重叠、词缀、古汉语遗留词汇在同义词中所占的比重都较小;若一对同义词有音节上的差异,则口语倾向于为单音节,书面语倾向于为双音节。本文的调查结果对语言教学以及教材编写都有一定的启示。
- 张文贤邱立坤宋作艳陈保亚
- 关键词:同义词语体差异对外汉语教学