国家重点基础研究发展计划(2004CB318102)
- 作品数:78 被引量:743H指数:16
- 相关作者:俞士汶彭爽吴云芳金晓艳穗志方更多>>
- 相关机构:北京大学南京师范大学南开大学更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
- 现代汉语类词缀的定量与定性研究被引量:76
- 2008年
- 本文基于《现代汉语语法信息词典》8万词的词库,对类词缀的构词频率进行了统计和分析,同时也对类词缀的能产性、定位性以及虚化程度等构词特征进行了探讨,并区分了类词缀与部件词。我们采用定量研究和定性研究相结合的方法,对每一个类词缀从读音、义项、同形、词频、构词方式等方面进行全方位的考察,共确立了现代汉语的单音节类前缀23个、类后缀53个。
- 曾立英
- 关键词:类词缀
- 计算语言学与外语教学被引量:8
- 2006年
- 本文概要介绍计算语言学的基本概念及计算语言学对外语教学的意义和作用,希望为促进外语教学提供一些新的想法,同时也希望吸引更多外语教学研究者关注计算语言学,共同推动人类语言技术的进步。
- 俞士汶柏晓静
- 关键词:计算语言学外语教学语料库教育科技
- 旁指代词的连接功能考察被引量:1
- 2006年
- 本文对旁指代词“另”和“另外”的连接功能进行了详细的分析,并简要地探讨了旁指代词的连接功能在英语中的表现形式。
- 金晓艳彭爽
- 关键词:旁指代词
- 基于词频和语义信息的组合型歧义消解
- 组合型歧义切分是汉语自动分词的难点之一。本文挖掘歧义字段上下文的相对词频信息和语义信息,建立语境计算模型。首先基于相对词频比,建立RFRUM模型,其次采用类似K近邻的分类思想,利用知网,建立语义相似度计算模型,最后尝试两...
- 丁德鑫曲维光于丽丽陈小荷李惠
- 关键词:中文自动分词语境信息语义计算
- 文献传递
- 人民日报标注语料的索引方法研究
- 本文对人民日报标注语料的索引方法进行了研究,提出一种词语和标记的二元混合索引的方法,在可以同时检索词语和标记串的基础上,有效地提高了检索效率。
- 王洪俊施水才俞士汶肖诗斌
- 关键词:混合索引
- 文献传递
- 现代汉语虚词知识库的研究被引量:30
- 2007年
- 现代汉语虚词在句法中所起的作用比较复杂,其个性较强,用法各异。目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对真实语料中虚词用法规律的考察,着力构建面向机器的现代汉语虚词用法信息词典和虚词用法规则库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。
- 昝红英张坤丽柴玉梅俞士汶
- 关键词:计算机应用中文信息处理虚词语言知识库规则库
- “像”的明喻计算被引量:8
- 2008年
- 汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。
- 李斌于丽丽石民曲维光
- 关键词:计算机应用中文信息处理
- 基于内容的名人网页褒贬性评价被引量:4
- 2005年
- 在已有基本褒贬义词典的基础上构建了一种可用于名人网页褒贬性评价的褒贬义词典,着重论述了网页褒贬性评价的模型、方法及工作流程,并提出了通过评价模板实现词典更新的初步构想。本系统基本实现了网页内褒贬词语的标注,并对部分名人网页进行褒贬性评价测试,取得了初步的成效。网页的褒贬评价可以嵌入到搜索引擎中,提供进一步的个性化服务。
- 熊德兰柴玉梅昝红英
- 面向中文学术专著的机器辅助翻译研究被引量:7
- 2006年
- 学术专著的对外传播对我国科学技术的发展意义重大。本文分析当前专著翻译工作中存在的问题和专著本身的特点,介绍一个面向中文学术专著的机器辅助翻译模型及其计算机辅助环境,用以细化专著翻译过程、规范人与计算机的分工与协作。实际应用的结果表明,该模型及辅助翻译系统能有效地提高专著翻译工作的自动化程度,保证专著翻译的效率和质量。
- 柏晓静俞士汶
- 关键词:翻译记忆双语语料库
- 面向自动文摘的文本结构划分被引量:3
- 2008年
- 文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
- 朱荷香曲维光卢俊之李素建邵艳秋
- 关键词:文本结构自动文摘向量空间模型