刘海涛
- 作品数:5 被引量:11H指数:1
- 供职机构:北京广播学院文学院应用语言学系更多>>
- 发文基金:国家广电总局部级社科研究项目更多>>
- 相关领域:语言文字自动化与计算机技术文化科学更多>>
- 语料库中熟语的标记问题被引量:9
- 2004年
- 熟语是自然语言中普遍存在的语言现象。本文分析了国内现有语料库对熟语的标注方式 ,发现这种方式对语料库的进一步加工是有问题的。为了在语料库标注阶段把熟语问题处理好 ,本文从信息处理的角度将熟语中的成语、惯用语、歇后语、习用语、专门语以及缩略语归为固定语的范畴 ,进而提出根据固定语的语法功能给定词性标记 ,再根据它们的词汇特征给定词汇范畴标记的双层标记法 ,这样在一定程度上解决了熟语的语料库标注问题。
- 安娜刘海涛侯敏
- 关键词:人工智能自然语言处理熟语固定语语料库
- 计算语言学不仅仅是计算——读冯志伟《计算语言学探索》被引量:1
- 2003年
- 刘海涛
- 关键词:歧义结构机器翻译
- 语料库中熟语的标记问题
- 一引言在建设传媒语言语料库的过程中,我们根据对语料库加工的通行做法,先对原始语料作词性标注。词性标注之后,当我们开始进行句法层次的加工时,发现目前的熟语标记存在一定的问题。我们在对生语料做词性标注时,采用的是北京大学计算...
- 安娜刘海涛侯敏
- 文献传递
- 巴比塔何时能建成被引量:1
- 2003年
- 简单回顾了机器翻译的历史,探讨了实现机器翻译的困难所在以及如何评价机器翻译系统的优劣,最后介绍了几种目前常用的机器翻译的方式。
- 刘海涛
- 关键词:机器翻译人工智能
- 语料库中熟语的标记问题
- 本文对语料库中熟语的标记问题进行了探讨。文章围绕熟语的本质与信息处理用“语”的要求、固定语的标注等进行了阐述。
- 安娜刘海涛侯敏
- 关键词:汉语语言语言文字语言标记
- 文献传递