王锦
- 作品数:3 被引量:15H指数:2
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 现代汉语语义资源用于短语歧义模式消歧研究被引量:11
- 2007年
- 现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词与词之间正确的搭配关系。本文研究了大量包含歧义的短语实例,分析了计算机处理汉语结构时面临的定界歧义和结构关系歧义问题,在已有短语结构规则的基础上归纳出了七种结构歧义模式,提出了分析歧义模式的关键是四种基本搭配信息的判断,并实现了基于语义知识和搭配知识的消歧算法。对887处短语进行排歧的实验结果表明,处理短语结构的正确率由82.30%上升到87.18%。
- 王锦陈群秀
- 关键词:计算机应用中文信息处理搭配词典
- 现代汉语语义资源用于短语歧义模式消歧研究
- 现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词之间正确的搭配关系。本文总结出七种短语结构歧义模式,在已有的基于规则与概率模型的句法分析器基础上,使用现代汉语语义知识库以及搭配词典作为语义资源,针对每种短语歧...
- 王锦陈群秀
- 关键词:搭配词典句法分析语义信息排歧
- 文献传递
- 汉语述语形容词机器词典机器学习词聚类研究被引量:4
- 2007年
- 本文提出了一个基于现代汉语述语形容词机器词典以及平衡语料库的形容词多信息聚类算法。聚类的过程根据形容词的语料提取了三重信息(所修饰的名词,同义近义词以及反义词),从而使形容词与形容词之间构成网络关系。本文重点描述了如何根据三重信息分别建模计算形容词的相似性并通过计算字面相似度以及路径权值这些辅助信息修正每两个形容词之间的相似度,从而在某种程度上缓解了数据稀疏的问题,实验结果显示该算法是有效的。
- 王锦陈群秀
- 关键词:机器翻译词聚类