姚树杰
- 作品数:2 被引量:15H指数:2
- 供职机构:教育部更多>>
- 发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于句对质量和覆盖度的统计机器翻译训练语料选取被引量:12
- 2011年
- 该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模训练子集的方法。在CWMT2008汉英翻译任务上的实验结果表明,利用本文的方法能够从现有大规模语料中选取高质量的子集,在减少80%训练语料的情况下达到与Baseline系统(使用全部训练语料)相当的翻译性能(BLEU值)。
- 姚树杰肖桐朱靖波
- 关键词:覆盖度统计机器翻译
- 面向统计机器翻译的语料处理与评价技术研究
- 近年来,基于统计的方法在机器翻译领域内越来越占据到主导地位,多种基于统计方法的机器翻译系统相继出现,如基于短语、基于层次型短语、基于句法等等。而对于机器翻译系统,语料是不可或缺的重要资源,所谓“巧妇难为无米之炊”。“饭”...
- 姚树杰
- 关键词:统计机器翻译预处理覆盖度
- 文献传递