刘婉婉
- 作品数:5 被引量:24H指数:4
- 供职机构:内蒙古工业大学信息工程学院更多>>
- 发文基金:内蒙古自治区自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LSTM的蒙汉机器翻译的研究被引量:7
- 2018年
- 由于内蒙古地区蒙汉机器翻译水平落后、平行双语语料规模较小,利用传统的统计机器翻译方法会出现数据稀疏以及训练过拟合等问题,导致翻译质量不高。针对这种情况,提出基于LSTM的蒙汉神经机器翻译方法,通过利用长短时记忆模型构建端到端的神经网络框架并对蒙汉机器翻译系统进行建模。为了更有效地理解蒙古语语义信息,根据蒙古语的特点将蒙古文单词分割成词素形式,导入模型,并在模型中引入局部注意力机制计算与目标词有关联的源语词素的权重,获得蒙古语和汉语词汇间的对齐概率,从而提升翻译质量。实验结果表明,该方法相比传统蒙汉翻译系统提高了翻译质量。
- 刘婉婉苏依拉乌尼尔仁庆道尔吉
- 关键词:注意力机器翻译蒙汉
- 基于CNN词根形态选择模型的改进蒙汉机器翻译研究被引量:7
- 2018年
- 随着科学技术的发展,以循环神经网络为基础的机器翻译方法由于翻译质量更好而逐渐取代统计机器翻译方法,特别是在国际大语种之间的互译方面,RNN在对语料编码时能够提取更好的特征,这对翻译质量好坏至关重要。然而在蒙古语这类小语种的翻译方面,由于语料不足导致的数据稀疏和RNN模型训练梯度消失等问题,很难从语料中充分获取语义关系,因此该文提出一种基于卷积神经网络CNN(convolutional neural network)的蒙汉机器翻译方法,在对源语料编码时利用池化层获取语义关系,并根据蒙古语构词特点得到句子的语义信息,再通过融合全局注意力机制的GRU循环神经网络将编码过后的源语言解码为汉语。实验结果表明,该方法在翻译准确率和训练速度两方面均优于RNN基准机器翻译方法。
- 乌尼尔苏依拉刘婉婉仁庆道尔吉
- 关键词:机器翻译蒙汉CNN
- 基于实例相似度检测的蒙汉机器翻译方法被引量:5
- 2017年
- 针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的蒙古语做出有效的翻译,并在一定程度上提高翻译质量,在蒙汉机器翻译中具有较好的应用价值.
- 苏依拉刘婉婉乌尼尔
- 关键词:蒙古语相似度算法对齐
- 基于门控循环神经网络词性标注的蒙汉机器翻译研究被引量:3
- 2018年
- 统计机器翻译可以通过统计方法预测出目标词,但没有充分理解原文语义关系,因而得到的译文质量不高。针对该问题,利用一种基于门控单元循环神经网络结构来对蒙汉神经机器翻译系统进行建模,引入注意力机制来获取双语词语的对齐信息,并在构建字典过程中对双语词语进行词性标注来强化语义,以此来缓解因欠训练导致的错译问题。实验结果表明,与RNN的基准系统和传统的统计机器翻译方法相比,该方法 BLEU值得到一定的提升。
- 刘婉婉苏依拉乌尼尔仁庆道尔吉
- 关键词:机器翻译对齐
- 基于统计分析的蒙汉自然语言的机器翻译被引量:4
- 2017年
- 为改变内蒙古地区蒙汉机器翻译发展相对落后的现状,采用基于统计的机器翻译方法将短语作为翻译的最基本单元,并基于最大熵模型提出了一种分词方法和词对齐方法,通过调序结果来输出译文.实验结果表明:改进后的翻译系统BLEU值在一定程度上有所提高,所提方法可为蒙汉应用研究提供参考.
- 苏依拉乌尼尔刘婉婉
- 关键词:自然语言统计机器翻译最大熵模型短语