辽宁省教育厅高等学校科学研究项目(LT2010084)
- 作品数:2 被引量:5H指数:1
- 相关作者:季铎罗阳张桂平王莹莹项田帅更多>>
- 相关机构:沈阳航空航天大学更多>>
- 发文基金:辽宁省教育厅高等学校科学研究项目辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向单一网页的双语资源挖掘方法
- 双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。本文提出一种面向单一双语网页的双语资源挖掘方法,该方法与现今平行网页的双...
- 罗阳季铎张桂平王莹莹
- 关键词:WEB挖掘网页分类频繁序列模式支持向量机
- 文献传递
- 面向单一双语网页的双语资源挖掘方法被引量:5
- 2011年
- 双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包含双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源。实验结果表明,该方法能够有效改进双语资源挖掘的质量。
- 罗阳季铎张桂平王莹莹
- 关键词:WEB挖掘网页分类频繁序列模式支持向量机
- 基于web的日英词典自动获取技术的研究
- 2012年
- 双语词典资源对于自然语言处理研究的巨大价值已经得到越来越多的认可,尤其是在机器翻译、跨语言信息检索等方面。传统人工构建词典存在规模小、时效性差、语种不够灵活等问题,而且耗费大量的人力财力。提出了一种基于web的获取日英释义的新方法。该方法采用双向融合计算技术,首先对日语单词进行启发式搜索,在返回的网页摘要中应用基于距离和频率的方法挖掘出其候选英语单词;在第二阶段对候选英语单词进行二次搜索,并对两个阶段的结果进行融合计算来确定日英释义。
- 项田帅尹宝生季铎蔡东风
- 关键词:双语词典启发式搜索