国家重点实验室开放基金(201001051)
- 作品数:2 被引量:46H指数:2
- 相关作者:李亚超加羊吉宗成庆于洪志更多>>
- 相关机构:西北民族大学中国科学院自动化研究所更多>>
- 发文基金:国家重点实验室开放基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于条件随机场的藏语自动分词方法研究与实现被引量:27
- 2013年
- 藏语自动分词是藏语信息处理的基础性关键问题,而紧缩词识别是藏语分词中的重点和难点。目前公开的紧缩词识别方法都是基于规则的方法,需要词库支持。该文提出了一种基于条件随机场的紧缩词识别方法,并在此基础上实现了基于条件随机场的藏语自动分词系统。实验结果表明,基于条件随机场的紧缩词识别方法快速、有效,而且可以方便地与分词模块相结合,显著提高了藏语分词的效果。
- 李亚超加羊吉宗成庆于洪志
- 关键词:条件随机场格助词
- 最大熵和条件随机场模型相融合的藏文人名识别被引量:21
- 2014年
- 藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。
- 加羊吉李亚超宗成庆于洪志
- 关键词:最大熵条件随机场