国家社会科学基金(10AYY006)
- 作品数:20 被引量:110H指数:8
- 相关作者:艾山吾买尔吐尔根·依布拉音麦热哈巴艾力姜文斌麦热哈巴·艾力更多>>
- 相关机构:新疆大学中国科学院信息技术实验室更多>>
- 发文基金:国家社会科学基金国家自然科学基金国家电子信息产业发展基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于语法语义知识的维吾尔文机构名识别被引量:7
- 2014年
- 为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转移原理的高效识别算法。实验结果表明,该算法识别的F值达到83.05%,获得了较好结果。
- 麦合甫热提米日姑.肉孜麦热哈巴艾力吐尔根.依布拉音
- 关键词:自然语言处理命名实体识别机构名识别
- 基于词典和统计相结合的维吾尔语拼写检查方法被引量:2
- 2014年
- 该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查错方法。首先,提出基于词典的方法进行词库和词干提取的拼写检查;其次,提出基于N元语法的词缀连接有效性判断模型,对未登录词提出基于N元语法的拼写检查模型;最后,结合以上几种方法各自的优点提出基于混合策略的拼写检查方法,该方法在准确性和检查结果可靠性等方面得到了较显著的提高。
- 麦合甫热提艾山吾买尔麦热哈巴艾力吐尔根.伊布拉音张健
- 关键词:维吾尔语拼写检查词典N元语法
- 新疆少数民族语言文字信息处理研究与应用被引量:26
- 2011年
- 该文主要对国内开展维吾尔、哈萨克、柯尔克孜等少数民族语言信息处理以来的相关研究工作进行了介绍和评价。在此基础上对维吾尔、哈萨克、柯尔克孜文信息处理的进一步发展进行了展望。目的是为了探讨如何加速推进维吾尔、哈萨克、柯尔克孜文信息处理技术的发展。通过对维、哈、柯文操作系统、信息技术标准、语言信息处理及综合应用等四个方面历史和现状的介绍及简单评价,对维、哈、柯语信息处理的发展方向做了相关描述。
- 吐尔根·依布拉音袁保社
- 关键词:维吾尔文哈萨克文信息处理操作系统自然语言
- 维吾尔语动词体范畴的有限状态自动机的构建被引量:4
- 2012年
- 维吾尔语动词的体范畴是维吾尔语动词语法范畴中极为复杂的范畴,也是维吾尔语信息处理中的难点问题之一,计算机对维吾尔语动词体范畴的处理是在对人称、时、否定等语法范畴处理之后才进行处理。但是难点就是体范畴重叠问题的解决。维吾尔语动词的体范畴词尾按照一定的规则连接在词干,这使得维吾尔语动词体范畴的重叠形式可用有限状态自动机形式化描述。因此它根据重叠规则构造从右向左的非确定自动机,之后把从右向左方向的自动机转换成从左向右的非确定自动机,最后把非确定自动机转换成确定自动机来实现维吾尔语动词体范畴的形式化描述。
- 阿孜古丽.夏力甫早克热.卡德尔吐尔根.依布拉音
- 关键词:维吾尔语动词体范畴有限状态自动机形式化
- 基于词干提取的维吾尔语事件类时间短语识别被引量:6
- 2014年
- 针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏着性语言的事件类时间短语的识别方法。根据维吾尔语典型的黏着性语言形态特点,对时间短语构成进行分析和分类,采用机器学习的方法将难于识别的事件类隐性时间短语识别问题转换为基于统计方法的序列标注;通过对维吾尔语事件类时间要素分析及维吾尔语构词的研究,引入黏着语特有的词干特征,选定实验特征集合,对比分析不同的特征集合的自动识别准确率的平均值。实验结果表明,该方法对维吾尔语事件类时间短语识别的F-值达到85.37%。这一结果对其它黏着性语言的研究具有参考意义。
- 邹岳琳吐尔根.依布拉音麦热哈巴艾力艾山吾买尔帕力旦.吐尔逊
- 关键词:自然语言处理条件随机场词干提取
- 维吾尔文智能输入法研究被引量:4
- 2013年
- 开发智能化的输入法是维吾尔文输入技术的一个发展方向,也是维吾尔文自然语言信息处理的基础性研究课题。该文根据维吾尔文自身特点,对用户输入过程中所犯各种错误进行分析,设计并实现了词语搭配知识库,提出了基于二元语法模型的一种新型维吾尔文输入算法,并给出了实现其关键模块功能的程序流程图。它具有自动预测、自动联想输入和自动校对等功能。
- 米日姑·肉孜吐尔根·依布拉音麦热哈巴·艾力
- 关键词:中文信息处理维吾尔文智能输入法语言模型
- 基于统计和规则混合策略的维吾尔人名识别研究被引量:8
- 2014年
- 本文采用统计和规则相结合的混合策略,提出一种维吾尔人名的自动识别方法.该方法利用知识库中的统计信息,对维吾尔人名做初步的提取,分析维吾尔人名构成的各类特征,提取特征集,总结相应的识别规则,对候选人名进行识别,并消除歧义.在此基础上构建了维吾尔人名识别系统,并对系统进行了封闭和开放测试,实验结果表明,封闭测试的准确率达到88.47%,召回率达到85.1%.
- 加日拉·买买提热衣木吐尔根·依布拉音艾山·吾买尔
- 维吾尔语词尾对汉维统计机器翻译影响的研究被引量:8
- 2014年
- 维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。
- 米莉万.雪合来提麦热哈巴艾力吐尔根.依布拉音姜文斌
- 关键词:词尾统计机器翻译语言模型
- 维吾尔语词法中音变现象的自动还原模型被引量:8
- 2012年
- 该文针对维吾尔语的音变现象,提出了一种自动还原模型。与以往方法不同的是,此模型中我们把音变现象泛化,先假设维吾尔语中所有语音都有音变现象,从而将还原问题转化为类似于词性标注问题,再利用标注的方法解决了还原操作。在新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上做了实验,还原模块作为维吾尔语词法分析器的一部分,把词法分析器功能的F值从84.1%提高到了91.4%,同时维吾尔语中词缀数目最多、变形情况最复杂的动词词干的还原正确率也达到了88.6%,实际应用中完全可以被接受。
- 麦热哈巴艾力姜文斌姜文斌
- 关键词:维吾尔语词法分析
- 面向水暖行业ERP系统设计与实现
- 2015年
- 本文主要研究分析国内的中小企业对于ERP系统的需求,并对基于.NET技术运用MVC实现ERP系统的优势经行了讨论.本文以新疆天润建材有限公司的需求为例设计与实现了一个小型的天润ERP系统.该ERP系统实现了业务数据、采购、生成、销售、仓库、零售、财务、物流等业务及相关数据的管理功能,覆盖了企业生产、销售等所有环节.天润ERP系统采用HTML和MVC技术开发,具有较好的可扩展性.
- 田怡艾山吾买尔亚森.艾则孜
- 关键词:ERP中小企业