牛宁宁
- 作品数:4 被引量:7H指数:2
- 供职机构:新疆大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 哈萨克语词法和短语处理技术研究及应用开发
- 古丽拉•阿东别克卡木那•江波孜达吾勒•阿布都哈依尔沙吾亚•阿东别克李秀红阿依达尔•米尔卡马力古丽扎达•海沙汪洋牛宁宁木合亚提•尼亚孜别克海拉提•克孜尔别克努尔毕亚•亚地卡尔
- 该研究是国家自然科学基金的“现代哈萨克语短语识别及其语块库构建技术研究”和“现代哈萨克语词级文本语料库构建技术研究”及国家教育部的“基于语料库的哈萨克语词语标注规范研究”项目支持的应用技术研究项目。哈萨克语属于阿尔泰语系...
- 关键词:
- 关键词:词性标注应用软件
- 基于最大熵的哈萨克语词性标注模型被引量:4
- 2013年
- 最大熵模型能够充分利用上下文,灵活取用多个特征。使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板。对模型进行了改进,在解码中取概率最大的前n个词性分别加入下一个词的特征向量中,以此类推直至句子结束,最终选出一条概率最优的词性标注序列。实验结果表明,特征模板的选择是正确的,改进模型的准确率达到了96.8%。
- 桑海岩古丽拉.阿东别克牛宁宁
- 关键词:自然语言处理词性标注最大熵模型哈萨克语
- 哈萨克语兼类词词性标注研究
- 词性标注是指根据词的上下文信息,为文本中的每个词都赋予一个词性标记,它是自然语言处理的一个重要环节,是机器翻译、语音识别、文本分类、信息检索等许多应用的基础。然而,在词性自动标注的过程中,未登录词及兼类词的词性标注是要解...
- 牛宁宁
- 关键词:哈萨克语兼类词词性标注最大熵条件随机场关联规则
- 文献传递
- 基于条件随机场的哈萨克语基本短语自动识别被引量:3
- 2014年
- 为解决识别哈萨克语基本短语的问题,提出一种基于条件随机场模型的哈萨克语基本短语自动识别方法。利用基于贪心策略的特征模板自动选择算法,结合哈萨克语基本短语的特点,从众多上下文特征中选取出合适的特征;每次从备选特征模板中挑选出局部最优的特征模板项,加入到最终的特征模板中,进一步提高识别准确率。实验结果表明,该方法的识别准确率和召回率分别达到了89.01%和84.07%。
- 汪泱古丽拉.阿东别克户冰心牛宁宁
- 关键词:条件随机场哈萨克语贪心策略