才华
- 作品数:10 被引量:17H指数:3
- 供职机构:西藏大学图书馆更多>>
- 发文基金:西藏自治区自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字农业科学更多>>
- 藏文组字部件的自动识别与字排序研究被引量:1
- 2014年
- 藏文字有着独特的构字规则,组字部件的自动识别在藏文字、词、句层面的信息化处理有重要的应用。文章提出的藏文字部件自动识别方法理念为,现代藏文字按其第一个部件字符的不同分成5种结构类型,每一种类型又按其字长分为若干个子类,在每个子类中定义各字的部件识别算法,最后在藏文组字部件识别的基础上,给每个部件赋予序值,实现藏文字的有效排序。
- 才华
- 关键词:藏文信息处理构字部件
- 试提一种新的藏文音节字排序模型被引量:2
- 2012年
- 音节字的排序是藏文字词排序的基础,但目前还没有统一的规范标准。本文对《新编藏文字典》中任意部首内部的音节排序做一种同一而合理的调整,提出一种形式简便,运算快捷的排序模型,供以参考。
- 才华普布卓玛
- 关键词:藏文信息处理
- 向量空间模型在藏文文本信息检索中的应用被引量:3
- 2011年
- 基于向量空间的信息检索模型VSM,以其简洁直观、检索结果和排序效果良好等优点,在信息检索领域得到普遍的应用。文章结合藏文文本的特点,研究VSM在藏文文本信息检索中的应用方法。
- 才华
- 关键词:信息检索向量模型
- Unicode藏文分词系统的设计被引量:2
- 2012年
- 微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。
- 才华普布卓玛
- 关键词:藏文信息处理分词HASH表
- 隐马尔科夫模型在词性标注中的应用
- 2012年
- 文章从一阶隐马尔科夫模型(HMM)的定义及其基本问题出发,把词性自动标注描述成HMM模型的一个应用,并给出了语料库中统计计算各个模型参数的方法,其中对词性序列的检测和最佳词性序列的生成方面进行了较详细的描述和研究。
- 才华
- 关键词:信息处理词性标注隐马尔科夫模型
- 藏文编码字符集标准应用中的问题及对策
- 2016年
- 藏文文本中存在同形异码现象给文本处理带来一定的问题。通过大规模文本统计,找出了90组同形异码实例;分析发现,藏文文本中同形异码现象是国际编码集中同时存在单字符编码和组合字符编码导致的。描述了各种可能产生同形异码的字符,从改进国际编码字符集和改进输入法等方面提出一些建议。
- 龙从军刘汇丹安波才华吴健
- 基于格语法的藏语句法语义一体化研究
- 藏语自然语言的句法、语义分析不仅是藏文信息处理技术向智能化发展的前提和基础,还可以为目前藏语词法领域所遇到分词单位不一致,词性标记不统一等问题及相关技术瓶颈提供理论支撑与技术方案,在藏语自然语言处理中起到承前启后的作用....
- 才华
- 关键词:句法语义分析
- 论藏文格结构体及其语法功能被引量:1
- 2018年
- 藏文传统语法有着悠久的历史和丰富的研究成果,但从自然语言处理角度来讲,藏文传统语法存在重义轻形,不便于形式化等问题。文章通过Fillmore格语法与藏语传统语法的比较研究,提出一种新的藏语语法单位即格结构体,并证实格结构体才是藏语句子最直接的组成成分的观点。该研究对藏语语法研究和藏语自然语言处理具有一定的指导意义。
- 才华才华欧珠
- 关键词:句法分析语义分析
- 基于小字符集的藏文自动分词技术研究被引量:3
- 2013年
- 文章针对传统藏文分词的切词难点及切分歧义现象,提出一种基于小字符集的藏文自动分词技术方案。其中包括分词预处理、多级Hash词典机制、藏文格助词紧缩格的判别及还原规则、逐字匹配算法和未登录词的处理等内容。
- 才华
- 自然语言处理在信息检索中的应用研究被引量:5
- 2017年
- 随着网络技术的迅猛发展,信息检索水平也越来越高。在网络信息检索的发展历程中,相关的研究者一直以来希望把信息检索和自然语言处理相结合,从而达到快速、高效率的检索效果。为了具体探究自然语言处理在信息检索中的优势和特点,笔者重点分析了自然语言处理的方法和技术优势以及目前自然语言处理存在的问题,对其应用范围展开了详细探讨,并根据我国自然语言检索的现状进行前景展望,希望能够为信息检索工作做出一些贡献。
- 关白才让叁智才华
- 关键词:自然语言信息检索