国家重点基础研究发展计划(2010CB334708)
- 作品数:24 被引量:205H指数:9
- 相关作者:赵海兴才让加李发旭才让卓玛才智杰更多>>
- 相关机构:青海师范大学陕西师范大学青海大学更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金青海省自然科学基金更多>>
- 相关领域:自动化与计算机技术理学经济管理自然科学总论更多>>
- 藏语语料库加工方法研究
- 为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,然后针对藏语的语法特征提出藏语...
- 才让加头旦才让周毛先
- 关键词:藏语语料库词类词典
- 文献传递
- 一种星–树结构的确定性的小世界网络
- 2014年
- 在过去的的几十年,人们运用各种机制建构了许多不确定性的和确定性的小世界网络。最近,郭世泽等人通过在星图K1,2上运用一个简单的算法在每个迭代步添加一些边首次形成了一个二叉树结构的确定性的小世界网络。本文通过一个星图K1,6在每个迭代步连接每个树的各祖父节点和它的四个孙子节点,由此构建一个二叉树结构的新的确定性的小世界网络模型。此外,我们给出了一些拓扑属性的分析结果,它表明构建的模型是小世界网络。
- 侯鹏锋赵海兴
- 关键词:小世界网络
- 基于耦合映像格子的有向网络相继故障被引量:10
- 2011年
- 针对现实世界中存在大量的有向网络,根据有向网络中边的有向性,提出适合描述有向网络耦合映像格子(CML)的相继故障模型,利用仿真分析的方法研究了BA无标度有向网络和ER随机图有向网络在该模型作用下的相继故障行为。仿真中,对节点数固定的网络采用蓄意攻击和随机攻击两种策略进行攻击,并记录相关数据。通过对所得数据的分析发现:1)这两类有向网络的相继故障进程比同规模的无向网络要剧烈;2)当网络遭受攻击时,有向网络比无向网络更加脆弱;3)ER随机图网络相继故障发生过程中引起网络相继故障规模增长的4个临界值之间存在线性关系。
- 马秀娟马福祥赵海兴
- 关键词:有向网络耦合映像格子复杂网络
- 基于语料库的藏语高频词抽取研究被引量:3
- 2012年
- 在借鉴汉语基于语料的词抽取技术研究成果的基础上,给出藏语文本预处理方法,并提出一种基于语料库的藏语高频词抽取算法,其中包括藏语文本预处理用噪音字表、紧缩词及其预处理方法和基于语料库的藏语高频词抽取算法。实验结果表明,该算法的准确率达86.22%,召回率达89.79%,F值达87.94%。
- 才让卓玛才智杰
- 关键词:信息处理高频词自动分词语料库
- 一种超网络演化模型构建及特性分析被引量:67
- 2013年
- 现实世界的很多超网络比如科学家合作超网络,演员合作超网络,WorldWideWeb(WWW)以及引文超网络都具有超边的增长和优先连接机制.基于这个原则,本文构建了一种超网络动态演化模型,并介绍了这个模型的一些基本拓扑性质,如节点度、节点超度、超边的度等.在此演化模型上重点理论分析了超度分布的特性,并进行了仿真实验,发现随着网络规模的增大,这个超网络动态演化模型的超度分布遵循无标度的特性.
- 胡枫赵海兴马秀娟
- 关键词:复杂网络超图超网络
- 基于判别式的藏语依存句法分析被引量:16
- 2013年
- 现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%,可实际应用到藏语依存树库的构建和其他自然语言处理中。
- 华却才让赵海兴
- 关键词:最大生成树感知机
- 判别式藏语文本词性标注研究被引量:9
- 2014年
- 该文在分析了现有藏文词性标注方法的基础上,提出感知机训练模型的判别式藏语词性标注方法,重点研究了符合藏语词法特性的模型训练特征模板、模型训练和词性标注方法。并且在人工标注的测试集上获得了98.26%的词性标注精确率,可以实际应用到藏语自然语言处理中。
- 华却才让刘群赵海兴
- 关键词:词性标注
- 面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究被引量:18
- 2011年
- 双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏双语文本的篇章级、段落级、句子级自动对齐技术进行研究,为开发和研究汉藏机器翻译奠定基础。主要研究汉藏双语语料库对齐、汉藏双语词典抽取、双语语料的收集、整理、存储以及检索等关键技术。最终研究结果是藏文编码的自动识别与转换技术,藏语语料库构建技术、汉藏双语词典抽取技术、汉藏平行语料库句子和词语对齐技术,并建立面向汉藏机器翻译的大规模汉藏双语对齐语料库。
- 才让加
- 关键词:对齐技术
- 基于超图结构的科研合作网络演化模型被引量:50
- 2013年
- 基于科研论文作者的合作方式,用超图理论构建了一个科研合作超网络演化模型.利用平均场理论分析了作者发表论文的演化规律,发现作者的超度(即发表论文数)分布符合幂律分布.进一步理论分析得到分布的幂指数γ与合作领域作者增长速度相关.γ越大,新作者增长速度越快,且存在关系:γ=1+L/M(L/M为作者增长率).并通过对物理学报与中国科学2003—2012年期间作者发表论文进行了数据分析,实证结果与理论分析及模拟结果能很好地符合.本文对科研合作网络的理论和实证研究有一定的借鉴意义.
- 胡枫赵海兴何佳倍李发旭李淑玲张子柯
- 关键词:复杂网络超图科研合作网络
- 藏汉句子局部对齐策略的研究被引量:2
- 2010年
- 介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进行句子局部对齐的策略,并做了验证.
- 华却才让
- 关键词:句子对齐评价函数