国家自然科学基金(60173024) 作品数:5 被引量:44 H指数:2 相关作者: 江荻 燕海雄 潘悟云 云健 更多>> 相关机构: 中国社会科学院 北京理工大学 大连民族学院 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 更多>> 相关领域: 语言文字 自动化与计算机技术 文化科学 更多>>
书面藏语的续连规则及词形变体的自动识别 被引量:1 2004年 本文是现代书面藏语不同类型句法单位变体形式的机器自动识别研究,包括词形 变化的单位分类,抽取变体形式的信息和对文本进行句法语义功能的标注处理方法。 江荻关键词:书面藏语 变体 词形变化 句法语义 对文 现代藏语带助动词的谓语组块及其识别 本文在现代藏语组块分析的前提下,讨论带助动词的谓语组块中助动词的自动识别策略。文章首先介绍了藏语助动词的功能以及在各类句法结构中的分布特征,然后根据这些句法分布特征提出了助动词的基本识别算法以及识别中可利用的句法规则。 龙从军 江荻关键词:现代藏语 助动词 句法分布 文献传递 E研究中电子文献的层次化自动分类方法 被引量:1 2009年 E研究中学科交叉广泛存在,因此对多学科的电子文献进行自动分类非常必要。针对E研究中的电子文献特征维数较高的特点,以上海高校比较语言学E-研究院为例,提出了一种可逐层降低分类难度、分而治之的层次化自动分类方法。该方法首先利用不需要矩阵运算的几何分类算法对文本向量进行初步分类;然后,利用fisher的线性判别方法将向量投影一维特征空间;最后,在一维空间中运用NBayes决策进行平均错误率最小的文献分类。实验结果表明该分类方法具有较好的精确性和速度:在闭集测试和开集测试中,均获得了较高的分类准确率、召回率及F1值,文献分类平均耗时0.29 s。以上工作为E研究提供了智能化支持。 云健 江荻 潘悟云关键词:FISHER线性判别 藏语语法词典的构建方法:词条与文本互动 构建藏语语法属性电子词典需要采用一些非通用语标注的方法,这些方法包括以转写形式为操作对象,词语或形态语法属性描述,隔行对照标注。而在提高标柱规范和标注效率方面,则需要建立词典与例句文本的互动。本项目利用Toolbox软件... 江荻文献传递 The Markers of Non-finite VP of Tibetan and its Automatic Recognizing Strategies <正> This paper discusses the computerized recognition strategies of nominalization markers in the modern Tibet... Jiang Di Long CongjunDepartment of Computational LinguisticsInstitute of Ethnology & Anthropology of Chinese Academy of Social Sciences The College of Graduates of Chinese Academy of Social Sciences文献传递 The Current Status of Sorting Order of Tibetan Dictionaries and Standardization This paper discusses the problem of sorting orders of Tibetan dictionaries and Tibetan electronic databases. T... Di Jiang Academy of humanities藏语动词的及物性、自主性与施格语言类型 藏语语法属性词典对动词的描述涉及藏语的句法特征和句法语义类型。论文简要介绍了藏语动词的及物性与自主性现象,通过英、藏语言的句法语义关系比较,明确了藏语属于通格一施格型语言,是与英语这类主格-受格型语言相对应的另一种词格关... 江荻关键词:藏语 及物性 自主性 文献传递 书面藏语排序的数学模型及算法 被引量:25 2004年 针对中国国家标准及ISO藏文编码字符集提出书面藏语字词的排序涉及藏字结构序、构造级和字符序概念 ,是不同于中文、英文序性而性质独特的一种排序 .文章详尽分析了藏字字形、结构形态、传统字符顺序以及藏字字长和层高等特征 ,构建出藏语排序的数学模型 .然后依据模型要求为每类藏文符号进行数字赋值 ,通过算法逐步确定字符位置并识别字符 ,最后按照抽取字符的对应数值组合排序 ,完成了藏语字词的排序 .该模型现已在Win dows平台上实现 . 江荻 康才晙关键词:计算机排序 数学模型 藏语文本信息处理的历程与进展 本文叙述了25年来中国藏语信息处理领域有关藏语文本及电子词典工作的发展过程以及目前的进展状况。叙述的内容有藏语文本统计计算和熵值计算研究,有藏语资源和词典构建讨论,藏语分词、分词规范以及组块识别阐述,最后还讨论了藏文拉丁... 江荻关键词:藏语 自然语言处理 文献传递 现代藏语动词的句法语义分类及相关语法句式 本文突破了传统藏文文法关于动词分类的简单描述,建立起以句法语义为纲要的动词类别和相关句法规则.本文区分了藏语12大类动词。各类动词都有不同论元数量和不同句法性质的要求。因此,动词的句法语义类别划分能够较细致和全面反映各种... 江荻关键词:藏语 句法结构 文献传递