赵建国
- 作品数:12 被引量:23H指数:3
- 供职机构:新疆大学人文学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字经济管理理学更多>>
- 维吾尔书面文学语言──察合台语被引量:1
- 2000年
- 本文利用有关文献资料论述了察合台语的形成和发展过程,探讨了察合台语的特点及其对现 代维吾尔语的影响。
- 阿布里米提.艾海提赵建国
- 关键词:察合台语
- 全文增补中
- 基于栈式降噪自编码和词嵌入表示的维吾尔语零指代消解
- 2018年
- 针对维吾尔语零指代现象,提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。首先由大规模无标注维吾尔语语料训练得到富含语义和句法信息的词嵌入表示,将其作为候选先行语和缺省零代词的语义特征;其次根据维吾尔语语言特点,抽取14项针对零指代消解任务的手工设计特征;然后融合word embedding特征和14项hand-crafted特征作为栈式降噪自编码的输入,最后经过无监督逐层贪婪的预训练和有监督的微调过程,使用softmax进行分类完成维吾尔语零指代消解任务。实验结果表明,与传统栈式自编码、浅层机器学习的支持向量机和人工神经网络相比,栈式降噪自编码的F值分别提高了4.450%、10.032%和8.140%,实验结果验证了该方法的有效性及栈式降噪自编码在任务中具备挖掘高层面鲁棒性语义特征的优势。
- 秦越禹龙田生伟冯冠军吐尔根.依布拉音艾斯卡尔艾木都拉赵建国
- 关键词:维吾尔语
- 汉维语数字熟语及其翻译被引量:4
- 2007年
- 汉维语数字熟语中数目词所蕴涵的文化涵义极为丰富,且比喻意义很少对应,根据汉维语数字熟语中的数目词在翻译过程中传递的文化信息及其差异,汉维语数字熟语翻译主要采用直译法、意译法、对应(借用)法、直译加注法等。
- 赵建国
- 关键词:熟语翻译
- 基于堆栈降噪自编码的维吾尔语事件共指关系识别
- 2018年
- 结合维吾尔语的语言特点,基于堆栈降噪自编码(SDAE),提出一种新的维吾尔语事件共指关系识别方法。将维吾尔语事件两两构成候选事件对,抽取事件基本属性、触发词、事件距离等9项特征,利用Word Embedding富含语义信息的特性,将其计算得到的维吾尔语事件触发词语义相似度作为特征之一,训练SDAE模型,将SDAE的输出作为softmax层的输入,从而分类完成维吾尔语事件共指关系识别任务。实验结果表明,与浅层机器学习模型支持向量机相比,基于深度学习机制的SDAE模型更适用于维吾尔语事件共指关系识别任务,并提升了识别性能。
- 王淑媛田生伟禹龙冯冠军艾山吾买尔李圃赵建国
- 关键词:维吾尔语语义相似度
- 注意力机制的LSTM-DBN维语人称代词指代消解被引量:1
- 2019年
- 针对维吾尔语中人称代词指代歧义问题,结合维吾尔语言的词法、语法、词间位置等关系,以及注意力机制、长短时记忆网络和深度置信网络,提出了一种维语人称代词指代消解模型。首先,分析维语中人称代词指代的特点和表达规律,提取出相应词向量特征;其次,借助长短时记忆网络挖掘维吾尔语人称代词的语义特征,并利用注意力机制的相似性度量、权重调节能力,避免信息在层间传递的丢失,实现特征编码向量的信息整合;最后利用深度置信网络(DBN)进一步挖掘出隐藏在维语上下文中的深层语义特征,完成维语人称代词指代消解。实验结果表明,所提模型在挖掘深层语义信息和识别效果上优于传统的深度学习模型,准确率达到了81.14%,F1达到了78.83%。
- 李东欣禹龙田生伟李圃赵建国
- 关键词:人称代词指代消解
- 基于深度学习的维吾尔语名词短语指代消解被引量:7
- 2017年
- 针对维吾尔语名词短语指代现象,提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法.通过对维吾尔语名词短语指称性的研究,提取出利于消解任务的13项特征.为提高特征对文本语义的表达,在特征集中引入富含词汇语义及上下文位置关系的Word embedding.利用深度学习机制无监督的提取隐含的深层语义特征,训练Softmax分类器进而完成指代消解任务.该方法在维吾尔语指代消解任务中的准确率为74.5%,召回率为70.6%,F值为72.4%.实验结果证明,深度学习模型较浅层的支持向量机更合适于本文的指代消解任务,对Word embedding特征项的引入,有效地提高了指代消解模型的性能.
- 李敏禹龙田生伟吐尔根.依布拉音赵建国
- 关键词:指代消解WORDEMBEDDING维吾尔语
- 基于DCNNs-LSTM模型的维吾尔语突发事件识别研究被引量:3
- 2018年
- 结合对维吾尔语语言的特点分析,该文提出一种基于深度卷积神经网络(deep convolutional neural networks,DCNNs)联合长短期记忆网络(long-short term memory,LSTM)实现的维吾尔语文本突发事件识别方法。该方法提取突发事件包含六大特征块,并在特征集中引入富含词汇语义及上下文位置关系的Word Embedding,利用DCNNs对黏着性语言特征抽象化的学习能力抽取事件句中的高阶局部特征,以此作为LSTM网络的输入,利用其对于事件句中抽象含义序列关系的捕获特性获取全局特征,训练Softmax分类器完成维吾尔语突发事件的识别任务。该方法在维吾尔语突发事件识别中的准确率达到80.60%,召回率81.39%,F值80.99%。实验结果表明,与不同层数的DCNNs和独立的LSTM网络相比,DCNNs-LSTM模型更具备挖掘隐含上下文深层语义信息的能力,对Word Embedding特征项的引入有效地提高了模型识别性能。
- 黎红禹龙田生伟吐尔根.依布拉音赵建国
- 关键词:维吾尔语WORDEMBEDDING
- 托勒密所说的“石堡”究竟何在被引量:1
- 1999年
- 本文利用中外资料。
- 西仁.库尔班赵建国
- 数字“七"与塔吉克族文化被引量:1
- 2009年
- 数字"七"在塔吉克族文化中具有浓郁的神秘色彩,它常见于塔吉克族民间俗语、神话传说、文学作品及宗教教义中。文章从文化学的视角对数字"七"与塔吉克族文化之关系进行了初步探讨,分析了数字"七"在塔吉克族风俗习俗和宗教信仰中的表现形式,并指出"七"之文化含义的形成与塔吉克族的宇宙观有关。
- 西仁.库尔班赵建国
- 基于深度置信网络的维吾尔语人称代词待消解项识别被引量:1
- 2017年
- 针对维吾尔语人称代词指代消解研究忽略了待消解项识别而引入了噪声的问题,提出一种基于深度置信网络(Deep Belief Networks,DBN)的维吾尔语人称代词待消解项识别方法。在分析维吾尔语人称代词语法特征和语言规则的基础上,总结出包含10项特征的维吾尔语人称代词待消解项特征集。所提方法首先通过逐层贪婪地训练每一层受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)网络,来保证特征向量映射到不同的特征空间,尽可能多地保留特征信息;并在最后一层设置BP网络,对RBM输出的特征向量进行分类,以有监督的方式训练整个网络并进行微调。实验结果表明,所提方法正确识别维吾尔语人称代词待消解项的准确率达到95.17%,比SVM算法提高了9%,从而验证了其有效性和可行性。
- 秦越禹龙田生伟赵建国冯冠军
- 关键词:维吾尔语特征提取