张全
- 作品数:122 被引量:179H指数:7
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家重点基础研究发展计划中国科学院声学研究所知识创新工程项目中国科学院知识创新工程青年人才领域前沿项目更多>>
- 相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
- 自然语言语义理解下的信息检索模型
- 为了提升信息检索系统性能,语义学被引入了传统基于概率统计算法的检索模型之中,本文将沿着这一思路,以HNC自然语言理解体系为基础,阐述HNC理论下,引入语义知识,逐步构建检索系统的策略.并结合已经取得的部分研究成果对这一策...
- 吴晨张全缪建明韦向峰
- 关键词:信息检索自然语言处理语义理解概念层次网络
- 文献传递
- 利用语句结构信息的机器翻译自动评测初探
- 2010年
- 机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制。
- 丁泽亚张全缪建明池毓焕臧翰芬
- 关键词:句类转换句式转换
- 汉语句群中的语义块共享
- 本文根据HNC理论关于句群和句子的定义,具体分析了HNC句群和语言交际研究中句群概念的差异,探讨了不同类型语料的结构差别。针对句子表达中语义块共享问题,本文在迭句、链句、环句、塔句概念的基础上,在HNC句群范围内进行了进...
- 张全吴晨韦向峰
- 关键词:HNC理论语义块
- 文献传递
- 单字动词的组合处理研究
- 从词汇层面来看,汉语处理的难点之一是词语边界模糊。而汉语中的单字词处理,则是这一难点中的难点。其根源在于,汉语单字词的意义复杂,义项很多。而汉语单字词具有很强的组合特征.在组合形成的多字结构中,单个汉字的语义模糊大大减少...
- 孙雄勇张全
- 关键词:HNC
- 文献传递
- 基于模板的中文人物评论意见挖掘被引量:4
- 2010年
- 使用基于模板的方法对中文人物评论语句进行意见元素挖掘,提取出句中所含的评价对象、评价词语,并分析出意见的倾向性。进行了中文人物评论语句的自动意见挖掘实验,实验中首先建立了一定数量的熟语料库,然后从语料库中生成意见模板,最后用生成的模板来提取语句的意见元素。实验获得了72.55%的F-score,表明该算法是有效的。
- 李娟张全贾宁臧翰芬
- HNC语义标注模型的构建被引量:3
- 2009年
- 介绍一种基于HNC理论的、人机结合的汉语语料语义标注模型。首先分析了HNC语义标注的内容,在此基础上定义了标注的流程。因标注十分复杂,在流程的主要环节使用机器标注来帮助人工标注。具体地说,在语义块切分问题上采用最大熵模型,其正确率和召回率分别达到了83.78%和91.17%;在句类判断问题上采用基于实例的模型,其正确率达到了51.64%。运用此标注模型建设了HNC语义标注语料库,目前语料规模已达到40万字。
- 谢法奎张全
- 关键词:概念层次网络语料库最大熵模型
- 一种基于概念符号的文本领域的获取系统及方法
- 本发明公开了一种基于概念符号的文本领域的获取系统及方法。该系统包括:一用于表达词语概念和领域类别的概念符号集、一存储词语及其概念符号的词语知识库、一分词处理器、一语句语义分析器、一领域判别器。该方法包括以下步骤:(1)把...
- 韦向峰黄曾阳张全缪建明
- 文献传递
- 寻找理性法官
- 哲学是一种无用的学问,它不像科学,能显著的致用,所以它常常被人忽略;它所研究的是关于宇宙和人生一些根本问题,又觉得它不可须臾离开。在科研工作中,我们都在自觉不自觉地涉足哲学之中,因此作一点哲学上的思考,会有益于我们的工作...
- 张全
- 关键词:机器翻译概念层次网络自然语言处理
- 文献传递
- 柔性KNN算法研究被引量:5
- 2007年
- KNN算法是一种常用的效果较好的文本分类算法。但是标准KNN算法中,近邻的数目K对所有处理文本都是一样的,而判断类别时加权的仅仅是文本之间的相似度。基于近邻序列的排序,提出了变K算法,并且结合效果较好权重算法,形成了柔性的KNN算法,提高了分类的效果。
- 张运良张全
- 关键词:计算机应用文本分类KNN算法
- 概念优先组合判断研究
- 概念优先组合判断的研究有助于语义块结构和功能的确定,也有助于句类分析系统性能的提高。本文利用HNC 概念符号知识深入到词语的语义层面,从概念类别的内涵出发,结合概念间语义相关度计算方法以及句类知识对概念优先组合的各种情况...
- 张运良张全
- 关键词:自然语言理解HNC理论语义相关度并联结构
- 文献传递