朱江涛 作品数:8 被引量:14 H指数:2 供职机构: 沈阳航空工业学院 更多>> 相关领域: 自动化与计算机技术 语言文字 文化科学 更多>>
一种基于网络的英文缩略语信息的自动抽取方法 面对Internet中丰富的信息资源,本文提出了一种基于互联网,实现缩略语源词组及中文翻译的自动获取方法.本文利用缩略语构词规则来提取候选词组,利用句法规则进行筛选,实现了缩略语源词组的自动抽取;采用基于带有参数的模式匹... 朱江涛 蔡东风 张桂平关键词:缩略语 中文翻译 信息抽取 文献传递 基于SVM的疑问句问点语义角色标注 被引量:5 2006年 SVM(SupportVectorM ach ine)是一种基于结构风险最小化原则的分类算法,由于其完善的理论基础使其在小样本模式识别中表现出比其他算法更好的泛化能力。语义角色标注是一种浅层语义分析的方法。为了加深对问句的理解,对问句的问点进行语义角色标注是必要的。故将问点的语义角色标注视为分类问题,并提出了一种基于SVM的问点语义角色标注方法。在哈工大标准问句集上进行实验,取得了语义角色标注封闭测试91.4%,开放测试71.6%的正确率。实验结果表明本文所采用的方法是有效的。 吕德新 张桂平 蔡东风 朱江涛关键词:SVM 语义角色标注 结构风险最小化 基于语义相似度的句法歧义结构消解 被引量:1 2006年 以汉语句法结构分析中最普遍存在的句法结构歧义现象,即“动词短语+名词短语+的+名词短语”(VP+NP1+的/u+NP2)为研究对象,提出了一种基于知网知识库的歧义消解策略。据此提出利用改进的知网相似度计算的歧义消解策略。通过对从人民日报的语料中抽取1000个“VP+NP1+的/u+NP2”的实例进行测试,实验结果正确率达到83.4%,表明这是一种有效的识别“VP+NP1+的/u+NP2”歧义结构的方法。 周俏丽 蔡东风 吕德新 朱江涛 吴英泽关键词:知网 歧义结构 消歧 相似度计算 基于启发式信息的中文姓名识别方法 被引量:1 2006年 提出了一种以姓氏和互信息作为启发式信息探测潜在姓名,对上下文进行局部全切分,最后利用隐马尔科夫模型为工具识别姓名的新方法。本方法将姓名识别,汉语分词,词性标注结合为一体,总体上提高了姓名识别的性能,一定程度上解决了分词错误对姓名识别带来的影响。实验结果表明本文提出的方法是有效的。 朱江涛 蔡东风 吕德新 周俏丽关键词:姓名识别 自动分词 词性标注 全切分 致使动词对“动+名1+的+名2”歧义结构的影响 被引量:2 2006年 配价理论对汉语的句法结构组合具有一定的解释力,它可以从语法的角度来进行优选,消除句法结构歧义。带有致使意义的动词会对动词的配价数和句型归类产生影响,所以本文提出当“动+名1+的+名2”中的“动”为致使动词时,我们可以通过动词的配价数和句型归类实现对“动+名1+的+名2”歧义结构的消解。实验结果表明本文提出的方法是有效的。 周俏丽 蔡东风 吕德新 朱江涛 吴英泽关键词:结构歧义 消歧 致使动词 中文信息处理中命名实体识别问题的研究 命名实体识别是自然语言信息处理的一项基础工作。命名实体识别的研究,对自然语言理解,信息检索和信息抽取具有重大的意义。国际上,很早就开始了命名实体识别技术的研究并取得了不错的成果。但是,由于中文本身的内在特点,使得命名实体... 朱江涛关键词:中文信息处理 词法分析 分词 命名实体识别 隐马尔可夫模型 最大熵模型 文献传递 基于最大熵模型的中文姓名识别方法初探 本文描述了一种采取姓氏触发策略,基于最大熵模型的中文姓名识别方法。在识别过程中,首先对候选姓氏进行归类,然后对于多义候选姓氏,通过提取其上下文信息,利用最大熵模型来判断姓氏,最后识别出整个姓名,从而完成对中文姓名的识别过... 朱江涛 赵丽奎 蔡东风关键词:最大熵模型 中文姓名识别 文献传递 一种基于网络的英文缩略语信息的自动抽取方法 面对Internet中丰富的信息资源,本文提出了一种基于互联网,实现缩略语源词组及中文翻译的自动获取方法。本文利用缩略语构词规则来提取候选词组,利用句法规则进行筛选,实现了缩略语源词组的自动抽取;采用基于带有参数的模式匹... 朱江涛 蔡东风 张桂平关键词:缩略语 中文翻译 信息抽取 文献传递