蔡东风
- 作品数:183 被引量:575H指数:10
- 供职机构:沈阳航空航天大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术语言文字文化科学自然科学总论更多>>
- 词汇语义相似度计算中相关技术的分析
- 本文扼要介绍了目前国内外关于词汇语义相似度计算的研究现状,阐述并分析了几种具有代表性的计算方法,并对目前较为流行的基于SUMO、HowNet的词汇语义相似度计算进行了较详细的介绍,对计算方法的特点进行分析,并在对知网概念...
- 余超蔡东风张桂平
- 关键词:WORDNETHOWNET本体
- 文献传递
- 基于统计检验的核函数度量方法研究被引量:2
- 2015年
- 将统计检验方法应用于核函数度量。以核函数、规范化核函数、中心化核函数和核距离作为样本在特征空间中的几何关系度量,使用t检验和F检验等7种统计检验方法检验特征空间中同类样本间几何关系度量值与异类样本间几何关系度量值的分布差异,以此反映特征空间中同类样本间内聚性与异类样本间分离性间的差异。在11个UCI数据集上进行的核函数选择实验表明,基于统计检验的核度量方法达到或超过了核校准与特征空间核度量标准等方法的效果,适用于核函数度量;并且发现两类数据分布差异主要体现在了方差差异上。此外,对核函数的处理(规范化或中心化)会改变特征空间,使得度量结果失真。
- 王裴岩蔡东风
- 关键词:核函数
- 面向专利文本的单语模板的自动获取方法被引量:1
- 2010年
- 基于模板的机器翻译方法在专利文本的自动翻译中具有广泛的应用。由于专利文本的术语繁多,并且分布极不均匀,因此在使用统计方法获取翻译模板时通常会产生严重的数据稀疏问题。本文提出一种专利文本的单语模板的自动获取方法,这种方法充分利用了专利文本中词汇分布极不均匀的特点,通过统计词汇出现的频率来识别出模板的固定部分和可泛化部分。实验结果证明,这种方法在专利文本的模板的自动获取上具有非常好的性能。
- 周俏丽蔡东风张桂平
- 关键词:机器翻译
- 基于启发式信息的中文姓名识别方法被引量:1
- 2006年
- 提出了一种以姓氏和互信息作为启发式信息探测潜在姓名,对上下文进行局部全切分,最后利用隐马尔科夫模型为工具识别姓名的新方法。本方法将姓名识别,汉语分词,词性标注结合为一体,总体上提高了姓名识别的性能,一定程度上解决了分词错误对姓名识别带来的影响。实验结果表明本文提出的方法是有效的。
- 朱江涛蔡东风吕德新周俏丽
- 关键词:姓名识别自动分词词性标注全切分
- 基于语义信息的问题分类被引量:4
- 2006年
- 问题分类是问答系统的一个非常基础而重要的子模块。以问题的语义信息为分类依据,建立了一个新的问题分类体系,并提出了一种基于《知网》的自动分类方法。利用该方法对507个问题进行分类实验。实验中问题分类的平均召回率为93.72%,平均正确率为82.23%。实验结果表明,该分类方法是有效的并且以语义信息作为分类依据是可行的。
- 吕德新张桂平蔡东风余超
- 关键词:知网问答系统
- 一种基于特征抽取和语义增强的文本摘要生成方法
- 本发明公开一种基于特征抽取和语义增强的文本摘要生成方法,包括以下步骤:引入特征提取器,使用特征提取器获取原文的特征向量;将特征向量与编码器的输出结果分别以部分连接和全连接的方式相连,过滤噪声;使用语义增强器获取句子内部的...
- 白宇缪湾湾蔡东风
- 致使动词对“动+名1+的+名2”歧义结构的影响被引量:2
- 2006年
- 配价理论对汉语的句法结构组合具有一定的解释力,它可以从语法的角度来进行优选,消除句法结构歧义。带有致使意义的动词会对动词的配价数和句型归类产生影响,所以本文提出当“动+名1+的+名2”中的“动”为致使动词时,我们可以通过动词的配价数和句型归类实现对“动+名1+的+名2”歧义结构的消解。实验结果表明本文提出的方法是有效的。
- 周俏丽蔡东风吕德新朱江涛吴英泽
- 关键词:结构歧义消歧致使动词
- 一种基于语境的词语相似度计算方法
- 词语相似度计算是机器翻译、信息检索等自然语言处理领域的关键问题之一。传统的词语相似度计算方法,未能很好地考虑上下文信息对词语语义的约束,从而不能对语境变换带来的词语间相似度的差异进行有效的区分。本文引入模糊数学中隶属函数...
- 白宇于水叶娜蔡东风任晓娜
- 关键词:词语相似度隶属函数自然语言处理
- 文献传递
- 基于知网的句法歧义结构消解
- 2006年
- 本文以汉语句法结构分析中普遍存在的句法结构歧义现象,即“动词+名词+的+名词”(V+N1+L的/u+N2)为研究对象,提出了一种基于知网知识库的歧义消解策略。本文根据知纲的义原分类体系制定了消歧规则,退一步提出了利用知纲的相似度计算和义原分类规则相结合的歧义消解策略。通过对人民日报语料中的1000个VNN实例的测试,准确率达83.7%,表明这是一种有效的识别VNN歧义结构的方法。
- 蔡东风周俏丽张桂平吴英泽
- 关键词:歧义结构消歧相似度计算
- 韩语辅助翻译系统
- 张桂平蔡东风尹宝生徐立军陈建军田晓光刘健朱英哲曲长城
- 技术说明:韩语辅助翻译系统是在对用户实际翻译过程中进行深入分析的基础上,提出了人机分工协作、人机优势互补、人机共同进步的辅助翻译概念,并将其应用在韩汉翻译工作的辅助上。不同于一般的翻译或辅助翻译软件,本系统是一个面向用户...
- 关键词:
- 关键词:韩语人机交互