郑实福
- 作品数:6 被引量:351H指数:3
- 供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
- 发文基金:哈尔滨工业大学校基金资助国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 可分性判据在中文网页分类中的应用被引量:8
- 2002年
- 提出了一种改进的基于统计的中文网页的分类算法,通过对传统的基于计算相似度文本分类方法和基于贝叶斯模型文本分类算法的研究,我们对贝叶斯模型分类算法进行了改进,提出了利用一种基于概率分布的可分性判据分类方法,即用类别密度函数似然比来增加特征词的可分性信息的算法。通过对计算相似度方法、贝叶斯方法及改进的贝叶斯方法的对比实验表明,改进算法可以使类与类的间隔最大化,因而具有较高的分类精确率和召回率。
- 秦兵郑实福刘挺张刚李生
- 关键词:可分性判据贝叶斯方法中文网页分类计算机网络
- 句子相似度计算在FAQ中的应用
- 本文设计并实现了一个基于常问问题库的中文问答系统。对用户以自然语言输入的问题,该系统能够自动地在FAQ(Frequently-Asked Question)库中寻找候选问题集,通过计算句子相似度,将匹配的答案返回给用户。...
- 王洋秦兵郑实福
- 关键词:句子相似度
- 文献传递
- 自动问答综述被引量:228
- 2002年
- 自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。
- 郑实福刘挺秦兵李生
- 关键词:信息检索答案抽取自然语言处理
- 基于常问问题集的中文问答系统研究被引量:155
- 2003年
- 首先根据用户的提问建立一个候选问题集,然后通过计算句子语义相似度,在候选问题集中找到相似的问句,并将答案返回给用户.该系统还能够自动地更新和维护FAQ库.实验表明,与基于关键词的句子相似度计算相比,基于语义的句子相似度计算提高了问题匹配的准确率.
- 秦兵刘挺王洋郑实福李生
- 关键词:中文问答系统句子相似度数据库数据结构
- 基于改进的贝叶斯模型的中文网页分类器
- 本文提出了一种改进的基于统计的中文网页的分类算法,通过对传统的基于计算相似度文本分类方法和基于贝叶斯模型文本分类算法的研究,我们对贝叶斯模型分类算法进行了改进,提出了利用类别密度函数似然比来增加特征词的可分性信息的算法....
- 秦兵郑实福刘挺张刚李生
- 关键词:似然比贝叶斯方法网页分类
- 中文自动问答技术研究
- 该文中提出的中文自动问答系统包括三个主要组成部分:问题理解、信息检索和答案抽取.对于用户提交的问题,首先要通过问题理解来掌握用户的提问意图.问题理解包括:问题的分类、关键词的提取和关键词扩展.信息检索的任务是在已有的文档...
- 郑实福
- 关键词:信息检索
- 文献传递