刘传汉
- 作品数:12 被引量:56H指数:5
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 基于主题概念的多文档自动摘要研究被引量:12
- 2005年
- 文章叙述了一种针对大规模文档集的综合性自动摘要的研究与实践.首先利用HOWNET来计算文献主题概念的内聚度,在此基础上,处理文档之间的相关度以及各自在整个文档集中的主题重要度等特征;其次阐述了基于文档综合主题辞和综合优先度的多文档自动摘要生成原理.实验结果表明,该系统经过对新闻多文档集进行综合性分析,生成的摘要能有效地反映重要的主题内容.
- 刘德荣王永成刘传汉
- 关键词:文献主题主题内容主题概念文档重要度
- 基于弱化语法规则的机器翻译方法研究被引量:1
- 2006年
- 在机器翻译的方法中,基于规则的翻译方法和基于实例的翻译方法都有各自的优缺点。结合两者的优点,提出了一种基于弱化语法规则的机器翻译方法,该方法在大量分析句子语法特征的基础上以及利用语言专家的知识构建语法规则库,在利用语法识别出句子后,把句子的各个组成部分标记出来,然后利用语义块进行匹配推理翻译出句子的各个组成部分,最后根据句法把句子的各个译出的组成部分装配起来形成译文。实验表明,该方法达到了较好的翻译效果,并且具有较大的发展潜力。
- 李党林王永成刘传汉
- 关键词:机器翻译基于统计
- 一种基于逐层扫描的频繁字串快速提取算法被引量:1
- 2008年
- 串频统计是一种简便有效的抽取未登录词方法。本文提出了一种快速的频繁字串提取和计频方法,通过逐层扫描快速发现频繁字串,修正字串有效出现频次,最后抽取平均互信息量达到阚值的字串。实验结果显示该方法有效可行。
- 张宇萌刘传汉
- 关键词:互信息
- 面向对话文本的自动摘要系统的研究被引量:4
- 2005年
- 该文介绍了对话文本自动摘要系统的一些关键技术,包括体裁的识别、对话信息单元的识别、问题句与回答句的关联等。摘要的连贯性是衡量摘要质量的一个重要指标,由于对话文本本身的交互性,使得摘要的连贯性常存在于不同的对话者的对话内容之中,并以问题-回答对的形式出现。该文设计了一种自动识别这些局部连贯性的方法,该方法首先自动识别出所有的问题句;然后识别出与问题句相对应的回答句,形成问题-回答对;最后根据启发式规则,从这些问题-回答对中选取句子生成摘要。实验结果表明,该方法具有较高的识别准确率,并在无损摘要信息量的基础上大大提高对话文本摘要的连贯性。
- 陈卫平王永成刘传汉
- 关键词:对话文本连贯性
- 动态词链算法被引量:3
- 2003年
- 介绍了动态词链算法的基本思想。由于该算法是以电子词典WordNet为基础而不是以对文章的语义理解为基础的,因此适用于任何文章。可以用此算法生成词链,再由此生成文章的摘要。
- 刘素红刘传汉王永成
- 关键词:组件WORDNET电子词典
- 关系数据库中存储XML文档的技术被引量:5
- 2002年
- XML及其相关技术日益渗透至计算机科学的各个层面 ,为了实现XML的潜能 ,XML的有效存储是一个必须首要解决的技术环节。对该技术进行了较为详尽的阐述 ,并介绍了Oracle为存储XML文档所进行的功能扩展。
- 薛俊义刘琴许卓明刘传汉
- 关键词:XML数据库数据存储模式映射ORACLE
- 论文本的自动摘要被引量:1
- 2003年
- 自动摘要的研究是自然语言处理领域的一项重要且具有实践意义的工作,同时也是Internet信息处理的主要研究任务之一。本文叙述了自动摘要系统的历史和现状,并对它们做了归纳和总结。根据作者的观点,摘要大致可以分为五类;主题摘要、信息摘要、纲目摘要、摘录型摘要和评论型摘要。所采用的方法可分为下列七种:位置法、提示字串法、频率统计法、信息抽取法、框架法、理解分析法和仿人方法。
- 王永成刘功申刘传汉胡佩华孙展
- 关键词:自然语言处理信息处理
- 基于XML的商业DBMS技术评述被引量:5
- 2002年
- XML已成为Web上数据表示与交换的标准格式。在需求与技术的驱动下,各数据库厂商纷纷推出了XML-Enabled产品。介绍并评述了目前3种主要的商业DBMS(Oracle8i、DB2、SQL Server2000)对XML进行的功能扩展。
- 刘琴许卓明刘传汉
- 关键词:DBMS关系数据库SQLSERVER商业数据库
- 论自动文摘及其分类被引量:14
- 2005年
- 自动文摘,即利用计算机自动编制文摘,是信息时代的需要.本文讨论了文摘的不同定义、特点和功能.目前,文摘的分类方法不适用于自动文摘的分类,因此,本文试着从多角度对自动文摘系统进行了分类,这样的分类根据自动文摘的特点进行的划分,是对自动文摘分类的一种总结,可以作为构造自动文摘系统和思考自动文摘发展方向的参考和借鉴.最后,概述了中文自动文摘系统的研究状况,展望了自动文摘的发展趋势.
- 王志琪王永成刘传汉
- 关键词:自动文摘自然语言处理
- 利用分割技术提高对话文本自动摘要的一致性被引量:2
- 2007年
- 针对传统的基于抽取的自动摘要方法不能很好地处理对话文本一致性的问题,提出了对话文本自动摘要中的体裁、问题-回答对识别等关键技术.设计了一种类似于TextTiling的文本分割方法对候选的回答段落进行分割,以便提高问题-回答对的关联精度.实验结果表明,利用问题-回答对的关联信息能够提高对话文本自动摘要的整体一致性.
- 刘传汉王永成刘德荣王志琪
- 关键词:文本分割一致性