沈达阳
- 作品数:9 被引量:122H指数:7
- 供职机构:汕头大学计算机科学研究所更多>>
- 发文基金:国家自然科学基金广东省自然科学基金国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉字简繁体智能化转换系统被引量:1
- 1996年
- 沈达阳孙茂松
- 关键词:智能化汉字信息处理简体繁体
- 汉语自动分词和词性标注一体化系统被引量:9
- 1996年
- 沈达阳孙茂松黄昌宁
- 关键词:汉语自动分词词性标注汉字处理信息处理
- Internet的信息收集Agent及其搜索方法被引量:7
- 1998年
- 本文首先介绍了Internet上Agent技术的重要性和信息结构,接着阐明了Internet信息收集Agent的功能及其信息搜索算法,并进一步描述其具体实现的体系结构。
- 沈达阳林作铨陈智健
- 关键词:信息收集信息搜索INTERNET网AGENT
- Intranet搜索索引自动生成工具Weblndex被引量:3
- 1999年
- 本文在分析几种典型Internet搜索引擎的基础上,设计实现了一种面向Intranet的信息收集agent,着重阐述了WebIndex,一个基于IICA体系的Intranet搜索索引自动生成工具。该系统克服了现有产品的一些缺点,在系统的可伸缩性、可移植性和中文处理能力方面有明显的改进。
- 沈达阳于斌林作铨
- 关键词:搜索引擎INTRANET网
- Internet中文个人信息搜索被引量:10
- 1999年
- 本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分别为97.8%和61.9%、100%和64.5%、94.5%和92.1%,对电子邮件地址和电话传真号码的召回率和精确率均为100%。鉴于Internet上的信息检索以及自然语言处理这两个领域都互向对方提出了要求,我们相信,面向大规模真实文本的汉语分析技术与Internet的结合。
- 沈达阳孙茂松
- 关键词:INTERNET信息处理
- 万维网知识挖掘方法的研究被引量:26
- 2000年
- 1.引言万维网(World Wide Web)的出现使计算机拥有海量的信息资源,然而这些信息却很少以计算机可理解的结构存在,因为,万维网上的页面本来就是以人,而不是计算机为其阅读对象的。因此,复杂的文本结构、图像、声音等多种信息的存在,既把万维网变成一种丰富多采的媒体,又造成了计算机对万维网信息进一步处理的障碍。
- 沈达阳孙茂松
- 关键词:万维网知识挖掘WEBINTERNET网
- Internet上的软件Agent被引量:25
- 1997年
- 本文首先介绍Agent的基本概念及其相关理论、体系结构和语言。然后较详细地介绍软件Agent方面的典型工作。最后,阐释Internet软件Agent有关思想,并给出一些相应的研究结果。
- 沈达阳林作铨
- 关键词:AGENTINTERNET
- 基于统计的汉语分词模型及实现方法被引量:17
- 1998年
- 本文介绍了一种基于统计的汉语分词模型以及该模型在不同资源要求下的实现方法,并进一步讨论了这种方法的优缺点,最后,作者实现了这些方法,并给出相应的实验结果和结论。
- 沈达阳孙茂松黄昌宁
- 关键词:中文信息处理汉语分词
- 汉语分词系统中的信息集成和最佳路径搜索方法被引量:27
- 1997年
- 复杂的汉语分词系统中,各种信息的有效集成是系统实现的关键。本文介绍了分调系统SegTag中信息集成方法,并讨论了信息集成结构中的两种最佳路径搜索方法。最后,我们给出实验结果和结论。
- 沈达阳孙茂松黄昌宁
- 关键词:汉语分词词性标注信息集成