国家重点基础研究发展计划(G1998030507-4)
- 作品数:20 被引量:853H指数:11
- 相关作者:俞士汶刘群李保利朱学锋孙斌更多>>
- 相关机构:北京大学中国科学院新加坡国立大学更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家教育部“985工程”更多>>
- 相关领域:自动化与计算机技术语言文字电子电信理学更多>>
- 现代汉语语义词典(SKCC)的新进展
- “现代汉语语义词典”(SKCC)是一部面向中文信息处理的语义知识库,1998年底完成一期工程,收词48,835条。从2001开始,北大计算语言学研究所与中文系合作进行SKCC的二期开发。针对机器翻译的需要,对原有的语义分...
- 王惠俞士汶詹卫东
- 关键词:语义词典语义属性语义分类计算词典学中文信息处理
- 文献传递
- 北京大学现代汉语语料库基本加工规范(续)被引量:33
- 2002年
- 北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉 ,更广泛地向专家、同行征询意见 ,以便进一步修订。
- 俞士汶段慧明朱学锋孙斌
- 关键词:词语切分词性标注汉字处理系统
- 机器翻译与语言研究被引量:5
- 2002年
- 本文从机器翻译的一般模式谈起,讨论了服务于机器翻译的语言研究应该注意的问题,包括:应更加重视形式与意义之间对应关系的系统研究;应重视以机器为“标准”来扩大关注的语言现象的范围;应重视在形式化的知识表示框架下进行大规模的语言工程实践的研究工作。
- 詹卫东常宝宝俞士汶
- 关键词:机器翻译语言研究电子词典形式化语言知识库
- 基于格关系和配价的藏语动词再分类研究
- 本文着重介绍了我们根据研制藏汉机器翻译系统的实际需要,在采用传统语法对藏语动词的已有分类基础上,采纳格语法和配价理论的合理思想,结合藏语的格接续特征,通过每个动词的配价信息以及所能携带的相应的格助词类型(格标)及其数量来...
- 陈玉忠李保利俞士汶
- 关键词:藏语动词配价理论
- 文献传递
- 北京大学现代汉语语料库基本加工规范被引量:169
- 2002年
- 北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外,还包括专有名词(人名、地名、团体机构名称等)标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉,更广泛地向专家、同行征询意见,以便进一步修订。
- 俞士汶段慧明朱学锋孙斌
- 关键词:词语切分词性标注汉字处理系统
- 统计和规则相结合的汉语组块分析被引量:41
- 2002年
- 从文本中获得的组块对机器翻译、信息检索等很多领域都非常有用.介绍了规则和统计进行组块分析的处理策略,提出了规则与统计相结合的处理方法.并且结合组块分析的实际情况改进了一般评价系统性能的指标,通过封闭测试和开放测试验证,与单纯规则组块划分相比较,组块识别的精确率和召回率都得到了提高,组块划分错误率降低了7%.
- 李素建刘群白硕
- 关键词:语料库自然语言处理计算机
- 基于实例的汉英机器翻译系统研究与实现被引量:22
- 2002年
- 文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、翻译结果的正确率等方面取得了令人满意的结果。
- 王长胜刘群
- 关键词:汉英机器翻译系统双语语料库计算机
- 扩展面向对象编程(XOOP)的理论和方法被引量:6
- 2001年
- 针对使用继承的传统对象系统在映射真实世界的对象关系时遇到的各种困难 ,提出一种普遍的软件工程方法 ,即扩展的面向对象方法 (XOO) ,它通过支持双向派生、归纳、更一般的多态机制等技术 ,来补足继承机制的不足 ,并进一步增强对象方法在描述对象关系方面的能力 .作者强调了虚归纳是一种普遍的软件工程方法 ,它使得归纳与继承的高效结合成为可能 ,可以作为重用已有类库代码和与继承类层次结合的有效方法 .文中还描述了XOOP的一个较为完整的实现——编程语言 C* * .
- 孙斌
- 关键词:面向对象编程语言程序设计
- 基于动态知识库的问答系统研究
- 问答系统有着较长的历史。本文在综述现有问答系统的基础上,提出“动态知识库”的概念,并基于此,搭建了“亲属关系问答系统”,在知识获取、问答系统发展趋势等方面,进行了一定的探索。
- 王树西刘群白硕王斌程学旗姜吉发
- 关键词:问答系统动态知识库知识获取
- 文献传递
- “现代汉语语义词典”的结构及应用被引量:27
- 2006年
- “现代汉语语义词典(SKCC)”是一个面向汉英机器翻译的大规模汉语语义知识库,它以数据库文件形式收录6.6万余实词,不仅给出每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制。目的是为计算机语义自动分析、词义消歧等任务提供强有力的支持。本文介绍这部语义词典的结构、内容,并以实例说明这部词典可有效地解决翻译系统中的词汇歧义(WSD)问题。
- 王惠詹卫东俞士汶
- 关键词:语义词典词义消歧词汇语义学自然语言处理