刘伟
- 作品数:26 被引量:49H指数:4
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家社会科学基金国家高技术研究发展计划国家科技支撑计划更多>>
- 相关领域:文化科学自动化与计算机技术环境科学与工程更多>>
- 汉语主题词表研究热点与发展路径研究被引量:1
- 2016年
- 利用文献计量方法对近30年来汉语主题词表研究论文进行统计,揭示汉语主题词表研究的总体面貌。利用关键词共现分析和社会网络分析方法,对研究主题、作者合著关系进行可视化展示,并对网络环境下新型汉语主题词表的发展思路提出了建议和对策。
- 宋培彦刘伟
- 关键词:汉语主题词表知识组织可视化共现
- 一种新型的中文科技文献半自动标引方法
- 本发明提供了一种新型的中文科技文献半自动标引方法,包括:对用户需要标注的文献集合的被引文献进行获取,获取被引文献集合;对被引文献集合中每篇文献进行标注,获得标注的被引文献;对被引文献集合中文献之间的引用关系网络进行构建,...
- 刘伟
- 文献传递
- 同义词抽取结果的噪音清洗方法研究
- 2015年
- 【目的】同义词抽取结果中的噪音会严重影响结果的可应用性,需要预先进行清洗。【方法】提出一种基于同义关系网络的噪音清洗方法,将同义词抽取结果转化为无向结构的同义关系网络,在该网络中自动识别出同义词抽取结果中部分噪音,并结合语义的分布相似性对方法进行改进,以提高噪音的识别比例。【结果】通过在工程技术领域随机选取的术语上进行实验,表明该方法可以过滤同义词抽取结果中32.6%–73.0%的噪音。【局限】只能清除部分噪音,还需要改进方法以提高噪音识别的准确性。【结论】通过构建同义关系网络能够清洗同义词抽取结果中的噪音,该问题值得进一步深入研究。
- 刘伟王星宋培彦
- 关键词:同义词信息抽取
- 基于引文的中文学术文献自动标引方法研究被引量:9
- 2014年
- 针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。
- 王星刘伟
- 关键词:自动标引学术文献遗传算法
- 一种新型的中文新闻页面增量采集的方法及装置
- 本发明提供了一种新型的中文新闻页面增量采集的方法及装置,其中,一种新型的中文新闻页面增量采集的方法,包括:对稳定页面进行识别,获得识别后的稳定页面;对新闻页面分类器进行相应的操作,获得生成的新闻页面分类器;对新增页面进行...
- 刘伟
- 文献传递
- 基于内容特征元数据的多源异构科技资源关联聚合研究被引量:4
- 2020年
- 科技资源已成为推动科学技术进步、提升国家科技实力的关键性因素,但科技资源的孤岛问题严重阻碍了科技资源共享服务。在分析科技资源内容特征元数据的基础上,关联聚合研究多源异构的科技资源的方法,利用知识组织工具从内容特征元数据中抽取主题概念,利用主题概念建立科技资源之间的关联,继而对不同类型和来源科技资源进行聚合,利用真实的科技资源元数据进行实证分析,表明该方法在揭示科技资源共享服务方面的有效性。
- 刘伟
- 关键词:科技资源元数据主题抽取
- 互联网环境下的英文同义术语自动发现研究与系统实现被引量:4
- 2012年
- 以英文同义术语为例,提出三种有效的自动获取互联网术语资源的技术手段,包括语法模式的自学习,在线同义词典的抽取,静态同义术语分类的爬取。在此基础上,设计并实现互联网同义术语检索原型系统(WebSynonym Searcher)。实验测试表明,从互联网中自动获取同义术语是一种非常有前景的途径。
- 刘伟黄小江万小军王星
- 关键词:互联网在线词典
- 面向叙词表更新的新术语分布特征研究被引量:3
- 2019年
- [目的/意义]为增强叙词表实用性,需要不断地将领域中出现的新术语更新到叙词表中,更新维护过程中,从时间及词频等角度对新术语分布特征进行探索研究,可以为新术语发现方法提供参考。[方法/过程]基于新术语相关特征,结合对应文档频率在时间点和时间段上的发展分布,通过相关统计分析,研究术语在不同成长时期的分布特征,尤其界定术语在开始期与成长期的分布差异。[结果/结论]实证分析表明新术语一般处于术语发展的成长期,当候选新术语保持正向增长趋势超过一定年限,可以认为该术语同时具有新颖性、时间持续性及术语性特征。基于该分布特征进行领域新术语的识别,结合词表编制专家的判断,该方法在新术语收录判断中具有较高的准确率,且能有效识别实际应用中占比较多的低频词。
- 雷晓常春刘伟
- 关键词:新术语
- 网络环境下叙词表编制系统中的并发机制探讨
- 2011年
- 网络技术的成熟和飞速发展,使得叙词表在开放网络环境下进行编制维护并提供访问服务成为必然的发展趋势,同时也提出新的挑战:如何同时保证大量在线用户的各种访问操作和编制维护操作的可并发性?本文针对这个问题展开探讨,提出一种新的适用于开放网络环境下叙词表编制系统用户操作之间的并发机制,通过引入数据库理论中封锁的技术来消除在线叙词表编制系统中用户并发操作时可能会引发的冲突。
- 刘伟周杰
- 关键词:叙词表叙词表编制并发封锁
- 一种新型的中文科技文献半自动标引方法
- 本发明提供了一种新型的中文科技文献半自动标引方法,包括:对用户需要标注的文献集合的被引文献进行获取,获取被引文献集合;对被引文献集合中每篇文献进行标注,获得标注的被引文献;对被引文献集合中文献之间的引用关系网络进行构建,...
- 刘伟
- 文献传递