国家社会科学基金(10BTQ047)
- 作品数:9 被引量:77H指数:6
- 相关作者:白如江王效岳胡泽文于晓繁亢丽芸更多>>
- 相关机构:山东理工大学更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 海量网络学术文献自动分类系统被引量:9
- 2013年
- 随着Internet的发展,互联网上的学术文献数量呈指数增长,很难为科研工作者所利用,因此亟需一种方法对海量的网络学术文献进行自动的搜集、整理、分类。在前期充分的实验论证后,设计实现一个海量网络学术文献自动分类系统,该系统使用模块化设计,包括学术文献自动抓取模块、学术文献词-文档矩阵处理模块、本体集成模块以及基于语义驱动的分类模块。实验证明,该系统可以有效地完成海量学术文献的自动抓取、处理和分类工作。
- 王效岳白如江王晓笛祝娜
- 关键词:学术文献并行处理
- MapReduce原理及其在自然语言处理中的应用研究被引量:2
- 2014年
- 针对目前海量数据处理在处理速度、存储空间、容错性、访问时间等方面存在的问题,对Google MapReduce编程模型的原理、执行流程等进行分析,从MapReduce与索引构建、统计机器翻译、聚类算法、文本分类四个方面,总结MapReduce编程模型在自然语言处理及信息检索等领域的主要应用,以期对MapReduce编程模型原理及其主要应用有一个较全面的认识。
- 亢丽芸王效岳白如江
- 关键词:MAPREDUCE自然语言处理统计机器翻译聚类算法文本分类
- MapReduce原理及其主要实现平台分析被引量:18
- 2012年
- 针对海量数据处理在处理速度、存储空间、容错性、访问时间等方面存在的问题,对Google MapReduce编程模型的原理、执行流程等进行分析研究,介绍4种主要的MapReduce实现平台Hadoop、Phoenix、Disco、Mars,从编程语言、构建平台、功能特点和应用领域4个方面对4种平台进行比较分析,以期对MapReduce编程模型原理及其应用平台有一个较全面的认识。
- 亢丽芸王效岳白如江
- 关键词:MAPREDUCEHADOOPPHOENIXMARS
- 基于SUMO和WordNet本体集成的文本分类模型研究被引量:8
- 2011年
- 针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。
- 胡泽文王效岳白如江
- 关键词:WORDNET本体集成文本分类模型
- 本体集成:概念、过程、工具与方法综述被引量:3
- 2011年
- 针对目前本体集成领域相关概念和集成工具较多、集成过程不一、集成方法介绍过少等问题,简要辨析本体集成的概念,给出本体集成的基本过程。对比分析国内外流行的本体集成工具,对目前本体集成领域新出现的方法,如形式化概念分析法、范畴论法、RDFS闭包图法等理论基础和实现过程进行详细分析,以便为国内学者在该领域的研究提供启发和指导。
- 王效岳胡泽文白如江李玉平
- 关键词:本体集成本体异构形式化概念分析范畴论
- 国内外主要本体库比较分析研究被引量:14
- 2011年
- 介绍4种国内外主要的通用本体库W ordNet、DBped ia、Cyc、HowNet和两个比较成功的专业领域本体库生物医学和企业领域本体库,从描述语言、存储方式、查询语言、构建平台和应用领域5个方面分别对4种通用本体库和领域本体库进行比较分析,为国内外学者在本体库及其应用研究方面提供帮助。
- 白如江于晓繁王效岳
- 关键词:本体库WORDNETHOWNET
- 本体集成方法和工具综述被引量:6
- 2011年
- 本体集成是消除本体异质、实现语义通信并达到最高层级的语义融合,最后达到知识重用和互操作的过程。对本体集成的4种主要方法和5种主要工具进行综述,并对它们进行比较分析。
- 于晓繁王效岳白如江
- 关键词:本体集成
- 2001-2009年我国科学学研究进展——基于关键词的统计分析被引量:8
- 2010年
- 为了解科学学研究现状,对2001—2005年和2006—2009年两个阶段科学学主要期刊发表的论文进行统计,提取关键词。首先对高频词进行统计,分析科学学研究热点;其次,通过绘制两个阶段的共词网络并进行主成分展示,分析两个阶段科学学研究的主题;最后,对两个阶段的研究热点和主题进行比较分析。研究发现,科学学是一门随时代进步而发展的科学,并且其理论和方法正处于不断完善中。
- 李长玲纪雪梅支岭白如江
- 关键词:科学学研究主题共词分析
- 国内外文本分类研究计量分析与综述被引量:16
- 2011年
- 运用文献计量分析方法、计算机统计分析技术、社会网络分析软件对文本分类领域的历史文献进行计量分析及可视化,通过绘制文献数量分布图、核心关键词的共现网络,挖掘文本分类领域的发展趋势、目前研究概况、热点及未来研究趋势等信息,并对文本分类领域研究热点和未来研究趋势进行综述。
- 胡泽文王效岳白如江
- 关键词:文本分类社会网络分析可视化图谱