中央高校基本科研业务费专项资金(CZY11002)
- 作品数:3 被引量:103H指数:2
- 相关作者:向文李成华江小平张新访更多>>
- 相关机构:华中科技大学中南民族大学更多>>
- 发文基金:中央高校基本科研业务费专项资金武汉市科技攻关计划项目国家科技重大专项更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 云计算环境下朴素贝叶斯文本分类算法的实现被引量:21
- 2011年
- 采用分布式编程MapReduce模型研究了文本统一格式预处理、训练、测试以及分类等基于朴素贝叶斯文本分类算法主要计算过程的MapReduce并行化方法,并在Hadoop云计算平台进行了实验。实验结果表明:朴素贝叶斯文本分类算法MapReduce并行化后在Hadoop云计算平台上部署运行,具有较好的加速比,对中文网页文本分类识别率达到了86%。
- 江小平李成华向文张新访
- 关键词:云计算并行计算文本分类朴素贝叶斯算法
- 面向管理实体对象的海量工程项目数据模型及实现被引量:2
- 2013年
- 针对建立统一数据模型的PIP数据中心的需求,提出一种面向管理实体对象的数据基本模型,把工程项目数据按项目全生命周期过程分解为若干个基于工作流的可管理的实体对象,给出了项目工程数据概念层模型,利用该模型实现项目工程数据的自然表达和记录。进一步,基于文档型数据库MongoDB技术提出工程项目数据的组织方法,并设计了存储服务集群架构方案。实验表明,该存储方案具有高效的数据写入和查询性能,具有服务高可用性和存储能力的可扩展性等特点。
- 李成华江小平向文李斌
- 关键词:项目信息门户信息集成文档型数据库
- k-means聚类算法的MapReduce并行化实现被引量:81
- 2011年
- 针对k-means聚类算法特点,给出了MapReduce编程模型实现k-means聚类算法的方法,Map函数完成每个记录到聚类中心距离的计算并重新标记其属于的新聚类类别,Reduce函数根据Map函数得到的中间结果计算出新的聚类中心,供下一轮MapReduce Job使用.实验结果表明:k-means算法MapReduce并行化后部署在Hadoop集群上运行,具有较好的加速比和良好的扩展性.
- 江小平李成华向文张新访颜海涛
- 关键词:云计算并行计算MAPREDUCE模型数据挖掘K-MEANS聚类算法