于洪梅
- 作品数:8 被引量:4H指数:1
- 供职机构:吉林大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金吉林省科技厅科技发展计划项目深部探测技术与实验研究专项更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 支持大规模流数据处理的弹性在线MapReduce模型及拓扑协议
- 2016年
- 针对现阶段大规模流数据在线处理的广泛需求,本文提出了弹性在线MapReduce流数据处理模型及相关的动态拓扑结构协议。该模型兼容现有MapReduce模型,采用内存计算模式,并具有动态的作业拓扑结构,支持大规模流数据处理作业在运行过程中的弹性调整,从而满足流数据的时效性、动态性和突发性等特殊要求。在弹性在线MapReduce模型的基础上建立了流数据处理作业动态拓扑结构管理机制,设计了作业在线初始化协议和在线调整协议。为进一步提高系统灵活性和整合资源,提出了作业间的操作共享概念,设计了作业共享协议。通过协议分析,本文提出的在线初始化协议、在线动态调整协议及作业共享协议的最大复杂度均为O(n);在数据流量发生突发性变化时,系统具有良好的可伸缩性。
- 魏晓辉李翔李洪亮李聪庄园于洪梅
- 关键词:计算机系统结构流数据处理MAPREDUCE拓扑结构
- 基于模拟后缀数组索引结构的实现
- 2009年
- 实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的小波树上模拟实现了后缀数组功能。理论分析和实验结果表明,这种结构具有很小的空间占用,并不影响索引结构的运行效率。
- 杨炜鸿张毅于洪梅
- 关键词:全文索引后缀数组哈夫曼编码
- 分布式网络爬虫框架Crawlzilla被引量:1
- 2017年
- 互联网技术的飞速发展带了网络信息的爆炸式增长,互联网已经成为了企业,机构和个人发布信息的主要平台。据CNNIC(中国互联网络信息中心)发布的2015年中国网民搜索行为研究报告中指出,截止到2015年12月,我国搜索引擎用户达到了5.66亿,使用率为82.3%,手机搜索用户达4.78亿,使用率为77.1%。互联网的发展速度日益加快,随之而来的是爆炸式的信息体量的增长。传统的搜索引擎已经不能够满足一些企业和单位内部的个性化检索的需求。本文将对通用爬虫框架Crawlzilla做简要的分析,并说明其在企业内部制定个性检索服务的可行性。
- 徐海啸董飒董飒于洪梅李翔
- 关键词:爬虫搜索引擎
- 面向脉动阵列神经网络加速器的软错误近似容错设计
- 2024年
- 本文根据神经网络本身的错误弹性和层内过滤器相似性提出了一种近似容错设计,把过滤器划分成不同校验组进行不精确校验,保证严重错误被检出并恢复。通过优化过滤器-计算单元映射使校验流程与脉动阵列数据流契合,相较于传统双模冗余,本文提出的容错设计可以降低73.39%的性能开销。
- 魏晓辉王晨洋吴旗郑新阳于洪梅岳恒山
- 关键词:计算机系统结构脉动阵列软错误
- 地球系统模型(CESM)移植到ARM高性能计算集群的实证研究
- 2023年
- 气候模拟非常具有挑战性,涉及大量相互作用的物理过程。地球系统模型(CESM)是一个开源的耦合气候系统,广泛应用于区域和全球气候预测。CESM应用运行需要做大量的数值计算,超高分辨率气候模拟则需要更大规模的并行计算能力。近年来,基于ARM的高性能计算集群的出现为这些需要大量计算的物理系统的运行提供了一种新的选择。可扩展性和能效是传统HPC平台的两个关键问题。与传统的X86高性能计算平台相比,基于ARM的处理器提供了更高的内存带宽和每芯片更多的内核,有利于应用程序的可扩展性。在该文的工作中,以CESM为研究对象,并将其成功移植到了基于ARM架构的华为鲲鹏处理器上。根据CESM的运行时数据,提出了一个定制的C/Fortran编译器并改进了进程调度算法。在华为鲲鹏处理器和英特尔至强处理器上进行了大量的对比实验,结果表明:在华为鲲鹏处理器上优化后的CESM实例虽然单核性能相对较低,但整体性能提升了31.78%~42.93%,并具有更好的可扩展性。
- 徐海啸吴旗于洪梅徐哲文李想赵禹刘治奇
- 关键词:气候模型
- 基于多智能体深度强化学习的空间众包任务分配被引量:3
- 2022年
- 针对现有空间众包中的任务分配大多只考虑单边、短期利益和单一场景的问题,提出一种基于多智能体深度强化学习的空间众包任务分配算法.首先定义一种新的空间众包场景,其中工人可以自由选择是否与他人合作;然后设计基于注意力机制和A2C(advantage actor-critic)方法的多智能体深度强化学习模型进行新场景下的任务分配;最后进行仿真实验,并将该算法与其他最新的任务分配算法进行性能对比.仿真实验结果表明,该算法能同时实现最高的任务完成率和工人收益率,证明了该算法的有效性和鲁棒性.
- 赵鹏程高尚于洪梅
- 分布式高分数据分发平台的设计与实现
- 2017年
- 随着科技的发展,人们对未知世界探索的欲望也越来越强烈,自从1957年10月4日人类向太空发射的第一颗人造卫星开始,截止到2015年12月31日,全球共有在轨卫星1381颗,与2011年在轨卫星数量(986颗)相比,5年期间数量增长了39%,而其中对地观测卫星占14%。这给全球的卫星事业的发展带来了巨大的机遇和挑战,我国也建立自己的卫星系统。我国在2006年到2020年国家中长期科学和技术发展规划纲要中把建立高分辨率对地观测系统(简称高分专项)作为16个重大科技发展专项之一。随着高分数据的民用应用的发展,高分数据已经逐渐走进了人们的生活,从农业保险、灾情预测到指挥城市都发挥着重要的作用。基于以上背景,设计并实现了一个分布式高分数据分发平台。
- 徐海啸董飒李翔于洪梅吴旗
- 关键词:WEB技术SPRINGMVC数据分发