李焱
- 作品数:5 被引量:18H指数:2
- 供职机构:国家互联网应急中心更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 流水行云:支持可扩展的并行分布式流处理系统被引量:9
- 2015年
- 数据流处理系统,无论是集中式还是分布式,都需要克服单点瓶颈问题.不仅如此,如果数据流处理系统是静态配置的,那么还会出现处理节点供给不足或者过剩的情况,为此本文提出了一种支持可扩展的并行分布式数据流处理系统—流水行云,该系统根据有状态算子将查询拓扑划分为并行处理的子查询,并且通过有状态算子的分发器和收集器实现了数据流的保序,同时最大化减少并行处理的通信开销,不仅如此,结合负载均衡和重配置的可扩展技术使得该系统能够根据输入负载动态调整处理节点的负载和个数.60个节点组成的集群的实验证明了该系统的可扩展能力.
- 张鹏刘庆云刘庆云谭建龙李焱
- 关键词:可扩展负载均衡重配置
- 基于Cookie的网盘资源在线溯源方法
- 2016年
- 网盘作为一种基于互联网的信息传播载体,其所分享的敏感资源已经在网络流量中占有越来越多的比例,因此,获取网盘资源的分享链接对于网络安全有着重要的意义。提出了一种高效可扩展的基于Cookie的网盘资源溯源方法—Cookie Tracing。该方法通过在海量的HTTP会话中建立Cookie与HTTP会话的索引表来实现网盘资源和下载网盘资源的跳转链的关联,同时通过累计散列算法加快溯源结果的验证。实验结果表明,所提方法具有较好的性能和可扩展性。
- 林海伦李焱王伟平岳银亮林政
- 关键词:COOKIE
- 面向数据流处理的元组跟踪方法
- 2013年
- 为了保证数据流中的每个元组得到可靠处理,传统的方法需要在内存中保存每个元组,直到它们被数据流处理系统正常处理,因此会带来很大的内存开销。为此提出了一种既能够保证元组得到可靠处理,又能够节省内存开销的元组跟踪方法。该方法包括内存分配策略、元组跟踪单元选择策略和校验值更新策略,这3个策略使得元组跟踪单元只保留元组标识符的异或校验值而不是元组减少内存开销,同时通过改进一致性散列变换实现元组跟踪单元的负载均衡。内存开销和负载均衡的相关实验表明,该方法能够有效实现对元组的跟踪和可靠处理。
- 杜华明张鹏徐克付徐克付谭建龙
- 关键词:数据流处理可靠性数据流负载均衡
- 一种工作流的任务调度方法、多工作流调度方法及其系统
- 本发明涉及一种工作流的任务调度方法以及多工作流调度方法和系统,所述任务调度方法包括:步骤1,计算工作流中每个任务的向上权值,按向上权值的降序将任务放入待调度任务列表;步骤2,选择向上权值最大的任务,遍历并计算该任务在每个...
- 张鹏张世鹏李焱朱嵬刘庆云谭建龙
- 文献传递
- 高效的基于段模式的恶意URL检测方法被引量:9
- 2015年
- 提出一种高效的基于段模式的检测恶意URL的方法,该方法首先解析已标注的恶意URL中的域名、路径名和文件名3个语义段,然后通过建立以三元组为词项的倒排索引快速计算恶意URL每个语义段的模式,最后基于倒排索引查找到的段模式来判定给定的URL是否是恶意URL。不仅如此,该方法还支持基于Jaccard的随机域名识别技术来判定包含随机域名的恶意URL。实验结果表明,与当前先进的基准方法相比,该方法具有较好的性能和可扩展性。
- 林海伦李焱王伟平岳银亮林政
- 关键词:三元组倒排索引