中国人民大学科学研究基金(11XNL010)
- 作品数:24 被引量:3,052H指数:14
- 相关作者:孟小峰慈祥马友忠李勇霍峥更多>>
- 相关机构:中国人民大学西北师范大学洛阳师范学院更多>>
- 发文基金:中国人民大学科学研究基金国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- COLA:云环境下的在线聚集系统
- 相对于传统的批处理模式,在线聚集能在处理过程中不断地返回近似结果.COLA是一个云环境下的基于MapReduce的在线聚集系统,它能在处理开始后短时间内返回高准确度的估计结果,使得用户可以提前终止处理,从而在云平台即用即...
- 干艳桃史英杰孟小峰
- 关键词:MAPREDUCE云计算
- 文献传递
- DegreeTree:学者谱系构建系统被引量:1
- 2015年
- Web数据的不断丰富,使构建学者的社会网络成为可能,但是国内目前鲜有系统挖掘学者的师生关系.DegreeTree系统借助Deep Web数据集成技术从互联网上自动集成计算机领域的学位论文,进行数据清洗、实体识别、实体关系抽取和实体链接,由数据源模块、语义构建模块、查询处理模块、数据展示模块组成.由于学者的单位信息可能发生改变,匹配同一学者不同时期的导师、学生身份至关重要,该系统用学位论文的年份、授予单位、关键词、分类号等属性完成这一实体链接过程.用户使用DegreeTree系统可以查询以学者为中心的谱系图,并编辑修改错误或缺失信息.
- 郝泽慧孟小峰
- 关键词:数据集成社会网络
- 移动应用集成:框架、技术与挑战被引量:16
- 2013年
- 随着移动互联网的广泛普及和飞速发展,出现了大量的移动应用,其种类和数量还在不断增加.手机制造商、电信运营商和互联网服务提供商等纷纷推出自己的移动应用商店,移动应用已经成为互联网发展的一种新模式.移动应用的相关信息分布在应用商店、专业论坛及社交网络中,由于其信息的多样性、异构性、动态性,给移动应用集成带来了巨大挑战.移动应用集成的主要任务是研究如何把海量的移动应用及其相关信息有效地集成起来,为用户提供高质量的搜索、发现和推荐服务.移动应用集成还是一个比较新的研究领域,文中提出了一个移动应用集成的基本框架,对移动应用集成中的关键技术进行了分析总结,在此基础上对未来的研究方向及挑战进行了阐述.
- 马友忠孟小峰姜大昕
- 关键词:数据抽取移动互联网
- 大数据管理:概念、技术与挑战被引量:2394
- 2013年
- 云计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数据时代正式到来.数据从简单的处理对象开始转变为一种基础性资源,如何更好地管理和利用大数据已经成为普遍关注的话题.大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,数据管理方式上的变革正在酝酿和发生.对大数据的基本概念进行剖析,并对大数据的主要应用作简单对比.在此基础上,阐述大数据处理的基本框架,并就云计算技术对于大数据时代数据管理所产生的作用进行分析.最后归纳总结大数据时代所面临的新挑战.
- 孟小峰慈祥
- 关键词:大数据数据分析云计算
- 云数据管理系统中查询技术研究综述被引量:47
- 2013年
- 作为一种全新的互联网应用模式,云计算在工业界和学术界备受关注.人们可以通过终端设备便捷地获取云端服务,并以按需使用的方式获得存储资源、计算资源以及软硬件资源.云计算的发展带来了一系列挑战性问题,而云数据的管理问题首当其冲.文中结合云数据的特点提出了一个云数据管理系统的框架,并在此基础上从索引管理、查询处理、查询优化以及在线聚集等几个方面对云数据管理系统中查询技术的研究工作进行了总结分析,指明了该领域面临的挑战和未来的研究工作.
- 史英杰孟小峰
- 关键词:云计算查询处理查询优化
- PrivateCheckIn:一种移动社交网络中的轨迹隐私保护方法被引量:70
- 2013年
- 移动设备的发展及无线网络的普及促使移动社交网络的出现及发展.签到服务作为移动社交网络中的主流应用,存在着严重的轨迹隐私泄露风险.文中针对签到服务中假名用户的轨迹隐私泄露问题,提出了一种轨迹隐私保护方法PrivateCheckIn.该方法设计了一种签到序列缓存机制,通过为缓存的签到序列建立前缀树、对前缀树进行剪枝及重构形成k-匿名前缀树,遍历k-匿名前缀树得到k-匿名签到序列,达到了轨迹k-匿名的隐私保护效果.文中证明了PrivateCheckIn方法既能保护假名用户的轨迹隐私,又确保损失签到位置最少,有效地保证了用户体验.通过构建前缀树的方式获取轨迹k-匿名集降低了计算代价.最后,文中在真实数据集上与(k,δ)-anonymity方法进行了充分的对比实验,验证了PrivateCheckIn方法的准确性与有效性.
- 霍峥孟小峰黄毅
- 关键词:数据库应用隐私保护位置隐私
- 大数据融合研究:问题与挑战被引量:133
- 2016年
- 随着大规模数据的关联和交叉,数据特征和现实需求都发生了变化.以大规模、多源异构、跨领域、跨媒体、跨语言、动态演化、普适化为主要特征的数据发挥着更重要的作用,相应的数据存储、分析和理解也面临着重大挑战.当下亟待解决的问题是如何利用数据的关联、交叉和融合实现大数据的价值最大化.认为解决这一问题的关键在于数据的融合,所以提出了大数据融合的概念.首先以Web数据、科学数据和商业数据的融合作为案例分析了大数据融合的需求和必要性,并提出了大数据融合的新任务;然后,总结分析了现有融合技术;最后针对大数据融合问题可能面临的挑战和大数据融合带来的问题进行了分析.
- 孟小峰杜治娟
- 关键词:大数据数据集成数据融合知识融合数据管理
- 面向ScholarSpace知识库的关键词查询方法被引量:1
- 2015年
- 知识库中存储着大量关于真实世界中的实体信息及实体之间的关系,随着规模的不断增长,其应用也愈发广泛。另一方面,由于大量互联网用户通过关键词描述问题和查询意图,因此如何让知识库具备更好的关键词查询应答能力,成为了研究的热点。从中文知识库的构建入手,提出了一套完整的面向中文限定领域知识库的关键词检索框架,实现并改进了基于模板的关键词查询转换方法,提出了基于语义的知识库释义和实体索引方法,提高了关键词映射能力。同时在SPARQL转换过程中采用了缺失关系索引,提高了转换成功率,提升了能够处理的查询数量。同时在学术空间ScholarSpace上对该框架进行了系统实现,取得了良好的应用效果。
- 李和瀚孟小峰邹磊
- 关键词:查询转换语义相似度
- 基于相变存储器和闪存的数据库事务恢复模型被引量:3
- 2013年
- 随着闪存容量不断增大、价格不断下降,闪存在实际存储系统上得到了越来越广泛的应用.但是,闪存的页级读写、异位更新、有限寿命等阻碍了闪存数据库系统的性能提升,尤其是事务恢复.闪存的异位更新使得影子页技术可以很好地支持闪存数据库事务恢复,同时也给闪存数据库带来新挑战,如事务管理、缓冲区管理.相变存储器凭借其比闪存更高的读写速度、更小的读写粒度、更长的寿命成为了下一代主流存储技术,所以相变存储器可以用于解决在闪存数据库中使用影子页技术所产生的事务管理和缓冲区管理问题.该文基于相变存储器和闪存混合式存储提出一种全新的数据库事务恢复模型——SPFP.该模型充分利用相变存储器的特性完成事务管理.为支持非强制缓冲区管理,基于SPFP提出了一种优化的数据库事务恢复模型——SPFLP,利用相变存储器记录更多事务信息.实验结果表明,相较于全闪存存储的数据库系统,SPFLP大大提高了基于混合存储的数据库事务处理性能.
- 范玉雷孟小峰
- 关键词:闪存相变存储器数据库事务恢复
- 本地化差分隐私研究综述被引量:68
- 2018年
- 大数据时代信息技术不断发展,个人信息的隐私问题越来越受到关注,如何在数据发布和分析的同时保证其中的个人敏感信息不被泄露是当前面临的重大挑战.中心化差分隐私保护技术建立在可信第三方数据收集者的假设基础上,然而该假设在现实中不一定成立.基于此提出的本地化差分隐私作为一种新的隐私保护模型,具有强隐私保护性,不仅可以抵御具有任意背景知识的攻击者,而且能够防止来自不可信第三方的隐私攻击,对敏感信息提供了更全面的保护.介绍了本地化差分隐私的原理与特性,总结和归纳了该技术的当前研究工作,重点阐述了该技术的研究热点:本地化差分隐私下的频数统计、均值统计以及满足本地化差分隐私的扰动机制设计.在对已有技术深入对比分析的基础上,指出了本地化差分隐私保护技术的未来研究挑战.
- 叶青青孟小峰朱敏杰霍峥
- 关键词:隐私保护