国家自然科学基金(71272191)
- 作品数:22 被引量:131H指数:7
- 相关作者:高长元魏玲张树臣郭新朋翟丽丽更多>>
- 相关机构:哈尔滨理工大学哈尔滨工程大学惠灵顿维多利亚大学更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金黑龙江省博士后基金更多>>
- 相关领域:经济管理文化科学自动化与计算机技术理学更多>>
- 基于Bigtable与MapReduce的Apriori算法改进被引量:22
- 2015年
- 为提高Apriori算法挖掘频繁项目集的效率,引进了Bigtable技术与MapReduce模型来对Apriori算法进行优化,设计出大数据环境下挖掘频繁项目集的新算法BM-Apriori算法。与单纯基于MapReduce模型的Apriori改进算法相比,新算法利用Bigtable的时间戳属性代替了键/值对的产生,只需扫描数据库一次即可,节约了模式匹配的时间。同时,BM-Apriori算法在项集列表中新增事务标号列,自动获取事务标号以计算支持度。将BM-Apriori算法在Hadoop平台上进行了实验,结果表明Bigtable技术的融入使得BM-Apriori算法具有更高的效率与可拓展性。
- 魏玲魏永江高长元
- 关键词:APRIORI算法大数据
- 行列混合存储的数据压缩策略研究
- 2017年
- 大数据技术不断深入发展,对于数据压缩技术的要求也在不断提高.为此,构建叠加式行列混合存储结构,提出动态编码选择数据压缩策略.首先,依据数据类型,选取对应处理效果最佳的编码方式;然后,设计基于行列存储的页式存储结构对数据属性缓冲区中的数据进行处理,确定可压缩的属性数据并存储于属性块;最后设计并实现动态编码选择数据压缩算法,对属性块中的数据进行压缩处理,计算数据压缩比.应用大规模数据集SSB中的数据表进行数据压缩处理,实验结果验证了基于行列混合存储的动态编码选择数据压缩策略在数据压缩比、数据压缩时间方面性能优于单一行、列存储下的数据压缩方式,提高了压缩效率.
- 魏玲郭新朋
- 关键词:数据压缩
- 基于并行处理机制的数据复用策略研究被引量:2
- 2017年
- 针对频繁出现的数据冗余、数据复用效率低下等问题,将列存储方式结合并行处理机制对数据复用策略进行优化。构建了基于MapReduce的数据复用并行化处理模型,利用改进型CSM模式匹配算法结合数据挖掘过程中的数据筛选算法,提出并行化数据复用算法。该算法利用数据属性的模式匹配确定属性列之间的对应关系,使用数据检测方式验证属性列数据复用的可行性,从而进行属性列数据筛选,实现并行化的数据复用策略。在大数据环境下的数据仓库中,对大规模基准数据属性集SSB和TPCH中提取的数据实证进行分析,实验结果分析中存储量和处理时间分别减少了17%和35%,验证了并行化数据复用策略在数据存储量、数据处理时间等方面比普通数据复用策略更具高效性。
- 魏玲郭新朋
- 关键词:并行处理数据复用数据仓库
- 在线评论结构模型构建及实证分析被引量:1
- 2014年
- 在线评论成为影响消费者购买决策的重要方面,已经引起国内外学者的关注。为了探讨在线评论重要的构成因素,设计了在线评论模型,并对模型进行测试。同时对消费者进行调研以及数据采集,且根据调查结果进行数据分析。研究发现:使用在线评论的消费者可以分为四类:产品偏好型、网站信任型、多目标型和评论者非偏好型。本研究意义在于,深入了解在线评论消费者的特征;指导企业和评论者正确发布在线评论的内容。
- 张睿高长元Tiong Goh陈可义
- 关键词:消费者行为
- 移动云计算联盟企业数据资产评估方法研究被引量:12
- 2016年
- 移动云计算联盟是以移动大数据共享为目的的企业中间组织,联盟企业数据资产评估是联盟顺利运行的关键环节。传统LSM模型不能够反映联盟企业数据资产漏损率及动态持有数据资产价值的问题,本文通过分析联盟企业数据资产的实物期权特性及漏损性,构建了基于漏损率的LSM模型以评估移动云计算联盟企业数据资产,并以中关村数海大数据交易联盟为实例,对该模型进行了验证。科学合理地评估移动云计算联盟企业数据资产价值,能够有效促进联盟健康发展,同时为联盟数据共享奠定坚实基础。
- 翟丽丽王佳妮何晓燕
- 关键词:实物期权LSM漏损率
- 基于个性化情景的移动商务信任推荐模型研究被引量:2
- 2017年
- 【目的/意义】移动互联网时代,移动电子商务用户的个性化信息需求具有极强的情景依赖性与感知信任性,针对目前移动商务信息服务个性化和准确性较低,提出融入用户个性化情景与用户间信任关系的推荐模型。【方法/过程】首先,通过用户当前情景和历史评分数据计算出对每个用户即时信息需求影响最大的K个情景要素,以此构造用户个性化情景,然后结合不同信任环境下的用户信任度矩阵改进已有的不同信任信息环境下用户情景兴趣推荐方法,进而进行项目推荐。【结果/结论】通过Movie lens与Book-Crossing数据集对本文提出的算法和其它两种算法进行比较,实验结果表明:本模型具有较高的推荐准确率,可有效地解决移动商务环境下的个性化推荐问题。
- 杜巍高长元
- 关键词:移动商务信任关系
- 合作创新网络中知识传导的行为分析与均衡策略被引量:5
- 2014年
- 在分析合作创新网络、知识传导等国内外理论成果及实践应用的基础上,揭示网络知识主体(生产者、传播者与采纳者)的划分标准及运作结构,阐述其各类传导行为的典型特征、转移过程及驱动模式;依据知识传导主体绩效形成路径及测度方法,构建创新网络中知识总供给函数、总需求函数与总剩余函数的均衡模型,形成网络知识创造、传播与应用的综合治理策略。
- 单子丹高长元
- 关键词:知识传导
- 云计算产业集群创新生态系统构建及发展对策被引量:2
- 2015年
- 中国云谷作为国家云计算产业集群化发展所在基地,处于发展期的开端,商业模式和行业环境在不断的建设中,还应充分调动集群创新主体的能动性,大力加强内涵建设,通过创新促进其升级发展。基于创新生态系统理论从组织生态学视角构建中国云谷的制度层、主体层和知识层等三维创新生态系统模型,对中国云谷创新主体进行分类分析,并采用SWOT分析方法对中国云谷的创新生态系统现状进行优势、劣势、机会和威胁的全面分析,进而得出SO发展战略,提出了云计算产业集群创新生态系统具体的创新发展对策和建议。
- 刘鸿宇杨彩霞陈伟王海晶
- 关键词:创新生态系统SWOT分析
- 基于价值网的高技术虚拟产业集群合作与竞争协同演化研究被引量:5
- 2013年
- 从高技术虚拟产业集群价值创造环节出发,分析其合作与竞争产生的动因,建立HTVIC合作与竞争协同演化价值网运作模型。在考虑HTVIC价值单元间合作、竞争及自组织协同效应基础上,构建HTVIC合作与竞争协同演化动力学模型,并对其演化的稳定性与过程进行仿真模拟。仿真结果表明HTVIC合作与竞争协同演化平衡状态受价值创造最大规模、合作与竞争强度及自组织协同效应的共同影响。最后,为引导HTVIC平稳有序发展与价值创造能力提升制定合作与竞争协同演化的平衡策略。
- 张树臣高长元
- 关键词:高技术虚拟产业集群价值网
- 电机耗铜量的优化研究
- 2015年
- 以电机设计中生产数据为依据,应用电机学、统计学、运筹学,综合研究建立电机优化设计系统解决电机设计中耗铜量的优化问题。影响电机性能的因素较多,由电机设计者的定性分析和统计学中的相关分析,确定主要因素剔除次要因素,用逐步回归分析建立耗铜量与主要变量的非线性统计模型,以此为非线性规划的目标函数,以电机生产的国家标准为约束建立同一中心高、同一冲模使耗铜量最少的非线性规划数学模型,求其最优解,以指导实际生产及电机优化设计,使新电机耗铜量降低9.2%。
- 翟喜成吕宁
- 关键词:电机学统计学运筹学优化设计