邹权
- 作品数:47 被引量:312H指数:9
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金福建省自然科学基金黑龙江省杰出青年科学基金更多>>
- 相关领域:自动化与计算机技术生物学医药卫生农业科学更多>>
- 基于视图树的实视图动态选择
- 为用户缓存实视图可以有效提高其OLAP查询的性能。但是,已有的缓存管理策略由于没有考虑用户在进行OLAP分析时的数据访问特性,在处理实视图动态选择问题时无法获得好的性能。提出了视图路径和视图树的概念,并以视图树作为客户端...
- 林子雨邹权林琛赖永炫郑炜
- 关键词:数据仓库联机分析处理多维数据缓存
- 文献传递网络资源链接
- 融入时间关联因子曲线拟合的交通流异常挖掘方法被引量:4
- 2013年
- 分析了智能交通系统(ITS)的特征使得获取交通流信息的质量和准确性难以保证,且ITS的分析和预测与数据的存在时间远近关联的紧密性。如果不考虑时间关联,将这些含有噪声、冗余、错误或不一致源信息应用到以参数驱动的预测模型,就无法得到全面的分析和精确的预测。研究了引入时间关联因子的曲线拟合对交通流源数据进行预处理和异常检测并解决时间关联性问题。基于ITS已有的流量—时间比例曲线模型,运用最小二乘法曲线拟合原理,提出了一种加入时间关联因子曲线拟合的交通流异常挖掘方法,并运用分箱思想设定交通系统动态正常数据范围,从而在曲线拟合的基础上剔除异常数据,最后用实例验证了拟合效果及该方法对异常交通流数据的有效识别。
- 陈珂邹权
- 关键词:交通流数据异常检测
- Linux下高效的C/S模式文件传输方法研究
- 目前在Linux环境下局域网一对多的文件传输问题尚没有有效地解决。本文利用Socket编程实现客户端/服务器模式的文件传输,开发了多客户、多文件同时传输以及支持断点续传的高效传输软件与方法,其中重点解决了多线程并发,断点...
- 李旭斌戴平阳王其聪邹权
- 关键词:SOCKET多线程线程池断点续传缓冲队列
- 文献传递
- 基于多层的基因图谱特征基因选择方法研究
- 本文提出一种多层的特征基因选择方法,用于从癌症患者及正常人的基因表达谱中提取癌症相关的致病基因。通过初筛选、分组筛选和组合选择三步,并结合联合统计检验、遗传算法、K近邻算法等分类方法,挑出对分类影响最重要的特征基因,结肠...
- 黄瑞雪林舒杨吴迪炜曲延云邹权
- 关键词:遗传算法K近邻算法基因表达谱
- 文献传递
- 基于Map Reduce的多序列星比对方法在肿瘤研究中的应用被引量:1
- 2016年
- 序列比对是生物信息学的基础,通过多条序列比对可以挖掘出生物序列中的各种重要信息。大规模的基因序列比对方法对运算能力要求较高,基于Map Reduce框架的多序列比对方法在多序列星比对算法的基础上利用分布式并行计算来处理大规模数据。实验结果表明:相对于单机处理方法,基于Map Reduce的序列比对方法可以更快速地处理大规模数据,并且具有良好的硬件扩展性。本文探讨了多序列比对在肿瘤研究方面的应用前景。
- 李大鹏鞠颖邹权
- 关键词:生物信息学多序列比对并行计算癌症
- 基于集成学习和分层结构的多分类算法被引量:9
- 2015年
- 分类是数据挖掘、模式识别等领域的重要研究内容.文中提出基于集成学习和分层结构的多分类算法.首先依据问题的类别层分解问题,定义层次分类器的分层结构,然后在分层结构的基础上通过集成学习方法集成多个弱分类器以构成分类过程.在CCDM 2014数据挖掘竞赛中,文中算法在平均精度和F1-score等多项指标上均取得最高成绩,证明该算法在分类问题上的可行性.
- 邹权宋莉陈文强曾建沧林琛
- 一种基于关键字树的DNA数据库搜索算法
- 2009年
- 针对BLAST等软件在生物数据库中搜索DNA分子序列时,不能兼顾时间开销和搜索敏感性的问题,提出一种基于关键字树的多种子搜索算法。首先将查询序列分割成多个种子并将它们构建成一棵关键字树;然后利用Aho-Corasick算法在数据库中搜索,找到每个种子的所有完全匹配;最后检查种子匹配密度大的区域,确定其是否是查询序列的近似出现。实验表明算法兼顾了时间开销和搜索的敏感性,而且能发现基因序列中的移位现象.
- 邹权郭茂祖刘扬王春宇
- 关键词:种子
- 基于线粒体SNP的疾病人群分类方法研究
- 本文提出了一种基于线粒体SNP位点分析的疾病人群分类方法。采用基于关键字树的多序列比对算法将线柱体DNA对齐,通过卡方统计量和信息含量差值筛选获取与疾病关联的显著性线粒体SNP位点集合作为分类特征,使用k*算法生成有效分...
- 王峻郭茂祖邹权
- 关键词:线粒体疾病人群基因组序列帕金森症
- 文献传递
- 一种适合大豆MicroRNA鉴定的RT-PCR方法被引量:3
- 2009年
- MicroRNAs(miRNAs)是一类调控真核基因转录后表达的非编码小分子RNA。绝大多数miRNAs由计算机预测得到,其存在与否及时空分布还不清楚。因此建立高效、敏感和特异的检测方法,是探明miRNAs在多种组织中时空调控的基础和前提。研究以Lau等和Shi等的方法为基础设计方案,采用通用反转录引物,以大豆幼叶、老叶、根、茎组织为研究材料,对预测的、且Sanger Institute公布的miR156a进行扩增以检测扩增效率和准确性。经比较,该方法具有反转录引物通用、成本低,操作简单,可快速、敏感、高通量地同时比较一种组织中多个miRNAs,也可比较多个组织中miRNA;且该方法比Northern Blot和Microarray需要的RNA量少得多。
- 刘永鑫韩英鹏常玮邹权郭茂祖李文滨
- 关键词:大豆MICRORNA
- 基于替换概率的闪存数据库缓冲区替换算法被引量:12
- 2013年
- 闪存具有和传统磁盘不同的特性,包括写前擦除、异地更新、读写延迟非对称等.传统的面向磁盘的缓冲区替换算法无法在闪存数据库系统中获得较好的性能.文中提出了一种新的面向闪存数据库的缓冲区替换算法——APB-LRU,其特点:(1)该算法将缓冲区分为冷区和热区,用来捕获数据访问频度,前者用于存放只访问过一次的数据页,后者用于存放至少访问过两次的数据页;(2)采用了其它研究所没有的概率替换机制,即以较大的概率替换冷区中的干净页,以较小的概率替换冷区中的脏页,从而避免了冷脏页长期驻留缓冲区的情况,提高了命中率,获得了较好的整体性能;(3)设计了冷、热区比例动态变化机制,可以根据工作负载的变化动态调整冷、热区所占缓冲区的比例,从而使得替换算法在不同的负载模式下都可以取得较好的性能.基于不同测试数据集的大量实验结果表明,APB-LRU算法具有比其它已有的算法更好的性能.
- 林子雨赖明星邹权薛永生杨思颖
- 关键词:闪存数据库