于梁梁
- 作品数:4 被引量:0H指数:0
- 供职机构:哈尔滨医科大学生物信息学系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:生物学医药卫生更多>>
- cDNA芯片中重复检测值的处理方法对差异表达基因选择的影响
- 2008年
- 采用六套cDNA数据,两种常用的方法处理表达谱中对应同一条Unigene的多条克隆的表达值,分析对利用SAM和T-test筛选差异基因的影响。结果显示:表达谱中对应同一条Unigene的多个克隆之间的相关性不高,并存在许多负相关;两种处理重复检测值的方法对差异表达基因的选择有很大的影响。
- 吕莹丽于梁梁郭政王栋杨强
- 关键词:差异表达基因基因表达谱
- cDNA芯片重复探针检测值的一致性
- 通过SOURCE数据库对四套cDNA数据的探针进行注释,分析对应同一条Unigene的多个探针的检测值(即重复检测值)之间的相关性。采用两种常规方法处理重复检测值,比较这两种处理方法对筛选差异表达基因的影响。结果显示:U...
- 于梁梁
- 关键词:差异表达基因探针检测值相关系数
- Oligo基因芯片的异常值处理对有监督疾病分类的影响
- 2008年
- 基因芯片实验产生的表达谱数据中存在大量不合格的检测点,对异常值的不同处理,对于有监督疾病分类结果的影响很大。针对此问题,在Oligo芯片数据中,在表达水平层面,通常对检测值做最大值和最小值的预处理后,进行后续分析。本研究选取了四套Oligo芯片数据集,采用不同限定芯片数据中最大值和最小值的方法,考察支持向量机、K近邻、决策树三种分类器对分类疾病样本效能的影响程度。结果显示:Dudoit等限定最大值和最小值分别为16000和100是一种合理的策略,可以达到很好的分类效果。同时发现对于小于100的检测值较多的数据集,采用限定最小值为10的策略同样能得到很好的分类效果,并可以为后续分析保留更多的原始数据。因此,合理限制Oligo芯片中的异常值,对于提高疾病分型是一种较好的策略。进一步采用功能表达谱方法,构造反映功能结点中全部注释基因的总体表达状态的均值或中值指标,利用构建的功能表达谱进行分类分析。发现不同异常值的限定方法对基于功能表达谱进行分类得到的准确率的影响较小,可以获得较稳定的分类结果。
- 吕莹丽王栋郭政于梁梁李彦辉朱晶王晨光
- 关键词:基因表达谱
- cDNA芯片重复探针检测值的一致性分析
- 2009年
- 通过SOURCE数据库对4套cDNA数据的探针进行了注释,分析了对应同一条Unigene的多个探针的检测值(即重复检测值)之间的相关性。采用两种常规方法处理了重复检测值,比较了这两种处理方法对筛选差异表达基因的影响。结果显示:Unigene的重复检测值之间存在一定比例的负相关;更新探针注释数据后的重复检测值之间的低相关比例减少,高相关比例显著提高;重复点样探针之间的相关性高于其它重复检测值,但是仍有很多低相关;两种处理重复检测值方法对于用基因表达差异显著性分析方法(SAM)与T检验方法筛选差异表达基因影响不大。
- 于梁梁王栋吕莹丽肖会杨强王晨光郭政李霞
- 关键词:差异表达基因相关系数探针