上海市科学技术委员会基础研究重点项目(08JC1405100)
- 作品数:1 被引量:5H指数:1
- 相关作者:贺佳高青斌吴骋金志超陆健更多>>
- 相关机构:第二军医大学更多>>
- 发文基金:上海市科学技术委员会基础研究重点项目国家自然科学基金更多>>
- 相关领域:医药卫生更多>>
- 两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类的比较研究被引量:5
- 2009年
- 目的比较两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类分析的效果,比较不同差异基因选取方法对分类结果的影响。方法利用NCI60等4个肿瘤基因表达数据库,通过4种不同方法选取差异表达基因,在此基础上,用两种基于偏最小二乘的方法行多分类分析。一是偏最小二乘线性判别,首先运用偏最小二乘法行降维,再利用降维得到的成分作为输入变量作线性判别分析;二是偏最小二乘判别分析,利用偏最小二乘回归直接进行分类。分类效果采用留一法和10倍交叉验证法进行评价。结果偏最小二乘判别分析的分类效果略优于偏最小二乘降维后的线性判别。以变量重要性指标选取差异表达基因时分类效果较好,其次是SAM法。结论在对肿瘤基因表达数据行多分类分析时,偏最小二乘法既是一种高效的降维方法,也是一种实用的分类方法。
- 金志超陆健吴骋高青斌孙亚林贺佳
- 关键词:偏最小二乘法