杜海洲
- 作品数:1 被引量:6H指数:1
- 供职机构:上海电力学院计算机与信息工程学院更多>>
- 发文基金:上海市教育委员会创新基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于互信息的模糊粗糙分类特征基因快速选取方法被引量:6
- 2013年
- 依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的特征基因的分类精度造成一定影响。因此,曾提出基于互信息的模糊粗糙集基因表达谱数据集特征基因的选取算法。然而,该算法计算代价较高,当所选取的基因数较多时难以实现。为此,对该算法进行了改进,从最大相关性和最重要性(最小冗余)两方面对互信息进行了近似替代计算,大大降低了算法的复杂度,提高了算法的效率。以急性白血病亚型(leukemia)、直肠癌(colon)和乳腺癌(Breast)分类特征基因选取为例进行实验,然后分别采用1NN和SVM分类器进行特征基因分类精度检验,结果证实了新方法的可行性和有效性。
- 徐菲菲魏莱杜海洲王文欢
- 关键词:特征选取模糊粗糙集互信息