魏莎莎 作品数:6 被引量:22 H指数:3 供职机构: 中国计量学院信息工程学院 更多>> 发文基金: 浙江省自然科学基金 国家自然科学基金 浙江省科技厅国际合作项目 更多>> 相关领域: 自动化与计算机技术 电子电信 航空宇航科学技术 更多>>
嵌入代价敏感的极限学习机相异性集成的基因表达数据分类 被引量:7 2014年 极限学习机的相异性集成算法(Dissimilarity Based Ensemble of Extreme Learning Machine,D-ELM)在基因表达数据分类中能够得到较稳定的分类效果,然而这种分类算法是基于分类精度的,当所给样本的误分类代价不相等时,不能直接实现代价敏感分类过程中的最小平均误分类代价的要求。通过在分类过程中引入概率估计以及误分类代价和拒识代价重新构造分类结果,提出了基于相异性集成极限学习机的代价敏感算法(CS-D-ELM)。该算法被运用到基因表达数据集上,得到了较好的分类效果。 安春霖 陆慧娟 魏莎莎 杨小兵关键词:极限学习机 基因表达数据 一种基于互信息最大化的模型无关基因选择方法 被引量:7 2014年 针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高。为了评价算法的性能,采用3个数据集进行了实验,结果表明MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率。MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得出的特征子集可直接用于其他类型的分类器,分类精度较高。 魏莎莎 陆慧娟 安春霖 郑恩辉 金伟关键词:遗传算法 基因选择 基于Fibonacci优化理论的改进ELM分类方法 极限学习机(Extreme Learning Machine,ELM)在大规模基因芯片技术的应用中为基因表达数据的肿瘤诊断提供了新的途径,是交叉科学领域新的突破。针对极限学习机随机确定权值,以及其算法存在大量隐层的神经元... 陆慧娟 魏莎莎 宋夫华 高波涌关键词:极限学习机 基于鱼群优化算法和Cholesky分解的RELM的基因表达数据分类 被引量:3 2014年 提出一种基于鱼群优化算法和Cholesky分解的改进的正则极限学习机算法(FSC-RELM)来对基因表达数据进行分类。FSC-RELM算法中,首先用鱼群优化算法对RELM输入层权值进行优化,其中目标函数定义为误差函数的倒数;再对RELM输出层权值矩阵进行分解,采用Cholesky分解法进行优化,以提高算法速度,减少训练时间。为了评价算法性能,对若干标准基因数据集进行了实验,结果表明,FSC-RELM算法在较短的时间内可以获得较高的分类精度,性能优异。 陆慧娟 魏莎莎 关伟 缪燕子关键词:CHOLESKY分解 基因表达数据 一种Fibonacci优化理论的改进ELM分类方法 被引量:4 2015年 作为一种单隐层前馈神经网络,极限学习机(Extreme Learning Machine:ELM)相比传统神经网络算法具有模型简单、泛化能力好、学习速度快等优点,在大规模基因芯片技术的应用中为基因表达数据的肿瘤诊断提供了新的途径,是交叉科学领域新的突破.针对极限学习机随机确定权值,以及其算法存在大量隐层的神经元个数导致算法性能不稳定、分类精度不理想等问题,采用基于优化理论中的Fibonacci序列对ELM隐层节点与偏置进行改进,提出了一种基于Fibonacci优化理论的ELM分类方法(F-ELM).将改进分类方法应用到Hepatitis和Bridges数据集上,实验结果表明,基于Fibonacci优化理论的ELM分类方法性能得到提升,并相对传统的SVM算法、BP和Bayes算法的分类精度较高. 陆慧娟 魏莎莎 宋夫华 高波涌关键词:极限学习机 基于云平台的互信息最大化特征提取方法研究 被引量:2 2013年 随着大规模基因芯片的应用,针对高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于云平台的互信息最大化特征提取(CMI-Selection)方法。Hadoop云计算平台对基因表达数据划分后进行并行计算,同时结合互信息最大化方法对特征进行提取,实现了云计算平台上的特征过滤模型。实验结果表明,基于云平台的互信息最大化特征提取方法能够在保证较高分类精度的情况下,快速提取特征,节省大量时间资源,是一种高效的基因特征提取系统。 魏莎莎 陆慧娟 金伟 李超关键词:云计算 特征提取