丁保淼
- 作品数:5 被引量:15H指数:3
- 供职机构:西华师范大学化学化工学院应用化学研究所更多>>
- 发文基金:四川省自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学天文地球更多>>
- 基于Chernoff距离的GA-PLS法预测蛋白质二级结构研究(英文)
- 2007年
- 提出了用于预测蛋白质二级结构的Chernoff-GA-PLS算法。该方法首先是根据各个氨基酸残基的理化性质等自身所带的信息,计算出各样本到不同类别的Chernoff距离,进而根据Chernoff距离对蛋白质的氨基酸序列数据进行编码。最后由偏最小二乘进行蛋白质二级结构预测,并在整个算法过程中使用GA优化各个运行参数。为解决蛋白质二结构预测中的编码问题,提高预测结果的准确性和鲁棒性提供了一种新的思路。应用本方法对28个蛋白质共5789个氨基酸进行处理,获得的正确预测率达73.47%,研究结果表明,该方法预测结果明显高于目前运用单一方法获得的65%左右的预测准确率。由于该方法的预测误差小,易在Matlab上编程实现,计算过程中的参数意义明确和良好的可解释性,因此具有良好的应用前景。
- 丁保淼张运陶程正军
- 关键词:蛋白质二级结构遗传算法偏最小二乘法
- 应用粗糙集理论分析识别岩石种类的因素被引量:4
- 2005年
- 推导了条件属性子集重要性的等价表示形式,设计出由决策算法正集的补集求解条件属性子集的重要性以及由其正集求取支持度的算法程序,并将其用于对地质中岩石种类识别作因素分析.结果表明设计的算法有效可行.
- 丁保淼张运陶
- 关键词:粗糙集理论岩石属性子集
- RS-GA-SVM方法在真核生物DNA翻译起始位点识别中的应用被引量:4
- 2007年
- 联合运用粗糙集(RS)理论-遗传算法(GA)-支持向量机(SVM)方法研究真核生物翻译起始位点(TIS)的识别。采用RST和GA算法从原始变量中筛选出TIS周围高度保守的位点构成变量集,再采用SVM识别真核生物的TIS。研究处理获得的结果为:采用RS-GA-SVM方法对于真核生物TIS的总识别正确率CP达92.00%,相关系数CO为0.8327;而直接使用SVM方法处理原始变量数据的总识别正确率CP和CO仅为89.87%和0.7885.研究表明,采用RS-GA算法对变量进行筛选,起到了去除冗余信息,提高识别效果的作用,同时也减少了计算工作量。
- 张运陶丁保淼
- 关键词:粗糙集理论支持向量机
- 基于c-均值聚类的粗糙集神经网络在心脏病诊断中的应用被引量:7
- 2007年
- 采用c-均值聚类法将决策表中的连续条件属性进行离散化,用粗糙集处理离散化后的决策表系统得到简化规则,然后将规则集输入BP神经网络进行训练,并对测试集进行预测.以此模型对一组有关心脏病诊断的数据进行处理,得到的预测判准率达85%,而单独使用粗糙集或BPNN进行预测,则判准率分别为76%和82%;若在粗糙集和BPNN联用模型中,对原始数据采用传统的等距离离散化和等频率离散化等离散化方法,预测判准率则分别只有53%和77%.
- 丁保淼张运陶高兴玉
- 关键词:C-均值聚类离散化粗糙集理论心脏病
- RS-GA-KNN算法识别灵长类动物DNA序列剪接位点
- 2006年
- 以灵长类动物DNA序列的剪接位点识别资料为研究对象,将选定样本序列中各碱基编码作为原始变量数据,用粗糙集方法和遗传算法对原始变量数据进行变量筛选,即以粗糙集方法选取的变量为基础,用遗传算法进行变量的二次搜索,从样本序列各碱基中挑选出保守性强的碱基对应的变量构成变量集,采用最近邻聚类识别灵长类动物DNA序列剪接位点类型,总识别准确率达90.66%,明显高于直接使用原始变量数据或将粗糙集理论方法和遗传算法单独用于变量选取的识别结果.
- 张运陶丁保淼黎云祥
- 关键词:粗糙集理论最近邻聚类剪接位点