国家高技术研究发展计划(2002AA222052) 作品数:8 被引量:23 H指数:4 相关作者: 郭政 李霞 王海芸 喻辉 李霞 更多>> 相关机构: 哈尔滨医科大学 哈尔滨工业大学 包头医学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 黑龙江省自然科学基金 更多>> 相关领域: 生物学 医药卫生 更多>>
基于基因表达谱的疾病亚型特征基因挖掘方法 被引量:4 2005年 在本研究中,提出了一种基于基因表达谱的疾病亚型特征基因挖掘方法,该方法基于过滤后基因表达谱,融合无监督聚类识别疾病亚型技术和提出的衡量特征基因对疾病亚型鉴别能力的模式质量测度,以嵌入的方式实现特征基因挖掘。最后将提出的方法应用于40例结肠癌组织与22例正常结肠组织中2000个基因的表达谱实验数据,结果显示:提出的方法是一种可行的疾病亚型特征基因挖掘方法,方法的优势在于可并行实现疾病亚型划分和特征基因识别。 徐连彬 王亚东 李霞 杨得印关键词:基因表达谱 特征基因 疾病 基因识别 肠组织 癌组织 基因表达时间延迟调控关系识别软件ITdGR 2005年 基因表达调控网络的深入研究有利于分子药物靶标的发现以及推新药的研发,是未来生物医学研究的重要内容。针对基因表达调控的时间延迟问题,我们初步设计开发了一套基于基因表达谱数据识别基因表达时间延迟调控关系的软件ITdGR(Identification of Time-delayed Gene Regulations)。并已经成功地将该软件应用于酿酒酵母细胞周期的基因表达谱数据中,识别出的调控关系与已有的知识相符。该软件为基因调控网络重构以及基因表达动态研究提供了一个方便和快捷的工具。 姜伟 李霞 郭政 饶绍奇关键词:基因调控网络 决策树 四种模式分类方法应用于基因表达谱分析的比较研究 被引量:4 2005年 利用基因表达谱数据借助于模式分类的方法识别癌症等疾病的类型及不同亚型是DNA芯片技术的一个应用方面。在这篇文章中,我们研究比较了在不同的特征基因选择方法的情况下,Fisher线性判别,Logit非线性判别,最小距离和K-最近邻四种模式分类方法对疾病分型效能的影响及四种模式分类方法的泛化能力,同时研究了在样本构成变化的情况下,模式分类方法的稳定性。结果发现:运用t检验法和分类树选择的特征基因,明显优于随机选择的基因在四种不同的分类器中分类效果;四种分类器中,K最近邻分类器的分类效能最优;基于最小距离的分类器和K最近邻分类器有较强的泛化能力;四种模式分类对样本构成的变化呈较好的稳定性。 王海芸 李霞 郭政 张瑞杰关键词:基因表达谱 癌症 与实验条件相关的基因功能模块聚类分析方法 被引量:5 2004年 针对细胞内基因功能模块化的现象,定义了“基因功能模块”和“特征功能模块”两个概念,并基于这两个概念提出一种“与实验条件相关的基因功能模块聚类算法”。该算法综合利用基因功能知识与基因表达谱信息,将基因聚类为与实验条件相关的基因功能模块。向基因表达谱中加入水平逐渐升高的数据噪音,根据基因功能模块对数据噪音的抵抗力,确定最稳定的基因功能模块,即特征功能模块。加噪音实验显示,在基因芯片技术可能发生的噪音范围内,该算法对噪音的稳健性优于层次聚类和模糊C均值聚类。将模块聚类算法应用在NCI60数据集上,发现了8个与实验条件高度相关的特征功能模块。 喻辉 郭政 李霞 屠康关键词:基因芯片技术 聚类分析 基因表达谱 两种过滤特征基因选择算法的有效性研究 被引量:7 2003年 对基因表达谱进行特征基因选择不仅能改善疾病分类方法的效能,而且为寻找与疾病相关的特征基因提供新的途径.通过比较用调整p值的t检验、非参数评分两种特征基因选择算法后和未进行选择时支持向量机(SVM)分类器的分类性能、支持向量(SV)的吻合度、错分样本ID的吻合度和对样本均匀翻倍后的稳定性.结果发现:特征选择后线性、核函数为二阶多项式和径向基的SVM分类性能明显提高;特征选择前后的SV及错分样本ID的吻合度均较高;SVM的稳定性较好.由此得出结论:这两种特征选择算法具有一定的有效性. 李丽 李霞 郭政 汪强虎 王海芸关键词:特征基因 有效性 支持向量机 DNA芯片技术 同一代谢通路上基因表达相关性分析 被引量:2 2006年 杜磊 李霞 郭政 宫滨生 闻凤霞关键词:代谢通路 基因芯片技术 模式识别方法 疾病状态 生命体系 发育阶段 基于GO与基因表达谱挖掘特征基因功能类 被引量:2 2003年 我们研制了基于Gene Ontology与基因表达谱挖掘与实验条件相关的特征基因功能类的算法OntoFexed,它的特点是分别采用信息增益方法和Rand Index评价单个基因功能类与一组基因功能类鉴别差异表达基因与不差异表达基因的能力。算法的优点是充分利用了GO的结构信息来搜索特征功能类,并能给出各个抽象层次上的特征功能类。我们将OntoFexed应用于腺癌数据集和NCI60数据集,发现OntoFexed确能发掘与实验条件相关的功能类,且算法对主要的参数有较高的稳健性。 喻辉 郭政 李霞关键词:基因表达谱 GENE ONTOLOGY 基因表达谱信息分析软件IDEA与WebGEA 2003年 基因芯片具有高通量快速并行检测基因表达水平的功能,是功能基因组研究的有力工具。针对基因芯片常规的信息分析需要,我们初步设计开发了基因表达谱的信息学分析平台,包括基于单机的软件IDKA(Information Digger for Experiments of microArray)与网络应用程序WebGEA(WEB GeneChip Expression Analysis),分别支持用户运行独立程序与在因特网上提交数据运行服务器程序来完成数据采掘分析任务。该平台得到良好的应用,是解决基因芯片常规的信息分析问题的一个方便工具。 王琦 许杰 郭政 李霞关键词:基因表达谱 数据挖掘 WEB平台