张瑞杰
- 作品数:33 被引量:86H指数:5
- 供职机构:哈尔滨医科大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省自然科学基金更多>>
- 相关领域:医药卫生生物学自动化与计算机技术文化科学更多>>
- 复杂疾病驱使的融合SDA-SVM集成基因挖掘方法被引量:4
- 2007年
- 提出了一种新颖的复杂疾病驱使的融合SDA-SVM(Stepwise Discriminant Analysis-Support Vector Machine,SDA-SVM)技术的集成基因挖掘方法。该集成方法融合逐步判别分析和支持向量机的优点,能够有效地进行复杂疾病相关基因的深度挖掘,使得挖掘出的基因能够较好地识别疾病类型和亚型。通过将该方法应用于一套弥散性大B细胞淋巴瘤DNA表达谱数据,并与其它基因挖掘方法对比,结果表明该方法挖掘出的基因具有较高的疾病相关性和较强的疾病类型识别能力。
- 杨德印李霞郝大鹏张杰张瑞杰饶绍奇
- 关键词:微阵列基因挖掘支持向量机
- 利用基因表达谱对组织样品分类方法的研究被引量:11
- 2003年
- 目的 探讨在基因表达谱数据分析中用主成分分析方法结合层次聚类法与K -均值聚类方法两种分类方法对组织样品分类的分类效果。方法 用主成分分析方法对数据降维后进行聚类分析 ,与不经主成分分析直接聚类 ,并结合筛选与组织样品分型相关的基因的各种筛选水平 ,评价聚类效果。结果 用约当指数进行评价两种聚类方法 :经主成分分析后用提取的主成分聚类与不用主成分的直接聚类效果不同 ;不同筛选相关基因的筛选水平对聚类效果也有影响。结论 对组织样品做聚类分析时 ,主成分分析能提高聚类质量 。
- 张瑞杰许杰王增权郭政李霞李康
- 关键词:基因表达谱聚类分析主成分分析差异表达基因
- 四种模式分类方法应用于基因表达谱分析的比较研究被引量:4
- 2005年
- 利用基因表达谱数据借助于模式分类的方法识别癌症等疾病的类型及不同亚型是DNA芯片技术的一个应用方面。在这篇文章中,我们研究比较了在不同的特征基因选择方法的情况下,Fisher线性判别,Logit非线性判别,最小距离和K-最近邻四种模式分类方法对疾病分型效能的影响及四种模式分类方法的泛化能力,同时研究了在样本构成变化的情况下,模式分类方法的稳定性。结果发现:运用t检验法和分类树选择的特征基因,明显优于随机选择的基因在四种不同的分类器中分类效果;四种分类器中,K最近邻分类器的分类效能最优;基于最小距离的分类器和K最近邻分类器有较强的泛化能力;四种模式分类对样本构成的变化呈较好的稳定性。
- 王海芸李霞郭政张瑞杰
- 关键词:基因表达谱癌症
- 人肺癌不同转移表型细胞系的转移相关基因的研究
- 2002年
- 李殿俊李波阎承慧吴晓秋郭正李霞张瑞杰付松滨
- 关键词:转移相关基因肺癌基因芯片
- 统计遗传学精品课建设探索与实践被引量:1
- 2010年
- 统计遗传学是生物信息专业的主干课程,同时也是生物信息学的一个重要方向。在生物信息学迅猛发展的今天,统计遗传学精品课程的建设工作尤为重要。在《统计遗传学》精品课建设过程中,我们在师资队伍、教学改革和教材建设、科研教学相结合、突出培养目标、精品课程网络平台建设等几个方面进行了探索与实践,并达到比较好的效果。这对于同领域相关课程的建设具有一定的指导意义。
- 张明明张瑞杰李晋吕洪超
- 关键词:统计遗传学精品课课程建设教学改革
- 结合已有知识体系的酒精中毒相关的SNP单体型及其相关基因挖掘被引量:1
- 2008年
- 高通量的单核苷酸多态(single nucleotide polym orphism,SNP)检测技术与已有的知识体系(如KEGG,GO数据库等)为与疾病相关的SNP单体型及相关基因挖掘提供了有力支撑.本研究对高通量SNP基因型数据,采用4种SNP单体型板块(block)识别方法(置信区间、FGT、连锁不平衡的稳定连接以及单体型板块融合技术),用聚类分析方法验证其效能,通过风险分析方法确定酒精中毒相关的SNP单体型,并基于已有知识体系建立SNP单体型与基因的映射,通过查询NCBI SNP与gene数据库定位SNP单体型板块,确定候选基因,最后结合KEGG,Biocarta及GO数据库进行基因功能注释.在对人类22对常染色体的分析中,寻找到可能与酒精中毒相关的159个单体型板块,包含227个SNP单体型,并预测其中102个SNP单体型可能会增加酒精中毒的发病风险.挖掘得到了121个酒精中毒相关基因,并进一步进行可靠的生物学功能注释验证.结果提示:采用聚类效果验证及风险分析的单体型识别机制,基于单体型的疾病相关基因定位并结合已有知识体系的疾病相关基因挖掘策略,不仅能大大缩减SNP数据挖掘的工作量,实现复杂疾病相关基因的精细定位,而且对于多因素复杂疾病发病机制的探索将更有指导意义.
- 张瑞杰李霞姜永帅刘桂友李传星张帆肖云宫滨生
- 关键词:酒精中毒基因定位
- R语言在生物统计学课程教学中的应用被引量:5
- 2017年
- 生物统计学是生物医学本科各专业的一门基础课程,是学生必须熟练掌握和应用的。然而,由于课时有限且计算复杂,使得学生在学习的过程中难以掌握,降低学习效率,从而失去学习兴趣。为了提高教学效果,培养学习的动手能力,将R语言与生物统计学课程教学相结合,课堂教学与课后实践相结合,提高学生的学习兴趣和动手能力。
- 段炼张瑞杰张明明吕洪超
- 关键词:生物统计学R语言教学
- 多基因复杂疾病基因作图的模式识别方法研究
- 李霞郭政饶绍奇张庆普李晶宫滨生张瑞杰吕飒丽杜磊
- 该项目对复杂疾病相关基因模式识别方法进行了系统研究。将遗传标记作为导致疾病分型的特征,视基因作图为提取疾病特征标记的模式识别问题,提出了同胞对基因连锁分析的模式识别方法。该方法能够较全面地反映多基因互作、基因和环境因素共...
- 关键词:
- 关键词:复杂疾病模式识别
- 向心性肥胖与全身性肥胖关系的研究被引量:2
- 2003年
- 闻凤霞王英张瑞杰高文慧宫滨生
- 关键词:向心性肥胖统计分析流行病学
- 基于SVM的药物靶点预测方法及其应用被引量:2
- 2012年
- 目的:基于已知药物靶点和潜在药物靶点蛋白的一级结构相似性,结合SVM技术研究新的有效的药物靶点预测方法。方法:构造训练样本集,提取蛋白质序列的一级结构特征,进行数据预处理,选择最优核函数,优化参数并进行特征选择,训练最优预测模型,检验模型的预测效果。以G蛋白偶联受体家族的蛋白质为预测集,应用建立的最优分类模型对其进行潜在药物靶点挖掘。结果:基于SVM所建立的最优分类模型预测的平均准确率为81.03%。应用最优分类器对构造的G蛋白预测集进行预测,结果发现预测排位在前20的蛋白质中有多个与疾病相关。特别的,其中有两个G蛋白在治疗靶点数据库(TTD)中显示已作为临床试验的药物靶点。结论:基于SVM和蛋白质序列特征的药物靶点预测方法是有效的,应用该方法预测出的潜在药物靶点能够为发现新的药靶提供参考。
- 尚振伟李晋姜永帅张明明吕洪超张瑞杰