王化琨
- 作品数:18 被引量:24H指数:3
- 供职机构:黑龙江大学数学科学学院更多>>
- 发文基金:黑龙江省教育厅科学技术研究项目黑龙江省高等教育教学改革工程项目黑龙江省研究生创新科研项目更多>>
- 相关领域:理学文化科学经济管理社会学更多>>
- 利用生物学网络识别表型相关基因的统计方法研究
- 2016年
- 在基因网络中,节点(基因)的中心性指标可以用来检测对特定表型具有重要的功能作用的基因。利用基因网络的拓扑结构,提出一种新的节点中心性指标得分来识别表型相关基因,并与常用的网络节点的度方法在识别重要基因等方面进行比较。数据实验结果显示,提出的节点的中心性方法能够更高效地检测具有关键功能的基因。
- 谷芳王志玲王化琨周影马维军
- 关键词:基因网络基因表达
- 数理统计在SARS传染模式分析及经济景气调查中的应用
- 本文由上下两篇组成,上篇是运用数理统计的方法对2003年北京市爆发的“非典”病毒的传播规律进行模拟研究。2003年春夏SARS疾病的病毒肆虐北京,战胜SARS流行以后,我们对于疾病的流行规律进行计算,找到了影响疾病传染的...
- 王化琨
- 关键词:SARSWEIBULL分布计数过程
- 基于生物学通路的差异表达基因检测
- 2014年
- 研究两组与疾病相关的差异通路检测方法。传统的Hotelling’s T2统计量要求样本数大于变量数,但对于基因集分析,样本数普遍小于变量数,结果导致Hotelling’s T2统计量的值不唯一。忽视协方差阵S的非对角线元素,虽然能够解决协方差阵的奇异问题,但也忽略了基因集内部基因的相关性。提出一种修正的Hotelling’s T2统计量,记为RT2统计量,它弥补了上述两种方法的不足。在模拟实验中,以ROC曲线作为评价标准,比较本方法与Hotelling’s T2检验法和对角线的Hotelling’s T2检验法在检验差异通路能力方面的优劣,证实本方法的识别能力更强。
- 吕丹丹王化琨马维军王士模顾贞
- 关键词:通路ROC曲线
- 基于GA-MSA-LSTM模型的苯污染物浓度预测研究
- 2024年
- 提出了一种基于遗传算法优化的多头自注意力-长短期记忆(Genetic algorithm multi-head self-attention long short-term memory,GA-MSA-LSTM)神经网络的预测模型,预测空气中的苯污染物的浓度。将MSA加入LSTM神经网络中,使用遗传算法确定最优的“头”个数、时间步长和隐藏层神经元个数,以期提高苯浓度预测的精确度,优化输出结果。数据实验结果显示,GA-MSA-LSTM模型的预测值较LSTM模型和MSA-LSTM模型,能够更好地反映真实值的变化趋势,在均方根误差(Root mean square error,RMSE)、平均绝对误差(Mean absolute error,MAE)和平均绝对百分比(Mean absolute percentage error,MAPE)3个评价指标上也体现了其优越性,充分说明了该模型的有效性和可行性。研究表明,该模型具有普遍适用性,也可以应用于不同类型的时间序列数据分析。
- 李凤翔王化琨
- 关键词:遗传算法神经网络
- 基于基因表达数据双向聚类算法的研究
- 2016年
- 基因组数据的聚类分析,可以从多个数据集中识别与特定的生物学表型相关联的基因。传统的聚类方法仅进行单向聚类,即仅对基因表达谱的特征(基因)或样本进行聚类,没有考虑基因与样本的关联性。针对基因表达数据提出了一种新的无监督双向聚类算法,同时对基因和样本进行聚类。对已提出的聚类性能评价指标进行了改进,利用改进的指标确定双向聚类算法最优的聚类个数。将该方法分别应用到乳腺癌和青少年类风湿性关节炎基因表达数据中,结果显示,与传统方法相比,本方法具有较好的聚类效果。
- 王志玲王化琨李晓松谷芳周影马维军
- 关键词:基因基因表达数据
- 北京地区2003年SARS传染期问题的分析
- 2006年
- 根据北京市疾病预防控制中心提供的北京市2003年SARS确诊病人的数据,利用参数拟合的方法,对SARS传染期的分布和分期情况进行了分段研究.病人传染期的变化反映了政府或医院对SARS疾病的重视程度.
- 王化琨陈莉莉
- 关键词:传染期WEIBULL分布
- 基于蛋白互作网络识别非小细胞肺癌相关基因功能模块被引量:1
- 2019年
- 本研究对非小细胞肺癌(non-small cell lung carcinoma,NSCLC)基因表达数据进行差异表达分析,并与蛋白质相互作用网络(PPIN)数据进行整合,进一步利用Heinz搜索算法识别NSCLC相关的基因功能模块,并对模块中的基因进行功能(GO term)和通路(KEGG)富集分析,旨在探究肺癌发病分子机制。蛋白互作网络分析得到一个包含96个基因和117个相互作用的功能模块,以及8个对NSCLC的发生和发展起到关键作用候选基因标志物。富集分析结果表明,这些基因主要富集于基因转录催化及染色质调控等生物学过程,并在基础转录因子、黏着连接、细胞周期、Wnt信号通路及HTLV-Ⅰ感染等生物学通路中发挥重要作用。本研究对非小细胞肺癌相关的基因和生物学通路进行预测,可用于肺癌的早期诊断和早期治疗,以降低肺癌死亡率。
- 李晴晴王化琨方羽艺周影
- 关键词:差异表达分析
- 一种基于Waeibull分布的聚类方法在基因表达数据聚类分析中的应用
- 聚类是一种广泛使用的基因表达数据分析技术。目前,大部分聚类方法基于距离分类基因,而很少有聚类方法根据基因表达水平的分布的相似性来分类基因。而且,随着生物学注释资源的积累,越来越多的基因已经被注释到不同的生物学功能类别中。...
- 王化琨
- 关键词:聚类算法基因表达功能注释拟合优度检验
- 基于差异共表达分析的肝癌特异性基因的筛选与验证
- 2021年
- 结合一种新颖的差异共表达分析方法,应用生物信息学工具,在多个肝组织数据集中获取与肝癌相关的基因模块和枢纽基因(Hub gene)。传统的差异表达分析方法只关注平均表达水平的差异,忽略了基因共同表达的信息。与传统差异表达分析方法相比,本方法可以有效地从基因相互作用角度识别出肝癌的关键基因。关键基因主要参与了p53、细胞周期、癌症和Wnt等重要的信号通路,其中HDAC1、APOB、UBE2D1、SOCS1和ELAVL1基因既没有显著的差异表达,也没有参与重要的癌症通路,但经鉴定这些基因与肝癌的发生和发展密切相关。生存曲线分析表明,有7个基因差异表达使得肝癌患者总体生存率显著降低(p<0.01)。这些结果可以作为差异表达分析研究结论的补充,为肝癌的诊断和治疗靶点选择及预后判断提供参考。
- 岳宇巍王化琨
- 关键词:基因网络肝癌
- 基于组织特异性基因集权重的分析方法研究
- 2021年
- 基因集检验是分析高维基因组数据不可或缺的方法之一。虽然许多基因的表达和功能是组织特异性的,但是大多数基因集检验是以不区分组织类型的方式进行的。本文利用来自人类蛋白图谱中的组织特异性基因活性信息计算组织特异性基因的权重,并使用分子签名数据库中过滤后的基因集,生成了组织特异性基因集权重。为了证明这些权重的有效性,使用这些权重对三种疾病的基因表达数据进行了基因集检验,并对检验产生的p值进行加权。通过加权FDR分析发现,使用组织特异性基因集权重的加权方法可以提高基因集检验的统计功效,进而更准确地识别有关高维基因组数据在生物学上的基因集关联信息。
- 田甜王化琨
- 关键词:组织特异性