张晓艳 作品数:14 被引量:36 H指数:4 供职机构: 同济大学生命科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 上海市卫生局科研基金 更多>> 相关领域: 医药卫生 生物学 自动化与计算机技术 文化科学 更多>>
基于基因表达谱与系统发育树的肿瘤细胞多药耐药性表型预测 2010年 应用基因芯片技术预测抗肿瘤药物多药耐药性(multiple drug resistance,MDR)表型时,探针表达值归一化策略和特征基因集的选取往往是导致实验间结果不一致性的重要原因.从基因芯片数据出发,如何建立一个统计学上稳定的预测模型,已成为MDR表型预测建模研究中迫切需要解决的问题.本研究以多药耐药肿瘤细胞系的基因表达数据为研究对象,将探针表达定性为有无表达(1/0)两种状态,再将其归类到由蛋白质结构域组序(protein domainor ganization,PDO)定义的基因集中.在此基础上,通过引入系统发育学中的基因含量方法(gene content),在PDO基因集水平上建立了系统发育学模型(细胞树),并用于MDR表型的预测.结果显示,肿瘤细胞系的分类主要受细胞病理分型和MDR表型(紫杉醇和长春碱)的影响.系统发育学模型在预测样本的MDR表型方面优于特征基因模型.尽管本文方法的应用受到样本混杂度的限制,但其对于血液系统肿瘤或纯度较高的细胞系仍具有潜在的应用价值. 刘鑫奕 李作峰 文静然 蔡青青 徐烨 张晓艳关键词:基因芯片 系统发育树 肿瘤 多药耐药性 5种药物在中国精神分裂症人群中的有效性与网络meta分析 被引量:3 2015年 目的 以网络meta分析方法综合评价阿立哌唑(Ari)、奥氮平(Ola)、帕利哌酮(Pal)、喹硫平(Que)和利培酮(Ris)5种药物对中国精神分裂症患者的疗效。方法 计算机检索Pub Med、Cochorane Library、中国知网(CNKI)、中文科技期刊数据库、中国学术期刊数据库和中国科学引文数据库,按照入选标准纳入文献,并进行质量评价。在Win BUGS 1.4.3软件中构建贝叶斯网络化模型,用药物的OR值来估计推荐的优先级。结果 纳入的60项临床试验共5 280例患者。网络meta分析显示:相比Pal、Ari、Ola和Ris,Que能显著提高临床有效率,OR值(Pal、Que)=0.415 4(95%CI:0.252 9~0.636 7),OR值(Pal、Ris)=0.674 4(95%CI:0.521 7~0.855 5),OR值(Ari、Que)=0.549 1(95%CI:0.298 8~0.909 6),OR值(Ola、Que)=0.474 6(95%CI:0.280 5~0.755 8),OR值(Que、Ris)=1.694(95%CI:1.115~2.495),差异具有统计学意义。结论 由分析结果可知,尽管Que有较高的推荐等级,但由于纳入的研究较少,其药物有效性还需进一步的证据支持。 顾文洁 张五芳 王超 张晓艳关键词:精神分裂症 贝叶斯模型 基于深度学习的电子病历命名实体识别及其在知识发现中的应用 被引量:8 2018年 通过引入医学文本语言和文档类别特征,构建了一个基于深度学习的电子病历命名实体识别系统。识别的实体包括身体部位、症状和体征、疾病和诊断、检查和检验以及治疗5大类。基于模型识别的结果,将其应用在基于共现的临床知识发现中。命名实体识别系统的准确率为93.29%,召回率为93.53%,F1值为93.41%。医学语言特征的引入能够进一步提高基于深度学习的医学实体识别系统的效果,实体识别的结果可以作为电子病历知识发现的基础。 欧阳恩 李作高 李昱熙 张晓艳关键词:自然语言处理 命名实体识别 知识发现 儿童先天性心脏病超声心动图报告与个体风险的相关性分析 被引量:4 2018年 目的分析儿童先天性心脏病超声心动图检查报告中文字描述信息与临床风险评估结果的相关性,并验证文本挖掘方法在此类分析中的可行性和应用价值。方法回顾性分析1 042例先天性心脏病患儿的彩色超声心动图报告,通过自然语言处理(natural language processing,NLP)技术进行特征提取与筛选,以患儿的风险等级为预测目标,借助机器学习算法构建决策树,推测出临床医师解读心脏超声报告时可能的决策路径。通过50次基于分层抽样的10折交叉验证评价模型的风险等级预测能力,进而评估报告在临床决策中的作用和价值。结果使用自动生成的全部三元语法(3-gram)或基于领域知识筛选后的特征,所训练的风险等级预测模型分别达到32.82%和48.57%的分类准确率,平均绝对误差(normalized mean absolute error,NMAE)分别为0.33和0.25。结论超声心动图报告中的文字部分,尤其是描述疾病征象的常用术语,能够在约75%的水平上反映先天性心脏病患儿的严重程度,为临床医师诊疗决策提供重要依据。 施雅慧 李作峰 常才 张晓艳关键词:超声心动图 先天性心脏病 自然语言处理 儿童 甲状腺癌的术前超声诊断:过度诊断还是诊断不足? 被引量:4 2018年 目的探讨术前超声在甲状腺癌诊断方面的准确性与漏诊率。方法用自然语言识别的方法提取816例术前超声检查发现单发甲状腺结节并接受手术治疗患者的术前超声及术后病理资料,分析超声检查对甲状腺癌的诊断准确性与漏诊率。结果经病理确诊甲状腺恶性肿瘤783例(96.0%),恶性潜能未定的滤泡性肿瘤6例(0.7%),良性27例(3.3%)。超声检查对甲状腺结节良恶性质的预测准确性为%.1%。对甲状腺癌数量的诊断准确性为94.5%。超声发现的单发结节术后证实为2个或者多个恶性结节的比例为5.5%,2.2%的病例术后发现对侧并发恶性结节。对中央区淋巴结的诊断准确性为73.0%,漏诊率为38.7%;对侧颈部淋巴结的诊断准确性为88.3%,漏诊率为3.4%。结论自然语言识别方法可以辅助临床研究。超声检查对甲状腺癌原发灶及颈部淋巴结的诊断具有重要价值,但对结节的数目存在一定的漏诊率,同时超声对中央区和侧颈部淋巴结的检查也存在诊断不足的问题。 李佳伟 欧阳恩 李作峰 周瑾 张凯 张晓艳 常才关键词:超声检查 甲状腺癌 基于人工智能的中文临床试验筛选标准文本分类研究 被引量:4 2021年 受试者招募是影响临床试验进展和结果的关键环节,一般通过筛选标准(包括纳入标准和排除标准)进行招募。筛选标准的语义类别研究可以优化临床试验设计和促进受试者自动筛选系统开发。本文通过学术测评的方式探究了利用人工智能技术对中文临床试验筛选标准语义类别的自动分类问题。本文收集了38341条带语义标注的中文筛选标准文本,并预先定义了44种语义类别。总共有75支队伍报名参加测评,其中27支队伍提交了结果。结果分析发现大部分参赛队伍使用了混合模型,主流的方法是引入能提供丰富语义表示的预训练语言模型,结合神经网络模型,针对分类任务进行微调,最后进行模型集成提高最终性能。研究结果显示,最佳系统的性能达到0.81的宏平均F1值,其主要是使用了基于预训练语言模型——变换器双向编码表征模型(BERT)与模型融合的方法。结果错误分析显示,从数据处理步骤来看,数据的预处理和后处理非常重要;从语料数量来看,数量较少类别的分类效果一般。通过本文研究,最终期望本文研究成果能为中文临床试验筛选标准短文本分类研究领域提供可供研究的数据集和最新结果。 宗辉 张泽宇 杨金璇 雷健波 李作峰 郝天永 张晓艳关键词:文本分类 人工智能 自然语言处理 生物信息专业实践教学体系建设研究与探索 被引量:2 2016年 生物信息专业实践教学是以计算机为载体,收集海量生物数据和生命信息,培养学生综合利用数学、物理和生物等学科的基本原理和生物信息学方法对生命信息收集、加工、储存、传播、分析与解析的能力,进一步巩固理论知识,提高独立思考和解决问题的能力。根据生物信息专业人才培养目标,以培养学生创新能力与实践能力为核心,阐述了如何建立培养可持续发展人才的生物信息专业实践教学体系。实践证明建立高水平的实践教学体系,对深化教学体系的改革起到了良好的示范作用。 刘艳 张晓艳关键词:生物信息 创新与实践能力 实践教学 电子数据获取系统在临床试验中的应用及展望 被引量:2 2010年 临床试验是由人参加或者由人的群体参加的、与健康相关的试验,其目的在于对上市、未上市药物、装置和设备、外科干预及咨询等进行比较测试。临床试验是一个组织错综复杂的系统工程,需要参与试验的各个方面协同合作。在临床试验实施过程中,数据采集和管理是重要环节之一。 文静然 张晓艳结直肠癌伴同时性肝转移的特征性术前临床指标及预测模型 被引量:2 2013年 目的:探讨结直肠癌伴同时性肝转移的特征性临床术前指标,并期基于此些指标建立预测模型。方法:1052例结直肠癌患者中以伴或不伴同时性肝转移为分组,使用信息熵增益方法筛选出特征性术前临床指标,并且使用Logistic回归方法建立预测模型;在150例患者(独立样本)中进行模型测试。结果:筛选出CEA,CA50,CA199,肿瘤部位(结肠/直肠),原发肿瘤最大径为特征性术前临床指标。以术前血清CEA及CA50值建立模型,敏感性0.82,特异性0.7342,准确率0.7423,ROC曲线下面积AUC为0.838;模型测试表现:ROC曲线下面积AUC为0.9046。结论:CEA,CA50,CA199,肿瘤部位(直肠/结肠),原发肿瘤肿瘤最大径等术前临床指标与结直肠癌伴同时性肝转移有关,以术前血清CEA及CA50值建立Logistic回归模型对其诊断有一定的帮助。 刘方奇 文静然 张晓艳 徐烨关键词:CEA CA50 生物信息专业博士研究生课程体系构建的思考 被引量:1 2016年 生物信息专业博士研究生课程体系是培养国家高科技生物技术人才的关键,建立高水平模块化的生物信息专业博士研究生课程体系,对全程保障生命科学创新型高素质人才的培养和深化教学体系的改革有良好的示范作用。本文通过调研美国哈佛大学、斯坦福大学的生物信息专业博士研究生教育情况,结合我国专业课程体系建设的基本原则和同济大学生物信息专业研究生的课程设置实情,探索了如何构建高效的模块化研究生课程结构体系。 刘艳 张晓艳关键词:博士研究生教育 课程体系建设