国家自然科学基金(60601017)
- 作品数:5 被引量:2H指数:1
- 相关作者:吴晓明刘丽丽王波祁长乐尹瑞更多>>
- 相关机构:西安交通大学咸阳职业技术学院西安交通大学口腔医院更多>>
- 发文基金:国家自然科学基金陕西省卫生厅科学研究基金中央级公益性科研院所基本科研业务费专项更多>>
- 相关领域:生物学医药卫生文化科学更多>>
- DNA保守序列识别算法的并行化和MPI集群环境构建被引量:1
- 2009年
- DNA序列中保守序列的识别需要较大的计算量。开发了一个转录因子结合位点识别的并行算法,能够从多条DNA序列中识别指定长度的序列模式。算法使用概率模型进行序列模式保守性的度量,利用迭代过程实现保守序列的搜索。使用C编程结合MPI消息传递模型开发了相应的程序,并在Windows平台下构建了一个3节点的集群环境,利用20个长度均为200的序列数据集进行测试,实现了模体识别工作,结果表明并行算法使模体识别的效率得到提高。
- 祁长乐吴晓明尹瑞刘丽丽王波
- 关键词:模体识别基因调控转录因子结合位点
- 利用转录因子结合位点的基因调控区序列比较
- 2009年
- 利用DNA中转录因子结合位点分布的序列比较方法对DNA序列进行聚类,并分析基因之间的联系。运用Matlab工具结合TRANSFAC数据库中的数据,对一组基因芯片共调控基因的上游序列进行比较和聚类,获得能够反映基因关系的树状聚类结果,从中确定出具有共同功能特征的基因,揭示了在大骨节病相关的诸多基因中,基因CIDEA、CYP4V2、RHBDD3、ENC1的调控区域有共同序列特征,表达模式和调控机理最为相似。这为更深层次的基因功能分析提供了依据。
- 王冠吴晓明王爽郭雄
- 关键词:转录因子结合位点
- 支持向量机在基因核心启动子识别中的应用研究
- 2016年
- 核心启动子是DNA转录起始位上游一段可以与引发转录但又不被转录的关键序列。目前启动子预测已经有许多的研究,但预测的准确程度仍有待提高。支持向量机是主要用于分类的一种机器学习方法,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。本研究采用支持向量机的机器学习方法,以多聚体词频统计和核酸序列正交编码两种特征提取方式,使用公共数据库提供的测试数据,对若干包括启动子和非启动子的大量核酸样本序列进行启动子识别和10折的交叉校验研究,发现核酸序列正交编码方式预测的准确率优于多聚体方式,而支持向量机的四种核函数中RBF核函数预测的准确性最高。研究还发现采用不同的序列长度(起始从-249到-100),预测准确度都接近,反映启动子与非启动子的核酸序列模式差异主要位于转录起始位上游-100到下游+50这段区间内,启动子序列中碱基G和C出现的频率显著性高于A和T,而非启动子正好相反。
- 李宏彬赫光中吴晓明
- 关键词:核心启动子支持向量机
- 高通量测序及读序映射算法的应用
- 2011年
- 免疫共沉淀-DNA高通量测序二者的结合是研究蛋白质与基因组DNA相互作用及组蛋白修饰的新实验工具,它同时也对短DNA读序在基因组上的映射、映射结果比较提出了新的算法需求。本文介绍新一代测序原理及数据的特点、相关的读序映射算法的基本原理及对应软件,并说明了该方法在组蛋白修饰、转录因子结合位点分析中的应用。
- 李慧丽何风杨航郑焱吴晓明
- 关键词:CHIP-SEQ基因组
- 生物数据库中关键信息的摘要提取和信息检索
- 分析了大量生物数据资源对生物学信息理解所带来的困难,提出了利用Web Service技术,结合数据库编程,构建生物数据库条目核心信息检索功能的方案。主要内容包括原始数据库的移植、关键信息提取和摘要、信息检索功能的实现。该...
- 吴晓明杜建强张虎勤王波
- 关键词:生物数据库信息检索服务核心信息
- 文献传递
- 利用组件技术增强网络课件交互功能的探索——生物信息学算法示教的实现被引量:1
- 2009年
- 介绍了多媒体网络课件中的交互式技术,提出利用网络组件,通过Web浏览器运行Linux平台生物信息软件,并实现网络课件中交互功能的方案。基于这一方案,开发了生物信息学网络课件的部分内容,构建了Blast、Emboss等常见生物信息学算法和软件的运行环境,实现了网络环境下生物信息学算法教学的实践环节。
- 吴晓明杜建强刘丽丽王旭祁长乐张虎勤王波
- 关键词:网络课件生物信息学交互操作LINUX