蒋志鹏 作品数:10 被引量:139 H指数:3 供职机构: 哈尔滨工业大学 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 更多>>
基于CATIA对汽车副车架点焊变形模拟分析 2012年 本文在使用CATIA有限元分析模块模拟焊接夹具实际夹紧动作的基础上,发现了副车架点焊变形产生的原因,为实际生产中解决技术问题提供了理论依据。 丛曰海 蒋志鹏关键词:CATIA 副车架 点焊 汽车 焊接夹具 黑龙江移动客户服务自动问答系统的设计与实现 随着中国移动通信集团黑龙江有限公司用户规模的不断增长、现有业务的不断发展以及新业务的不断推广,广大用户对业务咨询、问题投诉等方面的服务需求也显著增加,导致客户服务的压力随之加大。而同时,一方面静态常问问题集/(FAQ,f... 蒋志鹏关键词:移动通信领域 自动问答系统 相似度计算 文献传递 电子病历命名实体识别和实体关系抽取研究综述 被引量:127 2014年 电子病历(Electronic medical records,EMR)产生于临床治疗过程,其中命名实体和实体关系反映了患者健康状况,包含了大量与患者健康状况密切相关的医疗知识,因而对它们的识别和抽取是信息抽取研究在医疗领域的重要扩展.本文首先讨论了电子病历文本的语言特点和结构特点,然后在梳理了命名实体识别和实体关系抽取研究一般思路的基础上,分析了电子病历命名实体识别、实体修饰识别和实体关系抽取研究的具体任务和对应任务的主要研究方法.本文还介绍了相关的共享评测任务和标注语料库以及医疗领域几个重要的词典和知识库等资源.最后对这一研究领域仍需解决的问题和未来的发展方向作了展望. 杨锦锋 于秋滨 关毅 蒋志鹏关键词:电子病历 命名实体识别 实体关系抽取 中文分词和词性标注联合模型综述 被引量:1 2014年 中文分词和词性标注任务作为中文自然语言处理的初始步骤,已经得到广泛的研究。由于中文句子缺乏词边界,所以中文词性标注往往采用管道模式完成:首先对句子进行分词,然后使用分词阶段的结果进行词性标注。然而管道模式中,分词阶段的错误会传递到词性标注阶段,从而降低词性标注效果。近些年来,中文词性标注方面的研究集中在联合模型。联合模型同时完成句子的分词和词性标注任务,不但可以改善错误传递的问题,并且可以通过使用词性标注信息提高分词精度。联合模型分为基于字模型、基于词模型及混合模型。本文对联合模型的分类、训练算法及训练过程中的问题进行详细的阐述和讨论。 赵芳芳 蒋志鹏 关毅关键词:中文分词 基于中文电子病历的跨科室组块分析 被引量:3 2017年 针对医疗领域的研究,发现了不同科室间电子病历存在着差异,但是新语料的标注成本又非常高。为了解决这一问题,利用迁移学习的方法在中文电子病历中进行跨科室组块分析的研究。在构建的中文电子病历中,对比了SSVM与CRF模型在词性标注和组块分析上的实验结果,发现SSVM模型的效果更好并选择该模型作为基本标注模型;此外,使用了改进的结构对应学习算法(SCL)进行组块分析,使得该算法能适用于SSVM模型进行领域适应。实验结果表明该算法有效地改善了序列标注任务中跨科室的领域适应性问题。 戴雪 蒋志鹏 关毅关键词:词性标注 组块分析 基于多层协同纠错的中文层次句法分析 被引量:3 2014年 层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分析中错误累积问题尤为严重,该文提出了一种简单可行的错误预判及协同纠错算法,跟踪本层预判的错误标注结果进入下一层,利用两层预测分数相结合的方式协同纠错。实验结果表明,加入纠错方法后,层次句法分析在保证解析速度的同时,获得了与主流中文句法分析器相当的解析精度。 蒋志鹏 关毅 董喜双关键词:条件随机域模型 组块分析 中文电子病历的词法和句法分析研究 随着医疗大数据时代的来临,电子病历的知识挖掘和利用受到越来越多的关注。电子病历本身是一种半结构化的数据,其结构化的内容为计算机自动抽取和分析提供了便利,同时,非结构化数据的规模远大于结构化数据,并且蕴藏着丰富的医疗知识和... 蒋志鹏关键词:电子病历 自然语言处理 词性标注 句法分析 面向中文电子病历的词法语料标注研究 被引量:9 2014年 针对中文电子病历(CEMR)标注语料匮乏,目前面向中文电子病历的分词和词性标注研究仍处于空白阶段的实际情况,从中文电子病历语料的构建出发,提出了从数据预处理到语料标注的整体方案,获得了较高的标注一致性,为进行更大规模更高质量的病历语料标注工作提供了指导。通过实验量化中文电子病历与开放领域语料、英文电子病历语料的词法统计差异,系统地分析了通用标注模型在中文电子病历中的错误分布,为进行适用于中文电子病历分析的自然语言处理(NLP)技术研究奠定了基础。 蒋志鹏 赵芳芳 关毅 杨锦锋关键词:词性标注 浅谈工位与物流器具 2011年 本文以辽宁曙光汽车集团股份有限公司车桥事业部的物流器具改造为例。探讨了关于工位和物流器具与生产作业效率.质量和成本等之间的关系,提供从各生产作业功能环节的工位和物流器具的选型方案。 蒋志鹏关键词:物流 工位 股份 面向中文电子病历的句法分析融合模型 被引量:4 2019年 完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病历模式化强的子语言特征,首次以树片段形式化中文电子病历复用的模式,提出了面向数据句法分析(Dataoriented parsing, DOP)和层次句法分析融合模型.在树片段抽取阶段,提出效率更高的标准树片段和局部树片段抽取算法,分别解决了标准树片段的重复比对问题,以及二次树核(Quadratic tree kernel, QTK)的效率低下问题,获得了标准树片段集和局部树片段集.基于上述两个树片段集,提出词汇和词性混合匹配策略和最大化树片段组合算法改进面向数据句法分析模型,缓解了无效树片段带来的噪声.实验结果表明,该融合模型能够有效改善中文电子病历句法分析效果,基于少量标注语料F1值能够达到目前最高的80.87%,并且在跨科室句法分析上超过Stanford parser和Berkeley parser 2%以上. 蒋志鹏 关毅