您的位置: 专家智库
>
资助详情>
南通大学自然科学基金(11Z010)
南通大学自然科学基金(11Z010)
- 作品数:3 被引量:2H指数:1
- 相关作者:董建成王理张远鹏陈亚兰蒋葵更多>>
- 相关机构:南通大学更多>>
- 发文基金:国家自然科学基金南通大学自然科学基金南通市社会事业科技创新与示范计划项目更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 中文电子病历中否定术语检出方法研究
- 2015年
- 对中文电子病历中的否定术语进行检测,可以为非结构化的电子病历文本的概念索引的建立提供依据。对于电子病历中术语的提取,在经典的正向最大匹配算法的基础上,结合互信息,可以有效地避免覆盖性歧义对提取结果的影响;对于否定语义的确定,在基于规则算法的基础上,结合词共现率模型,有效地降低了由于标点录入错误而出现假阳性术语的概率。通过实验表明,本文提出的方法相对于传统的基于规则的算法,阴性结果的预测值提高了6.85%。
- 张远鹏董建成钱旦敏蒋葵陈亚兰王理
- 关键词:词共现互信息
- 利用领域关联知识从电子病历中抽取检查数据被引量:2
- 2014年
- 病历是患者在医院诊断治疗全过程的原始记录,一般情况下病历包含入院记录、病程记录、检查结果、医嘱、手术记录、护理记录等。目前,电子病历正在逐步替代纸质病历,但是由于临床信息的复杂性和灵活性,仍然有大量以自然语言为载体的叙述性文本存在。传统的信息抽取方法一般包括基于规则与统计的2种方法,而本研究中的信息抽取是一种新的方法,利用医学领域关联知识实现对病历文本中医学检查结果的自动抽取。实验结果表明,利用医学领域关联知识可以提高信息抽取的准确度,并且领域关联知识可以被重复利用,具有很好的分享性。
- 王理张远鹏董建成
- 关键词:电子病历抽取方法临床信息信息抽取
- 基于规则和词共现的中文电子病历否定检出
- 2015年
- 对于中文电子病历文本中的否定术语的检出,目前有很多方法,基于规则的否定检出是比较常用的一种算法。但是该方法无法解决由于标点录入错误造成假阳性的问题。因此,在基于规则算法的基础上,提出一种基于词共现的否定检出算法,通过收集200份中文电子病历约150 865个汉字字符进行实验,新方法的阴性预测值比基于规则的算法提高了7.85%。所以,基于规则和词共现的否定检出算法能够很好地降低由于标点录入错误而出现假阳性术语的概率。
- 张远鹏王理董建成
- 关键词:词共现互信息