丁长林
- 作品数:4 被引量:14H指数:3
- 供职机构:沈阳航空航天大学更多>>
- 发文基金:国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于有监督学习的医古文叙述性术语语义标注被引量:4
- 2015年
- 对自由文本形式的中医古籍文献(医古文)进行标注,是对其进行深入分析的前提,语义标注技术是实现该目的的方法之一。该文将中医古籍文献中包含的术语分为名称性术语以及叙述性术语。在分析叙述性术语特点的基础上,将对其语义标注转化为基于有监督学习的短句序列标注或分类问题,并提出了名词性术语规约操作以及基于知网的替换操作两种预处理方法。最后该文通过实验对比了三种学习模型及四种特征选择算法,并证明了问题转化的可行性以及两种预处理方法的有效性。
- 丁长林白宇蔡东风
- 关键词:语义标注有监督学习中医古籍文献
- 面向语义检索的中医理论知识库构建方法的研究被引量:6
- 2012年
- 知识资源的建设在语言信息处理中具有重要作用,中医基础理论知识库建设是进行中医文献处理和语义计算的基础工作。该文在分析中医基础理论术语特点的基础上,借鉴HowNet的构建思想,提出一种基于KDML的中医基础理论知识库构建方法。包括知识库构建过程中的义原选择方法及关系获取方法。
- 王莹莹白宇丁长林戴俭宇蔡东风
- 关键词:知识库
- 基于分类算法的专利摘要文本分割技术被引量:3
- 2012年
- 专利摘要是对专利的浓缩表述,将专利摘要按内容分割后,能更准确地定位对应的专利。由于专利摘要长度较短,而且不同内容间没有明显标志,使其分割不能使用传统的文本分割方法。本文将专利摘要的分割问题转化为句子分类问题,并尝试采用分类算法解决该问题。通过分析不同分类算法以及不同特征对本问题的解决效果,最终验证了利用句子分类方法进行专利摘要分割的可行性。
- 丁长林蔡东风王裴岩
- 关键词:文本分割词性
- 中医古籍文献语义标注技术的研究
- 语义标注是一个在领域分类指导下,为文档填加规范化知识表示的过程。表示结果可应用于面向文本的知识挖掘、智能检索等其它深层分析中。中医古籍文献即医古文,是我国中医文化精华的载体,对医古文的分析和处理越来越受广大学者的关注。然...
- 丁长林
- 关键词:语义标注中医古籍文献BOOTSTRAPPING
- 文献传递