苏娜
- 作品数:3 被引量:23H指数:2
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:山西省科技基础条件平台建设计划项目山西省回国留学人员科研经费资助项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于框架的汉语篇章结构生成和篇章关系识别被引量:2
- 2015年
- 针对汉语篇章分析的三个任务:篇章单元切割、篇章结构生成和篇章关系识别,该文提出引入框架语义进行分析研究。首先基于框架构建了汉语篇章连贯性描述体系以及相应语料库;然后抽取句首、依存句法、短语结构、目标词、框架等特征,分别训练基于最大熵的篇章单元间有无关系分类器和篇章关系分类器;最后采用贪婪算法自下向上生成篇章结构树。实验证明,框架语义可以有效切割篇章单元,并且框架特征可以有效提升篇章结构以及篇章关系的识别效果。
- 吕国英苏娜李茹王智强柴清华
- 关键词:篇章结构贪婪算法
- 基于CFN的汉语篇章连贯性研究被引量:4
- 2017年
- 篇章连贯性研究是篇章分析领域的重要课题之一。基于Chinese FrameNet(CFN),该文构建了汉语篇章连贯性描述体系,该描述体系研究了框架语义与篇章单元的关系,探讨了篇章如何通过框架与框架之间的语义关系实现篇章的连贯,为篇章连贯提供了合适的描写机制和计算基础。从《人民日报》选取了160篇文章进行标注实践,在篇章结构和篇章关系两方面均取得了大于0.8的kappa值,验证了描述体系具有较高的人工标注一致性,可作为进一步进行大规模篇章标注语料构建的依据。
- 吕国英苏娜李茹王智强
- 关键词:篇章结构KAPPA值
- 基于汉语篇章框架语义分析的阅读理解问答研究被引量:18
- 2016年
- 答案句检索和答案抽取是阅读理解中的两个核心技术.针对汉语阅读理解,该文提出一种新的基于篇章框架语义分析的答案句检索和答案抽取方法.答案句检索是基于框架相似性、框架关系及篇章框架关系来实现.其中,基于框架相似性的方法是通过计算背景材料与问句之间语义场景(框架)的相似度来进行答案句检索;基于框架关系和篇章框架关系的方法可以从语义相关角度获得与问句语义相关的答案句.在答案抽取时,提出基于框架语义相似性、有定零形式线索及框架关系的答案抽取方法.基于框架语义相似性可以从语义相似的答案句中抽取出充当问句疑问角色的框架元素作为答案;有定零形式线索能够在篇章范围定位答案句中充当答案的缺失语义成分;框架关系则能够通过建立框架元素之间的关系,抽取相关度高的框架元素作为答案.针对15个领域的552个阅读理解问题,该方法在答案句检索时相比传统基于相似度的方法能够获得更好的答案句检索结果;相比基于框架相似性的Baseline实验,加入篇章框架关系、框架关系及有定零形式线索的篇章级框架语义特征,能够获得更优的答案句检索与答案抽取结果.
- 王智强李茹梁吉业张旭华武娟苏娜
- 关键词:社会媒体社交网络自然语言处理