您的位置: 专家智库 > >

朱珊珊

作品数:9 被引量:12H指数:2
供职机构:苏州大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金江苏省高校自然科学研究项目国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇期刊文章
  • 2篇会议论文

领域

  • 8篇自动化与计算...

主题

  • 6篇隐式
  • 6篇篇章
  • 4篇语义
  • 3篇框架语义
  • 2篇篇章分析
  • 2篇半监督学习
  • 2篇TRI-TR...
  • 2篇不平衡数据
  • 1篇修辞
  • 1篇修辞结构
  • 1篇训练样本集
  • 1篇样本集
  • 1篇文本处理
  • 1篇显式
  • 1篇基于语义
  • 1篇TRI
  • 1篇TRAINI...

机构

  • 9篇苏州大学

作者

  • 9篇姚建民
  • 9篇洪宇
  • 9篇朱巧明
  • 9篇朱珊珊
  • 1篇周国栋
  • 1篇车婷婷
  • 1篇徐扬

传媒

  • 4篇中文信息学报
  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇山东大学学报...

年份

  • 2篇2016
  • 6篇2015
  • 1篇2014
9 条 记 录,以下是 1-9
排序方式:
面向不平衡数据的隐式篇章关系分类方法研究被引量:1
2015年
隐式篇章关系分类是篇章分析领域的一个重要研究子任务,大部分已有研究都假设参与分类的正类样本和负类样本数量相等,采用随机欠采样等不平衡数据处理方法保持训练样本中数据平衡,然而,在实际语料中正类样本和负类样本的分布是不平衡的,这一现象往往制约隐式篇章关系分类性能的有效提升。针对该问题,该文提出一种基于框架语义向量的隐式篇章关系分类方法,该方法借助框架语义知识库,将论元表示成框架语义向量,在此基础上,从外部数据资源中挖掘有效的篇章关系样本,对训练样本进行扩展,解决数据不平衡问题。在宾州篇章树库(Penn Discourse Treebank,PDTB)语料上的实验结果表明,相较于目前主流的不平衡数据处理方法,该文方法能够明显提高隐式篇章关系分类性能。
朱珊珊洪宇丁思远姚建民朱巧明
关键词:不平衡数据
基于Tri-Training的事件关系分类方法研究
2015年
事件关系分类是一项研究事件之间存在何种逻辑关系的自然语言处理技术。针对事件关系分类任务中训练语料不足的问题,提出了基于Tri-Training的事件关系分类方法。该方法首先根据已标注的语料训练三个不同的分类器,以多数投票的方式从未标注集中抽取置信度较高的样本对训练集进行扩充,然后利用新的训练集重新训练分类器,反复迭代,不断完善分类模型,最终达到提升事件关系分类性能的目的。实验结果表明,以F1值为评价标准,基于Tri-Training的事件关系分类方法在四大类事件关系上的分类性能为64.36%。
丁思远洪宇朱珊珊姚建民朱巧明
关键词:框架语义半监督学习
基于Tri-Training的事件关系分类方法研究
关系分类是一项研究事件之间存在何种逻辑关系的自然语言处理技术.该文针对事件关系分类任务中训练语料不足的问题,提出了基于Tri-Training的事件关系分类方法.该方法首先根据已标注的语料训练三个不同的分类器,以多数投票...
丁思远洪宇朱珊珊姚建民朱巧明
关键词:文本处理框架语义半监督学习
基于训练样本集扩展的隐式篇章关系分类被引量:3
2016年
隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习各种分类特征,分类精确率仅约为40%。针对这一问题,该文提出一种基于训练样本集扩展的隐式篇章关系分类方法。该方法首先借助论元向量,以原始训练样本集为种子实例,从外部数据资源中挖掘与其在语义以及关系上一致的"平行训练样本集";然后将"平行训练样本集"加入原始训练样本集中,形成扩展的训练样本集;最后基于扩展的训练样本集,实现隐式篇章关系的分类。该文在宾州篇章树库(Penn Discourse Treebank,PDTB)上对扩展的训练样本集进行评测,结果显示,相较于原始训练样本集,使用扩展的训练样本集的实验系统整体性能提升8.41%,在四种篇章关系类别上的平均性能提升5.42%。与现有主流分类方法性能对比,识别精确率提升6.36%。
朱珊珊洪宇丁思远严为绒姚建民朱巧明
关键词:篇章分析
基于语义场景的隐式篇章关系检测方法
2014年
针对篇章隐式关系检测较难的问题,提出了一种基于语义场景匹配的平行推理方法。该方法利用框架语义学,将论元抽象为概念一级的语义描述(简称语义场景),实现描述形式的压缩。基于大规模静态数据,通过语义场景的匹配挖掘可比较论元辅助关系推理。该方法能够在保证检测精度的同时,提升检测效率。利用宾州篇章树库(penn discourse tree bank,PDTB)对这一检测方法进行评测,检测精度为55.26%。
严为绒洪宇朱珊珊车婷婷姚建民朱巧明
基于框架语义的隐式篇章关系推理被引量:2
2015年
篇章关系分析是一种专门针对篇章语义关系及修辞结构进行分析与处理的自然语言理解任务。隐式篇章关系分析是其中重要的研究子任务,要求在显式关联线索缺失的情况下,自动检测特定论元对之间的语义关系类别。目前,隐式篇章关系分析性能较低,主流检测方法的准确率仅约为40%。造成这一现状的主要原因是:现有方法脱离论元的语义框架进行关系分析与检测,仅仅局限于特定论元特征的关联分析。针对这一问题,该文提出一种基于框架语义的隐式篇章关系推理方法,这一方法有效利用了框架语义知识库(即FrameNet)和相关识别技术,实现了论元语义框架的自动识别,并在此基础上,借助大规模文本数据中框架语义关联关系的分布概率,进行论元语义一级的关系判定。实验结果显示,仅仅利用第一层框架语义知识,即可提高隐式篇章关系检测性能至少5.14%;同时,在考虑关系类别平衡性的情况下,这一方法能提高至少10.68%。
严为绒朱珊珊洪宇姚建民朱巧明
关键词:框架语义
基于外联关系的隐式篇章关系推理
2015年
针对隐式篇章关系(implicit discourse relation)分类性能较低的问题,提出一种基于"外联"关系的无监督隐式篇章关系推理方法.该方法继承"显式指导隐式"的关系推理模式,针对每个待测"论元对",在大规模外部数据资源中挖掘与其内容近似的显式"参考对",借助"参考对"的显式关系推理隐式关系.特别地,该方法侧重挖掘2个论元中能够协同触发篇章关系的文字片段(即"外联"成分),以"外联"成分间的关系为参考,推理"论元对"整体的篇章关系.利用宾州篇章树库(Penn discourse treebank,PDTB)对这一推理方法进行评测.实验结果显示,该方法在隐式篇章关系推理性能上获得显著提升,识别精确率达到54.12%,与现有主流推理方法性能对比,识别精确率提升11.82%.
洪宇朱珊珊丁思远姚建民朱巧明周国栋
关键词:篇章分析
篇章关系分析研究综述被引量:6
2016年
篇章关系研究,旨在推断同一篇章内相邻或跨度在一定范围内的文本片段之间的语义连接关系。语义连接关系对篇章内容理解和结构分析都具有重要作用,成为目前篇章分析领域的重点研究内容。该文针对三个中英文篇章关系研究领域的语料库:基于修辞结构理论的篇章树库(Rhetorical Structure Theory Discourse Treebank,RSTDT)、宾州篇章树库(Penn Discourse Treebank,PDTB)和哈尔滨工业大学中文篇章关系语料库(HIT Chinese Discourse Treebank,HIT-CDTB),主要介绍篇章关系分析理论的语料资源与研究背景、标注与评测体系以及国内外研究现状。此外,总结相关工作,指出目前篇章关系,尤其是隐式篇章关系研究的主要难题。
严为绒徐扬朱珊珊洪宇姚建民朱巧明
面向不平衡数据的隐式篇章关系分类方法研究
篇章关系分类是篇章分析领域的一个重要研究子任务,大部分已有研究都假设参与分类的正类样本和负类样本数量相等,采用随机欠采样等不平衡数据处理方法保持训练样本中数据平衡,然而,在实际语料中正类样本和负类样本的分布是不平衡的,这...
朱珊珊洪宇丁思远姚建民朱巧明
关键词:不平衡数据
共1页<1>
聚类工具0