您的位置: 专家智库 > >

国家自然科学基金(60803093)

作品数:5 被引量:186H指数:5
相关作者:刘挺秦兵车万翔张梅山刘鸿宇更多>>
相关机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 2篇会议论文

领域

  • 7篇自动化与计算...

主题

  • 4篇抽取
  • 2篇对象抽取
  • 2篇评价对象抽取
  • 2篇情感分析
  • 2篇中文
  • 2篇句法
  • 2篇句法分析
  • 1篇信息抽取
  • 1篇信息处理
  • 1篇事件抽取
  • 1篇搜索
  • 1篇中文分词
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇自适
  • 1篇自适应
  • 1篇文本检索
  • 1篇领域自适应
  • 1篇计算机
  • 1篇计算机应用

机构

  • 6篇哈尔滨工业大...

作者

  • 6篇刘挺
  • 4篇秦兵
  • 2篇张梅山
  • 2篇赵妍妍
  • 2篇车万翔
  • 2篇刘鸿宇
  • 1篇邓知龙
  • 1篇丁效
  • 1篇宋凡

传媒

  • 4篇中文信息学报
  • 1篇Tsingh...
  • 1篇第十届全国计...
  • 1篇第五届全国青...

年份

  • 2篇2012
  • 1篇2011
  • 3篇2010
  • 1篇2009
5 条 记 录,以下是 1-7
排序方式:
评价对象抽取及其倾向性分析
情感分析近年来已经成为自然语言处理领域的热点问题,本文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词...
刘鸿宇赵妍妍秦兵刘挺
关键词:情感分析句法分析
文献传递
统计与词典相结合的领域自适应中文分词被引量:45
2012年
基于统计的中文分词方法由于训练语料领域的限制,导致其领域自适应性能力较差。相比分词训练语料,领域词典的获取要容易许多,而且能为分词提供丰富的领域信息。该文通过将词典信息以特征的方式融入到统计分词模型(该文使用CRF统计模型)中来实现领域自适应性。实验表明,这种方法显著提高了统计中文分词的领域自适应能力。当测试领域和训练领域相同时,分词的F-measure值提升了2%;当测试领域和训练领域不同时,分词的F-measure值提升了6%。
张梅山邓知龙车万翔刘挺
关键词:中文分词CRF领域自适应
基于主动学习的中文依存句法分析被引量:10
2012年
目前依存句法分析仍主要采用有指导的机器学习方法,即需要大规模高质量的树库作为训练语料,而现阶段中文依存树库资源相对较少,树库标注又是一件费时费力的工作。面对大量未标注语料,该文将主动学习应用到中文依存句法分析,优先选择句法模型预测不准的实例交由人工标注。该文提出并比较了多种衡量依存句法模型预测可信度的准则。实验表明,一方面,与随机选择标注实例相比,当使用相同数目训练实例时,主动学习使中文依存分析性能最高提升0.8%;另一方面,主动学习使依存分析达到相同准确率时只需标注更少量实例,人工标注量最多可减少30%。
车万翔张梅山刘挺
音乐领域典型事件抽取方法研究被引量:24
2011年
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该文采用了基于最大熵的事件元素识别方法。在该文构建的语料库下,最终事件类型识别的平均F值达到82.82%,事件元素识别的平均F值达到75.79%。
丁效宋凡秦兵刘挺
关键词:事件抽取
Event Type Recognition Based on Trigger Expansion被引量:7
2010年
Event extraction is an important research point in information extraction, which includes two important sub-tasks of event type recognition and event argument recognition. This paper describes a method based on automatic expansion of the event triggers for event type recognition. The event triggers are first extended through a thesaurus to enable the extraction of the candidate events and their candidate types. Then, a binary classification method is used to recognize the candidate event types. This method effectively improves the unbalanced data problem in training models and the data sparseness problem with a small corpus. Evaluations on the ACE2005 dataset give a final F-score of 61.24%, which outperforms traditional methods based on pure machine learning.
秦兵赵妍妍丁效刘挺翟国富
评价对象抽取及其倾向性分析被引量:101
2010年
情感分析近年来已经成为自然语言处理领域的热点问题,该文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词剪枝算法对候选评价对象进行筛选。在倾向性判断阶段,通过分析情感句句型,归纳相应的分析规则,使用无指导的方法完成评价对象在情感句中的倾向性判断。该系统参加了COAE2008任务三的评测,取得了较好成绩。
刘鸿宇赵妍妍秦兵刘挺
关键词:计算机应用中文信息处理情感分析句法分析
面向音乐领域的文本检索与挖掘系统
本文介绍了一个面向音乐领域的文本检索与挖掘系统——八维音乐资讯,主要通过信息抽取技术,对音乐领域的大量半结构化和非结构化的文本进行深层次的挖掘,从中抽取出有价值的信息,转换为结构化数据,目的是为用户提供精准化、全方位的音...
付瑞吉秦兵刘挺
关键词:信息抽取垂直搜索
文献传递
共1页<1>
聚类工具0