您的位置: 专家智库 > >

国家科技支撑计划(2012BAH39B04)

作品数:16 被引量:354H指数:5
相关作者:程学旗许洪波贾岩涛靳小龙易绵竹更多>>
相关机构:中国科学院中国科学院大学解放军外国语学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 16篇中文期刊文章

领域

  • 16篇自动化与计算...

主题

  • 5篇网络
  • 3篇对齐
  • 3篇语言
  • 3篇知识
  • 3篇知识网
  • 3篇知识网络
  • 3篇查询
  • 3篇超图
  • 3篇大数据
  • 2篇动态知识
  • 2篇语料
  • 2篇拓扑
  • 2篇相似度
  • 2篇跨语言
  • 2篇抽取
  • 2篇词对齐
  • 2篇APACHE
  • 1篇度数
  • 1篇短语
  • 1篇短语抽取

机构

  • 13篇中国科学院
  • 7篇中国科学院大...
  • 3篇解放军外国语...
  • 2篇解放军信息工...
  • 2篇石河子大学
  • 2篇中国人民解放...
  • 1篇国家互联网应...

作者

  • 9篇程学旗
  • 6篇许洪波
  • 4篇贾岩涛
  • 3篇靳小龙
  • 3篇易绵竹
  • 3篇梁英
  • 2篇刘剑
  • 2篇席耀一
  • 2篇张铁赢
  • 2篇王元卓
  • 2篇黄硕
  • 2篇刘雅辉
  • 2篇赵晓峰
  • 2篇唐亮
  • 1篇熊锦华
  • 1篇赵岭
  • 1篇谭松波
  • 1篇沈华伟
  • 1篇刘悦
  • 1篇郭岩

传媒

  • 5篇计算机研究与...
  • 4篇山东大学学报...
  • 3篇中文信息学报
  • 1篇电信科学
  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇软件学报

年份

  • 1篇2018
  • 1篇2017
  • 4篇2016
  • 3篇2015
  • 6篇2014
  • 1篇2013
16 条 记 录,以下是 1-10
排序方式:
一种短正文网页的正文自动化抽取方法被引量:2
2016年
随着互联网的发展,网页形式日趋多变。短正文网页日益增多,传统的网页正文自动化抽取方式对短正文网页抽取效果较差。针对以上问题,该文提出一种单记录(新闻、博客等)、短正文网页的正文自动化抽取方法,在该方法中,首先利用短正文网页分类算法对网页进行分类,然后针对短正文网页,使用基于页面深度以及文本密度的正文抽取算法抽取正文。
郗家贞郭岩黎强赵岭刘悦俞晓明程学旗
关键词:正文抽取
一种面向图数据的预装载缓存策略
2016年
真实世界中存在很多数据规模大且关联性强的图数据,而图缓存技术可有效提高对图数据的访问效率和查询效率。为此,提出一种面向大规模图数据的预装载缓存策略。采用基于节点访问日志和大度数优先2种装载方法,利用图数据访问的局部性特点缓存频繁访问的数据。在图存储系统GolaxyGDB中设计一个分布式图数据缓存框架,并描述其中图缓存策略的实现过程。实验结果表明,该策略能有效提高图数据复杂查询的命中率,降低响应时间,满足实际应用中的在线访问需求。
左遥梁英许洪波黄硕
关键词:访问日志APACHE分布式缓存
社交网络账号的马甲关系辨识方法被引量:3
2014年
正确辨识网络账号的马甲关系,能够维护网络环境的安全与和谐,抑制网络中不法行为和虚假信息。基于文本挖掘的作者身份识别一直受到广泛关注,但对社交网络中文本作者关系鉴别的研究较少,该文提出了一种社交网络账号的马甲识别方法,基于网络语言的风格和账号关系,分别提取网络文本特征和账号之间的回复关系频次两组特征构成特征集合,同时基于账号组合构建训练样本向量空间,鉴别网络账号的马甲关系。结合论坛数据对所提方法进行了实验验证,准确率达到80%,结果表明该方法具有较高的马甲辨别准确率。
樊茜许洪波梁英
关键词:语言风格社交网络
融合局部共现和上下文相似度的查询扩展方法被引量:2
2017年
为解决信息检索中用户查询可能与索引文档信息表示不匹配从而影响检索效果的问题,提出一种融合局部共现和上下文相似度的查询扩展方法,从与查询词具有共现关系的邻接词和与查询词具有高相关性或同指关系的词两个方面对用户输入查询词进行扩展,重点测试邻接词的取词窗口大小以及上下文向量的最优长度。试验表明:与采用单一扩展方法相比,融合方法的平均准确率取得了明显提高,当邻接词的窗口大小取5,上下文向量的长度取15时,具有更好的平均准确率。
唐亮赵晓峰席耀一易绵竹
关键词:查询扩展上下文
面向智能搜索的动态知识网络建模被引量:4
2014年
随着互联网数据的爆炸式增长和网民获取信息需求的不断增强,传统的搜索方式在移动搜索领域已经难以满足用户的需求,迫切需要将搜索方式从基于词层面提高到基于语义层面,实现基于语义理解的智能搜索。面向开放的互联网数据资源,提出了"动态知识网络+计算算子"的智能搜索模式。在此基础上,详细阐述了动态知识网络的理论基础、结构模式、系统模型及其特点,并且给出了基于动态知识网络支撑智能搜索的基本结构框架,从而对面向语义理解的智能搜索提供理论和模型支撑。最后,对未来研究过程中面临的主要问题和挑战进行了展望。
刘剑许洪波贾岩涛程学旗
关键词:智能搜索知识网络超图语义理解
图索引技术研究综述
2013年
随着信息技术和网络技术的发展,图作为一种通用的数据结构被用于不同学科建模各种实体以及实体之间的关系。图中各实体间隐藏了很多有价值的信息,为了挖掘图中隐藏的这些信息,图的相关研究成为了各领域的研究热点,但在大多数图研究中最关键的问题是如何有效地进行图查询。在图数据库中存在着两种图数据集:单图和图集。针对单图或图集进行图查询是相当费时的,为了加快图查询速度,图索引成为各种图查询算法的研究重点,而图索引的焦点在于利用图索引的结构模式来最小化搜索空间的大小。本文将图查询归为两种:子图查询和超图查询。在每种查询中,依据图索引建立时选择的图结构特性进行了细分,主要集中于图索引的构建思想,并对典型的索引方法进行了详细的叙述。针对不同的图索引分析了各自的优缺点,并比较了各种索引方法的特点。最后,总结并探讨了图索引的发展趋势。
刘雅辉刘春阳张铁赢程学旗
关键词:子图超图
基于词向量的越汉跨语言事件检索研究被引量:3
2018年
为了解决越汉跨语言事件检索中的查询翻译问题,该文提出了一种基于词向量的越汉跨语言事件检索方法。首先利用词向量构建事件关键词的汉语语义特征向量,然后计算越语的事件关键词的特征翻译向量,最后通过计算语义特征向量之间的相似度完成跨语言关键词对齐,从而实现查询关键词的自动翻译,进而完成跨语言事件检索。在构建的南海话题相关越汉语料库上进行的实验证明了该方法的有效性。
唐亮席耀一彭波刘香伟易绵竹
关键词:跨语言检索
大数据环境下的动态知识网络模型及构建方法被引量:1
2014年
针对语义知识库构建方式和语义表达模型研究中的不足,在已有工作的基础上,提出一种新的语义知识模型:动态知识网络,在详细阐述模型组成要素的基础上,进一步研究了该模型的知识表示方法.在语义知识模型的指导下,面向开放的网络数据资源,研究了动态知识网络的半自动构建方法,并且以360百科和新闻网页数据为基础进行了实验验证,结果表明所提模型和方法能够有效支持动态知识网络的构建.
刘剑许洪波唐慧丰贾岩涛程学旗
关键词:大数据知识网络超图网络百科
基于中文微博语料的情感倾向性分析被引量:11
2014年
微博的兴起与传播使得短文本情感分类成为目前的热门研究领域。通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法。首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩。
罗毅李利谭松波程学旗
关键词:情感分类
基于特征相似度的跨语言事件映射被引量:3
2016年
跨语言事件映射主要研究的是不同语言的事件之间的相似性。针对传统方法仅从文本内容来获取特征词导致准确率不高的问题,提出从文本标题、文本内容以及新词发现三方面综合分析,通过计算候选词的综合权重来得到最终的特征词。实验证明了与传统方法相比,该方法准确性大大提高。
唐亮席耀一赵晓峰易绵竹
关键词:文本聚类
共2页<12>
聚类工具0