翟海军
- 作品数:8 被引量:15H指数:3
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家重点基础研究发展计划中国科学院知识创新工程重要方向项目更多>>
- 相关领域:自动化与计算机技术环境科学与工程更多>>
- 基于转移学习的命名实体挖掘技术被引量:3
- 2011年
- 研究了针对大规模查询日志中丰富的命名实体的挖掘技术,通过利用Wikipedia数据,结合转移学习方法构建目标类别的分类器.该技术很好地利用了监督学习的优越性能以提高查询日志中命名实体挖掘的准确性,同时也解决了监督学习方法中大规模标注的问题.实验结果表明,基于转移学习的命名实体挖掘技术具有优越的命名实体挖掘性能.
- 翟海军郭勇郭嘉丰程学旗
- 基于转移学习的命名实体挖掘技术
- 本文研究了针对大规模查询日志中丰富的命名实体的挖掘技术。已有的研究工作提出了一种基于种子命名实体的弱指导框架,利用实体间的分布相似度来进行挖掘。区别于已有的方法,本文提出了一种新颖的基于转移学习的命名实体挖掘框架,该框架...
- 翟海军郭勇郭嘉丰程学旗
- 文献传递
- 基于转移学习的命名实体挖掘技术
- 本文研究了针对大规模查询日志中丰富的命名实体的挖掘技术。已有的研究工作提出了一种基于种子命名实体的弱指导框架,利用实体间的分布相似度来进行挖掘。区别于已有的方法,本文提出了一种新颖的基于转移学习的命名实体挖掘框架,该框架...
- 翟海军郭勇郭嘉丰程学旗
- 文献传递
- 基于用户查询日志的命名实体挖掘被引量:9
- 2010年
- 针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别。该文通过引入一个弱指导话题模型,利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性。实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法。
- 翟海军郭嘉丰王小磊许洪波
- 关键词:计算机应用中文信息处理
- 分布式信息系统的设计及其在环境动态监测中的应用被引量:3
- 2008年
- 利用ArcIMS客户端与服务器机制、ArcXML语言及面向对象的开发策略,设计可以集成多方面观测信息和遥感信息,并能实现环境监测的分布式信息系统。通过在内蒙古中南部的应用表明,该系统提供了有效集成分布式采集到的环境信息及实时发现典型环境问题的途径。
- 战金艳邓祥征唐华秀翟海军
- 关键词:动态监测信息系统地理信息系统草地退化荒漠化
- 基于线性回归的相关查询推荐
- 2010年
- 在分析搜索引擎查询日志的基础上,提出了一种基于线性回归的相关查询推荐方法。该方法考虑了查询串之间的多种关联关系,包括查询串会话共现、点击页面共享和查询串文本相似性,以避免因直接应用查询串之间的部分关联关系造成易受查询日志中噪音的影响。相比以往的方法,采用线性回归的方法来识别相关查询推荐的有效特征,能更好地解决噪音问题和进行有效的相关查询推荐。实验证实,采用线性回归挖掘的识别中文相关查询串的特征非常有效,且所提出的回归模型的预测准确率优于现有的方法。
- 翟海军张刚张瑾
- 关键词:查询日志
- 面向Web信息检索的知识挖掘
- 随着互联网络的快速发展,搜索引擎成为人们获取日常所需信息的重要工具。目前主流的信息检索系统以传统的关键词匹配技术作为核心,该技术在一定程度上满足了用户的信息需求。但是用户查询通常都很简短,不具备严格语法而且富于歧义,这些...
- 翟海军
- 关键词:信息检索查询分类语义扩展知识挖掘无监督学习
- 文献传递
- 基于用户查询日志的命名实体挖掘
- 本文研究了针对大规模查询日志中丰富的命名实体的挖掘技术。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度来进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,而实际命名实体却往往...
- 翟海军郭嘉丰王小磊许洪波
- 文献传递