李恒训
- 作品数:16 被引量:76H指数:3
- 供职机构:公安部第一研究所更多>>
- 发文基金:国家高技术研究发展计划国家重点基础研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术政治法律文化科学电子电信更多>>
- 基于主题词的网络热点话题发现
- 网络话题层出不穷,往往会引发重大舆情危机,如何快速高效的从海量信息中发现热点是一重大挑战.本文提出了一种基于主题词的网络热点话题发现算法。其基本思想为:首先综合主题词表和有意义串识别结果生成主题词候选集;然后对候选集进行...
- 李恒训张华平秦鹏于满泉刘金刚
- 关键词:信息检索主题词提取聚类分析
- 文献传递
- 基于FPGA的物联网安全接入网关设计与实现被引量:2
- 2013年
- 针对物联网感知网络与核心网络之间进行数据交换过程中,存在的安全威胁,文章研究设计了基于FPGA卡的物联网安全接入网关,保障不同安全级别的感知网络与核心网络在网络隔离的情况下,实现数据的安全交换。
- 李锁雷苏烈华李恒训
- 关键词:物联网FPGA网络隔离数据交换
- 基于关键词提取的搜索结果聚类研究
- 信息检索的结果往往庞杂,缺乏有效地加工整理,对搜索结果进行聚类是一种普遍的需求,而传统的文本聚类方法不能提供有效的类别标签,且速度较慢,不适用于在线搜索结果的聚类。本文针对性地提出了基于关键词提取的搜索结果聚类算法,工本...
- 秦鹏李恒训张华平刘金刚
- 关键词:关键词提取搜索结果聚类信息检索
- 文献传递
- WWW论坛采集关键技术研究被引量:1
- 2010年
- 论坛是互联网中最活跃的部分,蕴涵着丰富的信息。论坛采集是对论坛信息检索和挖掘的重要基础,然而传统的广度优先算法不能有效的获取论坛信息。针对论坛的深层链接、存在大量功能链接和无效链接及内容重复链接等特点,本文提出了一种论坛采集算法,能有效的解决以上难题。经过实验表明,论坛采集的覆盖率和有效率明显优于传统算法,并且应用在中科院计算所舆情监测平台上取得了良好的效果。
- 李恒训张华平刘金刚
- 关键词:信息检索舆情监测
- 基于网证的“防疫健康信息码”应用研究被引量:3
- 2020年
- 为解决各地区健康码标准不统一、数据不共享、缺乏互认机制等问题,公安部第一研究所依托"互联网+"可信身份认证平台(简称CTID平台)的实名认证能力,利用在网证安全二维码的成熟技术积累,设计了一种健康码解决方案,并在国家政务服务平台中进行应用,在全国健康码互信互认中取得了良好实践效果,为有效防控疫情风险,助力企业有序复工复产,保障人民群众有序流动提供了强有力支撑.
- 国伟李恒训李恒训郝久月
- 关键词:二维码
- 网络论坛采集及热点话题发现研究
- 近年来,互联网蓬勃发展,已经成为人们生活中不可或缺的一部分。其中网络论坛由于其富于交互性、即时性、开放性的特点,逐渐吸引了大量网络用户,已经成为互联网的重要组成部分。论坛是人们发布和获取信息的必要途径和重要手段,在生活、...
- 李恒训
- 文献传递
- 基于时空折中算法的密码分析系统设计与实现被引量:1
- 2013年
- 通过分布式系统能够提高生成查询表的速度和用彩虹表解密密码时的速度。文章通过研究彩虹表的原理,全面认识彩虹表的生成和应用,设计了一个分布式系统,使其能够通过多个节点产生彩虹表,及利用彩虹表解密多种加密算法。
- 苏烈华李恒训李锁雷
- 关键词:彩虹表密码分析HADOOP
- Tag-TextRank:一种基于Tag的网页关键词抽取方法
- 关键词抽取是从文本中抽取代表性关键词的过程,在文本处理领域中具有重要的应用价值。本文尝试利用一种近年来受到广泛关注的新的信息源--社会化标签(Tag)来提高网页关键词抽取的质量。在对Tag数据进行统计分析的基础上,提出了...
- 李鹏王斌石志伟崔雅超李恒训
- 关键词:社会化标签关键词抽取
- 文献传递
- 基于结构驱动的网络论坛采集路径研究被引量:1
- 2011年
- 网络论坛中蕴涵着大量具有实用价值和商业价值的信息,是搜索引擎和问答系统信息的重要来源。针对论坛结构复杂、链接种类繁多,以及容易陷入采集陷阱等问题,提出了一种基于结构驱动的采集路径选择方法。首先根据用户标注的少量类型数据,利用DOM树对采样网页基于网页结构进行结构聚类;其次根据各节点的评价进行采集路径选择;最后对翻页链接进行有效的识别和处理。实验表明,该方法采集的覆盖率和有效率明显优于传统算法,并且应用在中国科学院计算所舆情监测平台上取得了良好的效果。
- 李恒训李南波邱泳钦徐燕刘金刚
- 关键词:信息检索聚类
- Tag-TextRank:一种基于Tag的网页关键词抽取方法被引量:57
- 2012年
- 关键词抽取是从文本中抽取代表性关键词的过程,在文本处理领域中具有重要的应用价值.利用一种近年来受到广泛关注的新的信息源——社会化标签(tag)——来提高网页关键词抽取的质量.通过对Tag数据进行统计分析,发现用户往往对多个在话题上相关的网页使用同样的标签词,一个特定的文档可以通过其标注信息找到相关文档.在此基础上,提出了利用Tag进行关键词抽取的框架,并给出了一种具体的实现方法Tag-TextRank.该方法在TextRank基础上,通过目标文档中的每个Tag引入相关文档来估计词项图的边权重并计算得到词项的重要度,最后将不同Tag下的词项权重计算结果进行融合.在公开语料上的实验表明,Tag-TextRank在各项评价指标上均优于经典的关键词抽取方法TextRank,并具有很好的推广性.
- 李鹏王斌石志伟崔雅超李恒训
- 关键词:社会化标注关键词抽取