搜索到433篇“ WEB信息检索“的相关文章
- 多模态Web信息检索静态排序学习方法、系统、设备及介质
- 本发明公开了一种多模态Web信息检索静态排序学习方法、系统、设备及介质,方法包括获取目标网页的网页截图与网页信息并基于截图与信息得到网页文本信息、HTML文本、HTML标签以及网页统计特征信息;分别对网页文本信息、HTM...
- 耿光刚黄衍铭张继连冯丙文刘志全
- 研谈数据挖掘技术在Web信息检索中的应用被引量:1
- 2019年
- 信息技术在近些年来取得了非常迅速的发展,在大众的日常生活中随处都能看到信息技术的应用。另外随着目前计算机的普及,现在的一大社会现状就是数据相当丰富,但是信息就是另一个极端,这种矛盾也会随时间延续为大众的生活带来困扰。数据挖掘技术也就是在这种情况下诞生的一种由多个学科共同组成的一种新技术,它的应用范围将会很广并且产生相当大的影响。与此同时,数据在每时每分都在大量的不断地产生,这无疑也会对这一新技术带来一定的挑战。本篇文章则是对于数据挖掘技术在Web信息检索当中的应用进行了一定的探索,希望能够具有一定的研究价值。
- 段蔓李智峰
- 关键词:数据挖掘WEB信息检索
- 基于时态语义的Web信息检索实践进展与研究综述被引量:11
- 2018年
- 基于时态语义的Web信息检索在动态时间信息挖掘、群体记忆、时间问答系统等检索情景中具有相对广泛的应用。在大数据和人工智能迅猛发展的大趋势下,对基于时态语义的Web信息检索从关键技术的角度进行系统而全面的综述,不仅有利于了解该领域研究的整体状况,而且有益于把握时态检索的未来发展趋势。本文在引入文本时间信息的抽取和标注并融合时间信息的检索模型的基础上,以时态语义的技术为整体脉络,从三个方面综述研究情况:信息需求中隐含的时间意图分析,加入时间因素的检索模型构建,时间对提升检索结果的生成。以时态语义检索的本源问题和其在学术文献上的相关应用为切入点,提出时态语义检索未来的发展趋势:识别多源异构信息下的时间表达,构建能识别查询的时间预测模型,搭建能精准检索时间意图的检索平台和开发基于深度学习的隐含时间意图自动分类模型。
- 沈思李成名吴鹏
- 关键词:信息检索时态语义时间戳
- Web信息检索技术算法优化
- 2018年
- 文章主要研究Web信息检索技术算法,通过对检索技术算法TF-IDF以及Lucene排序算法的优化,进一步提升检索的效率。
- 李飞龙
- 关键词:中文分词爬虫LUCENEHTMLPARSER
- 一种基于多搜索引擎的Web信息检索方法
- 基于多搜索引擎的Web信息检索方法。该方法利用生产者‑消费者模型,通过网页爬取程序自动将用户输入的文本串提交给多个不同的搜索引擎,然后从各搜索引擎的返回页面抽取出搜索结果并进行合并、去重。在此基础上利用正向最大分词匹配方...
- 李玉坤许文亚
- 文献传递
- Web信息检索模型中的相似度计算方法研究被引量:1
- 2015年
- Web信息检索使人们能够在海量信息中找到所需信息,但由于自然语言多义性和用户检索时检索词的模糊性、不准确性,导致信息检索系统反馈结果往往不能完全满足用户需求。分析信息资源特点及Web信息检索基本原理、相关反馈技术;探讨信息检索模型中的相似度计算方法及查询扩展、检索结果过滤与重排、信息推荐服务、检索技术。
- 康熠华苏贵斌关莹
- 关键词:WEB信息检索相关度计算信息检索模型信息资源
- 云环境下少数民族Web信息检索系统的设计与实现
- 云南是一个少数民族较多的省份,这些少数民族相关的数据资源大多分布在各民族相关网站和民族地区政府网站和地方论坛等上。这些少数民族Web数据资源具有数据冗余、部分数据不确切、有用数据量小、数据结构多样性、网站知名度低而造成信...
- 金学鹏
- 关键词:云计算WEB信息检索本体
- 文献传递
- 基于本体的电子书web信息检索研究
- 随着信息技术的发展,电子图书异军突起,以其独特的优势受到读者的热爱,成为新一代电子新星。用户对电子书的需求不断增加,Internet上的电子书资源也以指数级增长。基于关键词的传统检索工具已经很难满足用户对电子书信息的查询...
- 何艳
- 关键词:本体信息检索信息内容语义相似度
- 文献传递
- 基于Lucene的Web信息检索系统设计与实现被引量:1
- 2014年
- 网络检索工具通常是Web信息检索系统,但是在校园网内部,这种信息检索系统不能有效地检索教师和学生所需要的各种教学资源及学习资源,如html网页、pdf文档、office文档等等。基于Lucene全文检索工具包,能实现校园网内部各种学习资源和教学资源的全文信息检索。
- 潘志文柏灼谢政涂辉邓丹君
- 关键词:LUCENEWEB信息检索
- 一种基于多搜索引擎的Web信息检索方法
- 基于多搜索引擎的Web信息检索方法。该方法利用生产者-消费者模型,通过网页爬取程序自动将用户输入的文本串提交给多个不同的搜索引擎,然后从各搜索引擎的返回页面抽取出搜索结果并进行合并、去重。在此基础上利用正向最大分词匹配方...
- 李玉坤许文亚
- 文献传递
相关作者
- 张敏

- 作品数:365被引量:1,590H指数:22
- 供职机构:清华大学
- 研究主题:信息检索 光纤水听器 搜索引擎 光纤传感器 存储介质
- 马少平

- 作品数:259被引量:1,972H指数:26
- 供职机构:西安工业大学
- 研究主题:搜索引擎 信息检索 用户行为分析 汉字识别 查询
- 张福炎

- 作品数:224被引量:3,119H指数:28
- 供职机构:南京大学
- 研究主题:信息检索 INTERNET 多媒体 WWW 计算机
- 韩亚洪

- 作品数:59被引量:182H指数:8
- 供职机构:天津大学
- 研究主题:图像 卷积神经网络 图像检索技术 训练集 初始化
- 王继成

- 作品数:36被引量:1,736H指数:19
- 供职机构:南京大学
- 研究主题:信息检索 WEB WWW VSM WEB信息检索