湖南省自然科学基金(07555084)
- 作品数:3 被引量:8H指数:2
- 相关作者:杨岳湘苏国荣邓劲生方宏詹恒飞更多>>
- 相关机构:国防科学技术大学更多>>
- 发文基金:广东省科技计划工业攻关项目湖南省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种去除重复URL的算法被引量:5
- 2010年
- 通过对Bloom Filter算法及其改进型在Web信息采集时的去重策略进行分析,结合Dynamic Bloom Filter算法,采用动态数组对集合元素进行表示,提出了一种去重应用策略,实现了对集合中重复URL的频度查询和删除操作支持,最后使用该去重策略进行了实验并和其他策略进行了比较,实验证明该应用策略能够在误判率较低的情况下取得较好的去重效果。
- 苏国荣杨岳湘邓劲生
- 关键词:布隆过滤器散列函数URL网页去重
- 文本提取和相似反馈的互联网图像检索研究被引量:1
- 2011年
- 使用基于文本的互联网图像检索技术是互联网图像检索最实用的方式,也对其他方式的互联网图像检索有重要辅助作用,但如何利用周边文本来对图像进行准确描述一直是一个难题。利用TFIDF为基础提出了一个基于句法和文本重要性分类的图像关键词权重计算方法,并尝试通过图像的相似性因素作为反馈进一步优化搜索结果,为用户返回最贴切的搜索结果。
- 詹恒飞杨岳湘方宏
- 关键词:图像文本提取
- 基于用户行为分析的校园网搜索引擎排序方法被引量:2
- 2010年
- 为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在不降低查全率的情况下,应用该排序方法的查准率有明显提高。
- 杨岳湘苏国荣邓劲生
- 关键词:校园网搜索引擎日志用户行为