关慧芬
- 作品数:5 被引量:11H指数:2
- 供职机构:陕西师范大学计算机科学学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 网络爬行技术研究被引量:4
- 2008年
- 阐述了基于整个W eb的爬行器、增量式的爬行器、基于主题的爬行器等不同类型网络爬行器的功能及优缺点;分析了近年来国内外网络爬行器的遍历算法,包括深度优先算法、广度优先算法、主题优先算法等.分析结果表明:基于遗传算法的爬行策略能够有效地加快抓取网页的速度和扩大搜索范围.
- 关慧芬师军马继红
- 关键词:爬行器遗传算法
- 基于遗传算法的主题爬行技术研究被引量:4
- 2008年
- 针对目前主题搜索策略的不足,提出了基于遗传算法的主题爬行策略,提高了链接于内容相似度不高的网页之后的页面被搜索的机会,扩大了相关网页的搜索范围。同时,在网页相关度分析方面,引入了基于本体语义的主题过滤策略。实验结果表明,基于遗传算法的主题爬虫抓取网页中的主题相关网页数量多,在合理选择种子集合时,能够抓取大量的主题相关度高的网页。
- 关慧芬师军马继红
- 关键词:主题爬虫遗传算法主题相关度本体语义
- 基于遗传算法的主题爬行技术研究
- 针对目前主题搜索策略的不足,提出了基于遗传箅法的主题爬行策略,提高了链接于内容相似度不高的网页之后的页面被搜索的机会,扩大了相关网页的搜索范围.同时,在网页相关度分析方面,引入了基于本体语义的主题过滤策略.实验结果表明,...
- 关慧芬师军马继红
- 关键词:主题爬虫主题相关度本体语义主题搜索网页搜索
- 文献传递
- 认知图理论的应用研究被引量:1
- 2008年
- 认知图又称心象图,是近年来研究的热点。它是一种定性推理技术,也可以看作是一种计算智能,能有效地解决基于先验知识的自适应行为。文中对认知图理论作了系统的归纳总结,主要包括古典认知图和模糊认知图两方面,模糊认知图是认知图的延伸与扩展。文中通过对模糊认知图扩展模型的描述以及扩展模型之间优缺点的比较,得出了模糊认知图扩展模型的实用性和优越性。
- 马继红师军关慧芬
- 关键词:模糊认知图
- 基于本体的主题爬虫技术研究被引量:2
- 2009年
- 最好优先搜索算法在主题页面附近搜索时能够表现出良好的性能,但算法只关注能"立即回报"的链接而容易遗失那些有远期价值的链接,导致当搜索位置距离主题团较远时容易迷失搜索方向。在最好优先搜索算法基础上,引入了本体帮助主题爬虫识别那些"未来回报"的链接,对抛弃的主题无关链接再基于领域本体进行一次其他主题相关度的判断实验。实验结果表明,基于本体的主题爬虫能够抓取大量主题相关度高的网页,提高了主题资源覆盖率,有效解决了传统算法无法穿过隧道的问题。
- 关慧芬师军
- 关键词:主题爬虫本体主题相关度