王琳
- 作品数:3 被引量:15H指数:2
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 使用双层分类器在垂直搜索中自动识别交互式查询接口
- 2016年
- 一框式检索功能普遍提供于各类互联网信息门户的首页,由于需要交互式操作以及返回页面仅包含与用户所提交关键字相关的查询结果等原因,较少受到传统搜索引擎的关注.但是在垂直搜索中,若能够有效利用远程服务器自带的站内检索功能,将在显著降低本地计算资源和带宽消耗的同时,提高查全和查准率.提出并实现了一种用于在主题相关的页面采集过程中自动定位交互式查询接口的双层分类器.针对8个不同领域主题的规模化实验显示,该分类器能够准确过滤非相关域名和非可查表单,实现搜索接口的有效识别.
- 王琳王行甫杜云开
- 关键词:垂直搜索HTML解析支持向量分类决策树
- 基于适应性动态步长的变异果蝇优化算法被引量:6
- 2016年
- 针对基本果蝇优化算法(FOA)容易陷入局部最优值、后期收敛速度变慢和收敛精度较低的缺点,提出了一种基于适应性动态步长的变异果蝇优化算法(MFOAADS)。首先,利用佳点集法选取种群初始位置,降低算法初始点选取的随机性和陷入局部最优值的概率;然后,采用适应性动态步长优化策略,提高收敛速度和求解精度;最后,若算法陷入了早熟,则对种群最优个体按一定概率执行柯西变异扰动,赋予其跳出局部最优的能力。经5个经典函数测试表明,固定迭代次数时MFOAADS的收敛精度与收敛速度明显优于FOA;固定目标精度时,MFOAADS相对于FOA平均迭代次数有着大幅下降且成功率达97%以上。实验结果表明,所提算法求解精度、运行效率以及可靠性相对于基本FOA算法都有着显著提高。
- 王行甫陈静王琳
- 关键词:早熟收敛佳点集柯西变异
- 基于余弦相似度和实例加权改进的贝叶斯算法被引量:9
- 2016年
- 面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标.针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法.算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类.基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率.
- 王行甫付欢欢王琳
- 关键词:朴素贝叶斯余弦相似度文本分类