王潇杨
- 作品数:3 被引量:3H指数:1
- 供职机构:东北师范大学更多>>
- 发文基金:“十一五”国家科技支撑计划国家大学生创新性实验计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 基于Map-Reduce的多表连接框架的研究与实现
- 最近几年,随着数据信息量的激增,大数据概念兴起。大数据的处理分析受到了国内外各个研究领域的广泛关注。由于谷歌的成功案例,使得MapReduce框架成为了目前研究和使用最广泛的大数据处理框架,其中Hadoop MapRed...
- 王潇杨
- 关键词:MAP-REDUCE
- 文献传递
- 图片型垃圾邮件过滤分析系统设计和实现被引量:3
- 2011年
- 从垃圾邮件图片的基本特性入手,选取图片的简单属性作为过滤特征对图片型垃圾邮件进行过滤.同时提出边缘灰度点比特征来提高过滤效率,该特征反映了图片中文字信息量的大小;其次,针对特征区间划分的问题,采用K均值实现特征区间的动态划分,得到粗糙特征区间(RFI)和提纯特征区间(PFI);最后,针对PFI提出一套快速判分的过滤机制,同时针对RFI提出一套基于SVM的过滤机制,该过滤机制的准确度可以达到98.396 6%.模型中选取的特征只需一次扫描就可以完成提取,满足了过滤系统时效性上的需求.
- 王潇杨陈南飞张登科王兴伟
- 关键词:邮件过滤
- 图片型垃圾邮件过滤分析系统设计和实现
- 从垃圾邮件图片的基本特性入手,选取图片的简单属性作为过滤特征对图片型垃圾邮件进行过滤.同时提出边缘灰度点比特征来提高过滤效率,该特征反映了图片中文字信息量的大小;其次,针对特征区间划分的问题,采用K均值实现特征区间的动态...
- 王潇杨陈南飞张登科王兴伟
- 关键词:邮件过滤