肖赟泓
- 作品数:3 被引量:15H指数:2
- 供职机构:北京科技大学计算机与通信工程学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种优化的k-NN文本分类算法被引量:2
- 2009年
- k-NN是经典的文本分类算法之一,在解决概念漂移问题上尤其具有优势,但其运行速度低下的缺点也非常严重,为此它通常借助特征选择降维方法来避免维度灾难、提高运行效率。但特征选择又会引起信息丢失等问题,不利于分类系统整体性能的提高。从文本向量的稀疏性特点出发,对传统的k-NN算法进行了诸多优化。优化算法简化了欧氏距离分类模型,大大降低了系统的运算开销,使运行效率有了质的提高。此外,优化算法还舍弃了特征选择预处理过程,从而可以完全避免因特征选择而引起的诸多不利问题,其分类性能也远远超出了普通k-NN。实验显示,优化算法在性能与效率双方面都有非常优秀的表现,它为传统的k-NN算法注入了新的活力,并可以在解决概念漂移等问题上发挥更大的作用。
- 闫鹏郑雪峰朱建勇肖赟泓
- 关键词:文本分类概念漂移
- 一种基于嵌入式特征选择的垃圾邮件过滤模型被引量:13
- 2009年
- 垃圾邮件自身的特点决定了消极学习型的文本分类算法更加适合于垃圾邮件过滤问题.但是,以k-NN为代表的消极型文本分类算法却存在着运行效率偏低等诸多缺点,不便于实际使用.为此,该文在向量余弦相似性公式的基础上,提出了一种新的"嵌入式特征选择垃圾邮件过滤模型"和基于此模型的消极学习型垃圾邮件过滤算法.与一些经典算法相比,新算法在显著降低运算开销的同时,巧妙地避免了由此而引起的信息丢失问题,因而在性能与效率两个方面都有明显提高,具有非常高的实际价值.
- 闫鹏郑雪峰朱建勇肖赟泓
- 关键词:垃圾邮件过滤
- “软件人”群网络安全风险评估模型的研究
- 2009年
- 通过对人工智能、"软件人"和网络安全风险评估技术的深入研究,提出一种基于"软件人"群的网络安全风险评估模型,能够动态地反应、评估网络系统的安全性,有效地解决了传统风险评估系统中检测和评估模块不能在网络中动态移动、随需分布,并限制评估速度、效率和应用范围等问题。使风险评估系统结构具有良好的自治性、灵活性、扩展性、适应性、分布式控制和应急响应能力,同时降低对网络系统带宽的依赖程度,提高了系统的服务能力和工作效率。
- 肖赟泓郑雪峰涂序彦闫鹏
- 关键词:风险评估软件人网络安全代理