广东省科技计划工业攻关项目(2005B10101032)
- 作品数:3 被引量:23H指数:2
- 相关作者:印鉴谭焕云陈志雄陈健闵华清更多>>
- 相关机构:中山大学华南理工大学广东省信息安全技术重点实验室更多>>
- 发文基金:国家教育部博士点基金广东省科技计划工业攻关项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大访问模式挖掘的数据库异常行为检测
- 引入访问模式描述用户访问数据库系统的主要行为特征,利用从数据库审计记录中挖掘的最大访问模式来检测数据库系统的异常行为.基于FP-tree结构,提出了一种最大访问模式挖掘算法MMAP.基于数据库系统中关系之间的外键依赖提出...
- 刘玉葆蔡嘉荣印鉴黄志兰
- 关键词:数据库入侵检测数据挖掘
- 文献传递
- 基于信息增益的中文文本关联分类被引量:4
- 2007年
- 关联分类是一种通过挖掘训练集中的关联规则,并利用这些规则预测新数据类属性的分类技术。最近的研究表明,关联分类取得了比传统的分类方法如C4.5更高的准确率。现有的基于支持度-置信度架构的关联分类方法仅仅是选择频繁文字构建分类规则,忽略了文字的分类有效性。本文提出一种新的ACIG算法,结合信息增益与FoilGain在中文文本中选择规则的文字,以提高文字的分类有效性。实验结果表明,ACIG算法比其他关联分类算法(CPAR)有更高的准确率。
- 陈志雄陈健闵华清
- 关键词:计算机应用中文信息处理信息增益文本分类
- 一种有效的文本聚类算法
- 1引言近年来,人们可以方便地从Internet、数字图书馆、新闻机构和公司内部网上获得数目惊人的文本文档,从而对发展能够帮助用户有效地检索、组织和
- 蔡嘉荣印鉴刘玉葆黄志兰
- 文献传递
- 基于χ~2统计量的kNN文本分类算法被引量:19
- 2007年
- 随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于χ2统计量能很好地体现词和类别之间的相关性,因此成为特征选择中常用的评估函数.本文分析了χ2统计量在特征选择和分类决策阶段的性质,提出了一种新的基于χ2统计量的相似度定义,并结合基于两次类别判定的快速搜索算法,改进了传统的kNN算法.实验结果显示基于χ2统计量的改进kNN文本分类算法能大大减少kNN算法的分类时间,并提高了kNN算法的准确率和召回率.
- 印鉴谭焕云
- 关键词:文本分类KNN
- 基于最大访问模式挖掘的数据库异常行为检测
- 2006年
- 引入访问模式描述用户访问数据库系统的主要行为特征,利用从数据库审计记录中挖掘的最大访问模式来检测数据库系统的异常行为.基于FP-tree结构,提出了一种最大访问模式挖掘算法MMAP.基于数据库系统中关系之间的外键依赖提出了一种关系距离约束,进一步减少挖掘算法的搜索空间.基于MMAP算法建立了一个检测模型,测试表明该模型能有效地检测数据库系统的异常行为.
- 刘玉葆蔡嘉荣印鉴黄志兰
- 关键词:数据库入侵检测数据挖掘