张学成
- 作品数:1 被引量:3H指数:1
- 供职机构:中国科学院研究生院管理学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:机械工程更多>>
- 大型仪器利用情况调查数据异常值检测的数学方法比较被引量:3
- 2012年
- 高质量的决策越来越依赖于高质量的数据挖掘及其分析,高质量的数据挖掘离不开高质量的数据.在大型仪器利用情况调查中,由于主客观因素,总是致使有些数据出现异常,影响数据的质量.这就需要通过适用的方法对异常数据进行检测处理.不同类型数据往往需要不同的异常值检测方法.分析了大型仪器利用情况调查数据的总体特点、一般方法,并以国家科技部平台中心主持的"我国大型仪器资源现状调查"(2009)中大型仪器使用机时和共享机时数据为主线,比较研究了回归方法、基于深度的方法和箱线图方法等对不同类型数据异常值检测的适用性.选取不同角度,检验并采用不同的适用方法,找出相关的可疑异常值,有助于下一步有效开展大型仪器利用情况异常数据的分析处理,提高数据质量,为大型仪器利用情况综合评价奠定基础,也为科技资源调查数据预处理中异常值检测方法提供有益借鉴.
- 张学成周斌孔瑞远韩丛英赵彤杨海珍
- 关键词:大型仪器