杨德贺 作品数:9 被引量:37 H指数:4 供职机构: 中国地震局地壳应力研究所 更多>> 发文基金: 中央级公益性科研院所基本科研业务费专项 国家自然科学基金 中国地震局地壳应力研究所基本科研业务专项 更多>> 相关领域: 天文地球 自动化与计算机技术 电子电信 建筑科学 更多>>
利用聚类方法快速检测前兆观测数据中的异常数据——以水管倾斜仪观测数据为例 2018年 随着前兆观测数据的激增,如何对大量的观测数据中存在的异常数据进行快速检测,是当前面临的比较迫切的问题。本文利用一种基于快速聚类的异常数据检测与评价方法,解决大量观测数据中异常数据的自动检测问题。首先,利用垂直距离分段方法对水管倾斜仪观测数据进行分割,构造分段数据对象;其次,利用均值、方差、峰度与偏度等特征对分段数据对象进行特征表达;然后,基于反正切函数改进影响蚁群算法聚类效率的路径持久性参数,利用快速搜索算法(Clustering by Fast Search,CFS)和改进的蚁群最优化算法(Ant Colony Optimization,ACO)分别对分段数据对象进行聚类,实现对观测数据中异常数据检测的目的;最后,利用F-measure、R-value指标与Chi-square检验评估CFS和ACO聚类方法在异常数据检测上的有效性,以上检测方法都通过了三种指标的有效性检验。实验结果表明ACO和CFS聚类算法可以有效、快速地检测到观测数据中的局部异常数据,诸如高频变化、尖峰等异常数据,为形变类观测数据中异常数据的识别提供一种有效的检测与评价方法。 杨德贺 刘大鹏关键词:异常数据 聚类 一种基于大数据的前兆异常识别方法——以云南鲁甸地震为例 被引量:10 2015年 利用大数据的研究思想,对鲁甸地震多个前兆测项的震前观测数据进行多测项异常检测的联合应用,结果与地震有很好的对应关系。对区域内更多数据的分析表明,该方法检测结果与5级以上地震具有较好的对应关系。该方法是将大数据思想引入地震观测数据应用的一次尝试。 王秀英 张聪聪 杨德贺关键词:大数据 异常检测 基于Hurst指数与盒维数的钻孔应变数据变化特征分析 被引量:3 2017年 形变观测数据是地震监测预报和地球科学研究的重要数据源,其中环境干扰排除、地震震例等异常数据的检测是形变观测数据推广应用的关键内容。针对形变观测数据中的钻孔应变观测数据,通过计算绘制功率谱图,研究其Hurst指数与盒维数分形特征,实现对观测数据中地震事件等异常数据的检测。实验结果表明钻孔应变观测数据符合1/f分布,其具有长时间记忆的分形特征,Hurst指数与分形盒维数变化都凸显出了地震等异常数据。随着信噪比的下降,钻孔应变观测数据的Hurst指数呈现下降的趋势,其盒维数呈现增加的趋势,进一步证实了Hurst指数与分形盒维数之和为2的关系,而它们的变化较大,表明具有较弱的抗噪能力。此研究结果可为地震研究提供理论基础。 杨德贺 王秀英 申旭辉 许嵩 鲁恒新关键词:HURST指数 异常数据 DEMETER卫星ISL离子密度数据一致性检验 被引量:2 2020年 中国地震电磁监测卫星计划的首颗地球物理场探测卫星"张衡1号"于2018年2月2日成功发射,目前正在进行在轨测试,数据验证工作亟待展开.为配合此项工作,本文以法国DEMETER卫星朗缪尔探针(ISL)载荷观测数据为例,对因存在问题而被弃之不用的离子密度数据展开大规模数据的计算、分析和验证工作.通过对离子密度数据自身时空一致性、离子密度与电子密度数据随太阳活动的周期及趋势一致性以及离子密度与电子密度在不同空间、时间的一致性计算检验,认为:离子密度数据具有很好的时空一致性,可以反映在不同时空尺度下随太阳活动的周期和趋势性相对变化规律;以电子密度作为参考,离子密度可能存在系统性偏差,这个偏差随昼夜、时空而变化,但由于离子密度与电子密度在不同时空尺度都保持高度一致的相对变化规律,这种偏差不会影响对数据的相对变化研究.进一步的数据模拟分析表明偏差由常数系统误差以及调制于其上的各种周期成分构成,其中常数系统误差是主要偏差,与数据表现出的随太阳活动变化的统计规律相符.由于这种系统差异的存在,离子密度与电子密度间轻微相对变化会使得它们的比例系数发生明显变化,从而有利于从大量数据中发现一些具有特殊规律的情况.本文的研究结果对于地震电测监测试验卫星的数据验证工作具有参考意义. 王秀英 杨德贺 楚伟 刘大鹏 谭巧 李文静 申旭辉关键词:数据验证 DEMETER卫星 形变观测数据的多异常形态统一识别 被引量:8 2017年 地震前兆数据中的形变观测数据变化复杂,地球物理场变化和环境干扰等信息识别与剔除是与地震相关现象分析的关键.传统的信号识别主要采用回归分析、经验模态分解、频域信号分解等方法,但它们难以统一识别高幅值变化(尖峰、阶跃)与高频变化波形.本文利用信息熵参与形变时序数据的自动化分段构造子序列,一定程度上避免了这两种波形被分割的弊端,然后以统计描述方式表达子序列,最后利用角度异常因子(Angle-Based Outlier Factor,ABOF)和局部异常因子(Local Outlier Factor,LOF)构建对数函数定义离群点,以解决统一识别高幅度变化与高频率变化的问题.实验表明,对于特征向量维度变化的情况,LOF-ABOF算法的计算效率呈线性变化关系;在特征表达策略改变的情况下,该算法对高幅值变化和高频变化的异常识别效果良好.本文所提供方法可以检测出高幅值变化与高频率变化的异常形态,为地震前兆数据中形变观测数据"前兆信号"的识别提供指导与参考,为深入认识地震现象及其产生机理奠定基础. 杨德贺 袁静 王秀英 申旭辉 滕海涛 李文静 谭巧 卫清关键词:信息熵 局部异常因子 基于自编码网络的浅源和深源诱发型微震识别 被引量:2 2018年 地震波形传播的复杂多变性,导致传统互相关分析方法难以识别诱发型微震事件的深度类型.本文基于微震波形的时域、频域及时频域特征,利用自编码网络(SAE)构造具有可鉴别性的特征空间,提升对深源和浅源诱发型微震事件的分类精度.首先,针对440个诱发型微震事件,构建了大小为40的特征空间;其次,利用遗传算法(GA)和关联规则特征选择方法(CFS)对特征空间进行初步筛选,得到特征重要性程度较强的谱矩心和线性度,通过分类验证了谱矩心与震源深度有强相关性;然后,将筛选结果输入到自编码网络,采用基于无监督学习的方法获得新的特征空间;最后,利用逻辑回归(LR)对新特征空间进行交叉验证分类.与利用初步筛选的特征结果进行分类相比,利用4层的自编码网络模型对40特征进行交叉验证分类,所得正确率(Accuracy)和接收者操作特征曲线(ROC)曲线下方的面积(AUC)分别从84. 5%提高到90. 91%及84. 31%提高到87. 14%,结果表明自编码网络提高了分类模型对低能量诱发型微震事件的识别精度. 杨德贺 王秀英 申旭辉 陈佳维 卫清融入结构信息的稀疏低秩丰度估计算法研究(英文) 被引量:6 2018年 丰度估计(AE)是从高光谱图像中识别地物的关键预处理技术.鉴于线性混合模型的可解释性以及数学上的可操作性,带约束的线性回归技术在丰度矩阵估计中备受关注.目前,这类方法存在的缺陷是其拟合过程中仅仅考虑到估计数据与真实数据之间的拟合误差,忽略了估计数据的结构与真实数据的结构之间的相似性信息.因此,提出了融合结构信息的线性回归模型,并应用于稀疏低秩丰度矩阵估计领域.首先,通过增加结构信息改进传统的带约束的线性回归模型,并经数学理论证明了增加结构信息的模型较传统模型更加有效;其次,应用该方法改进稀疏低秩丰度估计的数学模型;最后,采用交替乘子法(ADMM)技术求解新模型.实验结果表明,融入结构信息的稀疏低秩丰度估计算法能够有效地提高仿真数据和实际高光谱数据的丰度估计的估计精度,改善其抗噪性能. 袁静 章毓晋 杨德贺关键词:结构信息 “张衡一号”卫星电场数据存储实验 被引量:8 2021年 "张衡一号"卫星搭载的空间电场探测仪,可采集全球范围的电场数据,为空间科学研究及实验提供原位观测数据.该载荷产出的波形和功率谱数据都是以H5格式的文件方式存储,但由于电场观测数据量巨大,文件方式储存导致数据应用效率极低.因此,本文提出了一种基于关系性数据库的数据存储方法,可以显著提高数据访问时间.试验结果表明本文存储方法可应用到张衡一号卫星其他载荷数据,为电磁卫星海量观测数据的高效应用提供了有效的技术支撑. 高鹏 王秀英 杨德贺 李文静 郭峰关键词:数据入库 基于谱矩心和线性度的微震事件分类 2017年 岩体破裂产生的应力波触发微震事件,传统的互相关匹配难以识别微震事件深浅类型。本文利用谱矩心和线性度提取地震波的特征信息,并通过多层感知器网络进行分类识别,将微震事件分为浅源和深源。实验结果表明该方法的识别准确率为86.14%,谱矩心对微震事件分类精度高于线性度,且精度均高于传统的互相关方法。该方法不仅可以识别地震波形,也可为岩爆、滑坡等动力灾害监测提供预警信息。 周新 杨德贺关键词:线性度 多层感知器网络