气候系统是典型的非平稳性系统,然而对于气候观测数据的处理通常是在时间序列平稳的假定下完成的,比如气温和降水的多步预报,这通常会导致预报准确度较低。为改进该缺陷,首先将非平稳数据序列分解成平稳的、多尺度特征的本征模态函数分量(IMF),再使用数值集合预报与逐步回归分析相结合的方式对每一个IMF分量构建不同的预报模型,最后线性拟合成预报结果。通过Visual Studio 2008开发平台使用上述方法建立了一个短期气候预报系统,采用广西区88个气象站1957—2005年的2月距平气温数据进行实际验证。结果表明,相对于普通预测和单一预测方法,加入了EMD和集合预报技术的方法在仅用历史资料进行多步预测的情况下,对于气候的变化趋势以及突发性气候具有更好的预报能力。
首先针对雷电强度空间定量分析不足的问题,利用R语言对江苏省雷电强度进行聚类分析,得到江苏省2007—2009年夏半年雷电强度的5个等级,结果发现,占据雷电强度90%以上(31 k A以下)的1、2级组内成员最多,而后3个等级则呈递减趋势。为了给实际雷电防护工程提供参考,对江苏省各市的雷电强度空间变化范围进行区划,得出各市相应的强度等级分区。其中,淮安市的雷电强度空间变化最突出,连云港市则是13个地级市中变化最不显著的。最后探讨了雷电强度等级与6种土地利用类型的关系,结果显示,林地对于雷电强度等级的空间分布影响最大,其余5种地表类型在雷电强度为2级时关联性最大,随着雷电强度等级的增大,雷电强度等级的空间分布与这5种土地利用类型的关系逐渐减弱。
随着移动定位技术的发展和移动定位设备普及,移动对象轨迹数据分析逐渐成为空间数据挖掘领域的研究热点。基于出租车GPS轨迹数据进行空间聚类研究可以发现出租车移动的热点路径以及运动趋势。在传统OPTICS(Ordering Points To Identify the Clustering Structure)算法的基础上根据轨迹数据的特征提出了适合海量轨迹空间聚类的TR-OPTICS(Trajectory OPTICS)算法。该方法选取出租车轨迹中的载客轨迹为研究对象,经过轨迹特征点选取后采用MDL(Minimum Description Length)方式进行轨迹的二次划分,通过计算子轨迹间的水平距离、垂直距离、角度距离来度量轨迹的相似性。在聚类算法上采用外包矩形作为核心轨迹的搜索邻域,同时重新定义轨迹核心距离与轨迹可达距离,用邻接表代替空间索引来降低算法的复杂度。通过对南京市出租车载客轨迹的聚类分析,得到了出租车载客热点轨迹簇,并且经过多次实验与传统OPTICS算法、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法对比,提出的TR-OPTICS算法在算法执行效率上均优于其他两种算法,在聚类结果上该算法可以发现载客子轨迹簇主要集中在市中心的中央路、大桥南路、北京东路、中山东路、中山北路、建宁路、瑞金路、板仓街、迈皋桥等道路,并且聚类效果优于其他两种算法。结果表明,提出的TR-OPTICS算法提高了算法执行效率,同时也提高了聚类结果的准确性。
对收集的明代雹灾史料进行整理和分类,构建了我国明代的雹灾数据库,将雹灾的定性描述转化成定量描述。根据冰雹的大小和造成的危害进行等级划分,对发生雹灾时伴随的其它阵性天气现象进行统计分析。利用关联挖掘模型continuous association rule mining algorithm(CARMA)算法挖掘不同等级的雹灾与风、雨、雷电等阵性天气的关联性及其有关规律。结果表明:明代的雹灾与雨的关联性最大,其次是风和雷电;它们易带来大雨雹或大风雨雹等灾害。同时不同等级的雹灾发生时伴随着其他的阵性天气的置信度也存在着差异;因此当雹灾出现的时候,应同样考虑到其他如暴雨、狂风、雷电等强对流天气灾害造成的危害。获得的雹灾关联信息,可用于指导雹灾的预报与支持决策。