有人说,在“大数据时代”真正到来之前,气象数据便显现了大数据的诸多特性。气象数据一贯以庞杂众多、数据量大而著称,这些复杂的气象数据总体可以分为两类:一类数据是实况数据,另一类是模式数据。
简单来说,实况数据就是“一般过去时”数据,来自不同的观测设备。采集实况数据的气象站点遍布全球,观测范围从几千米的高空到地面,观测手段从高科技的卫星、雷达到最原始的人工观测,这些数据的采集都是为了更真实地反映出地球大气圈的运动变化。
实况数据是气象学科发展的最基础数据,也是模式数据产生的源头。如果没有实况数据,计算机在计算“模式数据”时就少了初始值;即使回归到没有计算机的人工预报时代,少了实况数据也无法进行天气预报。
模式数据与实况数据相比,更简单也更复杂。简单的是,这类数据仅由各类计算机的程序运算生成,属于预测未来的“一般将来时”数据;说它复杂则是因为计算量非常庞大,运用到的计算公式也异常复杂,为了更真实地模拟全球大气的走向,运算出的数据量也十分惊人。
模式数据由高性能计算机根据实况数据(包括地面、高空、卫星等)通过物理方程计算得出。可以简单形象地认为,有一套庞大的计算未来天气的程序,输入当前已知的天气现象,就可以输出未来还没有发生的天气现象。计算出的预报结果通常以规则的等经纬度网格来表示,网格上的每个点代表这个经纬度上未来某时刻某个物理量(比如气温)的数值。这就是现代天气预报业务的基础——数值预报模式。(王敬涛)