Intelligent wave forecasting and evaluation along the southeast coast of China based on ConvLSTM method

  • JIN Yang , 1 ,
  • HAN Lei 1 ,
  • JIN Meibing , 1, 2, * ,
  • DONG Changming 1, 2
Expand
  • 1. School of Marine Science, Nanjing University of Information Science & Technology, Nanjing 210044, China
  • 2. Southern Marine Science and Engineering Guangdong Laboratory (Zhuhai), Zhuhai 519080, China

Received date: 2024-03-04

  Revised date: 2024-05-11

  Online published: 2024-11-25

Abstract

Compared with the semi-theoretical and semi-analytical wave forecasting and numerical modeling,artificial intelligence wave forecasting has the advantages of higher forecasting accuracy and lower computational resource requirements. In this paper, a two-dimensional significant wave height (SWH) forecasting model for the southeast coast of China is established based on the convolutional long short-term memory network (ConvLSTM) algorithm using ERA5 (ECMWF Reanalysis v5) reanalysis data as the initial field. The data from 2014-2022 are used to train the forecasts of SWH for the next 6 h, 12 h, 18 h and 24 h, and the data from 2023 are used for testing. Sensitivity tests are carried out to optimize the model configuration and evaluate the prediction performance of SWH in the southeast coast of China at four period validity (6 h, 12 h, 18 h, 24 h) in 2023. Sensitivity tests show that when input time series length N=4(input SWH value of -18 h, -12 h, -6 h, 0 h), the accuracies of the model at four period validity are better than those of other time series length. When the combination of input physical elements is SWH, mean wave direction and sea surface 10 m wind vector, the accuracy of the model is better than other combinations at 12 h, 18 h and 24 h. Through the fine-tuning of ConvLSTM model training and configuration, the two-dimensional and high-precision intelligent prediction of SWH in the southeast coast of China can be realized.

Cite this article

JIN Yang , HAN Lei , JIN Meibing , DONG Changming . Intelligent wave forecasting and evaluation along the southeast coast of China based on ConvLSTM method[J]. Journal of Marine Sciences, 2024 , 42(3) : 88 -98 . DOI: 10.3969/j.issn.1001-909X.2024.03.007

0 引言

海洋表面波浪作为一种受风力驱动、重力作用和地形影响的水体运动形式,对海洋工程、海岸保护、海上航行以及海洋资源的开发和利用都具有重要作用[1-3]。由于波浪的复杂性和随机性,进行有效波高(significant wave height, SWH)的准确预报是海洋基础研究的重点和难点[4]
波浪预报方法大致可以分为三类:半理论半分析预报、数值模型和人工智能预报。半理论半分析预报法是综合利用风要素(风速、风时、风区)预测风浪和涌浪的变化[5-6],如SMB(Sverdrup-Munk-Bretschneider)[7]、PNJ (Pierson-Neumann-James)谱分析[8]以及风浪谱预报[9]等,具有易实现、速度快的优点,但往往不太准确,只适用于有限的案例[10]。波浪预报数值模型自1957年首次提出以来,通过优化物理参数、提升分辨率、整合多源数据等手段,预报精度得以显著提高,在局部至全球海域都有广泛应用[11-12]。如SWAN(simulating waves nearshore)模型[13]提升了近岸波浪的模拟精度;WW3(WAVEWATHCH III)模型在全球尺度波浪预报中展示出较高的精度[14];文圣常等[15]将涌浪的涡动黏性和底摩擦参数加入数值预报模型,精确地刻画出谱和风浪成长的关系;袁业立等[16]在数值模型中考虑了非定常背景场对波浪传播的影响,提升了波浪预报精度。数值模型因其科学性、准确性,是目前波浪预报的主要工具,但同时,由于计算成本高昂、时间需求长等方面的不足,也限制了它们在实时预报领域和有限计算资源下的进一步发展和应用[4]
近年来,人工智能技术,尤其是各类智能预报模型已广泛应用于海洋波浪预报,如ANN(artificial neural network)[17-18]、GA-ELM(genetic algorithm optimized extreme learning machine)[19-20]、RNN(recurrent neural network)[21]和LSTM(long short-term memory)网络[22-23]等。例如,MAKARYNSKYY[17]基于ANN对大西洋近海和爱尔兰海沿岸的两个点进行SWH及波周期的逐时预报;PUSHPAM等[21]应用RNN实现了SWH的 3 h、6 h、12 h和24 h预报;HU等[24]应用LSTM预报了伊利湖在理想条件下的波高和周期。ConvLSTM (convolutional long short-term memory)模型[25-26]具有优异的时空特征捕捉能力,CHOI等[27]利用ConvLSTM模型,从时间序列中提取出波高的时空特征,并获得准确的预报结果;ZHOU等[28]采用ConvLSTM技术,针对中国南海与东海海域开发了一个二维SWH预报模型,以过去三个时刻(间隔1 h)的SWH作为输入,预报未来1 h、3 h和6 h的SWH。
本研究采用ConvLSTM模型,提取中国东南沿海风浪特征信息,构建二维SWH预报模型,并研究了输入时间序列长度N和物理要素组合(SWH、平均波向、海面10 m 风矢量)对模型预报精度的影响。

1 数据和方法

1.1 研究区介绍

本文以中国东南沿海为研究区,这一区域海洋环境复杂,易在台风、风暴潮等极端天气影响下引发高波浪,从而对航运、渔业、滨海旅游、海上作业等活动以及沿海基础设施造成重大影响。海浪模拟区域选为16°N—33°N,110°E—127°E(图1)。
图1 中国东南海域的水深地形

Fig.1 The topography and water depth in the southeast seas of China

1.2 数据来源与处理

本文使用ECMWF (European Centre for Medium-Range Weather Forecasts)的再分析数据集ERA5,具体参数包括SWH、平均波向和海面10 m 风矢量(纬向风速U和经向风速V)。风速的时间分辨率为1 h,空间分辨率为0.25°×0.25°;SWH和平均波向的时间分辨率为1 h,空间分辨率为0.5°×0.5°,通过插值得到与风速相同的空间分辨率。各数据的空间范围均为16°N—33°N,110°E—127°E,时间跨度为2014—2023年。其中,2014—2022年ERA5数据作为模型的训练集,2023年ERA5数据作为模型的测试集和验证集,根据研究时段对数据均进行归一化、取平均值等处理。

1.3 ConvLSTM波浪模型的构建

波浪预报模型基于ConvLSTM算法建立,结构示意图见图2。ConvLSTM在LSTM基础上引入卷积代替矩阵乘法[26],不仅降低了计算资源的消耗,还增强了对二维空间的理解,在预报领域显示出更优性能。模型的隐藏层由3个ConvLSTM层和1个二维卷积层(Conv2D)组成,分别用tanh和sigmoid函数激活,以均方误差为损失函数进行优化。训练中通过Adam优化器和早停机制来避免过拟合和减少训练耗时,当损失值不再下降时停止训练,以二维形式输出SWH预报值。
图2 SWH预报模型的结构示意图

Fig.2 Schematic diagram of the structure of the SWH prediction model

为优化模型配置开展两组敏感性试验,比较模型在不同配置下预测结果的准确性。第一组试验,以SWH、平均波向、海面10 m经向和纬向风速作为输入物理量,改变输入时间序列长度N(1≤N≤6,N=1,取0 h的SWH; N=2, 取0 h和-6 h的SWH……);第二组试验,在N最佳取值的基础上,改变输入物理要素组合(SWH、平均波向、海面10 m纬向风速、海面10 m经向风速)。

1.4 模型预测性能评价

采用平均绝对误差(mean absolute error, MAE)、均方根误差(root mean squared error, RMSE)、平均绝对百分比误差(mean absolute percentage error, MAPE)以及相关系数(correlation coefficient, R)4个指标来评价模型预测结果的准确性,各指标的表达式为:
M A E = 1 n i = 1 n y p ( i ) - y t ( i )  
R M S E = 1 n i = 1 n ( y p ( i ) - y t ( i ) ) 2  
M A P E = 1 n i = 1 n y p ( i ) - y t ( i ) y t ( i ) × 100 %  
R = i = 1 n ( y p ( i ) - y p ( i ) ¯ ) ( y t ( i ) - y t ( i ) ¯ ) i = 1 n ( y p ( i ) - y p ( i ) ¯ ) 2 i = 1 n ( y t ( i ) - y t ( i ) ¯ ) 2
式中:n表示时间序列长度,$y_(t(i))$$y_(p(i))$ 分别代表观测值(ERA5)和预报值。MAE、RMSE和MAPE的值越小或者R的值越大时,预测结果的准确性越高,模型性能越好。

2 结果

2.1 时间序列长度对模型预报性能的影响

第一组敏感性试验是检验时间序列长度N(1≤N≤6)对波浪预报准确性的影响,R、RMSE、MAE和MAPE四个参数的评估结果如图3所示。总体上,随预报时效的增加,R值减小(图3a),RMSE,MAE和MAPE值增大(图3b~3d),预报结果的准确性下降。N=4时,R值在四个预报时效均为最大(图3a);N=4或5时,各预报时效的RMSE,MAE和MAPE值均较小(图3b~3d)。试验表明,选择适中的时间序列长度有利于提高模型结果的准确性,数据太少可能导致信息不足,过多则可能导致信息冗余。
图3 不同时间序列长度的ConvLSTM模型预报性能评价指标

Fig.3 Evaluation indexes of ConvLSTM model prediction performance with different time series length

N=4时,2023年中国东南沿海各季节SWH预测值和ERA5比较的R、RMSE、MAE和MAPE如图4所示。四个预报时效下,R的平均值为夏季>秋季>冬季>春季;RMSE和MAE的平均值为夏季<春季<秋季<冬季;MAPE的平均值为夏季<秋季<春季<冬季。上述结果表明模型预报性能在不同季节有微小差异,相对其他季节,冬季预测结果的准确性略低。
图4 ConvLSTM模型预报性能评价指数的季节差异

Fig.4 Seasonal difference of ConvLSTM model prediction performance evaluation indexes

以春季为例,对比了SWH空间分布预报结果与ERA5的差异。图5显示,ConvLSTM模型预报的SWH的空间分布与ERA5相似:东南部的吕宋海峡海域(17°N—23°N,123°E—127°E)为SWH高值区,最大值可达2 m,北部的长江口、杭州湾海域(28°N—33°N,120°E—127°E)的SWH相对较低。
图5 2023年春季观测SWH和预报SWH:ERA5(a~d), ConvLSTM模型(N=4, e~h)以及相对变化(i~l)

Fig.5 Observed SWH and predicted SWH of 2023 spring: ERA5 (a-d), ConvLSTM model (N=4, e-h) and the relative variability between model and ERA5 (i-l)

在6 h预报中,在研究区的大部分区域,SWH预报值与ERA5的相对误差为0左右,但在台湾岛西南部和大陆岸线周围海域(水深小于50 m),相对误差在0.2左右(图5i)。这是由于海浪在浅水区受地形影响大,复杂多变,导致预报误差增大。当预报时效分别增加到12 h、18 h和24 h,误差整体增大。总体来说,ConvLSTM模型能够准确捕捉SWH的空间分布特征和变化趋势,表现出良好的预报能力。
为了评估ConvLSTM模型预报的精度,对每个网格点上SWH的MAE、RMSE、MAPE和R进行了计算(图6)。其中,MAE、RMSE和MAPE呈现相似的空间分布(图6a~6l),R呈现相反的空间分布(图6m~6p)。在6 h预报中,在海岸附近, MAE和RMSE平均值约为0.4 m,MAPE约为30%;在开阔海域(水深大于50 m),MAE和RMSE低于0.2 m,MAPE约为10%;在南部海域,如南海海域,R大于0.97,相关性较高;在北部海域,如长江口和舟山群岛附近海域,R值较小,约为0.84~0.97,可能与岛屿众多引起波浪分布不连续有关。随着预报时效增加,R值呈下降趋势,在24 h预报中,台湾岛北部海域的相关系数相对较低,南部海域约为0.90;随着预报时效增加,在台湾海峡附近的MAE、RMSE和MAPE值增长明显,可能是由复杂的地形和岸线引起的。
图6 ConvLSTM模型预报结果评价指数空间分布

Fig.6 Spatial distribution of ConvLSTM model prediction results evaluation indexes

2.2 输入物理要素组合对ConvLSTM模型预报性能的影响

在最佳输入时间序列长度N=4的基础上,进一步探究不同类型数据资源对模型性能的影响。试验设置6个不同物理要素组合作为模型的输入,具体信息如表1所示。
表1 物理要素敏感性试验的ConvLSTM模型配置

Tab.1 ConvLSTM model configuration for the sensitivity test of physical elements

试验编号 输入的物理要素
2.1 SWH
2.2 SWH、平均波向
2.3 海面10 m经向风速、海面10 m纬向风速
2.4 SWH、海面10 m 经向风速、海面10 m纬向风速
2.5 SWH、平均波向、海面10 m纬向风速
2.6 SWH、平均波向、海面10 m经向风速、海面10 m纬向风速
在4个预报时效的结果中,R值最高的均为试验2.6(物理要素组合为SWH、平均波向、海面10 m 经向风速和海面10 m纬向风速),并且随着预报时效的增加,与其他试验组的差值逐渐增大(图7a)。图7b~7d显示,在6 h预报时,RMSE、MAE和MAPE的最小值均出现在试验2.4(物理要素组合为SWH、海面10 m 经向、纬向风速),在12 h、18 h和24 h的预报中,最小值均出现在试验2.6。上述结果表明在短时预报(6 h)中,输入变量中减少了平均波向未降低模型的预报性能,但在长时预报(12 h、18 h和24 h)中,输入变量中包含平均波向,模型预报结果的误差更小。
图7 不同试验组的ConvLSTM模型预报性能评价

Fig.7 Evaluation of ConvLSTM model prediction performance in different experiment groups

通过计算发现,仅考虑以海面10 m 风矢量作为输入变量(试验2.3),R为0.70~0.90,小于其他试验组(图7a),MAPE为18%~33%,大于其他试验组(图7d);以波浪数据作为输入变量(试验2.1、2.2),R为0.80~0.97,MAPE为11%~24%;以风、浪数据作为输入变量(试验2.4、2.5、2.6),R为0.81~0.97,MAPE为11%~22%。通过上述分析可以总结出,输入变量中同时包含波浪场和风场的模型(试验2.6),其预报结果的误差最小,准确性优于输入变量中仅包含波浪场或风场的模型,而在以单一物理场为输入变量的模型中,以波浪场为输入变量的模型预报的准确性高于仅考虑风场的模型。
以2023年春季为例,将基于试验2.4配置(物理量组合为SWH、海面10 m 经向、纬向风速)的ConvLSTM模型预测结果与ERA5进行对比(图8),发现在不同预报时效下,两者的空间分布均相似,量级相同。比较包含(图5i~5l)或不包含(图8i~8l)平均波向两种配置下模型的结果与ERA5数据的差异性,显示两种情况下的差异性相似。
图8 2023年春季观测SWH和预报SWH:ERA5(a~d),基于试验2.4配置的ConvLSTM模型(e~h)以及相对变化(i~l)

Fig.8 Observed SWH and predicted SWH of 2023 spring: ERA5 (a-d), ConvLSTM model based on experiment 2.4 configuration (e-h) and the relative variability between model and ERA5 (i-l)

图9为试验2.4中模型MAE、RMSE、MAPE及R值的空间分布。从图中可见,浅水区(水深小于50 m)与深水区(水深大于50 m)波浪的分布有明显不同;整体空间分布与图6 (试验2.6)大体一致,表现为在大陆海岸线及岛屿周边海域,预测波高的误差较大,随预报时效增加而误差增大,在台湾海峡表现尤为明显。试验2.4(物理要素组合为SWH、海面10 m 经向和纬向风速)中R值的空间分布(图9m~9p)和试验2.6(物理要素组合为SWH、平均波向、海面10 m经向和纬向风速,图6m~6p)相近,表明两种配置在捕捉波浪动态方面具有相似性,没有平均波向输入时,模型仍能实现6 h SWH的二维空间预报,但在12 h、18 h和24 h预报中,准确性会下降。
图9 基于试验2.4配置的ConvLSTM模型性能评价

Fig.9 Performance evaluation of ConvLSTM model based on experiment 2.4 configuration

3 结论

波浪预报的准确性在海洋工程、航行安全及可再生资源开发领域都具有重要意义。不同于以往仅使用SWH单一物理量作为输入变量进行SWH预报,本研究通过SWH、平均波向、海面10 m 风矢量等多变量输入,构建了基于ConvLSTM的中国东南部海域SWH二维预报模型,并开展了输入时间序列长度和物理量组合的敏感性试验。
对比不同输入时间序列长度(N=1~6)下模型的预报性能发现,选择适当的时间序列长度能显著提高模型预报精度并减少计算资源消耗。N=4时,模型能够成功预报SWH,其空间分布与ERA5大体一致,仅在台湾岛周围和大陆近岸处存在一些误差,表明模型能够准确捕捉SWH的空间分布特征和变化趋势,具有良好的预报性能。模型预报结果的准确性在季节间有细微差异,冬季预报值与观测值的相关性较低,误差较大,RMSE、MAE和MAPE指数均高于其他季节。
对比不同物理要素(SWH、平均波向、海面10 m 风矢量)组合下的模型预报性能评价指数发现,在6 h预报中,以SWH、海面10 m 风矢量组合作为输入变量时,模型预报性能最好;在12 h、18 h和24 h预报中,以SWH、平均波向和海面10 m 风矢量组合作为输入变量时,模型预报性能最好,预报值与ERA5的相关性较其他组合略高。
综上,ConvLSTM可以应用于二维浪高预报,通过精细调整模型配置,能够在确保预报结果准确的同时实现计算资源的经济使用。波浪存在多时间尺度的变化,在今后的研究中可以在SWH智能预报的基础上开展海浪其他多要素预报,如波周期等。
[1]
SHENG W N. Wave energy conversion and hydrodynamics modelling technologies: A review[J]. Renewable and Sustainable Energy Reviews, 2019, 109: 482-498.

[2]
REGUERO B G, LOSADA I J, MÉNDEZ F J. A recent increase in global wave power as a consequence of oceanic-warming[J]. Nature Communications, 2019, 10: 205.

[3]
KAMPHUIS J W. Introduction to coastal engineering and management[M]. Singapore: World Scientific, 2020.

[4]
WANG W X, TANG R C, LI C, et al. A BP neural network model optimized by mind evolutionary algorithm for predicting the ocean wave heights[J]. Ocean Engineering, 2018, 162: 98-107.

[5]
YEGANEH-BAKHTIARY A, EYVAZOGHLI H, SHABAKHTY N, et al. Machine learning prediction of wave characteristics: Comparison between semi-empirical approaches and DT model[J]. Ocean Engineering, 2023, 286: 115583.

[6]
刘凡, 陆小敏, 徐丹, 等. 海浪预报方法研究进展[J]. 河海大学学报:自然科学版, 2021, 49(5):387-393.

LIU F, LU X M, XU D, et al. Research progress of ocean waves forecasting method[J]. Journal of Hohai University: Natural Sciences, 2021, 49(5): 387-393.

[7]
BRETSCHNEIDER C L. Hurricane design wave practices[J]. Journal of the Waterways and Harbors Division, 1957, 83: 1-33.

[8]
NEUMANN G, PIERSON W J. A detailed comparison of theoretical wave spectra and wave forecasting methods[J]. Deutsche Hydrographische Zeitschrift, 1957, 10(4): 134-146.

[9]
文圣常. 普遍风浪谱及其应用[J]. 山东海洋学院学报,1960:15-43.

WEN S C. Universal wind wave spectrum and its applications[J]. Journal of Shandong Ocean University, 1960: 15-43.

[10]
KAMRANZAD B, ETEMAD-SHAHIDI A, KAZEMINEZHAD M H. Wave height forecasting in Dayyer, the Persian Gulf[J]. Ocean Engineering, 2011, 38(1): 248-255.

[11]
GELCI R, CAZALÉ H, VASSAL J. La méthode des densités spectroangulaires[J]. Comité Central Océanogr, 1957, 9: 416-435.

[12]
DURRANT T, GREENSLADE D, HEMER M, et al. A global wave hindcast focussed on the Central and South Pacific[R]//The Centre for Australian Weather and Climat Research Technical Report No. 070, 2014.

[13]
BOOIJ N, RIS R C, HOLTHUIJSEN L H. A third-generation wave model for coastal regions: 1. Model descrip-tion and validation[J]. Journal of Geophysical Research: Oceans, 1999, 104(C4): 7649-7666.

[14]
TOLMAN H L. User manual and system documentation of WAVEWATCH-III TM version 3.14[R]. [S.l.]: NECP, 2009.

[15]
文圣常, 钱成春, 叶安乐, 等. 基于选定风浪方向谱的海浪模拟方法(英文)[J]. 青岛海洋大学学报, 1999(3): 345-397.

WEN S C, QIAN C C, YE A L, et al. Wave modeling based on adopted wind-wave direction spectrum[J]. Journal of Ocean University of Qingdao, 1999 (3): 345-397.

[16]
袁业立, 华锋, 潘增弟, 等. LAGFD-WAM海浪数值模式:Ⅱ.区域性特征线嵌入格式及其应用[J]. 海洋学报, 1992, 14(6):12-24.

YUAN Y L, HUA F, PAN Z D, et al. LAGFD-WAM numerical model of ocean waves—Ⅱ. Embedding scheme of regional characteristic lines and its application[J]. Acta Oceanologica Sinica, 1992, 14(6): 12-24.

[17]
MAKARYNSKYY O. Improving wave predictions with artificial neural networks[J]. Ocean Engineering, 2004, 31(5/6): 709-724.

[18]
ZUBIER K. Using an artificial neural network for wave height forecasting in the Red Sea[J]. Indian Journal of Geo Marine Sciences, 2020, 49: 184-191.

[19]
CORNEJO-BUENO L, NIETO-BORGE J C, GARCÍA-DÍAZ P, et al. Significant wave height and energy flux prediction for marine energy applications: A grouping genetic algorithm-extreme learning machine approach[J]. Renewable Energy, 2016, 97: 380-389.

[20]
KUMAR N K, SAVITHA R, MAMUN A A. Ocean wave height prediction using ensemble of extreme learning machine[J]. Neurocomputing, 2018, 277: 12-20.

[21]
PUSHPAM P M M, ENIGO V S F. Forecasting significant wave height using RNN-LSTM Models[C]//2020 4th Inter-national Conference on Intelligent Computing and Control Systems (ICICCS). Madurai, India. IEEE, 2020: 1141-1146.

[22]
GERS F A, SCHRAUDOLPH N N, SCHMIDHUBER J. Learning precise timing with LSTM recurrent networks[J]. Journal of Machine Learning Research, 2002, 3: 115-143.

[23]
HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.

DOI PMID

[24]
HU H G, VAN DER WESTHUYSEN A J, CHU P, et al. Predicting Lake Erie wave heights and periods using XGBoost and LSTM[J]. Ocean Modelling, 2021, 164: 101832.

[25]
FAN S T, XIAO N H, DONG S. A novel model to predict significant wave height based on long short-term memory network[J]. Ocean Engineering, 2020, 205: 107298.

[26]
SHI X J, CHEN Z R, WANG H, et al. Convolutional LSTM network: A machine learning approach for precipitation nowcasting[J]. Advances in Neural Information Processing Systems, 2015: 802-810.

[27]
CHOI H, PARK M, SON G, et al. Real-time significant wave height estimation from raw ocean images based on 2D and 3D deep neural networks[J]. Ocean Engineering, 2020, 201: 107129.

[28]
ZHOU S Y, XIE W H, LU Y X, et al. ConvLSTM-based wave forecasts in the South and East China Seas[J]. Frontiers in Marine Science, 2021, 8: 680079.

Outlines

/