Review of application of deep learning in Indian Ocean Dipole prediction

  • ZHENG Mengke , 1 ,
  • FANG Wei , 2, 3, 4, * ,
  • ZHANG Xiaozhi 2, 3, 4
Expand
  • 1. School of Electronic and Information Engineering, Anhui Jianzhu University, Hefei 230601, China
  • 2. School of Computer Science, Nanjing University of Information Science & Technology, Nanjing 210044, China
  • 3. Key Laboratory of Transportation Meteorology of China Meteorological Administration (Nanjing Joint Institute for Atmospheric Sciences), Nanjing 210041, China
  • 4. Jiangsu Collaborative Innovation Center of Atmospheric Environment and Equipment Technology (CICAEET), Nanjing University of Information Science & Technology, Nanjing 210044, China

Received date: 2024-04-01

  Revised date: 2024-07-10

  Online published: 2024-11-25

Abstract

The Indian Ocean Dipole (IOD) is a pivotal climate phenomenon in the Indian Ocean region, exerting a significant impact on the climate change of the surrounding areas and the global climate system. Accurate prediction of IOD is essential for comprehending the dynamics of the global climate, yet traditional forecasting methods are limited in capturing its complexity and nonlinearity, constraining predictive capabilities. This paper begins by outlining the relevant theories of IOD and evaluates the strengths and weaknesses of traditional forecasting methods. It then provides a comprehensive analysis of the application and development of deep learning in the field of IOD prediction, highlights the advantages of deep learning models over traditional methods in terms of automatic feature extraction, nonlinear relationship modeling, and large data processing capabilities. Additionally, the paper discusses the challenges faced by deep learning models in IOD forecasting: including data scarcity, overfitting, and model interpretability issues, and proposes future research directions to promote innovation and progress in the application of deep learning technology in the field of climate prediction.

Cite this article

ZHENG Mengke , FANG Wei , ZHANG Xiaozhi . Review of application of deep learning in Indian Ocean Dipole prediction[J]. Journal of Marine Sciences, 2024 , 42(3) : 51 -63 . DOI: 10.3969/j.issn.1001-909X.2024.03.004

0 引言

印度洋偶极子(Indian Ocean Dipole,IOD)是指印度洋地区海温和海面高度异常的气候现象[1]。IOD现象与印度洋的季节性风场和海洋环流模式关系密切,且受季风系统的季节性变化与太阳辐射的季节性波动影响。IOD的主要特征是在东印度洋与西印度洋之间出现温差异常[2],即正IOD(IOD正相位)期间西印度洋海温升高而东印度洋海温降低,负IOD(IOD负相位)期间反之。这种温差异常的分布对印度洋及其周边地区的气候产生显著影响,同时通过调节海洋和大气之间的相互作用,与全球气候模式紧密相连,尤其是与厄尔尼诺-南方涛动(El Niño-Southern Oscillation,ENSO)现象之间的相互影响,在热带气候系统中起着关键作用。
IOD对印度洋沿岸国家和地区的气候模式、生态平衡、农业生产及水资源管理产生了深远影响[3]。它通过影响季风降水的分布和强度,显著作用于印度、东非和澳大利亚等地的气候条件。例如,在印度,正IOD通常与季风降水的增加相关联,这有利于农业生产,而负IOD则可能减少降水量,增加干旱的风险[4];在东非,正IOD期间可能会经历降水减少,出现干旱现象,但2019年的极端正IOD事件却异常地导致了该地区的洪涝灾害 [5-6];在澳大利亚,正IOD通常与其西北部的干旱和东南部的湿润条件相关联,而负IOD则相反,可能导致西北部湿润和东南部干旱[7-8]。此外,IOD还与亚洲夏季风的强度和位置变化有关,影响南亚和东南亚的季风降水[9]。IOD的影响不仅限于区域性气候,它对全球气候预测也具有关键作用。因此,需要不断加强对IOD的监测和研究,以提高预测准确性和应对能力。
随着IOD理论研究的深入和预测技术的进步,对IOD事件的预测日益受到重视。在IOD现象的研究历程中,一系列关键的科学发现和技术创新构成了该领域发展的重要节点。IOD理论研究历史中的里程碑事件如图1所示。
图1 IOD理论研究历史的里程碑事件展示图

Fig.1 Illustration of IOD theoretical research milestones

自1999年SAJI等[10]首次提出IOD概念并定义其强度衡量指标以来,IOD现象的研究逐渐成为气候科学的一个重要分支。这一开创性的工作为后续的IOD研究和预测提供了重要的理论基础。
2014年,CAI等[11]的研究表明,极端IOD事件的发生频率近年来有所增加,这一趋势可能与全球气候变暖有关。这一发现引起了科学界对IOD与全球气候变化关系的关注,并促进了对IOD影响机制的进一步探索。
2019年的极端正IOD事件引起了广泛关注。DU等[12] 针对该事件提出了解释机制,他们的研究不仅增进了对IOD事件成因的理解,也为未来IOD事件的有效预测和应对策略提供了宝贵的参考和指导。次年,ABRAM等[14]的研究揭示了IOD事件发生频率的显著增加,但他们指出,尽管发生频率上升,IOD事件的强度并未超出过去1 000年的自然变率范围。这一发现对于理解IOD事件的长期变化特征和区分自然变异与人类活动影响具有重要意义。
在预测技术方面, LING等[15]于2022年提出了一种基于深度学习的多任务学习模型(multi-task learning network,MTL-NET)用于预测IOD。该模型通过融合多种预测任务,显著提高了IOD预测的准确性,标志着IOD预测研究的新里程碑。
在IOD事件的预测中,深度学习技术已被证实能够有效提供关键的气候预测信息。与传统的统计模型和数值模式相比,其在处理非线性关系和大规模数据集方面有着显著优势。深度学习使研究者能够准确预测IOD事件的发作、持续性及强度,为印度次大陆、东南亚、澳大利亚和西太平洋岛国等地区提供精确的气候信息。深度学习同时也促进了对IOD事件成因的深入理解,为气候科学贡献了新的研究视角。因此,深度学习的应用对于增强我们对IOD现象的认识和应对能力具有重要意义。
本文首先对IOD现象的相关理论进行了概述,归纳总结了传统IOD预测方法,并分析了其优缺点;然后通过分析深度学习技术在IOD预测中的应用和效能,探讨了其相较于传统IOD预测方法的优越性和局限性;最后从深度学习预测IOD事件的现存挑战出发,对未来IOD预测的发展方向与趋势进行了展望。

1 IOD相关理论

IOD,一种显著的印度洋海气交互现象,以东、西印度洋海温异常波动为特征,形成鲜明的偶极模式[16]。这种模式通过印度洋季风等海气相互作用影响风向和降水模式。
IOD具有明显的季节性[17],通常在夏末至秋季形成并达到顶峰,这与ENSO全年可能发生的性质不同。此外,IOD现象的非对称性表明,正、负IOD的发展强度和气候影响存在差异[2],且这种非对称性随环境条件发生变化。IOD的表现形式具有多样性[18],包括不同类型的IOD事件,这增加了对其预测和研究的复杂性。海洋和大气之间的相互作用对IOD的形成和演变起着决定性作用。季风系统的年度变化,特别是其风向和强度的季节性波动,对印度洋海域的热力状态产生显著影响,进而会影响IOD的发展。
在热带气候系统中,IOD与ENSO之间的相互关系是关键气候动态[19-20]。尽管它们在地理上可能存在重叠,但在时间尺度和动力学机制上存在明显差异。正IOD可能会促进赤道太平洋西部的暖水区域扩张,从而有助于厄尔尼诺现象的形成;而负IOD可能会抑制这一效应,有时甚至与拉尼娜现象的增强相关。这种相互作用对印度次大陆的降水模式有重大影响,对于深入掌握和准确预测该区域的气候状况极为关键。
LI等[21]的研究表明,在印度次大陆地区,ENSO的正相位通常与降雨量的减少有关,而当ENSO的影响较弱或不明显时,IOD的正相位则可能增加该地区的降雨量。在1980年之前,ENSO和IOD之间存在较强的相关性,导致ENSO的影响在该地区占主导地位,IOD的影响相对较小,几乎被ENSO的影响所掩盖。然而,自1980年以来,ENSO和IOD的相关性减弱,IOD对降雨的影响开始变得更加显著,在某些情况下甚至成为主导因素。
亚洲夏季风与IOD之间也存在复杂的相互作用[22]。IOD事件通过改变热带印度洋的海面温度(sea surface temperature, SST)分布,进而影响亚洲夏季风的强度和路径。正IOD事件通常与印度洋西部SST的增暖相关,这可能导致夏季风的减弱。IOD与亚洲夏季风的相互作用涉及海洋-大气反馈机制,例如,通过调节海洋表层温度,改变海洋与大气之间的能量交换,从而影响夏季风的强度。这种相互作用可能因年份和地区而异,表现出时空变异性。因此,深入理解IOD与亚洲夏季风之间的相互作用,对于准确预测亚洲地区的气候条件具有重要意义。

2 IOD预测的传统研究方法

2.1 统计模型

统计模型[23-25]是通过深入分析IOD指数与各种气候变量(如海面温度、风场等)历史数据之间的相关性来建立的预测模型。例如,多元回归分析模型、经验正交函数分析模型等。
方玥炜等[26]构建并评估了多种统计模型,如多元线性回归模型和马尔可夫模型,旨在提高IOD预测的精度。实验过程中,研究者们使用了热带印度洋海面温度异常数据进行模型训练和验证,重点关注了IOD指数的预测性能。在对IOD指数的季节性预测效果进行评估时发现,秋季的预测精度最为突出,而春季则相对较低。春季预测的挑战可能源于该季节特有的气候多变性。除此之外,研究还特别指出,提高同期IOD指数的预测精度对于整体预测性能的增强具有显著效果。这一发现不仅验证了统计模型在捕捉季节性气候模式方面的有效性,也强调了它们在气候预测领域中的实际应用潜力。
统计模型作为一种预测手段,因其简单、计算效率高,在数据稀疏情形下尤为适用。然而,统计模型过度依赖历史数据,可能难以适应未知的气候变化,并且统计模型在捕捉复杂的非线性关系和处理观测误差方面存在局限,这影响了其在复杂气候预测中的准确性和可靠性[27-28]

2.2 数值模式

数值模式[29-30]作为IOD预测的一种关键方法,通过模拟海洋与大气间的复杂相互作用来进行数值预测。这些模型基于物理方程,包含海洋-大气耦合机制,以模拟两者之间的复杂交互作用。
晏红明等[31]利用具有高垂直分辨率的IAP9L大气环流模式进行数值模拟,旨在更精确地捕捉大气动态过程和气候变化对IOD的影响。研究团队设计了三种模拟试验:一个试验使用长期气候平均海温数据作为基准对照;另外两个试验分别在气候平均海温基础上,叠加具有正IOD和负IOD特征的海温偏差。模拟从3月开始,覆盖整个年度,以捕获IOD的季节性变化。每项试验均基于五种不同的初始场集成,以减少初始条件的不确定性。模拟结果显示,在IOD正相位期间,赤道东印度洋至阿拉伯海区域观测到异常的东风模式,这与印度南部及中南半岛南部地区夏季降水量的显著减少有关,与此相反,IOD负相位会导致西风异常,增加这些地区的降水。
中国科学院大气物理研究所开发的IAP-DecPreS系统[32],在数值模式的基础上加入数据同化技术[33-34],采纳了“集合最优插值-分析增量更新”(ensemble optimal interpolation with analysis update,EnOI-IAU)策略,能够有效整合海洋次表层温度剖面数据,优化IOD预测的性能。研究对全域同化与异常场同化两种不同策略在IOD预测中的应用效能进行了比较分析。利用1979—2015年间的气象数据,分别从每年的5月和8月开始进行模拟,每次模拟持续14个月。结果显示,基于全域同化的预测在确定性和概率性方面均优于异常场同化,在预测与ENSO同时发生的IOD事件时更为显著。
数值模式作为一种预测方法,通过综合考虑复杂的物理机制和相互作用,不仅有助于深入理解IOD的物理本质,还因其能够提供详细的时空分辨率而特别适用于长期预测。然而,数值模式也存在限制,其预测准确性可能受到初始条件敏感性、参数化方案选择、高计算复杂性以及对计算资源的大量需求等因素的影响。在这些因素中,初始条件的敏感性和参数化方案的适用性是影响预测不确定性的两个主要因素[35-36]
综合来看,传统方法和技术在IOD预测中各有其优势与局限(表1)。统计模型以其简单高效著称,但是难以应对未知气候的变化,无法捕捉复杂的非线性关系;数值模式能够考虑复杂的物理机制,但需要大量计算资源,且模式的准确性受到参数化方案和初始条件的影响。数据同化能够融合观测和模型数据,使得预测的准确性有所提高。通过综合应用这些方法和技术,可以实现优势互补,从而提高IOD预测的准确性和可靠性。
表1 传统IOD预测方法的优缺点分析

Tab.1 Analysis of the advantages and limitations of traditional IOD forecasting methods

方法 优点 局限性
统计模型 简易且计算效率高 对历史数据的过度依赖使其对未知的气候变化处理困难;无法捕捉复杂的非线性关系;对观测误差敏感
数值模式 可处理复杂的物理机制和相互作用,有助于理解IOD的物理机制;可提供详细的时空分辨率;可进行长期预测 对初始条件和参数化方案敏感;计算复杂度高,计算资源需求大

3 深度学习在IOD预测中的应用

深度学习依托于多层神经网络架构,能够自动提取数据特征并进行有效分类[37]。这些神经网络由众多节点或神经元组成,每个节点对输入信号进行加权处理,并通过激活函数生成输出。网络中每一层的输出数据会传递给下一层,形成连续的信息流,直至最终层生成模型的预测结果。以下是一些应用于IOD预测的网络模型示例,展示了深度学习技术在该领域的应用。

3.1 基于卷积神经网络的IOD预测

卷积神经网络(convolutional neural network,CNN),作为一种强大的图像和空间数据分析工具,在IOD预测中发挥着重要作用[38-39]。如图2所示,CNN通过卷积层来捕捉与IOD现象相关的关键海洋气象指标的空间特征,如海面温度异常和风场模式,这些特征对深入理解IOD的发展极为重要。CNN的池化层在减少特征维度的同时,保持了对IOD关键特征的敏感性,有助于模型在不同空间尺度上捕捉IOD的特征。随后的全连接层综合这些特征进行深入分析,实现对IOD事件的准确预测。
图2 卷积神经网络内部结构

Fig.2 Diagram of convolutional neural network architecture

LIU等[40]利用美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)的Extended Reconstructed Sea Surface Tempe-rature Version 5(ERSSTv5)数据集构建CNN模型,对IOD进行预测。ERSSTv5记录了1854—2019年全球海面温度异常(sea surface temperature anomaly,SSTA)信息。研究者选取了印度洋区域的SSTA数据作为CNN模型的输入特征,并将其分为训练集(1854—1989年)和验证集(1990—2019年)。构建CNN模型时,研究者设计了一个包含卷积层、池化层、全连接层和输出层的网络架构。卷积层负责提取SSTA数据的空间特征;池化层降低特征的空间维度,减少后续处理的复杂性;全连接层负责将提取的特征向量映射至最终的输出层,完成模型的预测任务。
在模型训练阶段,研究者对多个超参数进行了细致调整,包括过滤器的数量、批次大小和学习率,旨在优化模型性能。此外,研究者还采用了相关系数和均方根误差(root mean square error,RMSE)作为评估模型预测性能的指标。RMSE的计算公式如下:
RMSE= 1 n i = 1 n ( y ^ i - y i ) 2
式中: y ^ i是第i个时间点的预测值,yi是第i个时间点的观测值,n是观测值的数量。
实验结果证实,CNN在预测印度洋偶极子指数(dipole mode index,DMI)方面的表现优于北美多模型集合(North American Multi-Model Ensemble,NMME)中的动力模型,展现出更低的预测障碍敏感性和更小的系统性误差。图3所示即为CNN和NMME预测结果与实际观测到的DMI的对比。由图可知,CNN模型在预测DMI方面表现出色,具有长达7个月的预测能力。这种长期的预测能力可以让研究者提前规划并准备应对IOD现象可能带来的影响。CNN模型之所以能够取得这样的成果,归功于其强大的非线性特征提取能力和对空间结构信息的高效处理能力。这使得CNN特别适合于分析和预测复杂的气候数据模式,如海面温度异常。这一研究进展为气候预测领域带来了新的希望,并为未来进一步的模型优化和应用提供了坚实的基础。
图3 观测到的偶极子指数(DMI)与卷积神经网络(CNN)和北美多模型集合(NMME)预测结果的对比

(图件改绘自文献[40]。图例中“cor”表示相关系数,“lead”表示模型能够提前预测的时间长度。)

Fig.3 Comparison of the observed dipole mode index (DMI) with the predicted DMI using the convolutional neural network (CNN) and North American Multi-Model Ensemble (NMME)

(Figure is redrawn from reference [40]. In legend,‘cor’ refers to the correlation coefficient and ‘lead’ indicates the length of time the model can predict in advance.)

3.2 基于长短期记忆网络的IOD预测

长短期记忆网络(long short-term memory,LSTM)是一种特殊的循环神经网络(recurrent neural network,RNN)[41-45],能够解决长期依赖性问题。LSTM模型由输入门、遗忘门和输出门组成,能够自动学习并控制信息的存储和传递。如图4所示,LSTM模型的关键组件协同工作:输入门决定哪些最新信息应存储于单元状态中,这是捕捉当前气候数据对IOD事件影响的关键环节;遗忘门决定哪些长期存储的信息应被清除,帮助模型忽略与IOD发展无关的历史数据;输出门控制从单元状态到隐藏状态的信息流,这是确保IOD预测准确性的重要机制。LSTM的这种结构设计有效缓解了梯度消失和梯度爆炸问题,对于训练深度学习模型以预测具有长期影响的气候现象至关重要。
图4 LSTM单元结构图

Fig.4 Cell structure diagram of long short-term memory (LSTM)

HAQ等[46]利用LSTM模型分析了历史IOD数据及相关气候变量,以预测印度尼西亚东爪哇Sidoarjo地区的降雨情况。他们收集了2014年12月29日—2019年8月4日的IOD周数据和Juanda Surabaya气象站的日降雨数据。
在数据预处理阶段,研究人员执行了数据标准化,并采用插值技术来填充缺失的降雨数据。LSTM模型训练包括两个策略:第一种策略基于El Niño和IOD参数,第二种策略基于降雨参数。每种策略都尝试了不同的隐藏层数量、批量大小和学习率下降周期。
实验结果表明,基于降雨参数的LSTM模型在预测降雨方面更为准确,其平均绝对百分比误差(mean arctangent absolute percentage error,MAAPE)为0.581 0,而使用El Niño和IOD参数的模型的MAAPE值为0.964 4。MAAPE的计算公式如下:
MAAPE= 1 n i = 1 narctan y i - y ^ i y i
式中:yi是第i个时间点的观测值, y ^ i是第i个时间点的预测值,n是观测值的数量。
这表明在Sidoarjo地区,基于降雨参数的模型在预测降雨方面更为有效,而El Niño和IOD参数与降雨的相关性则较弱。尽管如此,LSTM模型通过整合El Niño和IOD参数,并优化调整隐藏层数量、批量大小和学习率下降周期等模型参数,仍然显著提高了与IOD相关的降雨预测的准确性。这说明LSTM模型能够有效地利用这些气候变量来增强预测性能,这对于预防由极端IOD事件引起的气候灾害具有重要意义。此外,该研究还特别强调了在预测模型中纳入地区特定气候特征(如季风变化、海温异常等)的重要性,因为这些因素与IOD的发展和演变密切相关。深入分析这些特征有助于更好地理解IOD事件对区域气候的影响,进而提高预测的准确性和可靠性。

3.3 基于卷积长短期记忆神经网络的IOD预测

卷积长短期记忆神经网络(convolutional LSTM network,ConvLSTM)是一种融合了CNN和LSTM的深度学习架构[47-49]。这种独特的结构使得ConvLSTM特别适合处理同时具有空间特征和时间序列依赖性的数据。卷积层通过卷积核捕捉输入数据中的局部特征,如边缘、纹理等,以识别图像模式。LSTM层则是一种特殊的RNN单元,它能够捕捉和记忆长期依赖信息,这对于处理序列数据(如时间序列)非常有用。并且,LSTM的门控机制也巧妙地解决了传统RNN在处理长序列数据时遇到的梯度消失或爆炸问题[41]。这种融合设计赋予了ConvLSTM处理复杂数据的能力,无论是在交通流量预测、气候建模,还是在其他需要综合考虑空间和时间信息的领域,都展现出强大的应用潜力。
在预测IOD指数的研究中,LI等[50]构建了ConvLSTM模型,该模型旨在提取海洋-大气数据的空间特征并分析其时间序列,以处理数据中的复杂时空关系。研究者使用了美国国家环境预报中心(National Centers for Environmental Prediction,NCEP)提供的1980—2018年的海洋大气再分析数据集。在模型训练中,研究者选取了特定时间步长(1月—3月、2月—4月、3月—5月)的海面温度异常作为输入数据,以预测未来7个月的IOD指数。这种方法充分利用了IOD的季节性特征,增强了预测的准确性。
在模型训练过程中,研究者们还考虑了风场信号对IOD预测的潜在影响,在每个时间步长中引入了风场数据。通过这种方式,模型不仅可以捕捉到海洋大气数据的空间特征,还能够考虑到风场对IOD现象的潜在影响。在模型训练阶段,研究者采用了Adam优化算法来调整网络权重,以最小化均方误差(mean squared error,MSE)作为损失函数来提高预测精度。设置了适当的epoch数以避免过拟合。同时模型使用了RMSE和准确率(accuracy,ACC)作为评估指标,以衡量模型预测的准确性。MSE和ACC的计算公式如下:
MSE= 1 n i = 1 n( y ^ i-yi)2
ACC=1- 1 n i = 1 n( y ^ i - y i y i)
式中: y ^ i是第i个时间点的预测值,yi是第i个时间点的观测值,n是观测值的数量。
实验结果表明,ConvLSTM模型在预测IOD指数方面展现了较高的准确性。其预测结果与实际观测值之间的平均相关系数高达82.87%,这一显著的相关性表明模型能够有效地捕捉IOD现象的演变趋势。如图5所示,ConvLSTM模型在基于前6个月风场数据的IOD指数预测上,相较于CFSv2模型展现出更优异的效果。研究者指出,能够同时处理空间和时间信息的ConvLSTM模型拥有卓越的预测性能,这对于理解和预测IOD这样的复杂气候现象十分重要。
图5 2015—2018年基于前6个月风场数据的ConvLSTM模型和CFSv2模型的IOD指数预测结果对比

(图件改绘自文献[50]。图例中“6u”表示过去6个月的风速数据。)

Fig.5 Comparison of IOD index prediction results from ConvLSTM model and CFSv2 model based on wind field data of the first 6 months from 2015 to 2018

(Figure is redrawn from reference [50]. In legend,“6u” refers to the wind speed data from the past 6 months.)

3.4 其他网络模型在IOD预测中的应用

除了使用上述深度学习模型以外,研究者LING等[15]还提出了基于深度学习的MTL-NET模型,该模型采用多任务学习框架,有效考量了ENSO与IOD之间的动态相互作用,提升了对IOD现象的预测准确性。模型通过处理大量的历史和实时数据实现对IOD的多季节预测。这些都使得MTL-NET模型在提前7个月甚至更长时间内的预测性能上,无论是相关系数还是均方根误差,均优于现有的动力模型。除此之外,MTL-NET模型集成了一个全新的注意力机制,该机制能够在不同的预测时间点上,识别出对预测正、负IOD事件最为关键的因素。这意味着,无论IOD处于正相位还是负相位,模型都能找出并聚焦于那些最重要的预测信号,从而提高预测的准确性和可靠性。
随着深度学习的不断发展,会有更多的复杂神经网络模型应用于IOD的预测研究,并在其中扮演越来越重要的角色。这些模型通常具有更强的数据处理能力、更出色的特征提取能力和更复杂的结构,能够更有效地捕捉IOD现象的复杂性和动态变化。同时研究人员也在探索如何提升这些模型的可解释性,以便更好地理解模型的预测过程和结果,进而增强对气候现象预测的信心和能力。

4 深度学习应用分析

深度学习技术在IOD预测领域取得了显著进展,特别是在开发数据驱动模型、精确预测IOD指数以及对IOD事件进行准确分类方面。通过对IOD事件的强度、持续时间和空间分布等关键特征的深入分析,深度学习模型能够助力研究者对IOD事件的不同类型及其影响进行更加深入的理解[51-52]表2详细列举了深度学习方法应用于IOD预测领域的优缺点。
表2 深度学习模型预测IOD的优缺点分析

Tab.2 Analysis of the advantages and limitations of deep learning models in predicting IOD

项目 优势 局限性
数据处理 能够有效地处理和分析大规模的气候数据集,从历史数据中发现不易被传统方法察觉的复杂模式和关联。 需要大量计算资源的同时还对大数据集有较高的依赖性,对数据质量和完整性比较敏感。
拟合能力 其卓越的非线性拟合能力,能够建立和模拟数据中复杂的非线性关系,提高预测的准确度。 在数据量有限或模型过于复杂时,深度学习模型可能会过度拟合训练数据,从而降低其在新数据上的泛化能力。
自动特征
学习
能够自动从原始数据中提取有用的特征,减少了对传统特征提取方法的依赖,提高了效率。
可解释性 决策过程的不透明性,使得其预测难以被直观理解和验证,从而可能限制其在关键领域(如灾害预警)的应用。
相较于传统预测方法,深度学习在大数据分析、非线性关系建模以及自动化特征提取方面展现出了显著优势。
1)在大数据的利用方面,深度学习展现出了卓越的性能,尤其是在IOD预测领域[53]。这些模型能够高效处理和深入分析庞大的观测数据集,显著提升了预测模型的容量和准确性。随着观测技术和计算能力的进步,气候科学领域积累了海量数据,这一数据积累为深度学习模型提供了坚实的数据支撑,极大地丰富了模型可学习的信息和特征集,从而使得对IOD事件的预测更为准确。
2)深度学习模型在处理气候系统的非线性特性方面具有显著优势[54]。由于气候系统是一个高度非线性和复杂的动态体系,它超出了传统线性模型的处理能力。深度学习模型通过其多层非线性变换,能够有效捕捉并模拟IOD的复杂时空依赖性。这使得模型在预测IOD事件时,能够提供准确度更高的结果,显著提升了预测性能。
3)深度学习模型拥有强大的自动特征学习能力[55]。模型能自动提取数据特征,降低了对传统特征提取方法的依赖。传统的气候预测方法往往依赖于专家知识和先验假设来选择影响气候的关键因素。然而,深度学习模型能自动从历史数据中识别关键特征。这意味着模型可以识别并利用那些可能被传统方法忽视的复杂模式和相互作用。
尽管深度学习方法在预测IOD时有着不小的优势,但其在数据需求、过拟合问题与解释性方面的局限性也不容忽视。
1)深度学习模型的训练通常依赖于大规模、高保真的数据集,以确保模型学习过程中的特征提取和模式识别的准确性。在IOD预测中,这意味着需要长期、连续的海洋和大气数据(如海面温度、风速、风向、降水量等)。这些数据的收集和处理成本高昂,且数据的质量和完整性直接影响模型的性能。在实际应用中,数据的不完整性、噪声以及缺失值等问题都可能对模型的训练和预测能力造成影响。与此同时,IOD事件的复杂性和多变性要求模型能够捕捉到多种尺度的时空变化,这进一步增加了数据需求的挑战。
2)在气候预测等高度不确定的领域,过拟合是深度学习模型需要面对的常见问题[56]。过拟合指模型在训练集上性能出色,但在新的测试集上泛化效果不佳,这表明模型可能学习到了数据中的噪声而非潜在的气候规律。对于IOD预测来说,泛化能力是非常重要的,研究者们采取了多种策略,如正则化、丢弃法、权重衰减等,以缓解过拟合问题,同时还使用交叉验证和早停等技术来监控模型的泛化能力。但是这些措施无法彻底防止过拟合,特别是在数据稀缺的情形下。
3)提高深度学习模型的可解释性,是当前深度学习研究中的重要课题之一[57]。深度学习模型因其众多的参数和复杂的架构而具有强大的预测性能,但这也使得模型的决策过程难以透明化。模型的可解释性对于理解模型的预测依据、提高用户信任以及在关键领域(如灾害预警)的决策支持至关重要。虽然特征重要性分析、激活图可视化等方法被用来提高模型的可解释性,但它们通常只能提供有限的洞察,未能全面揭示模型的内部工作机制。

5 挑战与未来发展方向

深度学习技术在IOD预测方面展现出巨大潜力,特别是在识别和分析海洋与大气之间复杂的相互作用模式方面。然而,在数据稀缺、模型泛化能力、可解释性以及集成方法等方面的难题仍然存在[58],未来发展可以从以下几个方面进行探索。

5.1 数据稀缺

IOD预测需要大量历史和实时数据,但目前数据稀缺限制了预测能力。为了克服现有数据集的局限性,后续研究可以探索采用先进的数据增强策略,扩充和丰富数据资源,提升模型训练的深度和广度。例如增加IOD事件的观测站点、延长观测时间序列,或者利用迁移学习将其他相关领域的数据和知识迁移到IOD预测中。此外,还可以探索多源数据融合技术,结合卫星遥感、浮标观测、气候模型输出等多种数据源,提高模型的训练效果。

5.2 模型泛化能力

IOD预测需要具有良好的泛化能力[59],即对新的未见过的IOD事件能够进行准确预测。为了提升这一能力,研究者们采取了多种策略。
1)数据增强[60]:通过实施旋转、平移、缩放等随机变换,增强模型对输入数据变化的鲁棒性,有效降低过拟合的风险。
2)迁移学习[61]:利用在其他领域(例如气候预测)预先训练好的深度学习模型,通过迁移学习技术将其知识迁移至IOD预测任务,以此提高模型的学习效率和性能。
除此之外,还包括正规化、超参数调优与数据平衡策略等。这些策略能够在一定程度上提升模型的泛化能力,增强模型的可靠性和有效性。然而,这些通常需要在模型复杂度、训练时间、计算资源需求与预测性能之间进行权衡。

5.3 可解释性

IOD预测领域强调模型的可解释性,这对于科学研究和实际应用极为重要。以下是提高模型可解释性的几种途径。
1)可视化方法:可视化是理解深度学习模型决策过程的直观方法[62]。其允许我们洞察模型如何通过中间层激活学习并表示特征间的关系。例如,CNN模型可以通过展示激活图来识别网络对输入图像最敏感的区域,RNN模型可以绘制隐藏状态的时间序列图来揭示模型随时间的信息处理机制。
2)解释性模型:使用解释性模型来替代或与深度学习模型结合,以提供更直观的解释和理解。解释性模型通常包括决策树、线性模型等[63],它们通过直观的结构或参数权重来展示模型如何基于输入特征做出预测。此外,还有局部解释方法,如局部可解释模型-无关解释(local interpretable model-agnostic explanations,LIME)和夏普利值可加解释(Shapley additive explanations,SHAP),通过分析模型对特定输入特征的敏感度,为复杂预测提供清晰的解释。
3)注意力机制:在模型中引入注意力机制(如CNN中的注意力模块或RNN中的自注意力机制)可以帮助模型聚焦于输入数据的关键部分[64]。通过分析这些注意力权重,了解模型在做出决策时关注的信息。
增强深度学习模型的可解释性是一个多学科交叉的领域,它结合了机器学习、认知科学、心理学和社会科学等领域的研究成果。随着技术的发展,新的解释性工具和方法将不断涌现,以帮助研究者更深入地理解和信任深度学习模型。

5.4 集成方法

通过与多种预测方法的结合,深度学习技术构建出了性能卓越的集成预测模型[65]。通过集成多种模型和方法的优点来提高预测性能和鲁棒性。研究可以进一步探索装袋法(bagging)、提升法(boosting)和堆叠法(stacking)等多样化的集成策略,并探索它们在IOD预测中的应用潜力。
未来的研究应当不断探索创新的深度学习架构和算法,以期在IOD预测中实现更高的应用效能。同时,跨学科的合作对于推动IOD预测的研究和发展极为关键,需要将气象学、海洋学、计算机科学等不同领域的专业知识进行有效融合。

6 结语

本文深入探讨了深度学习技术在提高IOD预测准确性方面的潜力,并指出了未来研究需要解决的关键问题。具体内容包括:
1)深度学习技术在IOD预测中彰显了卓越的性能,能够有效地捕捉和学习IOD事件的复杂时空特征,在预测IOD的强度和发生时间等方面提供更高的准确性。
2)尽管深度学习模型在IOD预测中取得了显著成果,但数据稀缺、模型的泛化能力以及预测结果的可解释性等关键问题仍待解决。为了克服这些挑战,未来的研究应当集中在以下几个方向:开发新的数据增强技术以扩充训练集,利用迁移学习和多任务学习提高模型的泛化能力,探索可视化和解释性工具以增强模型的可解释性。
3)集成学习方法,包括模型融合和多模型集成等,为提高IOD预测的准确性和鲁棒性开辟了新途径。通过整合不同模型的长处,可以更全面地捕捉IOD现象的多尺度特征,从而提高预测的可靠性。
深度学习技术在IOD事件预测中的应用不仅展现了其提升预测性能的巨大潜力,也为气候预测领域扩展了新的研究视角。面对数据稀缺、模型泛化和可解释性等考验,持续的技术创新和方法改进将使深度学习模型在气候科学中扮演更加关键的角色。这将为科学研究和决策制定提供坚实的基础,有效应对气候变化带来的挑战。
[1]
肖莺, 张祖强, 何金海. 印度洋偶极子研究进展综述[J]. 热带气象学报, 2009, 25(5):621-627.

XIAO Y, ZHANG Z Q, HE J H. Progresses in the studies on Indian Ocean Dipoles[J]. Journal of Tropical Meteorology, 2009, 25(5): 621-627.

[2]
黄怡陶, 张文君, 薛奥运. ENSO对印度洋偶极子非对称性的影响及机制研究[J]. 气象科学, 2023, 43(1):1-14.

HUANG Y T, ZHANG W J, XUE A Y. Influence of ENSO on Indian Ocean Dipole skewness and its physical mechanism[J]. Journal of the Meteorological Sciences, 2023, 43(1): 1-14.

[3]
BAHIYAH A, WIRASATRIYA A, MARDIANSYAH W, et al. Massive SST-front anomaly in the tip of Sumatra waters triggered by extreme positive IOD 2019 event[J]. International Journal of Remote Sensing, 2023: 1-18.

[4]
姜继兰, 刘屹岷, 李建平, 等. 印度洋偶极子研究进展回顾[J]. 地球科学进展, 2021, 36(6):579-591.

DOI

JIANG J L, LIU Y M, LI J P, et al. Indian Ocean Dipole: A review and perspective[J]. Advances in Earth Science, 2021, 36(6): 579-591.

[5]
MAGEE A D, KIEM A S. Using indicators of ENSO, IOD, and SAM to improve lead time and accuracy of tropical cyclone outlooks for Australia[J]. Journal of Applied Meteorology and Climatology, 2020, 59(11): 1901-1917.

[6]
ROY I, MLIWA M, TROCCOLI A. Important drivers of East African monsoon variability and improving rainy season onset prediction[J]. Natural Hazards, 2024, 120: 429-445.

[7]
LIGUORI G, MCGREGOR S, SINGH M, et al. Revisiting ENSO and IOD contributions to Australian precipitation[J]. Geophysical Research Letters, 2022, 49(1): e2021GL094295.

[8]
KURNIADI A, WELLER E, MIN S K, et al. Independent ENSO and IOD impacts on rainfall extremes over Indonesia[J]. International Journal of Climatology, 2021, 41(6): 3640-3656.

[9]
NGUYEN-LE D, NGO-DUC T, MATSUMOTO J. The tele-connection of the two types of ENSO and Indian Ocean Dipole on Southeast Asian autumn rainfall anomalies[J]. Climate Dynamics, 2024, 62(6): 1-23.

[10]
SAJI N H, GOSWAMI B N, VINAYACHANDRAN P N, et al. A dipole mode in the tropical Indian Ocean[J]. Nature, 1999, 401(6751): 360-363.

[11]
CAI W J, SANTOSO A, WANG G J, et al. Increased frequency of extreme Indian Ocean Dipole events due to greenhouse warming[J]. Nature, 2014, 510(7504): 254-258.

[12]
DU Y, ZHANG Y H, ZHANG L Y, et al. Thermo-cline warming induced extreme Indian Ocean Dipole in 2019[J]. Geophysical Research Letters, 2020, 47(18):e2020GL090079.

[13]
ABRAM N J, GAGAN M K, COLE J E, et al. Recent intensification of tropical climate variability in the Indian Ocean[J]. Nature Geoscience, 2008, 1(12): 849-853.

[14]
ABRAM N J, WRIGHT N M, ELLIS B, et al. Coupling of Indo-Pacific climate variability over the last millennium[J]. Nature, 2020, 579(7799): 385-392.

[15]
LING F H, LUO J J, LI Y, et al. Multi-task machine learning improves multi-seasonal prediction of the Indian Ocean Dipole[J]. Nature Communications, 2022, 13(1): 7681.

[16]
MCKENNA S, SANTOSO A, GUPTA A S, et al. Indian Ocean Dipole in CMIP5 and CMIP6: Characteristics, biases, and links to ENSO[J]. Scientific Reports, 2020, 10(1): 11500.

[17]
ZHANG Y, ZHOU W, WANG X, et al. IOD,ENSO, and seasonal precipitation variation over Eastern China[J]. Atmospheric Research, 2022, 270: 106042.

[18]
HUANG K, HUANG B H, WANG D X, et al. Diversity of strong negative Indian Ocean Dipole events since 1980: Characteristics and causes[J]. Climate Dynamics, 2024, 62(3): 2017-2040.

[19]
LESTARI R K, KOH T Y. Statistical evidence for asy-mmetry in ENSO-IOD interactions[J]. Atmosphere-Ocean, 2016, 54(5): 498-504.

[20]
董笛, 何金海. 印度洋偶极子与两类El Niño的关联及其可能机理[J]. 热带气象学报, 2015, 31(2):182-192.

DONG D, HE J H. The linkage between Indian Ocean Dipole and two types of El Niño event and its possible mechanisms[J]. Journal of Tropical Meteorology, 2015, 31(2): 182-192.

[21]
LI Z G, CAI W J, LIN X P. Dynamics of changing impacts of tropical Indo-Pacific variability on Indian and Australian rainfall[J]. Scientific Reports, 2016, 6: 31767.

DOI PMID

[22]
POWER K, AXELSSON J, WANGDI N, et al. Regional and local impacts of the ENSO and IOD events of 2015 and 2016 on the Indian summer monsoon—A Bhutan case study[J]. Atmosphere, 2021, 12(8): 954.

[23]
SEMENOV S M, POPOV I O, YASYUKEVICH V V. Statis-tical model for assessing the formation of climate-related hazards based on climate monitoring data[J]. Russian Meteorology and Hydrology, 2020, 45(5): 339-344.

[24]
PEREVEDENTSEV Y P, SHANTALINSKII K M, GURY-ANOV V V, et al. Empirical statistical model of climatic changes in the Volga region[J]. IOP Conference Series: Earth and Environmental Science, 2018, 211: 012016.

[25]
WANG Y F, XU Y P, SONG S, et al. Assessing the impacts of climatic and anthropogenic factors on water level variation in the Taihu Plain based on non-stationary statistical models[J]. Environmental Science and Pollution Research International, 2020, 27(18): 22829-22842.

DOI PMID

[26]
方玥炜, 唐佑民, 李俊德, 等. 几种统计模型对热带印度洋海温异常的预报[J]. 海洋学研究, 2018, 36(1):1-15.

DOI

FANG Y W, TANG Y M, LI J D, et al. Several statistical models to predict tropical Indian Ocean sea surface tempe-rature anomaly[J]. Journal of Marine Sciences, 2018, 36(1): 1-15.

[27]
LI X W, BORDBAR M H, LATIF M, et al. Monthly to seasonal prediction of tropical Atlantic sea surface tempe-rature with statistical models constructed from observations and data from the Kiel Climate Model[J]. Climate Dyna-mics, 2020, 54(3): 1829-1850.

[28]
YANG L C, FRANZKE C L E, FU Z T. Evaluation of the ability of regional climate models and a statistical model to represent the spatial characteristics of extreme precipitation[J]. International Journal of Climatology, 2020, 40(15): 6612-6628.

[29]
FERREIRA N C R, MIRANDA J H, COOKE R. Climate change and extreme events on drainage systems: Numerical simulation of soil water in corn crops in Illinois (USA)[J]. International Journal of Biometeorology, 2021, 65(7): 1001-1013.

DOI PMID

[30]
FANG X W, LI Z, CHENG C, et al. Response of freezing/thawing indexes to the wetting trend under warming climate conditions over the Qinghai-Tibetan Plateau during 1961-2010: A numerical simulation[J]. Advances in Atmospheric Sciences, 2023, 40(2): 211-222.

[31]
晏红明, 杨辉, 李崇银. 赤道印度洋海温偶极子的气候影响及数值模拟研究[J]. 海洋学报, 2007, 29(5):31-39.

YAN H M, YANG H, LI C Y. Numerical simulations on the climate impacts of temperature dipole in the equatorial Indian Ocean[J]. Acta Oceanologica Sinica, 2007, 29(5): 31-39.

[32]
胡帅, 吴波, 周天军. 近期气候预测系统IAP-DecPreS对印度洋偶极子的回报技巧:全场同化和异常场同化的比较[J]. 大气科学, 2019, 43(4):831-845.

HU S, WU B, ZHOU T J. Predictive skill of the near-term climate prediction system IAP-DecPreS for the Indian Ocean Dipole: A comparison of full-field and anomaly initializations[J]. Chinese Journal of Atmospheric Sciences, 2019, 43(4): 831-845.

[33]
FANG M, LI X. Paleoclimate data assimilation: Its moti-vation, progress and prospects[J]. Science China Earth Sciences, 2016, 59(9): 1817-1826.

[34]
SHAHABADI M B, BÉLAIR S, BILODEAU B, et al. Impact of weak coupling between land and atmosphere data assimilation systems on environment and climate change Canada’s global deterministic prediction system[J]. Weather and Forecasting, 2019, 34(6): 1741-1758.

[35]
HU G N, DANCE S L, BANNISTER R N, et al. Progress, challenges, and future steps in data assimilation for convection-permitting numerical weather prediction: Report on the virtual meeting held on 10 and 12 November 2021[J]. Atmospheric Science Letters, 2023, 24(1): e1130.

[36]
DANIEL D, AYENEW T, FLETCHER C G, et al. Nume-rical groundwater flow modelling under changing climate in Abaya-Chamo lakes basin, Rift Valley, Southern Ethiopia[J]. Modeling Earth Systems and Environment, 2022, 8(3): 3985-3999.

[37]
SHINDE P P, SHAH S. A review of machine learning and deep learning applications[C]//2018 Fourth International Conference on Computing Communication Control and Automation (ICCUBEA), August 16-18, 2018, Pune, India. IEEE, 2018: 1-6.

[38]
HAM Y G, KIM J H, LUO J J. Deep learning for multi-year ENSO forecasts[J]. Nature, 2019, 573(7775): 568-572.

[39]
SUN M, CHEN L, LI T, et al. CNN-based ENSO forecasts with a focus on SSTA zonal pattern and physical interpre-tation[J]. Geophysical Research Letters, 2023, 50(20):e2023GL105175.

[40]
LIU J, TANG Y M, WU Y L, et al. Forecasting the Indian Ocean Dipole with deep learning techniques[J]. Geophysical Research Letters, 2021, 48(20): e2021GL094407.

[41]
ZHANG Y, GU Z H, VAN GRIENSVEN THÉ J, et al. The discharge forecasting of multiple monitoring station for Humber River by Hybrid LSTM models[J]. Water, 2022, 14(11): 1794.

[42]
NIGAM A, SRIVASTAVA S. Hybrid deep learning models for traffic stream variables prediction during rainfall[J]. Multimodal Transportation, 2023, 2(1): 100052.

[43]
CAO X Q, GUO Y N, LIU B N, et al. ENSO prediction based on long short-term memory (LSTM)[J]. IOP Confe-rence Series: Materials Science and Engineering, 2020, 799: 012035.

[44]
HUANG A, VEGA-WESTHOFF B, SRIVER R L. Analyz-ing El Niño-Southern Oscillation predictability using long-short-term-memory models[J]. Earth and Space Science, 2019, 6(2): 212-221.

[45]
KHEYRURI Y, SHARAFATI A, NESHAT A. Predicting agricultural drought using meteorological and ENSO parameters in different regions of Iran based on the LSTM model[J]. Stochastic Environmental Research and Risk Assessment, 2023, 37(9): 3599-3613.

[46]
HAQ D Z, RINI NOVITASARI D C, HAMID A, et al. Long short-term memory algorithm for rainfall prediction based on El- Niño and IOD data[J]. Procedia Computer Science, 2021, 179: 829-837.

[47]
谢文鸿, 徐广珺, 董昌明. 基于ConvLSTM机器学习的风暴潮漫滩预报研究[J]. 大气科学学报, 2022, 45(5):674-687.

XIE W H, XU G J, DONG C M. Research on storm surge floodplain prediction based on ConvLSTM machine learning[J]. Transactions of Atmospheric Sciences, 2022, 45(5): 674-687.

[48]
GENG H T, HU Z Y, WANG T L. ConvLSTM based temperature forecast modification model for north China[J]. Journal of Tropical Meteorology, 2022, 28(4): 405-412.

[49]
MOISHIN M, DEO R C, PRASAD R, et al. Designing deep-based learning flood forecast model with ConvLSTM hybrid algorithm[J]. IEEE Access, 2021, 9: 50982-50993.

[50]
LI C, FENG Y, SUN T Y, et al. Long term Indian Ocean Dipole (IOD) index prediction used deep learning by ConvLSTM[J]. Remote Sensing, 2022, 14(3): 523.

[51]
RATNAM J V, DIJKSTRA H A, BEHERA S K. A machine learning based prediction system for the Indian Ocean Dipole[J]. Scientific Reports, 2020, 10(1): 284.

[52]
CHEN P, SUN B, WANG H J, et al. Improving the CFSv2 prediction of the Indian Ocean Dipole based on a physical-empirical model and a deep-learning approach[J]. International Journal of Climatology, 2022, 42(16): 9200-9214.

[53]
WANG G G, CHENG H L, ZHANG Y M, et al. ENSO analysis and prediction using deep learning: A review[J]. Neurocomputing, 2023, 520: 216-229.

[54]
LUCIA S, KARG B. A deep learning-based approach to robust nonlinear model predictive control[J]. IFAC PapersOnLine, 2018, 51(20): 511-516.

[55]
HABIBI O, CHEMMAKHA M, LAZAAR M. Effect of features extraction and selection on the evaluation of machine learning models[J]. IFAC-PapersOnLine, 2022, 55(12): 462-467.

[56]
CHARILAOU P, BATTAT R. Machine learning models and over-fitting considerations[J]. World Journal of Gastroen-terology, 2022, 28(5): 605-607.

[57]
化盈盈, 张岱墀, 葛仕明. 深度学习模型可解释性的研究进展[J]. 信息安全学报, 2020, 5(3):1-12.

HUA Y Y, ZHANG D C, GE S M. Research progress in the interpretability of deep learning models[J]. Journal of Cyber Security, 2020, 5(3): 1-12.

[58]
DING W P, ABDEL-BASSET M, HAWASH H, et al. Explainability of artificial intelligence methods, applications and challenges: A comprehensive survey[J]. Information Sciences, 2022, 615: 238-292.

[59]
MARIN I, KUZMANIC SKELIN A, GRUJIC T. Empirical evaluation of the effect of optimization and regularization techniques on the generalization performance of deep convolutional neural network[J]. Applied Sciences, 2020, 10(21): 7817.

[60]
SHORTEN C, KHOSHGOFTAAR T M. A survey on image data augmentation for deep learning[J]. Journal of Big Data, 2019, 6(1): 60.

[61]
ZHUANG F Z, QI Z Y, DUAN K Y, et al. A compre-hensive survey on transfer learning[J]. Proceedings of the IEEE, 2021, 109(1): 43-76.

[62]
MATVEEV S A, OSELEDETS I V, PONOMAREV E S, et al. Overview of visualization methods for artificial neural networks[J]. Computational Mathematics and Mathematical Physics, 2021, 61(5): 887-899.

[63]
曾春艳, 严康, 王志锋, 等. 深度学习模型可解释性研究综述[J]. 计算机工程与应用, 2021, 57(8):1-9.

DOI

ZENG C Y, YAN K, WANG Z F, et al. Survey of interpretability research on deep learning models[J]. Computer Engineering and Applications, 2021, 57(8): 1-9.

DOI

[64]
SAMO M, MASE J M M, FIGUEREDO G. Deep learning with attention mechanisms for road weather detection[J]. Sensors, 2023, 23(2): 798.

[65]
MOHAMMED A, KORA R. A comprehensive review on ensemble deep learning: Opportunities and challenges[J]. Journal of King Saud University-Computer and Information Sciences, 2023, 35(2): 757-774.

Outlines

/