ATFNet:革命性的长时间序列预测模型

ATFNet通过结合时域和频域模块,提高了长期时间序列预测的准确性。该模型创新地引入周期性加权和扩展DFT技术。

原文标题:ATFNet:长时间序列预测的自适应时频集成网络

原文作者:数据派THU

冷月清谈:

ATFNet模型旨在提高长期时间序列预测的精度,通过结合时域和频域模块,在捕获局部和全局依赖性方面表现出色。业内常用的时间序列分析方式通常局限于局部或全局依赖性的问题,而ATFNet通过引入一套新颖的加权机制,对周期性数据的权重进行动态调整,从而优化了预测效果。该模型分为三个核心模块:T-Block用于时域的局部依赖捕获,F-Block用于频域的全局依赖分析,Dominant Harmonic Series Energy Weighting则根据输入序列的周期性智能分配权重。此外,ATFNet还使用扩展离散傅立叶变换(Extended DFT)技术来降低计算成本并提供更高效的谱分析。这些创新使得ATFNet在多个数据集上展现了领先的预测表现,并且相关代码已在GitHub上发布,方便研究人员和工程师进行测试和应用。

怜星夜思:

1、ATFNet在实际应用中有哪些优势?
2、扩展离散傅立叶变换(Extended DFT)有什么特别之处?
3、注意力机制如何提高F-Block的效率?

原文内容


源:Deephub Imba

本文约1300字,建议阅读5分钟

本文介绍了ATFNet深度学习模型。


ATFNet是一个深度学习模型,它结合了时间域和频域模块来捕获时间序列数据中的依赖关系。引入了一种新的加权机制来调整周期性的权重,增强了离散傅立叶变换,并包括一个复杂关系识别的注意力机制,在长期时间序列预测中优于当前方法(每个模型都这么说)。这是4月发布在arxiv上的论文,还包含了源代码。


因为时间序列(TS)分析有两种类型的域,即时域和频域。时域是关于信号强度随时间的变化,而频域是从频率的角度分析时间序列。前者有助于理解局部依赖关系,后者有助于理解全局依赖关系。混合两者是一个很好的方法,但是需要确实可行的方法。

ATFNet框架旨在解决处理现实世界时间序列数据中不同周期特性混合的挑战。这种组合允许利用时域和频域表示的优势进行全面分析。


ATFNet主要由三个子部分组成:1)T-Block从时域捕获局部依赖性;2) F-Block从频域捕获全局依赖性。扩展DFT用于生成输入序列的频率对准频谱。3)主导谐波系列能量加权,根据输入序列的周期性,为f块和t块分配适当的权重。

扩展DFT


在ATFNet中使用扩展DFT来对齐输入序列的频谱,从而允许对时间序列数据进行更全面的分析。通过只考虑输出的前一半(去掉后一半)来降低成本。


完整级数的DFT基如下:

这样,我们就得到了一个长度为L + T的谱,它与完整序列的DFT谱一致。

F-Block


F-Block是基于原始注意力机制,并进行了一些修改。注意力机制虽然效率不高,但功能强大,经过修改可以使其更高效。

该块接受长度为l的单变量频谱F(扩展DFT的输出),然后用RevIN方法对F进行归一化以处理频域频谱

图片
Complex-valued Spectrum 注意力的最终输出计算如下:

RevIN是一种具有可学习仿射变换的归一化和反归一化方法。可以应用于任何深度神经网络,是一种模型不可知的方法。

这里没有使用位置编码

T-Block


这部分负责数据的局部依赖性,也就是时域。数据被分成序列长度为p的N个小块。将每个小块嵌入到编码器中,使用线性投影来生成输出。这里也使用了RevIN。

Dominant Harmonic Series Energy Weighting


主导谐波系列能量加权机制根据输入序列的周期性动态调整时频域模块之间的权重


算法如下:


结果


论文给出的对比MSE是最低的


8个数据集的多变量长期时间序列预测结果。最好的结果用粗体表示,第二好的结果用下划线表示。这里只显示所有预测长度T∈{96,192,336,720}的平均结果


ETT数据集的单变量长期时间序列预测结果。ETT数据集具有目标特征“Oil Temperature”,将其作为单变量时间序列进行预测。最好的结果用粗体表示,第二好的结果用下划线表示。


消融研究结果。

总结


这篇论文介绍了一个名为ATFNet的创新框架,它结合了时间域模块和频率域模块来同时捕获时间序列数据中的局部和全局依赖性。研究者提出了一种新颖的机制“主导谐波系列能量加权”,根据输入时间序列的周期性动态调整两个模块之间的权重。在频率域模块中,通过扩展的离散傅立叶变换(Extended DFT)来解决离散频率不对齐的问题,并引入了复数谱注意力机制,用于探究不同频率组合之间的复杂关系。

论文地址

https://arxiv.org/abs/2404.05192

代码

https://github.com/yhyhyhyhyhy/atfnet


编辑:王菁

校对:林亦霖


我觉得ATFNet可以更好地处理季节性数据,比如气象预测或能源消耗。这种模式可以适应变化的周期特性,让预测更加精准。

实际上,许多深度学习模型在处理长时间序列时常常面临时间依赖性的问题,ATFNet通过时频结合来解决这一点,是一种很值得关注的思路。

优势在于它的灵活性,能够通过调整加权算法适应不同的时间序列特性,可能会在金融数据分析等领域大放异彩。

注意力机制通过动态关注输入的关键信息,可以在复杂的时间序列中得到更清晰的信号,这对于提高模型的整体效率是非常有帮助的。

F-Block中修改的注意力机制,让模型可以减轻无关信息的干扰,归一化处理也让实现变得更简单。

注意力机制在整个深度学习领域都被广泛应用,相比于传统方法,它的适应性让F-Block在处理复杂关系时表现更胜一筹。

扩展DFT最大的问题是频率不对齐的问题,传统DFT可能忽视了某些重要频域信息,而扩展DFT通过调整周期性使得分析更全面,特别适合非均匀数据。

有趣的是,这种方法在很多实际场景中都有应用,比如在信号处理和图像识别等领域中,能有效地提升效果。

所以说,扩展DFT在实时性和准确性上都有提升,很适合动态变化的场景,但实现的复杂度稍高。