D3R方法有效检测不稳定时间序列异常,克服漂移影响,性能提升显著。
原文标题:无惧漂移!D3R方法可用于不稳定多元时间序列异常检测,SOTA提升11%
原文作者:数据派THU
冷月清谈:
现有方法通常侧重于稳定数据,忽略了现实世界数据中存在的漂移,导致误报。D3R 旨在解决这个问题。
D3R 的核心在于两个模块:
1. 动态分解模块:该模块利用时间戳作为输入,结合数据时间混合注意力机制和偏移减法策略来分解时间序列,提取稳定成分和趋势成分,克服了传统分解方法在长周期时间序列上的限制。
2. 扩散重建模块:该模块使用噪声扩散技术创建一个外部信息瓶颈,并用主干网络重建受污染的数据。重建误差作为异常得分。这种方法避免了传统方法在信息瓶颈调节上的高昂成本,允许外部调节信息瓶颈而无需重新训练模型。
实验结果表明,D3R 在多个真实世界数据集上优于现有方法,平均相对提升达到 11%。
怜星夜思:
2、D3R 使用噪声扩散技术创建外部信息瓶颈。除了噪声扩散,还有哪些技术可以用来创建外部信息瓶颈?它们各自有什么优缺点?
3、文章中提到的“偏移减法策略”具体是如何工作的?它对模型的性能提升有多大?在其他类型的时序数据中,这种策略是否仍然适用?
原文内容
来源:时序人本文约2000字,建议阅读5分钟
本文介绍一篇 NeurIPS 2023中的工作,作者提出了动态分解与扩散重建(D3R)方法,这是一种针对现实世界中不稳定数据的新型异常检测网络。

本文约2000字,建议阅读5分钟
本文介绍一篇 NeurIPS 2023中的工作,作者提出了动态分解与扩散重建(D3R)方法,这是一种针对现实世界中不稳定数据的新型异常检测网络。
-
长周期时间序列分解的技术限制。传统的分解方法通常是静态的,难以满足实时更新的要求;而一些现代的动态解决方案又往往受限于局部滑动窗口的尺寸,无法很好地处理那些周期长度超过窗口大小的情况。
-
信息瓶颈调节的成本高昂。正确设置信息瓶颈对基于重建的模型非常重要,通常需要通过大量的实验才能找到合适的平衡点。过去的方法多依赖于内部参数,比如潜在表示空间的大小,这意味着每次调整参数后都需要重新训练模型,这极大地浪费了计算资源。
-
数据编码器:由先进的时空 Transformer 模块组成,专门针对多维度时间序列中的时序依赖性和变量相关性进行建模。时空 Transformer 模块的具体构造详见下图左侧,它巧妙地集成了并行运作的时间注意力机制和空间注意力机制。
-
时间编码器:由单一的时间 Transformer 模块组成,对时间戳的时序依赖性进行建模。
-
分解模块:引入了一种新颖的数据时间混合注意力机制(详情见图2右侧),通过整合时间戳之间的点积相似性和观测值间的点积相似性,实现多源信息的有效融合,并据此生成稳定分量。
-
偏移减法:尽管不同周期内同一时刻的往往表现出某种程度上的相似波动模式,但并不总是严格一一对应。为此,作者采用了偏移减法策略,有效解决了潜在的水平位移问题。
-
噪声扩散:不同于传统的 DDPM 方法,在向输入添加噪声的同时,作者特别注意保持原有趋势不变,使得算法能够更加聚焦于那些更加重要的稳定分量上。
-
主干网络:同样依托于时空 Transformer 模块构建而成。它在关注稳定分量同时也兼顾到趋势分量的变化情况。值得注意的是,与常规 DDPM 流程不同,D3R 的主干网络直接承担起还原受污染数据的任务,而非单纯预测噪声本身。