麻省理工学院深度学习算法在随着时间的推移收集的测量中找到了隐藏的警告信号

算法检测时间序列数据中的异常

麻省理工学院的研究人员开发了一种基于深度学习的算法来检测时间序列数据中的异常。新闻来源:麻省理工学院

一种新的深度学习算法可以在系统——从卫星到数据中心——出现混乱时提供先进的通知。

当你负责一颗价值数百万美元、以每小时数千英里的速度在太空中飞驰的卫星时,你需要确保它运行平稳。时间序列会有所帮助。

时间序列只是随着时间的推移重复采取的测量记录。它可以跟踪系统的长期趋势和短期削波。实例包括自1958年以来的新日用病例的臭名昭着的Covid-19曲线和跟踪大气二氧化碳浓度的龙骨曲线。在大数据的时代,“时间序列被收集到卫星到涡轮机上,”Kalyan Veeramachani。“所有机械都有传感器,收集这些时间序列关于它们的运作方式。”

但分析这些时间序列,并在其中标记出异常数据点,可能会很棘手。数据可能是有噪声的。如果卫星操作员看到一系列高温读数,他们如何知道这是无害的波动还是卫星即将过热的信号?

这是Veeramachaneni面临的一个问题,他领导了数据-人工智能小组麻省理工学院他希望解决这个问题。该小组开发了一种基于深度学习的新方法,可以在时间序列数据中标记异常。他们的方法被称为“TadGAN”,优于其他竞争方法,可以帮助运营商探测并响应一系列高价值系统的重大变化,从太空飞行的卫星到地下室嗡嗡作响的计算机服务器群。

这项研究将在本月的IEEE大数据会议上公布。该论文的作者包括数据到人工智能小组成员Veeramachaneni、博士后刘东宇、访问研究学生亚历山大·盖格、硕士学生萨拉·阿勒尼海米什,以及西班牙雷伊·胡安·卡洛斯大学的阿尔弗雷多·库斯塔- infante。

高股权

对于作为卫星复杂的系统,必须自动化时间序列分析。卫星公司SES与Veeramachaneni合作,从其通信卫星接收了大量时间序列 - 每种航天器约30,000个独特的参数。SES控制室的人类运营商只能跟踪那些时间序列的一小部分,因为它们闪烁在屏幕上的闪烁。对于其余的,他们依靠警报系统来标记超出范围的值。“所以他们对我们说,”你能做得更好吗?“Veeramachaneni说。该公司希望他的团队使用深度学习来分析所有这些时间序列并标记任何异常行为。

这种请求的风险很高:如果深度学习算法不能检测到异常,团队可能会错过修复问题的机会。但是,如果它每次有一个吵闹的数据点就发出警报,人类审查员就会浪费时间不断检查这个喊狼来了的算法。“所以我们面临着这两个挑战,”刘说。“我们需要平衡它们。”

这个团队并不是仅仅在卫星系统上实现这种平衡,而是努力创建一个更通用的异常检测框架——一个可以跨行业应用的框架。他们转向了被称为生成对抗网络(GANs)的深度学习系统,该系统通常用于图像分析。

GAN由一对神经网络组成。其中一个网络是“生成者”,它生成假图像,而另一个网络是“鉴别者”,它处理图像,并试图确定它们是“生成者”生成的真实图像还是假图像。经过多轮的这一过程,发生器从鉴别器的反馈中学习,并变得熟练地创造超现实的赝品。这项技术被认为是“无监督”学习,因为它不需要一个预先标记的数据集,即图像被标记为他们的对象。(大型标记数据集很难获得。)

该团队将这种GAN方法用于时间序列数据。“通过这种训练策略,我们的模型可以分辨出哪些数据点是正常的,哪些是异常的,”Liu说。它通过检查实时时间序列和假甘生成的时间序列之间的差异(可能的异常)来做到这一点。但研究小组发现,单凭GANs还不足以在时间序列中检测异常,因为它们无法准确地定位出真实的时间序列片段,而这些片段应该与假的片段进行比较。结果,Veeramachaneni说:“如果你单独使用GAN,你会产生很多假阳性。”

为了防止误报,该团队补充了一种被称为自动编码器的算法——另一种无监督深度学习技术。与甘斯“狼来了”的倾向相反,自动编码器更容易漏掉真正的异常。这是因为自动编码器倾向于捕捉时间序列中的太多模式,有时将实际异常解释为无害的波动——这就是所谓的“过度拟合”问题。通过将GAN与自动编码器相结合,研究人员精心设计了一个异常检测系统,它达到了完美的平衡:TadGAN是警惕的,但它不会产生太多的错误警报。

经得起时间序列的考验

加上,田队队击败了比赛。在20世纪70年代开发了传统的时间系列预测方法,称为Arima。“我们希望看到我们来了多远,以及深度学习模式是否实际上可以改善这种古典方法,”Alnegheimish说。

该团队对11个数据集进行了异常检测测试,让ARIMA与TadGAN和其他7种方法进行了比较,其中包括亚马逊和微软等公司开发的一些方法。TadGAN在11个数据集中的8个异常检测方面优于ARIMA。由亚马逊开发的第二好的算法只在六个数据集上超过了ARIMA。

Alnegheimish强调,他们的目标不仅是开发一种一流的异常检测算法,而且要使其广泛使用。她说:“我们都知道人工智能存在再现性问题。该团队已经免费提供了TadGAN的代码,并发布了它们定期更新。此外,他们开发了一个基准系统,供用户比较不同异常检测模型的性能。

“这个基准测试是开源的,所以有人可以去尝试一下。如果他们愿意,他们可以添加自己的模型。”“我们希望减轻人工智能不可复制的污名。我们希望确保一切都是健全的。”

Veeramachaneni希望TadGAN有一天能服务于各种各样的行业,而不仅仅是卫星公司。例如,它可以用来监控计算机应用程序的性能,这些应用程序已成为现代经济的核心。“为了运营一个实验室,我有30个应用程序。Zoom、Slack、Github——你说的我都有,”他表示。“我希望他们都能永远无缝地工作。同样的情况也发生在全球数百万用户身上。

TadGAN可以帮助像Zoom这样的公司监控数据中心的时间序列信号,如CPU使用情况或温度,以帮助防止服务中断,这可能会威胁到公司的市场份额。在未来的工作中,该团队计划将TadGAN打包到用户界面中,以帮助将最先进的时间序列分析带给任何需要它的人。

参考:Alexander Geiger, Dongyu Liu, Sarah Alnegheimish, Alfredo custa - infante和Kalyan Veeramachaneni的《TadGAN:使用生成式对抗网络的时间序列异常检测》,2020年11月14日,计算机科学>机器学习
arXiv: 2009.07769

本研究由SES资助并与SES合作完成。

第一个发表评论关于“MIT深度学习算法在一段时间内收集的测量数据中发现隐藏的警告信号”

留下你的评论

电子邮件地址是可选的。如果提供的话,您的电子邮件不会发布或共享。