Large Language Models can Deliver Accurate and Interpretable Time Series Anomaly Detection
论文地址:https://arxiv.org/abs/2405.15370 (opens new window)
# 亮点
- 利用大语言模型对时间序列进行异常检测
- 不需要对大语言模型进行微调
- 设计了一个用大模型进行时间序列异常检测的完整流程
总之,值得一看
# 摘要
时间序列异常检测(TSAD)通过识别偏离标准趋势的非典型模式,从而保持系统完整性并实现快速响应措施,在各个行业中发挥着至关重要的作用。传统的TSAD模型通常依赖于深度学习,需要大量的训练数据,并且作为黑匣子运行,缺乏对检测到的异常的可解释性。为了应对这些挑战,我们提出了LLMAD,这是一种新的TSAD方法,它使用大型语言模型(LLM)来提供准确和可解释的TSAD结果。LLMAD通过检索正和负相似的时间序列片段,创新性地将LLM应用于上下文异常检测,显著提高了LLM的有效性。此外,LLMAD采用异常检测思想链(AnoCoT)方法来模拟其决策过程的专家逻辑。这种方法进一步提高了其性能,并使LLMAD能够通过多角度为其检测提供解释,这对用户决策尤为重要。在三个数据集上的实验表明,我们的LLMAD实现了与最先进的深度学习方法相当的检测性能,同时为检测提供了显著的可解释性。据我们所知,这是TSAD首次直接使用LLM的工作。
# 方法
# 时间序列数据预处理
为了让大模型更易分析输入的时间序列数据,作者首先对输入的时间序列进行了预处理
预处理的步骤如下:
- 重缩放(Rescaling):将序列的数值转换成大语言模型易于理解的范围
- 设置索引(Indexing):按照时间顺序为每个时间点设置索引,用于之后异常点的报告与分析
# 时间序列情景学习(Time Series ICL)
首先将已有的时间序列数据分为正常数据库以及异常数据库,对于输入的时间序列,通过FastDTW算法计算它在两个数据库中最相似的其他正常或异常序列,并将它们输出并排列,以为大模型提供正常或异常数据的参考。
# 异常检测思维链(AnoCoT)
用CoT提示技术指导大语言模型逐步推理。原文提示模板如下:
其中引入了领域专家知识(异常类型定义、异常级别定义等内容)、思维链提示、情景提示(之前检索的数据)
# 可解释的时间序列异常检测
让大语言模型生成全面的异常检测报告,从异常解释、异常类型、警告等级这三个方面进行。
编辑 (opens new window)
上次更新: 2024/05/30, 07:49:34
- 01
- tensor比较大小函数05-30
- 02
- 半监督学习经典方法 Π-model、Mean Teacher04-10
- 03
- A survey on semi-supervised learning04-10