根据麻省理工学院 (MIT) 的一项新研究,大型语言模型 (LLMs) 正成为保护可再生能源、医疗保健和交通等关键基础设施系统的重要工具。
该研究介绍了一种零样本LLM模型,用于检测复杂数据中的异常。通过利用AI驱动的诊断来监控和标记风力涡轮机、核磁共振成像 (MRI) 设备和铁路设备等设备的潜在问题,这种方法可以降低运营成本、提高可靠性、减少停机时间,并支持可持续的行业运营。
该研究的资深作者Kalyan Veeramachaneni表示,使用深度学习模型检测基础设施问题需要大量时间和资源来训练、微调和测试。机器学习模型的部署需要机器学习团队(负责训练)和操作团队(负责监控设备)之间的紧密合作。
“相比之下,LLM是即插即用的。我们不需要为每个新的数据流创建一个独立的模型。我们可以直接将LLM部署在流入的数据上,” Veeramachaneni说道。
研究人员开发了SigLLM,一个将时间序列数据转换为文本进行分析的框架。然后使用GPT-3.5 Turbo和Mistral LLM来检测模式异常并标记系统中可能表示潜在操作问题的异常。
团队在11个不同的数据集上评估了SigLLM的性能,这些数据集包含492个单变量时间序列和2,349个异常。多样化的数据来自包括NASA卫星和Yahoo流量在内的广泛应用,具有不同的信号长度和异常。
两块NVIDIA Titan RTX GPU和一块NVIDIA V100 Tensor Core GPU负责处理运行GPT-3.5 Turbo和Mistral进行零样本异常检测的计算需求。
研究发现,LLM能够检测异常,与传统的检测方法不同,SigLLM利用了LLM在模式识别中的内在能力,无需广泛的训练。然而,专业的深度学习模型的性能比SigLLM高出大约30%。
“我们惊讶地发现,基于LLM的方法比某些基于深度学习的变压器方法表现更好,” Veeramachaneni指出,“不过,这些方法并不像当前最先进的模型,例如带回归的自编码器 (AER) 那样好。我们还有一些工作要做才能达到那个水平。”
该研究可能代表着在AI驱动的监控方面迈出了重要一步,具有高效异常检测的潜力,尤其是在进一步改进模型的情况下。
Veeramachaneni表示,一个主要的挑战是如何在保持LLM优势的同时,使方法具有足够的鲁棒性。团队还计划研究LLM如何在未进行微调的情况下有效预测异常,这将涉及用各种提示测试LLM。
研究中使用的数据集可在GitHub上公开获取。
在NVIDIA技术博客上阅读完整故事。
Image source: Shutterstock