GELog: A GPT-Enhanced Log Representation Method for Anomaly Detection
The 33rd IEEE/ACM International Conference on Program Comprehension (ICPC 2025) 2025.01.13,
XuWenwu, WangPeng, ShiHaichao, ZhouGuoqiao,YaoJunliang, ZhangXiaoyu
Abstract
本研究提出了一种基于 GPT 增强的日志异常检测方法 GELog,旨在解决现有方法在日志进化、解析噪声和自然语言风格差异等方面的挑战。GELog 通过 GPT 对日志模板进行语义增强,利用 Sentence-BERT 提取语义向量,并设计注意力融合模块整合原始与增强语义,最终通过 Transformer 模型实现异常检测。在 HDFS、BGL 等四个公开数据集上的实验表明,GELog 显著提升了日志的语义表示能力,其 F1 分数分别达到 0.9973、0.9878 等,优于 DeepLog、LogRobust 等基线方法,有效验证了语义增强与融合策略在日志异常检测中的有效性和鲁棒性。