Nüwa: Enhancing Network Traffic Analysis with Pre-trained Side-channel Feature Imputation
2025 IEEE Transactions on Networking (TON 2025) 2025.6.9,
Faqi Zhao,Wenhao Li, Huaifeng Bao
Abstract
网络流量分类是网络安全和管理领域中的一项重要任务。近年来,基于学习的方法展现了其在加密网络流量的侧信道特征中推导模式的有效性。然而,流量突发的不可预测性可能会导致在重新传输过程中出现数据包丢失,从而生成碎片化的特征模式。不幸的是,现有方法在应对这些碎片化特征时显得力不从心,通常会导致性能大幅下降。为了解决这一问题,本文提出了一种基于预训练的框架,命名为 Nüwa,用于补全加密网络流量的侧信道特征,特别关注流量会话中丢失数据包的时间属性。首先,我们提出了一个基于词级别的 Sequence2Embedding (S2E) 模块,用于将侧信道特征转换为模型预训练所需的标记(tokens),以及一种 流量特征掩码策略 (Traffic Feature Masking, TFM),以模拟丢包网络中原始流的变化。此外,我们还引入了一个 流量特征补全模块 (Traffic Feature Imputation, TFI),能够以高效且上下文感知的方式恢复原始流量特征的缺失值。在四种不同的真实场景下的实验验证了 Nüwa 能够恢复主流时间序列模型的性能,同时保持补全特征的完整性。值得注意的是,即使在大规模特征丢失和领域适应的情况下,Nüwa 也展现了出色的鲁棒性。Nüwa 的原型已经被公开供进一步研究和开发使用。