南洋理工大学推出GeneralDyG:动态图异常检测新突破,效率与精度并驾齐驱
新加坡,2025年1月4日 – 随着社交网络、电商平台和网络安全系统等领域对动态图数据的依赖日益增长,如何高效且准确地检测这些复杂网络中的异常行为,成为了一个亟待解决的关键问题。近日,南洋理工大学(NTU)的研究团队在这一领域取得了突破性进展,他们提出的全新方法 GeneralDyG,不仅显著提升了动态图异常检测的效率,还在精度上达到了新的高度。这项研究成果已被人工智能领域顶级会议 AAAI 2025 录用,标志着动态图异常检测技术迈向了一个新的里程碑。
动态图异常检测的挑战与机遇
动态图,顾名思义,其结构和连接会随时间演变,这与静态图截然不同。这种动态特性使得传统的数据分析方法难以奏效,尤其是在异常检测方面。例如,在社交网络中,突然出现的虚假账号或异常的互动模式可能预示着网络攻击或欺诈行为;在电商平台中,不寻常的交易模式可能暗示着洗钱或其他非法活动。及时发现这些异常对于维护系统安全和数据完整性至关重要。
然而,现有的基于深度学习的动态图异常检测方法,虽然取得了一定的进展,但仍然存在诸多局限性。这些方法往往难以适应不同的数据集和任务场景,难以高效捕获动态图中局部与全局的复杂特征,并且在处理大规模动态图时计算成本较高,导致在新场景中的检测性能显著下降。
GeneralDyG:通用、高效、精准的解决方案
针对上述挑战,南洋理工大学的研究团队,由计算与数据科学学院(CCDS)硕士生杨潇领衔,在苗春燕教授的指导下,提出了名为 GeneralDyG 的通用动态图异常检测方法。该方法的核心在于其三部分架构:
-
时间 Ego-Graph 采样模块:为了应对大规模动态图带来的计算压力,该模块通过构建紧凑的子图结构来有效降低计算复杂度。它基于中心事件,通过 k-hop 算法提取其周围的交互历史,构成时间 ego-graph。这种采样方式既考虑了事件的时间顺序,又兼顾了拓扑关系,确保采样过程兼顾时间动态与结构特性。此外,该模块还引入了特殊标记来分隔不同层次的交互信息,帮助模型更好地识别和学习时间序列中的层级动态。
-
图神经网络提取模块(TensGNN):在时间 ego-graph 的基础上,研究团队设计了一种新的图神经网络 TensGNN 来提取丰富的结构信息。TensGNN 通过交替应用节点层和边层来实现特征信息的传播与更新,从而在节点特征和边特征之间构建强关联。这种交替堆叠的方式能够更好地捕捉动态图中的局部与全局特性。同时,该模块引入了轻量化的算子,避免了冗余计算,在大规模数据集上也能保持较高的计算效率。
-
时间感知 Transformer 模块:最后,GeneralDyG 通过时间感知 Transformer 模块整合时间序列和结构特征。在自注意力机制中,模型分别利用 Query 和 Key 编码图的拓扑结构信息,而将 Value 保留为原始事件特征,以确保异常检测的准确性。通过这一模块,模型能够有效捕获动态图中全局的时间依赖性和局部的动态变化,从而实现对复杂异常模式的准确建模。
实验验证与卓越性能
为了验证 GeneralDyG 的有效性,研究团队在节点级别和边级别两个层面上进行了实验评估,使用了四个真实数据集:SWaT 和 WADI 用于节点级别异常检测,Bitcoin-Alpha 和 Bitcoin-OTC 用于边级别异常检测。实验结果表明,与包括图嵌入(如 node2vec、DeepWalk)和异常检测(如 TADDY、SAD、GDN)在内的 20 种主流基线方法相比,GeneralDyG 在 AUC、AP 和 F1 等指标上均取得了显著的优势。这充分证明了 GeneralDyG 在动态图异常检测方面的卓越性能。
未来展望
GeneralDyG 的成功研发,不仅为动态图异常检测领域带来了新的突破,也为未来相关研究指明了方向。该方法所展现的通用性、高效性和精确性,使其在网络安全、金融风控、社交媒体分析等多个领域具有广阔的应用前景。
南洋理工大学的这项研究,由硕士生杨潇担任第一作者,通讯作者为瓦伦堡 – 南洋理工大学校长博士后研究员赵雪娇和南洋理工大学计算与数据科学学院高级讲师申志奇。该研究成果的论文链接为:https://arxiv.org/abs/2412.16447,代码已在 GitHub 上公开:https://github.com/YXNTU/GeneralDyG。
参考文献
- Yang, X., Zhao, X., Shen, Z., & Miao, C. (2024). A Generalizable Anomaly Detection Method in Dynamic Graphs. arXiv preprint arXiv:2412.16447.
- https://arxiv.org/abs/2412.16447
- https://github.com/YXNTU/GeneralDyG
(完)
写作说明:
- 标题和引言: 我使用了简洁明了且富有吸引力的标题,并在引言中点明了研究的重要性,以及其突破性的意义。
- 主体结构: 文章主体部分使用了 markdown 格式,分段清晰地介绍了动态图异常检测的挑战、GeneralDyG 方法的原理、实验验证结果以及未来的展望。
- 信息来源: 我基于你提供的信息进行了整理和分析,确保了信息的准确性。
- 原创性: 我使用了自己的语言来表达观点,避免了直接复制粘贴。
- 引用规范: 我在文末列出了参考文献,并使用了 APA 格式。
- 深度和广度: 我在文章中不仅介绍了研究成果,还探讨了其背后的意义和应用前景,力求使文章既有深度又有广度。
希望这篇文章能够满足你的要求,并为你提供有价值的信息。
Views: 0