CS224W 图机器学习18：GNN与算法对齐

课程目标 1：GNN 与传统图算法的关系

课程目标 2：理解 GNN 学习映射的过程

前置知识的概括总结：

思考：除了 1-WL，GNN 还可以轻松地模拟哪些其他任务？

任务 1：特征提取

MLP 很容易学习平滑函数（例如，线性、对数、指数） MLP 不擅长学习复杂函数（例如，平滑函数的总和、for 循环）

任务 2：汇总统计

任务 3：关系型 argmax

任务 4：最短路径问题

最短路径问题的常见思路，是通过递归的方式将问题分解为相同问题类型的较小实例，然后再依次进行解决

任务 4 实验分析：

总结：GNN 消息传递是一种动态规划算法，对于可以通过动态规划解决的任务，GNN 会是一个不错的架构选择

算法对齐（Algorithmic Alignment）：设计神经网络架构的一般原则

给定目标算法 $g$，将其分解一系列简单函数的组合： $g=g_m \odot...\odot g_1$，则其对应的神经网络架构为 $$f=f_m \odot...\odot f_1$$

关键：将整体算法拆分成单独的简单步骤，可以更容易神经网络的学习

应用 1：给定一组数字 $S$，判断是否存在和为 $k$ 的子集

该任务是一个 NP-hard 问题，无法通过动态规划解决，因此不适合 GNN
穷举搜索：遍历循环 $S$ 的所有子集，并检查子集的和是否为 $k$
穷举搜索转变为神经网络架构：$NES=MLP(max_{\tau \in S}LSTM(X_1,...,X_{|\tau|}|))$；其中 $LSTM$ 用于检查子集的和，$max$ 聚合函数用于寻找最佳子集，$MLP$ 用于映射真值（给出最终判断）

应用 1 实验分析（NES 模型的效果最佳）：

线性算法对齐假设：可以证明外推法对于线性目标函数是完美的，这也意味着神经网络可以推断出看不见的数据，即可在不可预见的未来情况下稳定运行

个人笔记