CS224W 图机器学习12：深度图生成模型

图生成的应用：药物发现、材料设计、社交网络建模

图生成的意义：理解图的表达、预测图的演变、实现图的模拟、检测图的异常

图生成的发展：（1）根据现实世界构建图（2）传统图生成（3）深度图生成

之前学习的图编码是一个 encoding 的过程，而图生成是一个 decoding 的过程

图生成的目标：给定来自 $p_{data}(G)$ 的图采样，构建模型 $p_{model}(G)$ 学习图的分布

图生成的的过程

基于最大似然估计，让 $p_{model}(x;\theta)$ 尽可能接近 $p_{data}(x)$（密度估计）；即找到最优的参数 $\theta$，使得似然估计值最大，也就是观测图数据 $x$ 最有可能成为模型生成样本的情况
通过引入随机噪声 $z\sim N(0,1)$，从已训练模型 $f$ 中采样生成图 $x_i=f(z_i;\theta)$

深度图生成模型：使用深度神经网络来构建图采样函数 $f$ 的模型

GraphRNN 通过自回归的方式实现图的生成，递归的每一步是节点/边的添加

递归生成的两种方式：

通过以上方式，可以将图生成问题转化为序列生成问题

GraphRNN 通过两种类型的 RNN 来实现图的生成：

GraphRNN 的问题：（1）任何一个新生成的节点都看你连接到之前的任意节点（2）边生成步骤太多（边依赖复杂），需要生成完整的邻接矩阵

GraphRNN 的简化：广度优先搜索（BFS）节点排序

上图中，节点 4 生成时没有连接到节点 1；因此在 BFS 排序的前提下，节点 1 所有的邻居节点已经被遍历；所以在节点 5 生成时，不需要考虑节点 5 和节点 1 之间的边生成
BFS 节点排序，能减少节点的可能排序，并且大幅减少需要的边生成步骤

GraphRNN 需要构建的邻接矩阵也得到简化：

图生成的评价（1）视觉相似度（2）图统计值的相似度

以分子图生成为例，说明 GCPN 模型：

分子图生成问题的 3 个特点：

思路：使用强化学习来引导模型的复杂训练过程

GCPN 是一种结合了图表示学习和强化学习的模型，其训练过程如下：

GraphRNN vs GCPN：

个人笔记