几何等变图神经网络综述_几何图神经网络_tzc_fly的博客

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

奔跑的斑马 · 三明市人民政府关于印发三明市化工园区规范提升 ...· 1 月前 ·

茫然的胡萝卜 · 西锐SR22_百度百科· 6 月前 ·

不拘小节的单车 · 野球帝到底几个人啊？ - 知乎· 1 年前 ·

礼貌的机器人 · 关于湖南省第七届中小学生艺术展演活动获奖情况 ...· 1 年前 ·

爱玩的黑框眼镜 · 13.99万起！蓝电E5正式上市，全新插混中 ...· 2 年前 ·

fig1
许多科学问题都要求以几何图形（geometric graphs）的形式处理数据。与一般图数据不同，几何图显示平移、旋转和反射的对称性。研究人员利用这种 对称性的归纳偏差 （inductive bias），开发了几何等变图神经网络（GNN），以更好地描述几何图的几何特性和拓扑。尽管取得了丰硕的成果，但它仍然缺乏一项survey来描述等变GNN是如何发展的，这反过来又阻碍了等变GNNs的进一步发展。为此，基于必要但简明的数学预备知识，我们下面分析并将现有方法分为三组，以了解如何表示GNN中的消息传递和聚合。另外还举例了相关应用，以便于以后的方法开发和实验评估研究。

归纳偏差or归纳偏置（inductive bias），归纳是自然科学研究中的一种方法，指的是从一些例子中寻找共性，形成一个通用的规则，bias是指我们对模型的偏好。因此归纳偏置可以理解为：

从现实生活中观察到的现象中归纳出一定的规则，然后对模型做一定的约束，从而可以起到"模型选择"的作用，即从假设空间中选择出更符合现实规则的模型。（可以理解为一个正则化方式）

关于等变与不变：

等变性（equivariant），对于一个特征，进行变换：
1.Introduction

2.Backgrounds

2.1.消息传递GNNs

2.2.等变性

3.几何等变GNNs

3.1.几何图

3.2.不可约表示Irreducible Representation

3.3.基于正则表示的模型

3.4.标量化

4.应用

物理动力学模拟

分子

1.Introduction

许多问题，尤其是物理和化学问题，需要以几何图的形式处理数据。 与一般图数据不同，几何图不仅为每个节点分配一个特征，还分配一个几何矢量 。例如，分子或蛋白质可以被视为几何图，其中原子的3D位置坐标是几何矢量；或者在一般的多体物理系统中，3D状态（位置、速度或自旋）是粒子的几何矢量。值得注意的是，几何图显示了平移、旋转和反射的对称性。这是因为无论我们如何将分子（或一般物理系统）从一个地方平移或旋转到另一个地方，控制原子（或粒子）动力学的物理定律是相同的。在处理这类数据时，必须将对称性的归纳偏差纳入模型的设计中，这推动了几何等变图神经网络（GNN）的研究。

GNN最初由Sperduti和Starita于1997提出，在深度学习的发展下，GNN在图结构建模方面表现出了突出的优势。虽然已经开发了丰富的结构，但大多数以前的GNN在几何上并不是等变的，因此不适合用于几何图。为了实现几何等变，人们提出了大量工作来改进GNN中的消息传递和聚合机制。

然而，鉴于取得了丰硕的成就，仍然没有一份survey来描述等变GNN是如何发展的。这不仅阻碍了外部研究人员迅速进入这一领域，还可能阻碍从现有论文中提取经验教训和新想法，供那些想进一步推动这一领域的研究人员使用。

2.Backgrounds

在本节中，将介绍两个关键因素，即图神经网络（GNN）和等变，作为讨论几何等变GNN的基础。

2.1.消息传递GNNs

GNNs已经被广泛用于处理关系数据。考虑

对于几何图，应用场景决定是否需要等变性，例如：

在预测分子的能量时，我们需要输出对几何矢量的任何旋转保持不变性（需要不变性）；

然而，在预测分子动力学时，我们要求输出与每个原子位置的输入相等（需要等变性）。

为了更好地区分，在下文中，用粗体表示几何矢量，用普通符号表示非几何量。

Eq.1-2被改为： $\textbf{m}_{ij}=\psi_{\textbf{m}}(\textbf{x}_{i},\textbf{x}_{j},h_{i},h_{j},e_{ij})\tag{5}$

图1中详细说明了上述等变消息传递机制。

图1：旋转情况下几何等变消息传递的图示。生成标量消息和矢量消息，然后进行聚合，从而产生等变更新。

目前已经提出了多种等变GNNs，它们通常是不同Group上的 Eq.4-7 的不同具体对象。根据消息的表示方式，将当前的方法分为三类：不可约表示（irreducible representation），正则表示（regular representation），标量化（scalarization）。

在大多数情况下，由于相对位置

 3.2.不可约表示Irreducible Representation

这类模型基于表示论中关于紧群的线性表示可以拆解为一系列不可约表示这一理论。从而在 $\textbf{m}_{ij}^{l}=\sum_{k\geq 0 }\textbf{W}^{lk}(\textbf{x}_{i}-\textbf{x}_{j})\textbf{x}_{j}^{k}$

3.3.基于正则表示的模型

另一类的工作尝试利用 群的正则表示 来构建群卷积操作。比如Lie卷积： $\textbf{x}_{i}'=\textbf{x}_{i}+\sum_{j\neq i}(\textbf{x}_{i}-\textbf{x}_{j})\varphi_{x}(m_{ij})$

等变GNN在从物理系统到化学物质的各种类型的real-world几何数据上有着广泛的应用。

物理动力学模拟

对复杂物理系统的动力学建模一直是一个具有挑战性的课题，神经网络已经被用于推断相互作用和动力学。在物理系统中，像带电粒子这样的物体通过遵循物理定律的力相互作用。通常任务是在初始条件下预测粒子的动力学，包括位置、速度和电荷。这样的任务是E(3)-等变的，因为粒子的动力学与整个系统一起平移、旋转和反射。

1.Introduction

2.Backgrounds

2.1.消息传递GNNs

3.2.不可约表示Irreducible Representation

3.3.基于正则表示的模型

物理动力学模拟