Spectral clustering via ensemble deep autoencoder learning (SC-EDAE)

时间：2023-08-29 17:07:01 tlh0400位移传感器

论文：2020 Pattern Recognition

网络结构

给定数据矩阵 $\in R^{n×d}$ ，首先使用 $m$ 不同的超参数AutoEncoder（由PCA建筑)训练，中间层表示 $\{Y_l \}_{l \in [1, m]}$ 。然后通过每一个 $Y_l$ 构建图相似度矩阵 $S_l$ 并将其融合成一个集成的图相似矩阵 $\bar S$ 。最后，在 $\bar S$ 上应用谱聚类方法。

接下来我们从谱聚类切入，详细介绍相似矩阵的构建过程。

谱聚类

这里使用的是对称拉普拉斯矩阵。
$L_{sym} =D^{−1/2}LD^{−1/2} = I - D^{−1/2}WD^{−1/2}$

对于无向图 $G$ 的切图，我们的目标是将图 $G (V, E)$ 切成相互没有连接的k个子图，每个子图点的集合为： $A_1,A_2,...,A_k$ ，它们满足 $A_i∩A_j=∅$ ,且 $A_1∪A_2∪...∪A_k=V$ .

对于任意两个子图点的集合 $A, B \subset V, A \cap B = \emptyset$ , 我们定义 $A$ 和 $B$ 之间的切图权重为：
$\sum\limits_{i \in A, j \in B}w_{ij}$

那么对于我们 $k$ 个子图点的集合： $A_1,A_2,...,A_k$ ，我们定义切图cut为：
$cut(A_1,A_2,...A_k) = \frac{1}{2}\sum\limits_{i=1}^{k}W(A_i, \overline{A}_i )$

其中 $\bar A_i$ 为 $A_i$ 的补集，意为除 $A_i$ 子集外其他 $V$ 的子集的并集。

那么如何切图可以让子图内的点权重和高，子图间的点权重和低呢？一个自然的想法就是最小化 $cut(A_1,A_2,...,A_k)$ , 但是可以发现，这种极小化的切图存在问题，如下图

　我们选择一个权重最小的边缘的点，比如C和H之间进行cut，这样可以最小化 $cut(A_1,A_2,...,A_k)$ , 但是却不是最优的切图，如何避免这种切图，并且找到类似图中"Best Cut"这样的最优切图呢，可以用下面的Ncut的切图方法。

Ncut切图

对每个切图，不光考虑最小化cut(A1,A2,…Ak)，它还同时考虑最大化每个子图点的权重
$NCut(A_1,A_2,...A_k) = \frac{1}{2}\sum\limits_{i=1}^{k}\frac{W(A_i, \overline{A}_i )}{vol(A_i)}$

那么怎么最小化这个Ncut函数呢？牛人们发现，Ncut函数可以通过如下方式表示。
我们引入指示向量 $h_j∈\{h_1,h_2,...,h_k\}$ , $j = 1, 2, . . . k,$ 对于任意一个向量 $h_j$ , 它是一个n维向量（n为样本数），我们定义 $h_{ij}$ 为：
$h_{ij}= \begin{cases} 0& { v_i \notin A_j}\\ \frac{1}{\sqrt{vol(A_j)}}& { v_i \in A_j} \end{cases}$ 、IC替代型号，打造电子元器件IC百科大全！

Spectral clustering via ensemble deep autoencoder learning (SC-EDAE)

相关文章