為什么做電子商務(wù)網(wǎng)站的原因中國(guó)建設(shè)網(wǎng)官方網(wǎng)站
圖表示學(xué)習(xí) Graph Representation Learning chapter2 背景知識(shí)和傳統(tǒng)方法
- 2.1 圖統(tǒng)計(jì)和核方法
- 2.1.1 節(jié)點(diǎn)層次的統(tǒng)計(jì)和特征
- 節(jié)點(diǎn)的度
- 節(jié)點(diǎn)中心度
- 聚類系數(shù)
- Closed Triangles, Ego Graphs, and Motifs
- 圖層次的特征和圖的核
- 節(jié)點(diǎn)袋
- Weisfieler–Lehman核
- Graphlets和基于路徑的方法
- 鄰域重疊檢測(cè)
2.1 圖統(tǒng)計(jì)和核方法
2.1.1 節(jié)點(diǎn)層次的統(tǒng)計(jì)和特征
節(jié)點(diǎn)的度
d u = ∑ v ∈ V A ( u , v ) (2.1) d_u = \sum_{v\in \mathcal{V}} A(u, v)\tag{2.1} du?=v∈V∑?A(u,v)(2.1)
需要說(shuō)明的是,在有向和加權(quán)圖中,度可以區(qū)分為不同的概念。例如入度和出度之類的。不管怎么說(shuō),這個(gè)特征在傳統(tǒng)機(jī)器學(xué)習(xí)中都是十分重要的。
節(jié)點(diǎn)中心度
e u = 1 λ ∑ v ∈ V A ( u , v ) e v , ? u ∈ V (2.2) e_u = \frac{1}{\lambda}\sum_{v\in \mathcal{V}}A(u, v)e_v, \forall u\in \mathcal{V}\tag{2.2} eu?=λ1?v∈V∑?A(u,v)ev?,?u∈V(2.2)
一種常見(jiàn)的方式是利用特征向量中心度,我們定義每個(gè)節(jié)點(diǎn)的中心度為周圍所有中心度的均值,其中 λ \lambda λ是一個(gè)常數(shù)。
求解這一過(guò)程,可以寫作如下形式: λ e = A e (2.3) \lambda e = Ae\tag{2.3} λe=Ae(2.3)
如果我們期望所有的中心度都是正的,我們可以應(yīng)用Perron-Frobenius Theorem,即對(duì)A求解特征向量。
此外我們也可以通過(guò)迭代法如下: e ( t + 1 ) = A e ( t ) (2.4) e^{(t+1)}=Ae^{(t)}\tag{2.4} e(t+1)=Ae(t)(2.4)
如果我們?cè)O(shè) e 0 = ( 1 , 1 , . . . , 1 ) T e^0=(1,1,...,1)^T e0=(1,1,...,1)T那么每次迭代后的結(jié)果是截至T步時(shí),經(jīng)過(guò)的次數(shù),由此可以得到重要性。
聚類系數(shù)
用于衡量節(jié)點(diǎn)局部鄰域封閉三角形的比例。
c u = ∣ ( v 1 , v 2 ) ∈ E : v 1 , v 2 ∈ N ( u ) ∣ C d u 2 (2.5) c_u=\frac{|(v_1,v_2)\in \mathcal{E}:v_1,v_2\in \mathcal{N}(u)|}{C_{d_u}^2}\tag{2.5} cu?=Cdu?2?∣(v1?,v2?)∈E:v1?,v2?∈N(u)∣?(2.5)
其中 N ( u ) = { v ∈ V : ( u , v ) ∈ E } \mathcal{N}(u)=\{v\in \mathcal{V}:(u,v)\in \mathcal{E}\} N(u)={v∈V:(u,v)∈E}也就是所有的相鄰節(jié)點(diǎn)構(gòu)成的集合。
這一特征描述了節(jié)點(diǎn)附近結(jié)構(gòu)的緊密程度。
Closed Triangles, Ego Graphs, and Motifs
略
圖層次的特征和圖的核
節(jié)點(diǎn)袋
單純綜合節(jié)點(diǎn)的特征。
Weisfieler–Lehman核
一種迭代鄰域聚合方法。
Graphlets和基于路徑的方法
Graphlets:計(jì)算不同子圖結(jié)構(gòu)出現(xiàn)次數(shù)。具體方式為,枚舉所有可能的子圖結(jié)構(gòu),然后統(tǒng)計(jì)出現(xiàn)的次數(shù)。
基于路徑,則是統(tǒng)計(jì)類似于最短路之類的。
鄰域重疊檢測(cè)
未完待續(xù)。