當(dāng)前位置：首頁 > news >正文

要給公司做一個(gè)網(wǎng)站怎么做網(wǎng)站優(yōu)化的方式有哪些

news 2025/7/13 13:36:53

要給公司做一個(gè)網(wǎng)站怎么做,網(wǎng)站優(yōu)化的方式有哪些,用dw怎么做網(wǎng)站,個(gè)人網(wǎng)站注冊平臺(tái)要多少錢激光點(diǎn)云配準(zhǔn)算法——Cofinet / GeoTransformer / MAC GeoTransformer MAC是當(dāng)前最SOTA的點(diǎn)云匹配算法，在之前我用總結(jié)過視覺特征匹配的相關(guān)算法視覺SLAM總結(jié)——SuperPoint / SuperGlue 本篇博客對(duì)Cofinet、GeoTransformer、MAC三篇論文進(jìn)行簡單總結(jié) 1. Cofine…

激光點(diǎn)云配準(zhǔn)算法——Cofinet / GeoTransformer / MAC

GeoTransformer + MAC是當(dāng)前最SOTA的點(diǎn)云匹配算法，在之前我用總結(jié)過視覺特征匹配的相關(guān)算法
視覺SLAM總結(jié)——SuperPoint / SuperGlue
本篇博客對(duì)Cofinet、GeoTransformer、MAC三篇論文進(jìn)行簡單總結(jié)

1. Cofinet

Cofinet發(fā)表于2021年ICCV，原文為《CoFiNet: Reliable Coarse-to-fine Correspondences
for Robust Point Cloud Registration》，對(duì)這篇文章進(jìn)行總結(jié)是因?yàn)樗梢运阕鱃eoTransformer的前身，其首次提出Coarse-To-Fine的點(diǎn)云匹配框架

Cofinet算法框架如下圖所示：
在這里插入圖片描述
算法主要又兩部分組成，Correspondence Proposal Block和Correspondence Refinement Block

1.1 Correspondence Proposal Block

Point Encoding：對(duì)于輸入的點(diǎn)云 $P_X \in R^{n \times 3}, P_Y \in R^{m \times 3}$ ，使用KPConv進(jìn)行特征提取，KPConv的細(xì)節(jié)在下文介紹，輸出經(jīng)過下采樣的SuperPoint $P_X^{\prime} \in R^{n^{\prime} \times 3}, P_Y^{\prime} \in R^{r n^{\prime} \times 3}$ 及其特征 $F_X^{\prime} \in R^{n^{\prime} \times b}, F_Y^{\prime} \in R^{m^{\prime} \times b}$ ，其中 $b = 256$ ： $\begin{aligned} & P_X \rightarrow P^{\prime}{ }_X, F^{\prime}{ }_X \\ & P_Y \rightarrow P^{\prime}{ }_Y, F^{\prime}{ }_Y \end{aligned}$ 每個(gè)經(jīng)過下采樣得到SuperPoint表征了原輸入點(diǎn)云一個(gè)小Patch上的所有信息

Attentional Feature Aggregation：對(duì)于SuperPoint $P_X^{\prime} \in R^{n^{\prime} \times 3}, P_Y^{\prime} \in R^{r n^{\prime} \times 3}$ 及其特征 $F_X^{\prime} \in R^{n^{\prime} \times b}, F_Y^{\prime} \in R^{m^{\prime} \times b}$ 進(jìn)行Self-Attention和Cross-Attention操作，Self-Attention用于擴(kuò)大感受野，Cross-Attention用于信息交互： $\begin{aligned} & F^{\prime}{ }_X \rightarrow \tilde{F}^{\prime}{ }_X \\ & F^{\prime}{ }_Y \rightarrow \tilde{F}^{\prime}{ }_Y \end{aligned}$

Correspondence Proposal：將 $\tilde{F}_X^{\prime}, \tilde{F}_Y^{\prime}$ 使用Sinkhorn算法構(gòu)建Confidence Matrix，在訓(xùn)練階段選用128對(duì)真值匹配點(diǎn)構(gòu)建GT Confidence Matrix對(duì)Sinkhorn算法輸出的Confidence Matrix進(jìn)行監(jiān)督，數(shù)目是固定的。在測試階段Confidence大于0.2的匹配作為Coarse-Level的匹配結(jié)果，如果數(shù)目小于200則將閾值調(diào)整到0.01，輸出的數(shù)目是不固定的。最終輸出SuperPoint的Correspondence集合 $C^{\prime}=\left\{\left(P^{\prime}{ }_X\left(i^{\prime}\right), P_Y^{\prime}\left(j^{\prime}\right)\right)\right\} .$

其中Attention部分和Optimal Transport部分和SuperGlue中采用的算法基本一致，在此不再贅述，感興趣的同學(xué)可以參考視覺SLAM總結(jié)——SuperPoint / SuperGlue

1.2 Correspondence Refinement Block

Node Decoding：Decoder部分使用 $\tilde{F}_X^{\prime}, \tilde{F}_Y^{\prime}$ 作為輸入，同樣使用KPConv進(jìn)行維度恢復(fù)，最終輸出Point Level的特征 $F_X \in R^{n \times c}, F_Y \in R^{m \times c}$ ，其中 $c = 32$

Point-To-Node Grouping：這部分的目的是將SuperPoint的Correspondence擴(kuò)展為Point Level Correspondence，基于Point Level Correspondence再進(jìn)一步求解位姿。這里使用的KNN建立SuperPoint和Point的關(guān)聯(lián)，經(jīng)過這個(gè)步驟后，每個(gè)SuperPoint $P_X^{\prime}\left(i^{\prime}\right)$ 會(huì)被分配一定數(shù)量的Point，這些Point構(gòu)成了一個(gè)Patch $G_{i^{\prime}}$ ，每個(gè)Patch的點(diǎn)的數(shù)量如果超過64個(gè)就會(huì)進(jìn)行截?cái)唷?span id="vxwlu0yf4" class="katex--display"> $G_{i^{\prime}}^P=\left\{p \in P_X \mid\left\|p-P^{\prime}{ }_X\left(i^{\prime}\right)\right\| \leq\left\|p-P^{\prime}{ }_X\left(j^{\prime}\right)\right\|, \forall j^{\prime} \neq i^{\prime}\right\}$ $G_{i^{\prime}}^F=\left\{f \in F_X \mid f \leftrightarrow \text { pwithp } \in G_{i^{\prime}}^P\right\}$ 通過上述操作之后Patch和Patch之間在歐式空間和特征空間會(huì)分別構(gòu)成集合： $C_P=\left\{\left(G_{i^{\prime}}^P, G_{j^{\prime}}^P\right)\right\}$ $C_F=\left\{\left(G_{i^{\prime}}^F, G_{j^{\prime}}^F\right)\right\}$

Density-Adaptive Matching：接著對(duì)每一個(gè)Patch進(jìn)行Point Level的Correspondence提取，Point Level級(jí)別無法直接使用Sinkhorn算法，原因是每個(gè)Patch中的存在的點(diǎn)的數(shù)量是不一致的，當(dāng)兩個(gè)點(diǎn)數(shù)不一致的Patch構(gòu)建Similarity Matrix時(shí)點(diǎn)數(shù)不足的位置使用 $-\infty$ 進(jìn)行填充，然后再使用Sinkhorn算法就可以消除點(diǎn)數(shù)不一致給模型帶來的影響。

在獲得Point Level的Correspondence后，仍然使用RANSAC方法進(jìn)行旋轉(zhuǎn)平移求解。

1.3 Loss

Coarse Scale損失函數(shù)如下： $\mathcal{L}_c=\frac{-\sum_{i^{\prime}, j^{\prime}} \mathbf{W}^{\prime}\left(i^{\prime}, j^{\prime}\right) \log \left(\mathbf{S}^{\prime}\left(i^{\prime}, j^{\prime}\right)\right)}{\sum_{i^{\prime}, j^{\prime}} \mathbf{W}^{\prime}\left(i^{\prime}, j^{\prime}\right)} .$ 其中 $\log \left(\mathbf{S}^{\prime}\left(i^{\prime}, j^{\prime}\right)\right)$ 為Sinkhorn生成的Confidence Matrix和Ground Truth的Confidence Matrix的交叉熵?fù)p失， $\mathbf{W}^{\prime}\left(i^{\prime}, j^{\prime}\right)$ 為加權(quán)系數(shù)，定義如下： $\mathbf{W}^{\prime}\left(i^{\prime}, j^{\prime}\right)= \begin{cases}\min \left(r\left(i^{\prime}, j^{\prime}\right), r\left(j^{\prime}, i^{\prime}\right)\right), & i^{\prime} \leq n^{\prime} \wedge j^{\prime} \leq m^{\prime}, \\ 1-r\left(i^{\prime}\right), & i^{\prime} \leq n^{\prime} \wedge j^{\prime}=m^{\prime}+1, \\ 1-r\left(j^{\prime}\right), & i^{\prime}=n^{\prime}+1 \wedge j^{\prime} \leq m^{\prime}, \\ 0, & \text { otherwise. }\end{cases}$ 其中 $r\left(i^{\prime}\right)$ 為單個(gè)Patch中Overlap點(diǎn)所占比例，定義如下： $r\left(i^{\prime}\right)=\frac{\mid\left\{\mathbf{p} \in \mathbf{G}_{i^{\prime}}^{\mathbf{P}} \mid \exists \mathbf{q} \in \mathbf{P}_{\mathbf{Y}} \text { s.t. }\left\|\overline{\mathbf{T}}_{\mathbf{Y}}^{\mathbf{X}}(\mathbf{p})-\mathbf{q}\right\|<\tau_p\right\} \mid}{\left|\mathbf{G}_{i^{\prime}}^{\mathbf{P}}\right|},$ $r\left(i^{\prime}, j^{\prime}\right)$ 為兩個(gè)Patch相互Overlap點(diǎn)所占比例，定義如下： $r\left(i^{\prime}, j^{\prime}\right)=\frac{\mid\left\{\mathbf{p} \in \mathbf{G}_{i^{\prime}}^{\mathbf{P}} \mid \exists \mathbf{q} \in \mathbf{G}_{j^{\prime}}^{\mathbf{P}} \text { s.t. }\left\|\overline{\mathbf{T}}_{\mathbf{Y}}^{\mathbf{X}}(\mathbf{p})-\mathbf{q}\right\|<\tau_p\right\} \mid}{\left|\mathbf{G}_{i^{\prime}}^{\mathbf{P}}\right|}$ 這里其實(shí)很好理解，當(dāng)Patch中被覆蓋的點(diǎn)的占比越高，說明這個(gè)Patch被匹配的可能性越大，權(quán)重也就應(yīng)該越高。

Finer Scale的損失函數(shù)如下： $\mathcal{L}_f=\frac{-\sum_{l, i, j} \widetilde{\mathbf{B}}^{(l)}(i, j) \log \left(\widetilde{\mathbf{S}}^{(l)}(i, j)\right)}{\sum_{l, i, j} \widetilde{\mathbf{B}}^{(l)}(i, j)}$ 其中交叉熵函數(shù)的定義是相同的，對(duì)于加權(quán)系數(shù)的定義如下： $\widetilde{\mathbf{B}}^{(l)}(i, j)=\left\{\begin{array}{ll} 1, & \left\|\widetilde{\mathbf{T}}_{\mathbf{Y}}^{\mathbf{X}}\left(\widetilde{\mathbf{G}}_{i^{\prime}}^{\mathbf{P}}(i)\right)-\widetilde{\mathbf{G}}_{j^{\prime}}^{\mathbf{P}}(j)\right\|<\tau_p, \\ 0, & \text { otherwise }, \end{array} \quad \forall i, \forall j \in[1, k]\right.$ $\widetilde{\mathbf{B}}^{(l)}(i, k+1)=\max \left(0,1-\sum_{j=1}^k \widetilde{\mathbf{B}}^{(l)}(i, j)\right), \quad \forall i \in[1, k]$ $\widetilde{\mathbf{B}}^{(l)}(k+1, j)=\max \left(0,1-\sum_{i=1}^k \widetilde{\mathbf{B}}^{(l)}(i, j)\right), \quad \forall j \in[1, k]$
最終的損失函數(shù)定義為： $L=L_c+\lambda L_f$

1.4 KPConv

KPConv是PointNet作者2019年提出來的一篇文章KPConv: Flexible and Deformable Convolution for Point Clouds》，因?yàn)镃ofiNet惡化GeoTransformer中都有用到這個(gè)模塊，因此在此對(duì)其進(jìn)行一個(gè)簡單總結(jié)

KPConv全稱為Kernel Point Convolution，是將Kernel Point當(dāng)成每個(gè)點(diǎn)云特征的參照物，去計(jì)算這些與這些Kernel Point的權(quán)重來更新每個(gè)點(diǎn)云特征。首先定義點(diǎn)云上某個(gè)點(diǎn) $x_i \in P \in R^{N \times 3}$ 和對(duì)應(yīng)的特征 $f_i \in F \in R^{N \times D}$ ，然后定義點(diǎn)云特征的卷積可以寫成如下形式： $g)(x)=\sum_{x_i \in N_x} g\left(x_i-x\right) f_i$ 其中 $g$ 為卷積核函數(shù)， $N_x$ 代表某個(gè)局部鄰域 $N_x=\left\{x_i \in P\left\|\mid x_i-x\right\| \leq r\right\}$ ，通常我們會(huì)對(duì)點(diǎn)云進(jìn)行去中心化，將每一個(gè)點(diǎn) $x_i$ 通過去中心化 $y_i=x_i-x$ 轉(zhuǎn)變成 $y_i$ ，因此局部鄰域 $B_r^3=\left\{y \in R^3\|\| y \| \leq r\right\}$ ，這樣使得局部鄰域中的計(jì)算具備平移不變形。

在KPConv中，作者定義了一組Kernel Points $\left\{\hat{x_k} \mid k<K\right\} \in B_r^3$ 和對(duì)應(yīng)的權(quán)重 $\left\{W_k \mid k<K\right\} \in R^{D_{\text {in }} \times D_{\text {out }}}$ ，將每個(gè)點(diǎn)周圍的Kernel Points作為其參照物，去進(jìn)行特征的聚合，基于Kernel Points的卷積核函數(shù)如下： $g\left(y_i\right)=\sum_{k<K} h\left(y_i, \hat{x_k}\right) W_k$ 其中權(quán)重系數(shù) $h\left(y_i, \hat{x_k}\right)$ 為： $h\left(y_i, \hat{x_k}\right)=\max \left(0,1 \frac{\left\|y_i-\hat{x_k}\right\|}{\sigma}\right)$ 即點(diǎn)和Kernel Points越接近時(shí)權(quán)重系數(shù)越大。該操作的示意圖如下：
在這里插入圖片描述
對(duì)比圖像的卷積操作如下：

其區(qū)別主要在于，在圖像的卷積操作中，因?yàn)橄袼匚恢煤途矸e核的位置都是離散的，可以很容易地找到一一對(duì)應(yīng)關(guān)系，而在點(diǎn)云的卷積操作中，點(diǎn)云點(diǎn)位置和卷積核的位置可以看做是連續(xù)的，無法完美地找到一一對(duì)應(yīng)關(guān)系，因此基于權(quán)重系數(shù) $h\left(y_i, \hat{x_k}\right)$ 的求和來表達(dá)這種關(guān)系。

2. GeoTransformer

GeoTransformer發(fā)表于2022年，在這之前的大部分工作

采用的是先檢測兩個(gè)點(diǎn)云中的Super Point再對(duì)Super Point進(jìn)行匹配的方式，如上CoFiNet所示，當(dāng)兩個(gè)點(diǎn)云重疊度很低時(shí)，找到兩個(gè)可匹配的Super Point是困難的，這使得后續(xù)的其他操作的精度難以得到保證。
Super Point描述的是點(diǎn)云的全局信息，為了更好地提取全局信息很多方法會(huì)使用Transformer進(jìn)行點(diǎn)云全局特征的學(xué)習(xí)，但是Transformer會(huì)天然地忽略點(diǎn)云的幾何信息，盡管可以使用點(diǎn)云坐標(biāo)作為位置編碼，但是基于點(diǎn)云坐標(biāo)的位置編碼都是Transformation-Invariant，也不是很不合理

針對(duì)這兩點(diǎn)，GeoTransformer通過Super Point中Pair-Wise的距離信息和Triplet-Wise的角度信息進(jìn)行編碼并嵌入到Transformer中，這種顯示地幾何信息編碼使得在低重疊度的點(diǎn)云匹配中具備較高的魯棒性。也正是因?yàn)槠ヅ涞聂敯粜钥梢允沟肎eoTransformer的后處理不依賴RANSC進(jìn)而使得整個(gè)算法變得很快。

GeoTransformer網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示：
在這里插入圖片描述
算法整體分為4個(gè)部分，首先使用使用KPConv的Backbone進(jìn)行Super Point提取，然后使用Transformer對(duì)Super Point進(jìn)行匹配，進(jìn)而將Super Point擴(kuò)展為Patch再Patch上進(jìn)行Point級(jí)別的匹配，最后使用Local-to-Global的配準(zhǔn)方式獲得最后的Transformation。

2.1 Superpoint Sampling and Feature Extraction

GeoTransformer同樣使用KP Conv進(jìn)行Super Point及其特征的提取，KP Conv的第一層輸出為用于稠密點(diǎn)云匹配的Point及其特征，每個(gè)Point會(huì)根據(jù)距離將分配給各個(gè)Super Point構(gòu)成Patch $\mathcal{G}_i^{\mathcal{P}}=\left\{\tilde{\mathbf{p}} \in \tilde{\mathcal{P}} \mid i=\operatorname{argmin}_j\left(\left\|\tilde{\mathbf{p}}-\hat{\mathbf{p}}_j\right\|_2\right), \hat{\mathbf{p}}_j \in \hat{\mathcal{P}}\right\}$ 其中 $\hat{\mathcal{P}}$ 和 $\hat{\mathcal{Q}}$ 為Super Point點(diǎn)云， $\tilde{\mathcal{P}}$ 和 $\tilde{\mathcal{Q}}$ 稠密幀點(diǎn)云.

2.2 Superpoint Matching Module

GeoTransformer同樣使用Self-Attention和Cross-Attention對(duì)Super Point的特征進(jìn)行學(xué)習(xí)，但是與CoFiNet不同的是，GeoTransformer將幾何結(jié)構(gòu)顯示地編碼到Super Point的特征中

Geometric Self-Attention：對(duì)于Super Point點(diǎn)云· $\hat{\mathcal{P}}$ 和 $\hat{\mathcal{Q}}$ 我們執(zhí)行如下相同的操作，定義Geometric Self-Attention輸入的特征矩陣為 $\mathbf{X} \in \mathbb{R}^{|\hat{\mathcal{P}}| \times d_i}$ ，輸出的特征矩陣為 $\mathbf{Z} \in \mathbb{R}^{|\hat{\mathcal{P}}| \times d_t}$ ，Self Attention中的權(quán)重系數(shù) $e_{i, j}$ 的計(jì)算公式如下 $e_{i, j}=\frac{\left(\mathbf{x}_i \mathbf{W}^Q\right)\left(\mathbf{x}_j \mathbf{w}^K+\mathbf{r}_{i, j} \mathbf{w}^R\right)^T}{\sqrt{t_t}} .$ 其中 $\mathbf{r}_{i, j} \in \mathbb{R}^{d_t}$ 為Geometric Structure Embedding， $\mathbf{W}^Q, \mathbf{W}^K, \mathbf{W}^V, \mathbf{W}^R \in \mathbb{R}^{d_t \times d_t}$ 為權(quán)重矩陣，下面我們來看看Geometric Structure Embedding是如何定義的

Geometric Structure Embedding包括Pair-Wise Distance Embedding和Triplet-Wise Embedding兩個(gè)部分，給定兩個(gè)Super Point $\hat{\mathbf{p}}_i, \hat{\mathbf{p}}_j \in \hat{\mathcal{P}}$

Pair-Wise Distance Embedding定義為 $\left\{\begin{array}{c} r_{i, j, 2 k}^D=\sin \left(\frac{d_{i, j} / \sigma_d}{10000^{2 k / d_t}}\right) \\ r_{i, j, 2 k+1}^D=\cos \left(\frac{d_{i, j} / \sigma_d}{10000^{2 k / d_t}}\right) \end{array}\right.$ 其中 $d_{i, j}=\left\|\hat{\mathbf{p}}_i-\hat{\mathbf{p}}_j\right\|_2$ ， $\sigma_d$ 為溫度系數(shù)

Triplet-Wise Angular Embedding的定義為 $\left\{\begin{array}{rl} r_{i, j, k, 2 x}^A & =\sin \left(\frac{\alpha_{i, j}^k / \sigma_a}{10000^{2 x / d_t}}\right) \\ r_{i, j, k, 2 x+1}^A & =\cos \left(\frac{\alpha_{i, j}^k / \sigma_a}{10000^{2 x / d_t}}\right) \end{array},\right.$ 其中 $\sigma_a$ 為溫度系數(shù)， $\alpha_{i, j}^k$ 計(jì)算方式為獲取Super Point $\hat{\mathbf{p}}_i$ 的 $K$ 鄰域，對(duì)于 $K$ 鄰域里的每一個(gè)Super Point計(jì)算 $\alpha_{i, j}^x=\angle\left(\Delta_{x, i}, \Delta_{j, i}\right)$ ，其中 $\Delta_{i, j}:=\hat{\mathbf{p}}_i-\hat{\mathbf{p}}_j$ ，如下圖所示：在這里插入圖片描述
最后Geometric Structure Embedding計(jì)算如下： $\mathbf{r}_{i, j}=\mathbf{r}_{i, j}^D \mathbf{W}^D+\max _x\left\{\mathbf{r}_{i, j, x}^A \mathbf{W}^A\right\}$ 整個(gè)計(jì)算過程流程圖如下圖所示：

Feature-Bsed Cross-Attention，Cross-Attention部分和正常的Cross-Attention相同的，公式如下： $\mathbf{z}_i^{\mathcal{P}}=\sum_{j=1}^{|\mathcal{Q}|} a_{i, j}\left(\mathbf{x}_j^{\mathcal{Q}} \mathbf{W}^V\right)$ $e_{i, j}=\frac{\left(\mathbf{x}_i^{\mathcal{P}} \mathbf{W}^Q\right)\left(\mathbf{x}_j^{\mathcal{Q}} \mathbf{W}^K\right)^T}{\sqrt{d_t}} .$ 其中 $\mathbf{X}^{\mathcal{P}}, \mathbf{X}^{\mathcal{Q}}$ 為Self-Attention輸出特征矩陣。

Superpoint Matching，當(dāng)Super Point的特征經(jīng)過多層Self-Attention和Cross-Attention后輸出的特征矩陣為 $\hat{\mathbf{H}}^{\mathcal{P}}$ 和 $\hat{\mathbf{H}}^{\mathcal{Q}}$ ，首先將 $\hat{\mathbf{H}}^{\mathcal{P}}$ 和 $\hat{\mathbf{H}}^{\mathcal{Q}}$ 進(jìn)行歸一化，然后計(jì)算Gaussian Correlation Matrix $\mathbf{S} \in \mathbb{R}^{|\hat{\mathcal{P}}| \times|\hat{\mathbf{Q}}|}$ $s_{i, j}=\exp \left(-\left\|\hat{\mathbf{h}}_i^{\mathcal{P}}-\hat{\mathbf{h}}_j^{\mathcal{Q}}\right\|_2^2\right)$ 為了進(jìn)一步抑制模糊匹配，我們對(duì)Gaussian Correlation Matrix進(jìn)行雙重歸一化操作： $\bar{s}_{i, j}=\frac{s_{i, j}}{\sum_{k=1}^{|\hat{\mathcal{Q}}|} s_{i, k}} \cdot \frac{s_{i, j}}{\sum_{k=1}^{|\hat{\mathcal{P}}|} s_{k, j}}$ 這種抑制可以有效消除錯(cuò)誤匹配。最后我們從Gaussian Correlation Matrix $\overline{\mathbf{S}}$ 中選擇最大的 $N_c$ 個(gè)對(duì)作為Super Point的匹配結(jié)果 $\hat{\mathcal{C}}=\left\{\left(\hat{\mathbf{p}}_{x_i}, \hat{\mathbf{q}}_{y_i}\right) \mid\left(x_i, y_i\right) \in \operatorname{topk}_{x, y}\left(\bar{s}_{x, y}\right)\right\}$ 由于GeoTransformer的強(qiáng)大編碼能力，這一步獲得的匹配結(jié)果準(zhǔn)確性是很高的，因此這一步不需要RANSAC再做進(jìn)一步外點(diǎn)去除。

2.3 Point Matching Module

由于Super Point的匹配已經(jīng)解決了全局的不確定性，在Point級(jí)別僅使用通過KPConv Backbone提供的局部特征即可。首先使用一對(duì)建立匹配的Super Point關(guān)聯(lián)Patch $\mathcal{G}_{x_i}^{\mathcal{P}}$ 和Patch $\mathcal{G}_{y_i}^{\mathcal{Q}}$ 點(diǎn)特征構(gòu)建損失矩陣 $\mathbf{C}_i \in \mathbb{R}^{n_i \times m_i}$ $\mathbf{C}_i=\mathbf{F}_{x_i}^{\mathcal{P}}\left(\mathbf{F}_{y_i}^{\mathcal{Q}}\right)^T / \sqrt{\tildevxwlu0yf4},$ 其中 $n_i=\left|\mathcal{G}_{x_i}^{\mathcal{P}}\right|, m_i=\left|\mathcal{G}_{y_i}^{\mathcal{Q}}\right|$ 分別為兩個(gè)Patch中Point的數(shù)量，然后添加新的一列和一行作為Dustbin，最后使用Sinkhorn Algorithm來計(jì)算最后的匹配關(guān)系，取匹配得分的TopK作為最后Point級(jí)別的匹配結(jié)果。

以上是針對(duì)一對(duì)Super Point提取的Point級(jí)別的匹配，所有Super Point提取的結(jié)果求并集就得到最后全局的Point的匹配結(jié)果 $\mathcal{C}=\bigcup_{i=1}^{N_c} \mathcal{C}_i$ .

2.4 RANSAC-free Local-to-Global Registration

LGR的大致步驟是根據(jù)每個(gè)Super Point對(duì)對(duì)應(yīng)的Patch中的Point的匹配關(guān)系都通過SVD計(jì)算一個(gè)變換矩陣 $\mathbf{T}_i=\left\{\mathbf{R}_i, \mathbf{t}_i\right\}$ ： $\mathbf{R}_i, \mathbf{t}_i=\min _{\mathbf{R}, \mathbf{t}} \sum_{\left(\tilde{\mathbf{p}}_{x_j} \tilde{\mathbf{q}}_{y_j}\right) \in \mathcal{C}_i} w_j^i\left\|\mathbf{R} \cdot \tilde{\mathbf{p}}_{x_j}+\mathbf{t}-\tilde{\mathbf{q}}_{y_j}\right\|_2^2$ 然后使用這些變換矩陣在全局的Point的匹配結(jié)果中計(jì)算內(nèi)點(diǎn)： $\mathbf{R}, \mathbf{t}=\max _{\mathbf{R}_i, \mathbf{t}_i} \sum_{\left(\tilde{\mathbf{p}}_{x_j}, \tilde{\mathbf{q}}_{y_j}\right) \in \mathcal{C}} \llbracket\left\|\mathbf{R}_i \cdot \tilde{\mathbf{p}}_{x_j}+\mathbf{t}_i-\tilde{\mathbf{q}}_{y_j}\right\|_2^2<\tau_a \rrbracket$ 將內(nèi)點(diǎn)數(shù)量最多的變換保留的內(nèi)點(diǎn)使用上述SVD計(jì)算公式進(jìn)行迭代求解獲得最終的匹配結(jié)果。

之所以可以實(shí)現(xiàn)這樣一個(gè)Local-to-Global的配準(zhǔn)過程是因?yàn)樽髡哒J(rèn)為Super Point的匹配結(jié)果準(zhǔn)確率是非常高的，這樣可以節(jié)省RANCAC帶來的耗時(shí)，但是在實(shí)際應(yīng)用過程中如果因?yàn)榫W(wǎng)絡(luò)訓(xùn)練不充分導(dǎo)致部分場景Super Point的匹配結(jié)果都不好，那算法也會(huì)整體失效，因此這部分是可以做進(jìn)一步優(yōu)化的地方，下面介紹的MAC在這部分就可以發(fā)揮作用

2.5 Loss Functions

損失函數(shù)主要由兩部分構(gòu)成，分別是用于計(jì)算Super Point匹配損失的Overlap-aware Circle Loss $\mathcal{L}_{o c}$ 和用于計(jì)算Point匹配損失的Point Matching Loss $\mathcal{L}_p$

Overlap-aware Circle Loss，由于Super Point的匹配真值是根據(jù)Patch Overlap的結(jié)果確定的，因此很有可能出現(xiàn)一對(duì)多的匹配結(jié)果，如果簡單當(dāng)做一個(gè)多標(biāo)簽分類任務(wù)使用Cross Entropy Loss進(jìn)行處理會(huì)使得高置信度的正樣本被抑制，使得最后預(yù)測的Super Point匹配關(guān)系不可靠。

為了解決上述問題，作者使用了Overlap-aware Circle Loss，即如果兩個(gè)Super Point的Patch Overlap比例超過10%，那么就作為正樣本，如果不存在Patch Overlap則作為負(fù)樣本。對(duì)于點(diǎn)云 $\mathcal{P}$ 中的Patch $\mathcal{G}_i^{\mathcal{P}} \in \mathcal{A}$ ，我們將其對(duì)應(yīng)點(diǎn)云 $\mathcal{Q}$ 中的正樣本定義為 $\varepsilon_p^i$ ，負(fù)樣本定義為 $\varepsilon_n^i$ ，則其損失函數(shù)為： $\mathcal{L}_{o c}^{\mathcal{P}}=\frac{1}{| \mathcal{A}|} \sum_{\mathcal{G}_i^{\mathcal{P}} \in \mathcal{A}} \log \left[1+\sum_{\mathcal{G}_j^{\mathcal{Q}} \in \varepsilon_p^i} e^{\lambda_i^j \beta_p^{i, j}\left(d_i^j-\Delta_p\right)} \sum_{\mathcal{G}_k^Q \in \varepsilon_n^i} e^{\beta_n^{i, k}\left(\Delta_n-d_i^k\right)}\right],$ 其中， $d_i^j=\left\|\hat{\mathbf{h}}_i^{\mathcal{P}}-\hat{\mathbf{h}}_j^{\mathcal{Q}}\right\|_2$ 為特征空間的距離， $\lambda_i^j=\left(o_i^j\right)^{\frac{1}{2}}$ 代表 $\mathcal{G}_i^{\mathcal{P}}$ 和 $\mathcal{G}_i^{\mathcal{Q}}$ 之間的overlap比例， $\beta_p^{i, j}=\gamma\left(d_i^j-\Delta_p\right)$ 和 $\beta_n^{i, k}=\gamma\left(\Delta_n-d_i^k\right)$ 分別為正樣本和負(fù)樣本的權(quán)重， $\Delta_p=0.1$ 和 $\Delta_n=1.4$ 為超參數(shù)。相同的損失函數(shù) $\mathcal{L}_{o c}^{\mathcal{Q}}$ 在點(diǎn)云 $\mathcal{Q}$ 上也計(jì)算一邊，最后的總損失為 $\mathcal{L}_{o c}=\left(\mathcal{L}_{o c}^{\mathcal{P}}+\mathcal{L}_{o c}^{\mathcal{Q}}\right) / 2$

Point Matching Loss，在訓(xùn)練階段隨機(jī)采樣 $N_g$ 對(duì)Super Point匹配真值，對(duì)于每個(gè)Super Point的匹配 $\hat{\mathcal{C}}_i^*$ 會(huì)在半徑 $\tau$ 內(nèi)提取一系列真值點(diǎn)的匹配 $\mathcal{M}_i$ ，對(duì)于Patch內(nèi)沒有匹配上的點(diǎn)記為 $\mathcal{I}_i$ 和 $\mathcal{J}_i$ ，那么最后的損失函數(shù)為： $\mathcal{L}_{p, i}=-\sum_{(x, y) \in \mathcal{M}_i} \log \bar{z}_{x, y}^i-\sum_{x \in \mathcal{I}_i} \log \bar{z}_{x, m_i+1}^i-\sum_{y \in \mathcal{J}_i} \log \bar{z}_{n_i+1, y}^i,$ 最后的損失函數(shù)為所有Super Point匹配結(jié)果的平均值： $\mathcal{L}_p=\frac{1}{N_g} \sum_{i=1}^{N_g} \mathcal{L}_{p, i}$ 。以上就完成了GeoTransformer的基本內(nèi)容介紹，下面補(bǔ)充下Circle Loss和Metrics相關(guān)的知識(shí)

2.6 Circle Loss

Circle Loss是在度量學(xué)習(xí)任務(wù)中提出的一種Loss，度量學(xué)習(xí)的目標(biāo)是相似或者屬于同一類樣本提取到的embedding向量之間具備更高的相似度或者更小的空間距離，像人臉識(shí)別、圖像檢索這樣的任務(wù)都屬于度量學(xué)習(xí)。

在Circle Loss之前的損失函數(shù)式通過訓(xùn)練使得positive之間的相似度 $s_p$ 大于positive和negative之間的相似度 $s_n$ ，損失函數(shù)定義為 $\max \left\{0, s_n+m-s_{\mathrm{p}}\right\}$ ，其中控制分離度的參數(shù) $m$ 為超參數(shù)，該損失函數(shù)的優(yōu)化方向要么是增大 $s_p$ 要么是減小 $s_n$ ，該損失函數(shù)定義的目標(biāo)是正確的，但問題如下圖(a)所示，在相同的控制參數(shù) $m$ 的影響下， $A$ 、 $B$ 、 $C$ 三個(gè)點(diǎn)可能被優(yōu)化到目標(biāo)邊界上任意一點(diǎn)，即 $T$ 或者 $T^{\prime}$ 點(diǎn)，這樣會(huì)導(dǎo)致優(yōu)化目標(biāo)不明確

在這里插入圖片描述
而Circle Loss則是將目標(biāo)邊界調(diào)整為了如圖(b)所示，這樣的目標(biāo)邊界將 $A$ 、 $B$ 、 $C$ 都往點(diǎn) $T$ 進(jìn)行優(yōu)化，目標(biāo)明確，效果更高，這里我們來簡單看到Circle Loss的推導(dǎo)過程：

Circle Loss的論文中提出的基礎(chǔ)版本的Loss如下所示： $L_{u n i}=\log \left[1+\sum_{i=1}^K \sum_{j=1}^L \exp \left(\gamma\left(s_n^j-s_p^i+m\right)\right)\right]=\log \left[1+\sum_{j=1}^L \exp \left(\gamma\left(s_n^j+m\right)\right) \sum_{i=1}^K \exp \left(\gamma\left(-s_p^i\right)\right)\right]$ 其中， $\gamma$ 起到損失函數(shù)尺度縮放作用。 $K$ 表示與輸入特征向量 $x$ 具備相同ID的樣本個(gè)數(shù)， $L$ 表示與輸入特征向量具備不同ID的樣本個(gè)數(shù)，即positive樣本為 $\left\{s_p^i\right\}(i=1,2, \cdots, K)$ ，negative樣本為 $\left\{s_n^i\right\}(i=1,2, \cdots, L)$ 。

Circle Loss認(rèn)為離最優(yōu)值越遠(yuǎn)的樣本應(yīng)該具備更更大的優(yōu)化權(quán)重，因此對(duì) $s_p$ 和 $s_n$ 分別進(jìn)行獨(dú)立加權(quán)，將優(yōu)化目標(biāo)修改為 $\alpha_n s_n+m-\alpha_p s_{\mathrm{p}} \leq 0$ ，其中 $\alpha_n^j$ 和 $\alpha_p^i$ 為自主學(xué)習(xí)得到的權(quán)重參數(shù)用于控制 $s_n$ 和 $s_p$ 的學(xué)習(xí)步長，因此Circle Loss的定義為： $L_{\text {circle }}=\log \left[1+\sum_{i=1}^K \sum_{j=1}^L \exp \left(\gamma\left(\alpha_n^j s_n^j-\alpha_p^i s_p^i\right)\right)\right]=\log \left[1+\sum_{j=1}^L \exp \left(\gamma \alpha_n^j s_n^j\right) \sum_{i=1}^K \exp \left(-\gamma \alpha_p^i s_p^i\right)\right]$ 其中 $\left\{\begin{array}{l} \alpha_p^i=\left[O_p-s_p^i\right]_{+} \\ \alpha_n^j=\left[s_n^j-O_n\right]_{+} \end{array}\right.$ 其中假設(shè) $s_n$ 和 $s_p$ 的最優(yōu)值分別為 $O_n$ 和 $O_p$ ，上述公式的含義是當(dāng) $s_p^i \geq O_p$ 時(shí)，說明得到的 $s_p$ 已經(jīng)足夠好，不需要再進(jìn)行懲罰， $s_n^j$ 同理。我們將控制分離度的參數(shù)對(duì)于 $s_n$ 和 $s_p$ 進(jìn)行解耦，則Circle Loss進(jìn)一步演變?yōu)?span id="vxwlu0yf4" class="katex--display"> $L_{\text {circle }}=\log \left[1+\sum_{j=1}^L \exp \left(\gamma \alpha_n^j s_n^j-\Delta_n\right) \sum_{i=1}^K \exp \left(-\gamma \alpha_{p}^i s_p^i-\Delta_p\right)\right]$ 為了簡單起見，作者將 $O_p 、 O_n 、 \Delta_n$ 和 $\Delta_p$ 分別設(shè)置為： $O_p=1+m$ $O_n=-m$ $\Delta_n=m$ $\Delta_p=1-m$ 其中 $\in[0,1], s_p^i>1-m, \quad s_n^j<m$ ， $m$ 越小對(duì)于訓(xùn)練集要求得到的預(yù)測置信度越高，在訓(xùn)練集上的你和程度越高，對(duì)于數(shù)據(jù)的泛化能力相對(duì)變差。經(jīng)過簡化，Circle Loss的超參數(shù)就只有 $\gamma$ 和 $m$ 兩個(gè)了

回到GeoTransformer，可以看到Overlap Circle Loss是在Circle Loss的基礎(chǔ)上在正樣本項(xiàng)上增加了一個(gè)表示overlap比例的權(quán)重，使得模型更加關(guān)注overlap高的匹配樣本。

2.7 Metrics

最后我們看下GeoTransformer對(duì)齊訓(xùn)練結(jié)果的評(píng)測方法，對(duì)于3DMatch和KITTI兩個(gè)數(shù)據(jù)集作者定義了兩類不同的評(píng)測指標(biāo)。

2.7.1 Inlier Ratio、Feature Matching Recall、Registration Recall

Inlier Ratio、Feature Matching Recall、Registration Recall這三個(gè)指標(biāo)是針對(duì)3DMatch數(shù)據(jù)集定義的
Inlier Ratio定義的是正確的匹配對(duì)相對(duì)于總匹配對(duì)的比例，其中兩個(gè)點(diǎn)之間的距離小于10cm定義為正確的匹配對(duì)，具體公式如下： $\operatorname{IR}=\frac{1}{|\mathcal{C}|} \sum_{\left(\mathbf{p}_{x_i}, \mathbf{q}_{y_i}\right) \in \mathcal{C}} \llbracket\left\|\overline{\mathbf{T}}_{\mathbf{P} \rightarrow \mathbf{Q}}\left(\mathbf{p}_{x_i}\right)-\mathbf{q}_{y_i}\right\|_2<\tau_1 \rrbracket,$

Feature Matching Recall定義的是Inlier Ratio值高于0.05的匹配點(diǎn)云的數(shù)量： $\mathrm{FMR}=\frac{1}{M} \sum_{i=1}^M \llbracket \mathrm{IR}_i>\tau_2 \rrbracket$ 其中 $M$ 為所有的點(diǎn)云對(duì)數(shù)量

Registration Recall定義的是正確匹配的點(diǎn)云對(duì)的數(shù)量，其中正確匹配的定義是最后求解的變化誤差小于0.2m： $\operatorname{RMSE}=\sqrt{\frac{1}{\left|\mathcal{C}^*\right|} \sum_{\left(\mathbf{p}_{x_i}^*, \mathbf{q}_{y_i}^*\right) \in \mathcal{C}^*}\left\|\mathbf{T}_{\mathbf{P} \rightarrow \mathbf{Q}}\left(\mathbf{p}_{x_i}^*\right)-\mathbf{q}_{y_i}^*\right\|_2^2},$ $\mathrm{RR}=\frac{1}{M} \sum_{i=1}^M \llbracket \mathrm{RMSE}_i<0.2 \mathrm{~m} \rrbracket$

2.7.2 Relative Rotation Error、Relative Translation Error、Registration Recall

Relative Rotation Error定義為真值和預(yù)測結(jié)果之間的角度誤差 $\mathrm{RRE}=\arccos \left(\frac{\operatorname{trace}\left(\mathbf{R}^T \cdot \overline{\mathbf{R}}-1\right)}{2}\right)$

Relative Translation Error定義為真值和預(yù)測結(jié)果之間的平移誤差 $\mathrm{RTE}=\|\mathbf{t}-\overline{\mathbf{t}}\|_2 .$

Registration Recall定義為Relative Rotation Error和Relative Translation Error都小于一定閾值比例 $\mathrm{RR}=\frac{1}{M} \sum_{i=1}^M \llbracket \mathrm{RRE}_i<5^{\circ} \wedge \mathrm{RTE}_i<2 \mathrm{~m} \rrbracket$

3. MAC

MAC發(fā)表于2023年CVPR，原論文為《3D Registration with Maximal Cliques》，本文的主要貢獻(xiàn)是優(yōu)化了極大團(tuán)的構(gòu)建策略，使得點(diǎn)云匹配的速度、性能顯著提升。極大團(tuán)的概念并不是本提出的，在之前已經(jīng)有很多研究人員研究該問題，本文提出了一個(gè)較高的解決方案。

3.1 Graph Construction

對(duì)于兩塊待匹配的點(diǎn)云 $\mathbf{P}^s$ 和 $\mathbf{P}^t$ ，初始的匹配關(guān)系 $\mathbf{C}_{\text {initial }}=\{\mathbf{c}\}$ 通過特征描述子獲得，其中 $\mathbf{c}=\left(\mathbf{p}^s, \mathbf{p}^t\right)$ ， $\mathbf{p}^s$ 和 $\mathbf{p}^t$ 分別為點(diǎn)云 $\mathbf{P}^s$ 和 $\mathbf{P}^t$ 中的點(diǎn)。MAC就是通過構(gòu)建Graph從 $\mathbf{C}_{\text {initial }}$ 中獲得點(diǎn)云 $\mathbf{P}^s$ 和 $\mathbf{P}^t$ 的位姿變換。

Fisrt Order Graph的構(gòu)建主要基于匹配點(diǎn)對(duì) $\left(\mathbf{c}_i, \mathbf{c}_j\right)$ 之間的剛性距離限制 $S_{d i s t}\left(\mathbf{c}_i, \mathbf{c}_j\right)=\left|\left\|\mathbf{p}_i^s-\mathbf{p}_j^s\right\|-\left\|\mathbf{p}_i^t-\mathbf{p}_j^t\right\|\right|$ 這其實(shí)很好理解，因?yàn)辄c(diǎn)云本身和點(diǎn)云匹配的過程都是剛性的?；谠撓拗莆覀冇?jì)算匹配點(diǎn)對(duì)之間點(diǎn)對(duì)得分為： $S_{c m p}\left(\mathbf{c}_i, \mathbf{c}_j\right)=\exp \left(-\frac{S_{d i s t}\left(\mathbf{c}_i, \mathbf{c}_j\right)^2}{2 d_{c m p}^2}\right)$ 其中 $d_{c m p}$ ，可以看到 $S_{\text {dist }}\left(\mathbf{c}_i, \mathbf{c}_j\right)$ 越小得分越高越接近于1，而 $S_{\text {dist }}\left(\mathbf{c}_i, \mathbf{c}_j\right)$ 過大則會(huì)導(dǎo)致得分幾乎為零。由于沒有方向，Fisrt Order Graph $\mathbf{W}_{F O G}$ 是一個(gè)對(duì)稱矩陣。

Second Order Graph是基于Fisrt Order Graph構(gòu)建的稀疏矩陣： $\mathbf{W}_{S O G}=\mathbf{W}_{F O G} \odot\left(\mathbf{W}_{F O G} \times \mathbf{W}_{F O G}\right)$ 相對(duì)于Fisrt Order Graph，Second Order Graph具備的優(yōu)勢是具備更嚴(yán)格邊構(gòu)建條件并且更稀疏，有助于更快地搜索團(tuán)。Fisrt Order Graph和Second Order Graph的區(qū)別如下圖所示：
在這里插入圖片描述

3.2 Search Maximal Cliques

給定一個(gè)無向圖 $G=(\mathbf{V}, \mathbf{E})$ ，團(tuán)的定義為 $C=\left(\mathbf{V}^{\prime}, \mathbf{E}^{\prime}\right)$ ，其中 $\mathbf{V}^{\prime} \subseteq \mathbf{V}, \mathbf{E}^{\prime} \subseteq \mathbf{E}$ ， $C$ 是 $G$ 的子集。最大團(tuán)的定義就是無向圖中擁有最多節(jié)點(diǎn)的團(tuán)。

之前有很多工作在研究如何從一個(gè)無向圖中搜索出最大團(tuán)，他是他們的問題是搜索過程集中在無向圖中的全局信息，而本文放松了這種限制使得搜索最大團(tuán)的過程可以更加關(guān)注局部信息。具體方法如下：

Node-guided Clique Selection在初始的最大團(tuán)搜索后得到 $C_{\text {initial }}$ ，我們賦予每一個(gè)團(tuán) $C_i=\left(\mathbf{V}_i, \mathbf{E}_i\right)$ 一個(gè)權(quán)重 $w_{C_i}$ ，權(quán)重的計(jì)算方式為： $w_{C_i}=\sum_{e_j \in \mathbf{E}_i} w_{e_j}$ 其中 $w_{e_j}$ 為 $\mathbf{W}_{S O G}$ 中的邊權(quán) $e_j$ ，一個(gè)node可能會(huì)被多個(gè)團(tuán)所包含，我們采用的策略是將該node保留在權(quán)重最大的團(tuán)中，其他權(quán)重偏低團(tuán)將會(huì)被移除，剩下的團(tuán)記為 $MAC_{\text {selected }}$ ，接下來我們對(duì) $MAC_{\text {selected }}$ 進(jìn)行進(jìn)一步過濾，過濾邏輯如下：

Normal Consistency 指的是給定兩個(gè)匹配對(duì) $\mathbf{c}_i=\left(\mathbf{p}_i^s, \mathbf{p}_i^t\right), \mathbf{c}_j=\left(\mathbf{p}_j^s, \mathbf{p}_j^t\right)$ 以及這四個(gè)點(diǎn)構(gòu)成的向量 $\mathbf{n}_i^s, \mathbf{n}_j^s, \mathbf{n}_i^t, \mathbf{n}_j^t$ ，他們的角度差分別為 $\alpha_{i j}^s=\angle\left(\mathbf{n}_i^s, \mathbf{n}_j^s\right), \alpha_{i j}^t=\angle\left(\mathbf{n}_i^t, \mathbf{n}_j^t\right)$ ，他們的角度差不應(yīng)該過，即 $\left|\sin \alpha_{i j}^s-\sin \alpha_{i j}^t\right|<t_\alpha$ 其中 $t_\alpha$ 為超參數(shù)閾值。
Clique Ranking指的是對(duì) $MAC_{\text {selected }}$ 按照權(quán)重 $w_{C_i}$ 進(jìn)行排序，Top-K的應(yīng)該被保留。

經(jīng)過上述操作，原本數(shù)量非常巨大的 $C_{\text {initial }}$ 會(huì)減小到一定數(shù)量，最后通過Instance-equal SVD或者Weighted SVD就可以求解最后的變換。

我覺得很棒的一點(diǎn)是MAC可以作為模塊添加到其他方法中，我們可以看到加入MAC后各個(gè)方法的指標(biāo)都有明顯提高：
在這里插入圖片描述

查看全文

http://www.risenshineclean.com/news/5056.html

中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

要給公司做一個(gè)網(wǎng)站怎么做網(wǎng)站優(yōu)化的方式有哪些

激光點(diǎn)云配準(zhǔn)算法——Cofinet / GeoTransformer / MAC