中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

廣州網(wǎng)站建設(shè) 易點(diǎn)seo站點(diǎn)是什么意思

廣州網(wǎng)站建設(shè) 易點(diǎn),seo站點(diǎn)是什么意思,好看免費(fèi)的ppt模板下載,wordpress數(shù)據(jù)都被存在哪0. 摘要 0.1. 問(wèn)題提出 1.超分辨率(SR)是一個(gè)不適定逆問(wèn)題,可行解眾多。 2.超分辨率(SR)算法在可行解中尋找一個(gè)在保真度和感知質(zhì)量之間取得平衡的“良好”解。 3.現(xiàn)有的方法重建高頻細(xì)節(jié)時(shí)會(huì)產(chǎn)生偽影和幻覺(jué),模型區(qū)分圖像細(xì)節(jié)與偽影仍是難題。 0.2. …

0. 摘要

0.1. 問(wèn)題提出

1.超分辨率(SR)是一個(gè)不適定逆問(wèn)題,可行解眾多。

2.超分辨率(SR)算法在可行解中尋找一個(gè)在保真度和感知質(zhì)量之間取得平衡的“良好”解。

3.現(xiàn)有的方法重建高頻細(xì)節(jié)時(shí)會(huì)產(chǎn)生偽影和幻覺(jué),模型區(qū)分圖像細(xì)節(jié)與偽影仍是難題。

0.2. 方法介紹

0.2.1. 損失函數(shù)改進(jìn)

本文表明,使用基于小波域損失函數(shù)的生成對(duì)抗網(wǎng)絡(luò)(GAN)超分辨率模型進(jìn)行訓(xùn)練,可以更好地學(xué)習(xí)到真正的高頻細(xì)節(jié)與偽影的特征,相比之下,RGB 域或傅里葉空間的損失函數(shù)則不然。

損失函數(shù)
損失函數(shù)定義具體說(shuō)明
RGB 域

在 RGB(紅、綠、藍(lán))顏色空間中定義的損失函數(shù)。

RGB 顏色空間是最常見(jiàn)的用于表示彩色圖像的模型,其中每個(gè)像素由紅、綠、藍(lán)三個(gè)通道的值來(lái)描述。

包含L2損失函數(shù)(均方誤差,MSE)、L1損失函數(shù)(平均絕對(duì)誤差,MAE)、感知損失
傅里葉空間

在傅里葉變換后的頻域中定義的損失函數(shù)。

傅里葉變換將圖像從空域(即 RGB 像素空間)轉(zhuǎn)換到頻域,其中低頻部分表示圖像的大致輪廓等基本信息,高頻部分表示圖像的細(xì)節(jié)信息。

在頻率域中,圖像的低頻部分主要包含了圖像的輪廓和基本形狀等信息,高頻部分則包含了圖像的細(xì)節(jié)信息。通過(guò)在傅里葉空間定義損失函數(shù),可以更好地控制重建圖像的頻率成分。

公式為$L_{Fourier}=\frac{1}{M}\sum_{j=1}^{M}||F(y)_{j}-F(\hat{y})_{j}||$

F(y)_{j}F(\hat{y})_{j}分別是原始圖像y和重建圖像\hat{y}的傅里葉變換,其中M是頻率域中的采樣點(diǎn)數(shù)。

小波域

在小波變換后的小波域中定義的損失函數(shù)。

小波變換可以將圖像分解為不同尺度和方向的小波系數(shù),這些系數(shù)能夠更好地描述圖像的局部特征。

小波變換能夠同時(shí)提供圖像在空間和頻率上的局部信息。

在超分辨率重構(gòu)中,不同尺度的小波系數(shù)對(duì)應(yīng)著圖像不同層次的細(xì)節(jié)。大尺度的小波系數(shù)主要反映圖像的輪廓等低頻信息,小尺度的小波系數(shù)則反映圖像的細(xì)節(jié)等高頻信息。通過(guò)在小波域定義損失函數(shù),可以更有針對(duì)性地恢復(fù)圖像的細(xì)節(jié)。

公式為$L_{Wavelet}=\frac1P\sum_{k=1}^P(W(y)_k-W(\hat{y})_k)^2$

W(y)W(\hat{y})分別是原始圖像y和重建圖像\hat{y}的小波系數(shù),P是小波系數(shù)的總數(shù)。

0.2.2. 判別器訓(xùn)練創(chuàng)新

通常情況下,判別器是基于 RGB 圖像進(jìn)行訓(xùn)練的。RGB 圖像包含了紅、綠、藍(lán)三個(gè)顏色通道的信息,是我們常見(jiàn)的圖像表示形式。

然而,在本文中,作者提出僅對(duì)高頻小波子帶進(jìn)行判別器的訓(xùn)練。這樣訓(xùn)練的優(yōu)勢(shì)是高頻小波子帶能夠更突出地反映圖像中的細(xì)節(jié)和邊緣等信息,這些細(xì)節(jié)對(duì)于判斷圖像的真實(shí)性和質(zhì)量至關(guān)重要。例如,在一幅包含人物和背景的圖像中,人物的輪廓、發(fā)絲以及背景中的樹(shù)葉紋理等細(xì)節(jié)信息在高頻小波子帶中會(huì)更加明顯。通過(guò)在高頻小波子帶中訓(xùn)練判別器,它可以更專注于這些細(xì)節(jié)特征,從而更精準(zhǔn)地判斷生成的細(xì)節(jié)是真實(shí)的還是偽造的,有效地區(qū)分圖像中的真實(shí)細(xì)節(jié)和偽影,更好地控制細(xì)節(jié)與幻影偽影。

0.2.3. 生成器訓(xùn)練方式

在訓(xùn)練生成器時(shí),使用小波子帶的保真度損失。小波變換(如 SWT)可以將圖像分解為不同尺度和方向的子帶,每個(gè)子帶都包含了圖像在特定尺度和方向上的信息。通過(guò)計(jì)算生成圖像的小波子帶與真實(shí)高分辨率圖像的小波子帶之間的差異(保真度損失),并將這些差異反向傳播給生成器,使生成器學(xué)習(xí)如何調(diào)整生成的圖像,以減小這種差異。這種訓(xùn)練方式使得生成器在生成圖像時(shí),能夠更加關(guān)注圖像結(jié)構(gòu)的尺度和方向信息。例如,在生成建筑物的圖像時(shí),生成器可以根據(jù)不同小波子帶中的信息,準(zhǔn)確地還原出建筑物的輪廓(大尺度結(jié)構(gòu))以及墻壁上的磚塊紋理(小尺度結(jié)構(gòu)),并且保證這些結(jié)構(gòu)在不同方向上的正確性,如水平和垂直方向的線條等。這樣生成的超分辨率圖像在結(jié)構(gòu)和細(xì)節(jié)上更加逼真,與真實(shí)圖像的特征更加接近。

0.3. 結(jié)果展示

大量的實(shí)驗(yàn)結(jié)果表明,根據(jù)多個(gè)客觀指標(biāo)和視覺(jué)評(píng)估,我們的模型實(shí)現(xiàn)了更好的感知失真權(quán)衡。

1. 引言

1.1. 單幅圖像超分辨率

卷積神經(jīng)網(wǎng)絡(luò)CNN,通過(guò)像素級(jí)l_{1}l_{2}保真度損失進(jìn)行訓(xùn)練。

隨后出現(xiàn)了更好的模型,采用了殘差連接和稠密連接。

后來(lái),空間注意力、通道注意力和Transformer網(wǎng)絡(luò)在峰值信噪比PSNR和結(jié)構(gòu)相似度SSIM方面表現(xiàn)出了令人印象深刻的性能。

然而,平均誤差最小化傾向于所有可行SR輸出的概率加權(quán)平均;因此,僅基于保真度損失進(jìn)行優(yōu)化的模型會(huì)產(chǎn)生過(guò)于平滑的圖像,缺乏HF細(xì)節(jié)。

1.2. 生成超分辨率模型

為了感知質(zhì)量更好的結(jié)果,提出了生成超分辨率模型,如生成對(duì)抗網(wǎng)絡(luò)GANs 、流模型和擴(kuò)散模型。生成超分辨率模型旨在從類似于真實(shí)圖像的分布中采樣預(yù)測(cè)的超分辨率圖像。 然而,眾所周知,它們會(huì)產(chǎn)生高頻細(xì)節(jié)的幻覺(jué)和結(jié)構(gòu)性偽影。

流和擴(kuò)散模型在某種意義上執(zhí)行隨機(jī)采樣,即單個(gè)模型可以生成許多樣本。因此,它們對(duì)每個(gè)樣本在學(xué)習(xí)細(xì)節(jié)與偽影之間的控制較少。

在本文中,我們專注于條件生成對(duì)抗網(wǎng)絡(luò)超分辨率模型,即單個(gè)訓(xùn)練模型生成單個(gè)超分辨率圖像樣本。生成對(duì)抗網(wǎng)絡(luò)模型通過(guò)像素級(jí)保真度和對(duì)抗(判別器)損失的加權(quán)和進(jìn)行訓(xùn)練。此外,還提出了額外的感知損失,如VGG損失、紋理匹配損失和內(nèi)容損失,以強(qiáng)制超分辨率和GT 圖像之間的特征級(jí)相似性,從而減輕幻覺(jué)和偽影。然而, 感知損失在控制幻覺(jué)和失真方面并不足夠有效。

1.3. 感知失真權(quán)衡

感知失真權(quán)衡假設(shè)指出,存在一個(gè)界限,超過(guò)這個(gè)界限,任何感知質(zhì)量的提升(通過(guò)無(wú)參考度量來(lái)衡量)都會(huì)以失真的增加(通過(guò)全參考度量來(lái)衡量) 為代價(jià)。在保真度和感知質(zhì)量之間找到最佳權(quán)衡不是一 個(gè)定義明確的優(yōu)化問(wèn)題,主要是因?yàn)闆](méi)有一種定量的感知圖像質(zhì)量度量與人類偏好有良好的相關(guān)性。認(rèn)識(shí)到這 一點(diǎn),最近的超分辨率挑戰(zhàn)要求超分辨率重建在正向退化模型下與低分辨率觀測(cè)結(jié)果一致(也稱為可行解), 并對(duì)視覺(jué)質(zhì)量進(jìn)行人類評(píng)估。然而,可行解集合的大小非常龐大,即使對(duì)于人類來(lái)說(shuō),確定哪些可行解包含真實(shí)的圖像細(xì)節(jié),哪些包含偽影或幻覺(jué)也是極其困難的。

1.5. 框架介紹

GAN-SR,利用小波域損失來(lái)抑制幻影和偽影,以實(shí)現(xiàn)更好的峰值信噪比(PD)權(quán)衡。

1.5.1. SWT子帶

SWT 是一種將圖像分解為多個(gè)子帶的技術(shù)。

在本文提出的 GAN - SR 框架中,利用 SWT 子帶的特性來(lái)定義保真損失和對(duì)立損失。

1.5.2. 保真損失

計(jì)算I_{SR}經(jīng)過(guò) SWT 分解后的子帶的l_{1}損失加權(quán)組合I_{HR}經(jīng)過(guò) SWT 分解后的子帶的l_{1}損失加權(quán)組合,再比較它們之間的差異(這里采用的不是傳統(tǒng)的 RGB 域l_{1}損失)

1.5.3. 對(duì)立損失

I_{HR}的高頻子帶連接后輸入判別器得到一個(gè)結(jié)果,同時(shí)將I_{SR}的高頻子帶連接后輸入判別器得到另一個(gè)結(jié)果,然后根據(jù)這兩個(gè)結(jié)果計(jì)算對(duì)立損失。

1.5.4. 不進(jìn)行子采樣

在一般的小波變換(如 DWT)過(guò)程中,子采樣是指在對(duì)圖像進(jìn)行分解時(shí),在某個(gè)方向(通常是水平或垂直方向)上每隔一定數(shù)量的像素點(diǎn)選取一個(gè)像素點(diǎn),從而降低圖像在該方向上的分辨率。例如,在水平方向上進(jìn)行 2 倍子采樣,就是每隔一個(gè)像素選取一個(gè)像素,這樣圖像的寬度就會(huì)變?yōu)樵瓉?lái)的一半。子采樣的目的是減少數(shù)據(jù)量,加快計(jì)算速度,但同時(shí)也會(huì)損失一定的信息。SWT 在分解圖像時(shí)不進(jìn)行子采樣,這使得它能夠提供低頻(LF)和高頻(HF)子帶的獨(dú)特局部特征。因?yàn)闆](méi)有子采樣帶來(lái)的信息丟失,SWT 分解后的子帶能夠更準(zhǔn)確地反映圖像在不同尺度和方向上的特征,圖像的尺度和頻率信息與空間位置內(nèi)在地耦合在一起。例如,對(duì)于一幅包含精細(xì)紋理和復(fù)雜結(jié)構(gòu)的圖像,SWT 可以完整地保留這些細(xì)節(jié)在各個(gè)子帶中的信息,使得模型在處理圖像時(shí)能夠更好地捕捉到圖像的局部特征,從而在定義保真損失和對(duì)立損失時(shí),能夠更精準(zhǔn)地控制圖像重建過(guò)程,有助于抑制幻影和偽影,實(shí)現(xiàn)更好的峰值信噪比權(quán)衡,提高超分辨率圖像的質(zhì)量。

1.6. 優(yōu)越性和貢獻(xiàn)

我們提出了一種小波域保真度損失(不同小波子帶的l_{1}損失的加權(quán)組合,而非傳統(tǒng)的RGB域l_{1}損失),?它在 SWT 子帶中能更好地觀察到圖像局部結(jié)構(gòu)的尺度和方向,對(duì)局部結(jié)構(gòu)的尺度和方向更敏感。

我們提議在對(duì)抗訓(xùn)練中使用 SWT 域判別器,以控制高頻失真。我們表明,與傳統(tǒng)的 RGB 域判別器相比,在高頻小波子帶上訓(xùn)練判別器,能夠更好地控制優(yōu)化景觀,將失真與真實(shí)的圖像細(xì)節(jié)分離出來(lái)。

我們表明,將我們提出的小波引導(dǎo)訓(xùn)練方案與 RGB 域的 DISTS 感知損失(而非傳統(tǒng)的基于 VGG 的 LPIPS 損失)相結(jié)合,顯著提高了保真度(在峰值信噪比中高達(dá) 0.5 分貝),同時(shí)感知質(zhì)量的損失極小 (不到 1%)。

2. 相關(guān)工作

GAN-based SR.基于生成對(duì)抗網(wǎng)絡(luò)的超分辨率。

Training GANs by Frequency Domain Losses.通過(guò)頻域損失訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)。

Modeling SR in the Wavelet Domain.在小波域中對(duì)超分辨率進(jìn)行建模。

3. WGSR: Wavelet-Guided SR Framework

WGSR框架通過(guò)以下方式抑制高頻幻影和失真,以實(shí)現(xiàn)更好的PD平衡:

  1. 僅在高頻 子帶上訓(xùn)練判別器
  2. 引入小波域失真損失來(lái)引導(dǎo)生成器
  3. 選擇更合適的感知損失,使其與我們的優(yōu)化目標(biāo)更好地耦合

3.1. 使用小波域損失的原因

平穩(wěn)小波變換(SWT)允許將圖像進(jìn)行多尺度分解,分解為一個(gè)被稱為 LL 的低頻子帶和幾個(gè)高頻(例如,LH、HL、HH)子帶。

LL 子帶的分解級(jí)別決定了分別在水平、垂直和對(duì)角方向傳輸詳細(xì)信息的高頻子帶的數(shù)量。

需要注意的是,由于在超分辨率任務(wù)中分辨率至關(guān)重要,我們使用 SWT 而不是經(jīng)典的離散小波變換DWT。SWT與DWT的主要區(qū)別在于SWT去除了 DWT 中的子采樣,因此,SWT 方法將尺度和頻率信息與空間位置內(nèi)在地耦合在一起。

LL 子帶的重要性:SWT 把圖像分解后,LL 子帶就像是圖像的 “根基”,對(duì)重建圖像的好壞(保真度)影響很大。如果這個(gè) “根基” 的頻率被改變了,那整個(gè)圖像就可能變得不像原來(lái)的樣子,也就是失真了。所以要保證 LL 子帶的頻率穩(wěn)定不變。同時(shí),圖像中那些和 LL 空間內(nèi)容能對(duì)應(yīng)得上的高頻部分(比如一些邊緣、紋理等細(xì)節(jié))也得重建好,這樣圖像看起來(lái)才真實(shí)。

通過(guò)對(duì)比 ESRGAN + 和 WGSR 方法在 SWT 分解下的情況,能看出 SWT 引導(dǎo)對(duì)抗訓(xùn)練的好處。

ESRGAN + 的問(wèn)題:拿 ESRGAN + 這個(gè)方法來(lái)說(shuō),它在訓(xùn)練的時(shí)候沒(méi)有小波域損失的引導(dǎo),就像走路沒(méi)有地圖一樣。它生成的圖像有很明顯的夸大的偽影,就好像圖像上多了一些不該有的東西。特別是 HL 子帶,因?yàn)閳D像里結(jié)構(gòu)的方向等原因,這個(gè)子帶里有更多的幻影,也就是看起來(lái)不真實(shí)的東西,它的失真程度更高,在和其他子帶比較時(shí),峰值信噪比(PSNR)分?jǐn)?shù)最低。這就說(shuō)明這個(gè)區(qū)域(HL 子帶)需要改進(jìn)。但是如果從普通的 RGB 圖像里去找這些問(wèn)題并改進(jìn),對(duì)判別器網(wǎng)絡(luò)來(lái)說(shuō)太難了,它根本發(fā)現(xiàn)不了圖像里這些不自然的偽影。

WGSR 的優(yōu)勢(shì):而我們提出的 WGSR 方法就不一樣了。我們通過(guò)只把高頻(HF)子帶輸入到判別器網(wǎng)絡(luò)里,而不是整個(gè) RGB 圖像,這樣就能更容易地把圖像的細(xì)節(jié)和那些不好的偽影分開(kāi)。經(jīng)過(guò)這樣的優(yōu)化,不管是在各個(gè)子帶,還是最后得到的超分辨率(SR)圖像,都有很大的進(jìn)步,圖像變得非常逼真,里面都是真實(shí)的圖像細(xì)節(jié),而不是那些假的幻影和偽影。所以說(shuō),SWT 引導(dǎo)的對(duì)抗訓(xùn)練是很有優(yōu)勢(shì)的,可以讓我們的模型生成更好的超分辨率圖像。

3.2. 結(jié)構(gòu)

如圖所示的所提出的框架由一個(gè)RGB域生成器和一個(gè)SWT 域判別器組成,它們使用 SWT 引導(dǎo)的保真度和對(duì)抗性以及像素域感知損失進(jìn)行聯(lián)合訓(xùn)練。該框架具有通用性,任何生成器和任何判別器模型都可以輕松地插入到這個(gè)框架中。

3.2.1. SWT域判別器

SWT 域判別器旨在判斷生成圖像的高頻細(xì)節(jié)與真實(shí)高頻細(xì)節(jié)的相似程度,通過(guò)特定的訓(xùn)練流程和架構(gòu),使其專注于評(píng)估水平、垂直和對(duì)角方向的細(xì)節(jié),以穩(wěn)定訓(xùn)練并有效防止幻覺(jué)與消除失真。

判別器任務(wù)

判別器就像一個(gè) “裁判”,它的工作是判斷生成圖像中的高頻細(xì)節(jié)(包括低頻、高頻和中頻子帶中的高頻部分)和真實(shí)圖像的高頻細(xì)節(jié)相比,有多像真的。它只關(guān)注圖像在水平、垂直和對(duì)角方向上的細(xì)節(jié),而不是直接看整個(gè) RGB 圖像。因?yàn)檫@些方向的細(xì)節(jié)對(duì)于控制圖像中真正的細(xì)節(jié)和那些不好的幻影、偽影特別重要。比如說(shuō),一張照片里建筑物的邊緣(水平和垂直方向細(xì)節(jié))、樹(shù)葉的脈絡(luò)(對(duì)角方向細(xì)節(jié))等,判別器要能判斷生成圖像里這些地方和真實(shí)圖像的差別。

子帶信息與訓(xùn)練簡(jiǎn)化

低頻(LL)、高頻水平(LH)、高頻垂直(HL)和高頻對(duì)角(HH)子帶傳遞的是稀疏信息。這就好比給判別器提供了一份簡(jiǎn)化的 “線索清單”,讓它的任務(wù)變得更容易,訓(xùn)練也能更穩(wěn)定。例如,在一幅風(fēng)景圖像中,LL 子帶可能給出了大致的地形輪廓(低頻信息),LH 子帶突出了水平方向的紋理(如河流、地平線等),HL 子帶強(qiáng)調(diào)了垂直方向的元素(如樹(shù)木、電線桿等),HH 子帶則體現(xiàn)了對(duì)角方向的細(xì)節(jié)(如山坡的斜邊、建筑物的棱角等)。這些信息不像完整的 RGB 圖像那么復(fù)雜,判別器可以更輕松地根據(jù)這些子帶信息來(lái)判斷圖像的好壞。

訓(xùn)練流程

首先,要對(duì)生成的圖像進(jìn)行 YCbCr 轉(zhuǎn)換,這就像是把圖像的 “語(yǔ)言” 翻譯成判別器能聽(tīng)懂的形式。然后,只取其中的 Y 通道,把 Cb 和 Cr 通道扔掉,再對(duì) Y 通道應(yīng)用 SWT 分解,這樣就能得到我們需要的低頻、高頻水平、高頻垂直和高頻對(duì)角子帶。在訓(xùn)練判別器的時(shí)候,只用 LH、HL、HH 這些細(xì)節(jié)子帶。

判別器架構(gòu)

判別器的內(nèi)部結(jié)構(gòu)像一個(gè) “加工廠”,有9個(gè)卷積層,這些卷積層的核大小在3\times 34\times 4之間交替變化。

卷積層后面跟著二維批量歸一化,就像對(duì)加工過(guò)程中的數(shù)據(jù)進(jìn)行 “整理”,讓數(shù)據(jù)更規(guī)范。

在卷積層和批量歸一化之間還有 ReLU 激活函數(shù),它就像一個(gè) “開(kāi)關(guān)”,決定哪些信息可以繼續(xù)傳遞下去。

每個(gè)卷積層輸出的特征數(shù)量從 64 慢慢增加到 512,最后通過(guò)兩個(gè)具有 LeakyReLU 激活的線性層,輸出一個(gè)二維數(shù)組。這個(gè)數(shù)組就是判別器給出的 “判決結(jié)果”,告訴我們生成圖像的高頻子帶和真實(shí)圖像的高頻子帶是否相似。

通過(guò)這樣的架構(gòu),判別器能夠把注意力集中在生成圖像的高頻細(xì)節(jié)上,尤其是那些能清楚區(qū)分偽造細(xì)節(jié)和真實(shí)細(xì)節(jié)的地方,從而防止圖像中出現(xiàn)幻覺(jué)(看到不存在的東西),并消除失真(讓圖像看起來(lái)更真實(shí))。

3.2.2. RGB域生成器

選擇RRDB架構(gòu)作為骨干生成器網(wǎng)絡(luò),其由 23 個(gè)不含批量歸一化的殘差密集塊組成。

除了輸出層,所有卷積層都使用具有64個(gè)特征的3\times 3核,并選擇 Leaky ReLU 作為激活函數(shù)。

由于生成器網(wǎng)絡(luò)在訓(xùn)練期間隨機(jī)裁剪 RGB 塊,我們將其稱為 RGB 域生成器。

值得 一提的是,我們提出的具有小波域損失和小波變換域判別器的訓(xùn)練方案可以與任何生成器網(wǎng)絡(luò)架構(gòu)相結(jié)合。

3.3. 通過(guò) SWT 域損失進(jìn)行訓(xùn)練

SWT 域保真損失L_{SWT}

與傳統(tǒng)GAN-SR 方法使用 RGB 域保真損失不同,本文定義了 SWT 域保真損失L_{SWT},并帶有相應(yīng)的調(diào)優(yōu)參數(shù)\lambda _{j}。其計(jì)算方式是先對(duì)生成圖像I_{SR}和真實(shí)圖像I_{HR}進(jìn)行 SWT 分解,然后計(jì)算它們?cè)诟鱾€(gè)子帶j上的l_{1}保真損失,乘以對(duì)應(yīng)的縮放因子\lambda _{j}后求和,再對(duì)小批量數(shù)據(jù)求平均。

例如,對(duì)于圖像中的線條(如窗戶邊緣、建筑物輪廓等)和細(xì)節(jié)(如樹(shù)葉紋理、字母形狀等),通過(guò)調(diào)整不同子帶的權(quán)重,可以控制生成圖像在這些區(qū)域的高頻細(xì)節(jié),避免出現(xiàn)幻影或偽影,使生成圖像更接近真實(shí)圖像,從而調(diào)整保真度和感知質(zhì)量的平衡。

對(duì)抗損失L_{adv,G}

為避免改變現(xiàn)有頻率或引入新頻率,對(duì)抗損失L_{adv,G}僅在細(xì)節(jié)子帶(LH、HL 和 HH)上計(jì)算。其計(jì)算涉及判別器模型D,通過(guò)比較生成圖像和真實(shí)圖像在 SWT 域的細(xì)節(jié)子帶連接后的情況來(lái)確定損失。具體來(lái)說(shuō),公式中的兩項(xiàng)分別計(jì)算了真實(shí)圖像和生成圖像經(jīng)過(guò)判別器后的對(duì)數(shù)損失,兩者相加得到對(duì)抗損失。判別器的任務(wù)是區(qū)分真實(shí)和生成的細(xì)節(jié)子帶,生成器則要盡量 “欺騙” 判別器,使生成的細(xì)節(jié)子帶被判別為真實(shí)的,從而促使生成器生成更逼真的高頻細(xì)節(jié)。

生成器總體損失$L_G$
生成器的總體損失$L_G$由三部分組成:SWT 域保真損失$L_{SWT}$ 、對(duì)抗損失$L_{adv,G}$乘以權(quán)重因子$\lambda_{adv}$、感知損失$L_{perc}$乘以權(quán)重因子$\lambda_{perc}$。
感知損失用于衡量圖像質(zhì)量評(píng)估指標(biāo)(如DISTS)所提供的特征空間中的誤差。通過(guò)調(diào)整這些損失項(xiàng)的權(quán)重,可以靈活地調(diào)整生成的超分辨率圖像的保真度和感知質(zhì)量之間的平衡。

例如,如果希望生成的圖像更注重細(xì)節(jié)保真度,可以增加$\lambda_{SWT}$的權(quán)重;如果更看重感知質(zhì)量,可以適當(dāng)增加$\lambda_{perc}$的權(quán)重。

在實(shí)驗(yàn)中,通過(guò)經(jīng)驗(yàn)搜索確定了各參數(shù)的最佳值,如$\lambda_{LL}=0.1$,$\lambda_{LH}=\lambda_{HL}=0.01$,$\lambda_{HH}=0.05$,$\lambda _{adv}= 0. 005$$\lambda_{perc}=1$,以實(shí)現(xiàn)最佳的感知失真權(quán)衡。

判別器損失$L_D$

判別器的損失$L_D$計(jì)算方式與對(duì)抗損失相關(guān),其輸入僅為高頻細(xì)節(jié)子帶。它同樣通過(guò)比較真實(shí)圖像和生成圖像經(jīng)過(guò)判別器后的對(duì)數(shù)損失來(lái)確定,目的是使判別器能夠準(zhǔn)確地區(qū)分真實(shí)和生成的高頻細(xì)節(jié)子帶,從而引導(dǎo)生成器生成更逼真的圖像,減少偽影和失真。

4. 實(shí)驗(yàn)

4.1.? 實(shí)驗(yàn)設(shè)置

訓(xùn)練細(xì)節(jié)

訓(xùn)練集:DIV2K的800張I_{LR},這些圖像是使用 MATLAB 雙三次下采樣核以 4 倍縮放因子生成的。在一個(gè)大小為 16 的小批量中,隨機(jī)裁剪32\times 32像素的RGBI_{LR}塊并提供給生成器。然后,在對(duì)生成圖像的 Y 通道應(yīng)用平穩(wěn)小波變換(SWT)后計(jì)算損失項(xiàng)。

優(yōu)化過(guò)程:使用默認(rèn)設(shè)置為\beta _{1}=0.9、\beta _{2}=0.999以及\epsilon =10^{-8}的 ADAM 優(yōu)化器。

初始化生成器:我們使用預(yù)訓(xùn)練的 RRDB權(quán)重初始化生成器的訓(xùn)練參數(shù),然后進(jìn)行60k 次迭代,初始學(xué)習(xí)率為10^{-4},在50k次迭代后減半。

由于小波損失是在訓(xùn)練期間計(jì)算的,它不影響運(yùn)行時(shí)間,因此 WGSR 的推理時(shí)間與 RRDB 的推理時(shí)間相同。

4.2.? 對(duì)比試驗(yàn)

定量比較

針對(duì)\times 4 超分辨率任務(wù),所提出的基于小波分解的優(yōu)化目標(biāo)與其他現(xiàn)有最佳方法的定量比較。最佳和次佳結(jié)果分別以粗體和下劃線標(biāo)記。

定性比較

SWT分解層級(jí)

層級(jí)作用:SWT 分解層級(jí)影響真實(shí)細(xì)節(jié)與偽影控制及 SR 性能,最佳層級(jí)取決于 LR 圖像結(jié)構(gòu)尺度和方向。

實(shí)驗(yàn)分析:以 Urban100 數(shù)據(jù)集中包含不同方向和空間頻率線條的圖像為例,如 img - 92,FxSR 和 SROOE 無(wú)法恢復(fù)正確結(jié)構(gòu),WGSR 使用 1 級(jí) SWT 可恢復(fù)線條方向但有混疊,使用 2 級(jí) SWT(將 1 級(jí) SWT 的 LL 子帶進(jìn)一步分解為 4 個(gè)子帶并保持細(xì)節(jié)子帶不變,共 7 個(gè)子帶)可更好恢復(fù)結(jié)構(gòu),通過(guò)對(duì) 2 級(jí)分解的不同子帶設(shè)置權(quán)重(如$\lambda_{L-LL}=0.1,\lambda_{L-LH}=\lambda_{L-HL}=0.01$, $\lambda _{L- HH}= 0. 05$, $\lambda _{LH}= \lambda _{HL}= 0. 1$, $\lambda _{HH}= 0. 05$),對(duì) 2 級(jí)高頻子帶在保真損失中加重懲罰可恢復(fù)更多真實(shí)細(xì)節(jié)和結(jié)構(gòu)。

小波基的選擇

選擇方法:實(shí)驗(yàn)研究了 haar、db7、db19、sym7、sym19、bior2.6、bior4.4 等小波濾波器對(duì) WGSR 模型在 BSD100 基準(zhǔn)上的影響。

結(jié)果分析:不同小波家族的 PD 權(quán)衡性能不同,Symlet “sym19” 提供最佳客觀質(zhì)量,Daubechies “db7” 實(shí)現(xiàn)最佳感知質(zhì)量,“sym7” 濾波器達(dá)到最佳權(quán)衡點(diǎn),因此實(shí)驗(yàn)選用 “sym7” 小波濾波器。

4.3. 消融實(shí)驗(yàn)

實(shí)驗(yàn)?zāi)康?/strong>

探究 WGSR 方法中每個(gè)損失項(xiàng) (保真度$l_1$、對(duì)抗損失$L_{adv, G}$和感知損失$L_{perc}$的作用。

實(shí)驗(yàn)設(shè)置與對(duì)比基準(zhǔn)

以 ESRGAN為基線 ($\#0$),其$l_1$$L_{adv, G}$在 RGB 域計(jì)算,$L_{perc}$采用$LPIPS$。
依次改變損失項(xiàng)的計(jì)算方式或類型,設(shè)置不同實(shí)驗(yàn)條件進(jìn)行對(duì)比:

$\#1$$L_{perc}$從LPIPS改為DISTS;

\#2在SWT 域計(jì)算$l_{1}$保真損失;

\#3在SWT域計(jì)算$L_{adv}$;

\#4在 SWT 域計(jì)算$l_1$$L_{adv, G}$$L_{perc}$為 LPIPS;

\# 5(WGSR)在SWT 域計(jì)算$l_{1}$$L_{adv,G}$$L_{perc}$為 DISTS。

實(shí)驗(yàn)結(jié)果分析

感知損失類型影響:$\#1$中改變$L_{perc}$為 DISTS 后,客觀和感知性能分別提高,表明 DISTS 有助于模型達(dá)到更好的 PD 點(diǎn)。

保真損失計(jì)算域影響:\#2在 SWT 域計(jì)算$l_1$保真損失,客觀質(zhì)量提升約 1 dB 且感知質(zhì)量不變,說(shuō)明在 SWT 子帶執(zhí)行保真度能更好控制生成細(xì)節(jié)。

對(duì)抗損失計(jì)算域影響:\#3在 SWT 域計(jì)算$L_{adv}$有利于感知質(zhì)量提升。

綜合影響:\# 5結(jié)合所有 SWT 域損失實(shí)現(xiàn)了客觀和感知質(zhì)量的最佳權(quán)衡。

4.4.?局限性

1.PSNR 和定量感知分?jǐn)?shù)不是視覺(jué)失真的良好評(píng)估指標(biāo)。WGSR在抑制視覺(jué)失真方面是有效的。然 而,這種視覺(jué)性能并未在定量測(cè)量中得到體現(xiàn)。

2.確定不同 SWT 域損失項(xiàng)的最佳權(quán)重是困難的,因?yàn)樵谒阉髯罴褭?quán)重過(guò)程中發(fā)現(xiàn),改變不同子帶保真損失權(quán)重會(huì)影響保真分?jǐn)?shù)和感知質(zhì)量。

如降低 LH 和 HL 子帶保真損失權(quán)重會(huì)使保真分?jǐn)?shù)下降,增加 HH 子帶保真項(xiàng)權(quán)重會(huì)降低感知質(zhì)量,同時(shí)較高的$L_{adv,G}$$L_{perc}$雖能提升感知質(zhì)量但會(huì)犧牲保真度。

權(quán)重選擇導(dǎo)致不同的感知 - 失真權(quán)衡點(diǎn),雖然使用小波域損失訓(xùn)練能使模型趨向更好的 PD 點(diǎn),但在區(qū)分真實(shí)圖像細(xì)節(jié)和偽影方面仍有改進(jìn)空間。

5. 結(jié)論

WGSR:一種新的基于生成對(duì)抗網(wǎng)絡(luò)(GAN)的超分辨率(SR)模型訓(xùn)練方法;該方法利用了小波域損失的加權(quán)組合;通過(guò)根據(jù)不同子帶中圖像特征的尺度和方向控制保真度和對(duì)抗損失的強(qiáng)度,我們的模型能夠以高重建精度學(xué)習(xí)真實(shí)的圖像細(xì)節(jié),同時(shí)避免高頻偽影和幻覺(jué);從而實(shí)現(xiàn)了更好的PD權(quán)衡。

本文提出的對(duì)抗訓(xùn)練方法具有通用性,即任何現(xiàn)成的GAN - SR模型都可以輕松插入此框架以受益于小波引導(dǎo)。

http://www.risenshineclean.com/news/40413.html

相關(guān)文章:

  • 杭州家具網(wǎng)站建設(shè)方案百度搜索引擎的特點(diǎn)
  • 源碼做網(wǎng)站教程網(wǎng)絡(luò)營(yíng)銷(xiāo)服務(wù)公司
  • 有沒(méi)有電腦做兼職的網(wǎng)站嗎流量查詢網(wǎng)站
  • 珠海網(wǎng)站開(kāi)發(fā)公司中國(guó)新聞網(wǎng)最新消息
  • 赤坎手機(jī)網(wǎng)站建設(shè)網(wǎng)絡(luò)項(xiàng)目怎么推廣
  • 宣傳做傳單的網(wǎng)站戶外廣告
  • 哪個(gè)網(wǎng)站買(mǎi)做房圖紙好鏈接推廣平臺(tái)
  • 做亞馬遜外國(guó)網(wǎng)站需要語(yǔ)言好嗎日本比分算1:1
  • 網(wǎng)站開(kāi)發(fā)的研究思路seo經(jīng)理
  • html5笑話網(wǎng)站源碼上海seo網(wǎng)絡(luò)優(yōu)化
  • 直銷(xiāo)購(gòu)物網(wǎng)站開(kāi)發(fā)搜狗搜索引擎優(yōu)化
  • 泰安建設(shè)企業(yè)網(wǎng)站華與華營(yíng)銷(xiāo)策劃公司
  • 網(wǎng)站做商城網(wǎng)絡(luò)營(yíng)銷(xiāo)策劃書(shū)結(jié)構(gòu)
  • 海南澄邁網(wǎng)站建設(shè)寧波免費(fèi)建站seo排名
  • 營(yíng)銷(xiāo)策劃方案4000字上海全國(guó)關(guān)鍵詞排名優(yōu)化
  • 網(wǎng)站首頁(yè)上的動(dòng)畫(huà)是咋做的灰色詞排名接單
  • 上海 設(shè)計(jì)網(wǎng)站建設(shè)上海百度seo優(yōu)化
  • 個(gè)人站長(zhǎng)怎么樣做網(wǎng)站才不會(huì)很累關(guān)鍵詞調(diào)詞平臺(tái)費(fèi)用
  • 適合推廣的網(wǎng)站有哪些南昌網(wǎng)站優(yōu)化公司
  • 手機(jī)網(wǎng)站設(shè)計(jì)小程序色盲眼鏡
  • 網(wǎng)站全局搜索如何做如何設(shè)計(jì)與制作網(wǎng)頁(yè)
  • vue.js 做網(wǎng)站網(wǎng)站開(kāi)發(fā)制作培訓(xùn)學(xué)校
  • 怎么設(shè)置網(wǎng)站亞馬遜站外推廣網(wǎng)站
  • 不用ftp做網(wǎng)站云seo關(guān)鍵詞排名優(yōu)化軟件
  • 建網(wǎng)站的公司不肯簽合同長(zhǎng)沙網(wǎng)站制作費(fèi)用
  • wordpress 技術(shù)教程seo 關(guān)鍵詞優(yōu)化
  • 做寫(xiě)真網(wǎng)站的限度游戲優(yōu)化
  • 做別人的網(wǎng)站詐騙視頻下載廣州網(wǎng)站優(yōu)化排名系統(tǒng)
  • 學(xué)校網(wǎng)站建設(shè)的風(fēng)險(xiǎn)分析微信管理系統(tǒng)登錄入口
  • 淄博網(wǎng)站制作形象培訓(xùn)網(wǎng)址