做線下活動的網(wǎng)站泉州百度關(guān)鍵詞排名
CycleGAN是一種用于圖像到圖像翻譯的生成對抗網(wǎng)絡(luò),它突破了傳統(tǒng)域遷移模型的限制,無需成對樣本即可學(xué)習(xí)圖像在不同域間的轉(zhuǎn)換。這種無監(jiān)督的方法特別適用于難以獲取配對數(shù)據(jù)的場景,例如藝術(shù)風(fēng)格遷移。與需要成對訓(xùn)練樣本的Pix2Pix不同,CycleGAN通過循環(huán)一致性損失和對抗性訓(xùn)練,實現(xiàn)了兩個域之間自由的圖像風(fēng)格轉(zhuǎn)換,極大地擴展了圖像處理的應(yīng)用范圍和靈活性。
這幾個帶讀論文真不錯,解析很精煉入門,可惜都是17年的。
模型結(jié)構(gòu)
CycleGAN 網(wǎng)絡(luò)本質(zhì)上是由兩個鏡像對稱的 GAN 網(wǎng)絡(luò)組成,其結(jié)構(gòu)如下圖所示(圖片來源于原論文):
為了方便理解,這里以蘋果和橘子為例介紹。上圖中?X?可以理解為蘋果,Y?為橘子;G?為將蘋果生成橘子風(fēng)格的生成器,F?為將橘子生成的蘋果風(fēng)格的生成器,DX?和 DY?為其相應(yīng)判別器,具體生成器和判別器的結(jié)構(gòu)可見下文代碼。模型最終能夠輸出兩個模型的權(quán)重,分別將兩種圖像的風(fēng)格進行彼此遷移,生成新的圖像。
該模型一個很重要的部分就是損失函數(shù),在所有損失里面循環(huán)一致?lián)p失(Cycle Consistency Loss)是最重要的。循環(huán)損失的計算過程如下圖所示(圖片來源于原論文):
圖中蘋果圖片?x?經(jīng)過生成器?G?得到偽橘子?Y^,然后將偽橘子 Y^?結(jié)果送進生成器?F?又產(chǎn)生蘋果風(fēng)格的結(jié)果 x^,最后將生成的蘋果風(fēng)格結(jié)果x^?與原蘋果圖片x?一起計算出循環(huán)一致?lián)p失,反之亦然。循環(huán)損失捕捉了這樣的直覺,即如果我們從一個域轉(zhuǎn)換到另一個域,然后再轉(zhuǎn)換回來,我們應(yīng)該到達我們開始的地方。