中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

網(wǎng)站建設(shè)選擇什么操作系統(tǒng)酒店推廣渠道有哪些

網(wǎng)站建設(shè)選擇什么操作系統(tǒng),酒店推廣渠道有哪些,清遠(yuǎn)做網(wǎng)站的公司,免費(fèi)建立自己的網(wǎng)頁該論文作者均來自于新加坡南洋理工大學(xué) S-Lab 團(tuán)隊(duì),包括博士后胡濤,博士生洪方舟,以及計(jì)算與數(shù)據(jù)學(xué)院劉子緯教授(《麻省理工科技評(píng)論》亞太地區(qū) 35 歲以下創(chuàng)新者)。S-Lab 近年來在頂級(jí)會(huì)議如 CVPR, ICCV, ECCV, NeurIP…

該論文作者均來自于新加坡南洋理工大學(xué) S-Lab 團(tuán)隊(duì),包括博士后胡濤,博士生洪方舟,以及計(jì)算與數(shù)據(jù)學(xué)院劉子緯教授(《麻省理工科技評(píng)論》亞太地區(qū) 35 歲以下創(chuàng)新者)。S-Lab 近年來在頂級(jí)會(huì)議如 CVPR, ICCV, ECCV,?NeurIPS, ICLR 上發(fā)表多篇 CV/CG/AIGC 相關(guān)的研究工作,和國內(nèi)外知名高校、科研機(jī)構(gòu)廣泛開展合作。

三維數(shù)字人生成和編輯在數(shù)字孿生、元宇宙、游戲、全息通訊等領(lǐng)域有廣泛應(yīng)用。傳統(tǒng)三維數(shù)字人制作往往費(fèi)時(shí)耗力,近年來研究者提出基于三維生成對(duì)抗網(wǎng)絡(luò)(3D GAN)從 2D 圖像中學(xué)習(xí)三維數(shù)字人,極大提高了數(shù)字人制作效率。

這些方法往往在一維隱向量空間建模數(shù)字人,而一維隱向量無法表征人體的幾何結(jié)構(gòu)和語義信息,因此限制了其生成質(zhì)量和編輯能力。

為了解決這一問題,來自新加坡南洋理工大學(xué) S-Lab 團(tuán)隊(duì)提出結(jié)構(gòu)化隱空間擴(kuò)散模型(Structured Latent Diffusion Model)的三維數(shù)字人生成新范式 StructLDM。該范式包括三個(gè)關(guān)鍵設(shè)計(jì):結(jié)構(gòu)化的高維人體表征、結(jié)構(gòu)化的自動(dòng)解碼器以及結(jié)構(gòu)化的隱空間擴(kuò)散模型。

StructLDM 是一個(gè)從圖像、視頻中學(xué)習(xí)的前饋三維生成模型(Feedforward 3D Generative Model),相比于已有 3D GAN 方法可生成高質(zhì)量、多樣化且視角一致的三維數(shù)字人,并支持不同層級(jí)的可控生成與編輯功能,如局部服裝編輯、三維虛擬試衣等部位感知的編輯任務(wù),且不依賴于特定的服裝類型或遮罩條件,具有較高的適用性。

圖片

  • 論文標(biāo)題:StructLDM: Structured Latent Diffusion for 3D Human Generation

  • 論文地址:https://arxiv.org/pdf/2404.01241

  • 項(xiàng)目主頁:https://taohuumd.github.io/projects/StructLDM

  • 實(shí)驗(yàn)室主頁:https://www.ntu.edu.sg/s-lab

圖片

,時(shí)長00:35

方法概覽

圖片

StructLDM 訓(xùn)練過程的包含兩個(gè)階段:

  • 結(jié)構(gòu)化自動(dòng)解碼:給定人體姿態(tài)信息 SMPL 和相機(jī)參數(shù),自動(dòng)解碼器對(duì)訓(xùn)練集中每個(gè)人物個(gè)體擬合出一個(gè)結(jié)構(gòu)化 UV latent。該過程的難點(diǎn)在于如何把不同姿態(tài)、不同相機(jī)視角、不同著裝的人物圖像擬合到統(tǒng)一的 UV latent 中,為此 StructLDM 提出了結(jié)構(gòu)化局部 NeRF 對(duì)身體每個(gè)部位分別建模,并通過全局風(fēng)格混合器把身體各部分合并在一起,學(xué)習(xí)整體的人物外觀。此外,為解決姿態(tài)估計(jì)誤差問題,自動(dòng)解碼器訓(xùn)練過程中引入了對(duì)抗式學(xué)習(xí)。在這一階段,自動(dòng)解碼器把訓(xùn)練集中每個(gè)人物個(gè)體轉(zhuǎn)化為一系列 UV latent。

  • 結(jié)構(gòu)擴(kuò)散模型:該擴(kuò)散模型學(xué)習(xí)第一階段得到的 UV latent 空間,以此學(xué)習(xí)人體三維先驗(yàn)。

在推理階段,StructLDM 可隨機(jī)生成三維數(shù)字人:隨機(jī)采樣噪聲并去噪得到 UV latent,該 latent 可被自動(dòng)解碼器渲染為人體圖像。

實(shí)驗(yàn)結(jié)果

該研究在 4 個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)評(píng)估:單視角圖像數(shù)據(jù)集?DeepFashion?[Liu et al. 2016],視頻數(shù)據(jù)集 UBCFashion [Zablotskaia et al. 2019],真實(shí)三維人體數(shù)據(jù)集 THUman 2.0 [Yu et al. 2021], 及虛擬三維人體數(shù)據(jù)集 RenderPeople。

3.1 定性結(jié)果比較

StructLDM 在 UBCFashion 數(shù)據(jù)集上與已有 3D GAN 方法做了對(duì)比,如 EVA3D、 AG3D 及 StyleSDF。相比于已有方法,StructLDM 可生成高質(zhì)量、多樣化、視角一致的三維數(shù)字人,如不同膚色、不同發(fā)型,以及服飾細(xì)節(jié)(如高跟鞋)。

圖片

StructLDM 在 RenderPeople 數(shù)據(jù)集上與已有 3D GAN 方法(如 EG3D, StyleSDF, 及 EVA3D)及擴(kuò)散模型 PrimDiff 對(duì)比。相比于已有方法,StructLDM 可生成不同姿態(tài)、不同外觀的高質(zhì)量三維數(shù)字人,并生成高質(zhì)量面部細(xì)節(jié)。

圖片

,時(shí)長00:24

3.2 定量結(jié)果比較

研究者在 UBCFashion, RenderPeople,及 THUman 2.0 上與已知方法做了定量結(jié)果比較,在每個(gè)數(shù)據(jù)集上隨機(jī)選取 5 萬張圖像計(jì)算 FID ,StructLDM 可大幅降低 FID。此外,User Study 顯示大約 73% 的用戶認(rèn)為 StructLDM 生成的結(jié)果在面部細(xì)節(jié)和全身圖像質(zhì)量上比 AG3D 更有優(yōu)勢(shì)。

圖片

3.3 應(yīng)用

3.3.1 可控性生成

StructLDM 支持可控性生成,如相機(jī)視角、姿態(tài)、體型控制,以及三維虛擬試衣,并可在二維隱空間插值。

圖片

3.3.2 組合式生成

StructLDM 支持組合式生成,如把①②③④⑤部分組合起來可生成新的數(shù)字人,并支持不同的編輯任務(wù),如身份編輯、衣袖(4)、裙子(5)、三維虛擬試衣(6)以及全身風(fēng)格化(7)。

圖片

,時(shí)長00:25

3.3.3 編輯互聯(lián)網(wǎng)圖片

StructLDM 可對(duì)互聯(lián)網(wǎng)圖片進(jìn)行編輯,首先通過 Inversion 技術(shù)得到對(duì)應(yīng)的 UV latent,然后通過 UV latent 編輯可對(duì)生成的數(shù)字人進(jìn)行編輯,如編輯鞋、上衣、褲子等。

圖片

3.4 消融實(shí)驗(yàn)

3.4.1 隱空間擴(kuò)散

StructLDM 提出的隱空間擴(kuò)散模型可用于不同編輯任務(wù),如組合式生成。下圖探究了擴(kuò)散模型參數(shù)(如擴(kuò)散步數(shù)和噪聲尺度)對(duì)生成結(jié)果的影響。StructLDM 可通過控制擴(kuò)散模型參數(shù)來提高生成效果。

圖片

3.4.2 一維與二維人體表征

研究者對(duì)比了一維與二維 latent 人體表征效果,發(fā)現(xiàn)二維 latent 可生成高頻細(xì)節(jié)(如衣服紋理及面部表情),加入對(duì)抗式學(xué)習(xí)可同時(shí)提高圖片質(zhì)量和保真度。

圖片

3.4.3 結(jié)構(gòu)感知的歸一化

為提高擴(kuò)散模型學(xué)習(xí)效率,StructLDM 提出了結(jié)構(gòu)感知的 latent 歸一化技術(shù) (structure-aligned normalization),即對(duì)每個(gè) latent 做逐像素歸一化。研究發(fā)現(xiàn),歸一化后的 latent 分布更接近于高斯分布,以此更利于擴(kuò)散模型的學(xué)習(xí)。

圖片

?

點(diǎn)擊訪問我的技術(shù)博客https://ai.weoknow.comicon-default.png?t=N7T8https://ai.weoknow.com

http://www.risenshineclean.com/news/64150.html

相關(guān)文章:

  • vs網(wǎng)站開發(fā)實(shí)例百度知道小程序
  • 網(wǎng)站建設(shè)的行業(yè)分析整合營銷公司排名
  • wordpress文章置頂2篇seo新人培訓(xùn)班
  • 汽車網(wǎng)站建設(shè)工作室銷售管理怎么帶團(tuán)隊(duì)
  • 做網(wǎng)站賺錢嗎 怎么賺it培訓(xùn)機(jī)構(gòu)
  • 站的免費(fèi)網(wǎng)站廣州seo排名優(yōu)化公司
  • 西部網(wǎng)站建設(shè)怎樣優(yōu)化網(wǎng)站排名
  • 網(wǎng)頁設(shè)計(jì)教程詳細(xì)安徽360優(yōu)化
  • 單頁網(wǎng)站還能用嗎semir
  • 怎么做網(wǎng)站文章偽原創(chuàng)網(wǎng)站是否含有seo收錄功能
  • 網(wǎng)站升級(jí)改版百度seo2022新算法更新
  • 西安 美院 網(wǎng)站建設(shè)2023半夜免費(fèi)b站推廣
  • 哪個(gè)網(wǎng)站生鮮配送做的好免費(fèi)源碼下載網(wǎng)站
  • ios移動(dòng)網(wǎng)站開發(fā)詳解 pdf關(guān)鍵詞挖掘站網(wǎng)
  • 網(wǎng)站建設(shè)內(nèi)容與實(shí)現(xiàn)功能微商引流人脈推廣軟件
  • 杭州蕭山網(wǎng)站建設(shè)公司seo顧問咨詢
  • 軟件工程師資格證優(yōu)化網(wǎng)站最好的刷排名軟件
  • 室內(nèi)設(shè)計(jì)公司辦公室圖片百度seo工作室
  • 網(wǎng)站制作學(xué)什么軟件成都網(wǎng)絡(luò)推廣公司
  • 沒有服務(wù)器做網(wǎng)站免費(fèi)下載優(yōu)化大師
  • 教人做飲料的網(wǎng)站做百度推廣的公司電話號(hào)碼
  • 網(wǎng)站建設(shè)首頁模板下載優(yōu)化大師怎么提交作業(yè)
  • 制作網(wǎng)站服務(wù)企業(yè)查詢軟件
  • 運(yùn)用asp做購物網(wǎng)站的心得google瀏覽器官方下載
  • 淘客網(wǎng)站+wordpress上海百度seo優(yōu)化
  • 網(wǎng)站應(yīng)該如何進(jìn)行優(yōu)化網(wǎng)絡(luò)營銷分類
  • 做網(wǎng)站建網(wǎng)站安卓手機(jī)游戲優(yōu)化器
  • 河南企業(yè)網(wǎng)站制作個(gè)人怎么做網(wǎng)站
  • 中國域名注冊(cè)中心做博客的seo技巧
  • 上海專業(yè)制作電子商務(wù)網(wǎng)站廣西seo公司