Meta放大招!發(fā)布3D生成最新成果——Meta 3D Gen。 號稱1分鐘內(nèi)即可文本端到端高質(zhì)量轉(zhuǎn)3D,包括高質(zhì)量紋理和基于PBR材質(zhì)(基于物理的渲染)貼圖的3D Mesh。 支持修改已有的3D對象/模型的紋理。 例如,編織風(fēng): 像素風(fēng): 暗黑恐怖風(fēng): 單拎出來一只金屬哈巴修狗,毛發(fā)紋理等各種細(xì)節(jié)拉滿: 搭配其它工具裝上骨架讓3D模型動(dòng)起來,效果也可以用“精細(xì)”兩字形容: 有網(wǎng)友看到此效果直呼“改變行業(yè)游戲規(guī)則”、“改變工作流程”。 還有不少網(wǎng)友認(rèn)為生成的模型可以直接3D打印了: 不過,這次Meta 3D Gen的發(fā)布木有代碼,木有Demo可玩。 與效果一同發(fā)布的,是一份技術(shù)報(bào)告以及兩篇論文,介紹了Meta 3D Gen背后用于文本到3D生成和文本到紋理生成的方法。 3D對象生成器+紋理生成器 翻看技術(shù)報(bào)告,原來Meta 3D Gen是一種組合系統(tǒng),基于Meta另外兩項(xiàng)研究,即同時(shí)發(fā)布的兩篇論文:Meta 3D AssetGen、Meta 3D TextureGen。 Meta 3D AssetGen用于文本到3D對象的生成(第一階段),Meta 3D TextureGen用于文本到紋理的生成(第二階段),兩者是Meta 3D Gen的關(guān)鍵組件。 AssetGen負(fù)責(zé)從文本描述生成完整的3D對象,其工作流程大致為: 1)用一個(gè)神經(jīng)網(wǎng)絡(luò)根據(jù)文本描述生成多個(gè)2D視圖; TextureGen負(fù)責(zé)為給定的3D對象生成紋理。它接收一個(gè)3D對象(包含形狀和UV坐標(biāo)信息等)和一個(gè)文本描述作為輸入,工作流程大致為: 1)使用一個(gè)神經(jīng)網(wǎng)絡(luò)生成這個(gè)3D對象的多個(gè)2D視圖; 值得一提的是,TextureGen中的紋理融合和增強(qiáng)網(wǎng)絡(luò)基于3D藝術(shù)家提供的“真實(shí)”UV圖進(jìn)行訓(xùn)練,與AssetGen生成的自動(dòng)提取的UV圖大有不同。 而Meta 3D Gen集成了這兩種方法,所以整體流程是: 首先使用AssetGen生成初始的3D形狀和UV映射。然后,使用TextureGen的第一個(gè)網(wǎng)絡(luò),基于這個(gè)3D形狀生成更高質(zhì)量的2D視圖。接著,使用TextureGen的第二個(gè)網(wǎng)絡(luò),從這些高質(zhì)量視圖生成統(tǒng)一的UV紋理。最后,使用AssetGen的紋理優(yōu)化網(wǎng)絡(luò)進(jìn)行最終的紋理融合和增強(qiáng)。 以下是在Meta 3D Gen在第一階段(左)和第二階段(右)后的視覺對比: 方法細(xì)節(jié),感興趣的家人們可以查看技術(shù)報(bào)告和論文,重點(diǎn)來看效果測試。 404個(gè)文本提示評估 基準(zhǔn)測試部分,Meta 3D Gen的比較對象包括:CSM Cube 2.0、Tripo3D、Rodin Gen-1 V0.5、Meshy v3和一個(gè)第三方文本轉(zhuǎn)3D生成器。 定量比較方面,Meta使用了404個(gè)來自DreamFusion的不同文本提示(分為物體、角色和組合場景三類,難度由低到高)讓模型進(jìn)行3D生成。 然后讓普通用戶和專業(yè)3D藝術(shù)家對模型在不同測試類別中的表現(xiàn)進(jìn)行評估和打分,評估指標(biāo)包括提示保真度、整體視覺質(zhì)量、幾何質(zhì)量和紋理質(zhì)量。 評估針對每個(gè)模型單獨(dú)進(jìn)行或通過隨機(jī)A/B測試來比較不同模型的表現(xiàn)。 根據(jù)Meta的測試結(jié)果,首先在生成時(shí)間方面,Meta 3D Gen僅需1分鐘,超越所有其它方法(3分鐘到1小時(shí)不等): 文本提示保真度,即模型的生成與文本prompt的符合度,Meta 3D Gen和其它模型的比較結(jié)果如下: 整體Meta 3D Gen效果最佳,Tripo3D、Third-part T23D generator與其相差不大,CSM Cube 2.0、Rodin Gen-1 V0.5稍顯遜色。 值得一提的是,用于對比的工業(yè)基線中,Tripo3D來自國內(nèi)玩家VAST,Meshy則是胡淵鳴在太極圖形之后創(chuàng)辦的獨(dú)立新品牌。 在難度最高的組合類場景生成中,Tripo3D排名第二,與Meta 3D Gen相近,但卻在最簡單的物體生成上表現(xiàn)不如Meta,拉低了整體評分。 A/B測試方面,主要是為了比較Meta 3D Gen和那些同時(shí)生成紋理和使用PBR材料的基準(zhǔn)模型。所有用戶、僅專業(yè)3D藝術(shù)家的評估結(jié)果分別如下,Meta 3D Gen在大多數(shù)指標(biāo)上表現(xiàn)優(yōu)于競爭者: 此外,Meta還分析了不同3D生成模型在處理不同復(fù)雜度的場景時(shí)的性能,下圖是Meta 3D Gen與基線方法相比的勝率。 縱坐標(biāo)是Meta win rate,低于50%說明對比方法比Meta好,折線越低方法越好。 結(jié)果顯示,隨著場景復(fù)雜度增加,例如從單一對象過渡到包含多個(gè)角色和元素的復(fù)合場景生成,Meta 3DGen的表現(xiàn)開始顯著優(yōu)于其它模型。 接下來再看定性比較。 相同提示詞,不同模型文本提示保真度對比是這樣?jì)饍旱模?/p> 除了Meta 3D Gen,Tripo3D表現(xiàn)也不錯(cuò),比如第一個(gè)生成帶有“GenAI”logo的金屬羊駝的例子,Meta 3D Gen雖然在logo生成上表現(xiàn)很好,但腿部生成明顯有缺陷,而Tripo3D的腿部生成更勝一籌,且紋理細(xì)節(jié)也很好。第二個(gè)壽司測試,CSM則表現(xiàn)優(yōu)異。 第三個(gè)“半獸人在砧板上鍛造錘子”的例子,Tripo3D和Meta各有優(yōu)勢。Tripo3D紋理和幾何細(xì)節(jié)更豐富、orc更保真、“鍛造錘子”也展現(xiàn)出來了;Meta的砧板相對好些,但整體紋理細(xì)節(jié)差些。 其它幾個(gè)模型的結(jié)果語義丟失嚴(yán)重。 此外,針對紋理的對比結(jié)果如下,在下面的這張圖中,Meta 3D Gen的紋理細(xì)節(jié)處理的很細(xì)致: 3D生成賽道真熱鬧 Meta 3D Gen的發(fā)布,無疑給持續(xù)升溫的3D生成賽道又添了一把火。 在對比測試中,也不乏國內(nèi)玩家的身影,比如Tripo 3D就是由AI初創(chuàng)公司VAST在今年初推出的3D生成大模型。 VAST創(chuàng)始人兼CEO為宋亞宸,此前在商湯負(fù)責(zé)AIGC技術(shù)在動(dòng)畫及游戲等行業(yè)實(shí)際落地,也曾參與創(chuàng)立AI獨(dú)角獸Minimax。CTO梁鼎是商湯的通用模型負(fù)責(zé)人、首席科學(xué)家曹炎培曾在騰訊AI Lab領(lǐng)導(dǎo)AIGC 3D方向的研發(fā)工作。 此外,Meshy模型也是由國內(nèi)玩家打造。 Meshy聯(lián)合創(chuàng)始人兼CEO是計(jì)算機(jī)圖形學(xué)知名學(xué)者胡淵鳴,胡淵鳴畢業(yè)于清華大學(xué)姚班,也是MIT博士、太極(TaiChi)編程語言作者。 說回Meta 3D Gen,雖然根據(jù)Meta的技術(shù)報(bào)告,Meta 3D Gen的表現(xiàn)在很多方面超過了基準(zhǔn)模型,不過也有人對此測試結(jié)果表示存疑。 首先在生成時(shí)間上,就有網(wǎng)友表示給CSM Cube 2.0標(biāo)的時(shí)間不準(zhǔn)確: 據(jù)量子位測試,其實(shí)Tripo3D最新Web版生成時(shí)間也縮短了,Stage1是10秒左右,Stage2現(xiàn)在只需要2分鐘。 據(jù)量子位在Tripo Discord beta頻道測試,Tripo3D新版幾何質(zhì)量也有了進(jìn)一步提升: Tripo團(tuán)隊(duì)發(fā)文表示更好的幾何和PBR都在路上了: 另一邊,胡淵鳴也發(fā)推文表示,Meshy很快就會(huì)發(fā)布速度提升10倍的模型。 Rodin團(tuán)隊(duì)也出面表示歡迎Meta加入3D生成賽道,未來想制定更綜合和合理的3D生成評判標(biāo)準(zhǔn)。 除此之外還有網(wǎng)友認(rèn)為,沒有Demo大家又玩不上,對于Meta 3D Gen很難評。 雀食,Tripo3D、Meshy等模型都是可以玩的。 而且還不是簡單玩玩,開頭網(wǎng)友說的3D打印甚至已經(jīng)落地了。 就拿Tripo3D來說,不僅在全球最大的3D素材交易網(wǎng)站-CG模型網(wǎng)已上線藝術(shù)家內(nèi)測版本: 而且已經(jīng)和全球家用3D打印機(jī)龍頭企業(yè)們達(dá)成合作,拓竹的Markerworld和Anycubic旗下的模型社區(qū)網(wǎng)站Makeronline等都已上線,3D打印愛好者們可以嘗試起來了! 在行業(yè)探索上,Meshy之前和Snap達(dá)成合作上線了AI 3D特效,CSM則做了更多產(chǎn)品化的探索,上線了Cube。 全球AI藝術(shù)家也在3D生成賽道上卷起來了,Tripo上個(gè)月做了全球第一個(gè)AI 3D全球渲染大賽,目前正在和CivitAI一起舉辦AI電影大賽Project Odyssey。 這次潑天的熱度算是落到3D生成賽道了。 參考鏈接:
本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選