編譯/VR陀螺
近日,專注于視覺內(nèi)容生成的模型公司 Stability AI 宣布與華人團(tuán)隊(duì)VAST開源了可單圖生成 3D的AI模型“TripoSR”。
在Nvidia A100上進(jìn)行測(cè)試時(shí),TripoSR可以在大約0.5秒內(nèi)生成草稿質(zhì)量的3D輸出(紋理網(wǎng)格),優(yōu)于OpenLRM等其他開放圖像到3D模型。除此之外,TripoSR在無需GPU的情況下也可以運(yùn)行。
圖源:Stability AI
據(jù)悉,TripoSR的靈感來自Adobe 2023年11月提出的LRM:單圖像到3D的大型重建模型。這種新的圖像到3D模型方法旨在滿足娛樂、游戲、工業(yè)設(shè)計(jì)和建筑專業(yè)人士日益增長的需求,并提供用于可視化詳細(xì)3D對(duì)象的響應(yīng)式輸出。
圖源:Stability AI
Stability AI 稱,“我們對(duì)基本LRM模型進(jìn)行了多項(xiàng)技術(shù)改進(jìn),包括通道號(hào)優(yōu)化、蒙版監(jiān)督和更高效的裁剪渲染策略。同時(shí),我們還通過一個(gè)更高質(zhì)量的Objaverse數(shù)據(jù)集子集訓(xùn)練數(shù)據(jù),從而讓TripoSR可以更接近地復(fù)制現(xiàn)實(shí)世界中的圖像分布,顯著提高模型的泛化能力。”
來源:stability.ai
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息