編譯/VR陀螺
自12月初以來,人們一直在探索OpenAI推出的對話AI ChatGPT神經(jīng)網(wǎng)絡(luò)的深度。近日,一位開發(fā)者讓這款對話AI吐出了可以工作的AR代碼。
OpenAI的ChatGPT對話AI被優(yōu)化為生成文本和回答問題。但12月初的初步測試很快表明,該系統(tǒng)不僅僅能回答幾個(gè)措辭整齊的句子,還能回答編程代碼。
由ChatGPT生成的AR應(yīng)用ChatARKit
開發(fā)者Bart Trzynadlowski想知道他是否能用ChatGPT開發(fā)一個(gè)AR應(yīng)用,只用語音命令就能自主地在環(huán)境中放置數(shù)字3D物體。他還使用OpenAI的人工智能模型Whipser來識別語音命令,然后將它們作為人工智能提示帶入ChatARKit應(yīng)用的JavaScript環(huán)境。
圖源:Bart Trzynadlowski
因此,ChatGPT能從Sketchfab中選擇符合語音命令的3D物體,并根據(jù)提示將它們放在桌面或地板上。如果提示它,ChatGPT甚至可以縮放和旋轉(zhuǎn)3D模型。人工智能系統(tǒng)會自行生成這方面的代碼。
據(jù)Trzynadlowski表示,這些是一些有效的提示樣本:
根據(jù)Trzynadlowski的說法,ChatGPT的工作并不可靠。對于相同的命令,人工智能模型會產(chǎn)生非常不同的輸出,并在應(yīng)用程序中放置不正確的JavaScript代碼行。有時(shí),ChatGPT會將對象描述變成代碼標(biāo)識符,這意味著無法再從Sketchfab檢索到3D模型。
Trzynadlowski在Github上將他的ChatGPT AR應(yīng)用作為開放源代碼免費(fèi)提供。
用自然語言在VR中生成3D物體
對于VR,開發(fā)者Jasmine Roberts最近展示了OpenAI新的3D人工智能Point-E,像圖像人工智能DALL-E 2一樣,它可以完全基于文本輸入生成內(nèi)容。然而,Point-E生成的不是圖像,而是代表三維模型的三維點(diǎn)云。每次生成,Point-E在單個(gè)Nvidia V100 GPU上只需要大約一到兩分鐘。值得一提的是,Roberts的演示是實(shí)時(shí)運(yùn)行的。
Point-E是OpenAI在文本轉(zhuǎn)3D合成方面進(jìn)一步工作的起點(diǎn)。谷歌與Dreamfusion,以及Nvidia與Magic3D最近也推出了文本轉(zhuǎn)3D系統(tǒng),這可能在未來3D內(nèi)容的進(jìn)一步傳播中發(fā)揮重要作用,而這也是元宇宙理論的一個(gè)重要基礎(chǔ)。
來源:mixed-news
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息