4月13日下午,由武漢東湖新技術(shù)開發(fā)區(qū)管理委員會(huì)主辦,陀螺科技聯(lián)合主辦的2023武漢元宇宙開發(fā)者高峰論壇在武漢光谷舉辦。
論壇以“元生萬(wàn)物,智匯光谷”為主題,聚焦元宇宙內(nèi)容發(fā)展趨勢(shì)、前沿開發(fā)技術(shù)及項(xiàng)目實(shí)戰(zhàn)經(jīng)驗(yàn),Unity、中國(guó)移動(dòng)咪咕公司、盛天網(wǎng)絡(luò)、TCL華星、聚好看科技、MultiMetaVerse、比鄰星球、維亞環(huán)球科技、彼真科技、佳創(chuàng)視訊、VeeR、鈴空游戲等行業(yè)先鋒代表為與會(huì)來(lái)賓帶來(lái)精彩分享。
其中,比鄰星球CTO王林強(qiáng)為與會(huì)來(lái)賓帶來(lái)了“AIGC加速構(gòu)建元宇宙數(shù)字空間生態(tài)”的主題演講。
以下為演講實(shí)錄:
大家好,我是比鄰星球的王林強(qiáng),很高興受邀參加“元生萬(wàn)物、智匯光谷”2023武漢元宇宙開發(fā)者高峰論壇。今天我要和大家分享的演講題目是“AIGC加速構(gòu)建元宇宙數(shù)字空間生態(tài)”。
這個(gè)主題包含了AIGC、元宇宙和數(shù)字生態(tài)三個(gè)關(guān)鍵詞。我的PPT分為三個(gè)部分,依次介紹當(dāng)前AIGC技術(shù)的發(fā)展趨勢(shì)和進(jìn)展,比鄰星球如何打造元宇宙,以及目前AIGC在比鄰星球元宇宙的落地、實(shí)踐和思考。
現(xiàn)場(chǎng)嘉賓看到的比鄰星球數(shù)字人靈靈視頻是使用基于圖片和文字生成視頻的技術(shù)做出來(lái)的。這個(gè)視頻反映出來(lái),對(duì)于所有的行業(yè)從業(yè)者而言,只需要花2分鐘的時(shí)間,提供一段文字加一張圖片,就可以生成類似的視頻。這樣的技術(shù)不算是AIGC目前核心和頂尖的技術(shù),但它說(shuō)明了兩個(gè)技術(shù)方向:
第一,AIGC能大幅度降低內(nèi)容創(chuàng)作的成本,提高效率;第二,使用AIGC能擺脫低效率的資源浪費(fèi),讓我們更多去專注文化、內(nèi)容的創(chuàng)意探索。這是我認(rèn)為AIGC未來(lái)在文化和元宇宙方向所擁有的巨大潛力。
最近AIGC比較火,伴隨ChatGPT在1750億參數(shù)規(guī)模下帶來(lái)的接近“圖靈測(cè)試”的智能水平,這是大家持續(xù)關(guān)注ChatGPT、并稱之為“智能問(wèn)答元年”的最重要原因。它解決的是未來(lái)元宇宙數(shù)字人的智能問(wèn)題。
第二個(gè)目前在AIGC領(lǐng)域比較火熱的技術(shù)是Stable Diffusion,它能基于一段文字或圖片,創(chuàng)作出新的圖片,而且這個(gè)AI圖片的創(chuàng)意已經(jīng)超過(guò)了很多專業(yè)美術(shù)和創(chuàng)意的平均水平。這是未來(lái)能解決圖像、圖片、或者藝術(shù)創(chuàng)作的一個(gè)最重要的二維技術(shù)。
AIGC行業(yè)下一個(gè)重大突破方向是NeRF,即“神經(jīng)輻射場(chǎng)”。它解決的是未來(lái)數(shù)字場(chǎng)景中3D場(chǎng)景以及3D人物的生成技術(shù),同樣能帶來(lái)效率的提升,以及成本的下降。未來(lái)這三大技術(shù)能奠定AIGC在元宇宙的重要地位,加速元宇宙的到來(lái)。
ChatGPT作為大的自然語(yǔ)言模型,可以解決智能問(wèn)題,未來(lái)大語(yǔ)言模型會(huì)朝萬(wàn)億規(guī)模、多模態(tài)和垂直模型發(fā)展;Stable Diffusion解決的是二維圖片創(chuàng)意問(wèn)題,可以做到文生文、圖生圖、文生視頻、圖生視頻;NeRF解決的是3D世界要素生成,包含3D數(shù)字人、3D物體和3D場(chǎng)景生成。
接下來(lái)3~5個(gè)月,NeRF可能有一個(gè)重大的突破方向是來(lái)自微軟的Rodin模型。它可以基于一段文字或一張照片,生成一個(gè)三維數(shù)字人形象。這可能會(huì)替代目前行業(yè)基于人工建模或基于技術(shù)進(jìn)行數(shù)字人建模的過(guò)程,真正加速未來(lái)數(shù)字人在元宇宙的快速落地。
當(dāng)智能問(wèn)答能接近圖靈測(cè)試,元宇宙的數(shù)字人就可以給我們提供更多的臨場(chǎng)感和真實(shí)感,可以定制更多的數(shù)字化角色和高質(zhì)量的生成內(nèi)容,這是元宇宙內(nèi)容部分所需要的,當(dāng)然還有一些智能NPC和數(shù)字陪伴等,這些是大的自然語(yǔ)言模型可以解決的問(wèn)題。
Stable Diffusion目前在元宇宙解決的問(wèn)題是可以快速更換場(chǎng)景中圖片,形成各種各樣的場(chǎng)景,以及數(shù)字的NFT生成,或者是元宇宙2D資產(chǎn)的生成。
三維物體生成是我們期望未來(lái)能快速落地的方向,這樣可以構(gòu)建元宇宙里大量的場(chǎng)景和物體,就會(huì)極大地豐富元宇宙的3D內(nèi)容。
剛剛講到的是目前AIGC的發(fā)展和未來(lái)技術(shù)的突破方向,下面介紹比鄰星球如何構(gòu)建3D AIGC/UGC平臺(tái)。
眾所周知元宇宙空間最重要的三要素是:數(shù)字人、數(shù)字物品、數(shù)字場(chǎng)景,而互動(dòng)行為可以將三要求有機(jī)地結(jié)合起來(lái)。
第二部分是社交網(wǎng)絡(luò)。不管是基于微信和熟人、或者是陌生人社交,我們產(chǎn)品的本質(zhì)是基于社交網(wǎng)絡(luò)建立連接并維護(hù)連接的活躍度。元宇宙社交是通過(guò)元宇宙空間,在互動(dòng)的過(guò)程中能產(chǎn)生和維護(hù)目前已有的連接,同時(shí)通過(guò)社交網(wǎng)絡(luò)帶動(dòng)用戶在元宇宙世界的互動(dòng),并促進(jìn)已建立的連接在元宇宙空間中完成社交行為。
比鄰星球AIGC和UGC平臺(tái)的主要核心是通過(guò)創(chuàng)作者經(jīng)濟(jì)的商業(yè)模式,讓更多有價(jià)值的AIGC和UGC內(nèi)容在我們的平臺(tái)上產(chǎn)生,并讓這些創(chuàng)意和社交資產(chǎn)得以變現(xiàn)。有了這樣的平臺(tái),就能獲得內(nèi)容豐富的元宇宙空間,以及豐富的消費(fèi)內(nèi)容。
比鄰星球APP內(nèi)容目前包括幾個(gè)方面。一是之前強(qiáng)調(diào)的元宇宙場(chǎng)景,其中有很多場(chǎng)景落地,包括星際露營(yíng)、深圳地標(biāo)建筑等元宇宙空間、以及會(huì)議室等場(chǎng)景。
二是數(shù)字人。在數(shù)字人可以進(jìn)行定制的基礎(chǔ)上,會(huì)產(chǎn)生很多的衣服和搭配等,這些都是可以由創(chuàng)作者生成的內(nèi)容,目前我們已經(jīng)有1000+內(nèi)容創(chuàng)作的服飾,供消費(fèi)者進(jìn)行使用或購(gòu)買。
下面是數(shù)字場(chǎng)景和數(shù)字互動(dòng),比鄰星球的數(shù)字場(chǎng)景允許所有人進(jìn)行多種互動(dòng)。我們希望通過(guò)數(shù)字元宇宙空間,幫助用戶構(gòu)建他們的社交網(wǎng)絡(luò),并在這里產(chǎn)生更多的社交行為。
比鄰星球創(chuàng)作者平臺(tái)的構(gòu)建思路,是希望通過(guò)該平臺(tái)把創(chuàng)作者和用戶全部聚合在一起,實(shí)現(xiàn)創(chuàng)作者可以創(chuàng)作出有創(chuàng)意的內(nèi)容,能被用戶進(jìn)行消費(fèi),并通過(guò)商業(yè)模式進(jìn)行驅(qū)動(dòng),構(gòu)建出有經(jīng)濟(jì)驅(qū)動(dòng)的元宇宙平臺(tái)。所有創(chuàng)作者都能通過(guò)我們的創(chuàng)作中心進(jìn)行3D資產(chǎn)的創(chuàng)作和銷售。
AIGC加速比鄰星球元宇宙構(gòu)建
下面快速地介紹AIGC在比鄰星球的落地和實(shí)踐。
數(shù)字人兩大重要特征是智慧和情緒,這樣才能讓用戶覺(jué)得是在和真實(shí)的“人”對(duì)話。
關(guān)于“智慧”部分,我們使用大模型的智能問(wèn)答,目前已經(jīng)接入ChatGPT和百度的文言一心來(lái)產(chǎn)生這樣的能力。至于“情緒”部分可以采用反向思路,基于大模型去判斷用戶的交互情感,以做出對(duì)應(yīng)的動(dòng)作和表情動(dòng)畫,讓數(shù)字人產(chǎn)生情緒。
我們還可以做語(yǔ)音到3D動(dòng)畫的生成,從文字/語(yǔ)音對(duì)唇形和面部表情進(jìn)行驅(qū)動(dòng)等,使之更加“擬人”。最近我們還上線了“角色”特征,比如ChatGPT里可以定制一個(gè)人設(shè),基于這樣的人設(shè)能讓用戶產(chǎn)生更加真實(shí)的交互。
在傳統(tǒng)的語(yǔ)音識(shí)別和合成方面,我們也在情緒和語(yǔ)氣的方面做探索,這些技術(shù)目前已經(jīng)相對(duì)成熟了,也有在我們的產(chǎn)品中落地。
關(guān)于AIGC在我們數(shù)字場(chǎng)景中的落地情況。我們已經(jīng)使用了NeRF的一些能力,去生成簡(jiǎn)單的道具,這些道具已經(jīng)不再基于人工進(jìn)行開發(fā)。第二是生成圖片和視頻的能力,其實(shí)我們的每個(gè)場(chǎng)景中都會(huì)有大量的屏幕和裝飾,未來(lái)用戶可以基于文字生成陽(yáng)光沙灘或是高山等背景圖,從而進(jìn)行場(chǎng)景替換,讓場(chǎng)景的豐富度得到極大提升。
NeRF還有一個(gè)重要作用是3D人物的面部生成,能降低成本,提升快速生成數(shù)字人的能力。當(dāng)然還有基于大模型的智能NPC的構(gòu)建。在我們的場(chǎng)景中就有這樣的NPC提供引導(dǎo),幫助從從未接觸過(guò)元宇宙玩法的新用戶低門檻、便捷地體驗(yàn)元宇宙,讓他們感受到更好的3D沉浸式社交體驗(yàn)。
比鄰星球的藝術(shù)家創(chuàng)作平臺(tái)還提供了編輯工具,讓用戶快速創(chuàng)建場(chǎng)景中的內(nèi)容資產(chǎn)。
我認(rèn)為:AIGC加速元宇宙生態(tài)的完善和構(gòu)建,將讓元宇宙的到來(lái)又近一步。。這個(gè)觀點(diǎn)是基于以下四點(diǎn)做出的判斷:1、數(shù)字人具備了更高的智能和擬人;2、3D生成能力即將讓“所想即所得”成為現(xiàn)實(shí);3、數(shù)字場(chǎng)景創(chuàng)作、豐富性、創(chuàng)意等門檻極大降低;4、真正融合數(shù)字人/物/場(chǎng)景,讓用戶獲得更有趣的互動(dòng),為社交網(wǎng)絡(luò)中的連接創(chuàng)造價(jià)值。
以上就是我的簡(jiǎn)短分享,如果有興趣的話可以通過(guò)手機(jī)應(yīng)用商城下載體驗(yàn)比鄰星球APP,并關(guān)注我們。謝謝大家!
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文經(jīng)原作者授權(quán)發(fā)布,不代表VR陀螺立場(chǎng),如需轉(zhuǎn)載請(qǐng)直接聯(lián)系原作者
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息