FBEC未來(lái)商業(yè)生態(tài)鏈接大會(huì)于2023年2月24日在深圳福田大中華喜來(lái)登酒店盛大召開(kāi),本次大會(huì)由廣東省游戲產(chǎn)業(yè)協(xié)會(huì)、深圳市互聯(lián)網(wǎng)文化市場(chǎng)協(xié)會(huì)指導(dǎo),陀螺科技主辦。
大會(huì)以“勇毅前行·逐光而上”為主題,以具有行業(yè)前瞻洞察的“探索者”為視角,逐“光”之旅為主線,聚焦元宇宙、XR、游戲、電競(jìng)、數(shù)字營(yíng)銷等前沿行業(yè),全方位呈現(xiàn)科技前沿成果,探討時(shí)代與商業(yè)議題,謀劃新科技、新商業(yè)、新模式未來(lái)價(jià)值,與時(shí)代同行者共赴劇變革新下的勇毅逐光之道!
FBEC主會(huì)場(chǎng)C:相信的力量——FBEC全球元宇宙CEO峰會(huì)由武漢東湖新技術(shù)開(kāi)發(fā)區(qū)管理委員會(huì)與陀螺科技聯(lián)合主辦,邀請(qǐng)到海信集團(tuán)聚好看科技股份有限公司AR/VR事業(yè)部總經(jīng)理吳連朋帶來(lái)主題為“虛擬空間及數(shù)字人交互的技術(shù)應(yīng)用趨勢(shì)”的精彩演講。吳連朋認(rèn)為,如果我們繞開(kāi)數(shù)字人的發(fā)展,談元宇宙就是沒(méi)有意義的。
以下為演講實(shí)錄:
大家下午好!
很開(kāi)心有機(jī)會(huì)能跟大家進(jìn)行分享交流,前面的嘉賓從不同的業(yè)務(wù)領(lǐng)域進(jìn)行了分享,我會(huì)從元宇宙的基礎(chǔ)“人+場(chǎng)”的應(yīng)用方向,也就是數(shù)字人+虛擬空間的技術(shù)方向進(jìn)行切入,在這個(gè)過(guò)程中,希望也能把海信集團(tuán)聚好看的思考和正在做的事情介紹給大家。
我們是海信旗下的一家互聯(lián)網(wǎng)公司,這是云服務(wù)板塊,從下往上有企業(yè)級(jí)的、基礎(chǔ)的PaaS云平臺(tái),目前包括國(guó)家電網(wǎng)、中大型企業(yè)數(shù)字化轉(zhuǎn)型里做私有云的PaaS平臺(tái)的切換。除此之外,還有通用互聯(lián)網(wǎng)架構(gòu)下所需要的PaaS云的部分,以及音視頻的解決方案,是面向移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)能力的構(gòu)建。
2016年的時(shí)候,在集團(tuán)戰(zhàn)略的部署下,我們開(kāi)始承擔(dān)XR板塊,其中包括眼鏡的探索方向。
2020年,我們發(fā)布了國(guó)內(nèi)首個(gè)雙8K直播的VR云平臺(tái),這是基于VR的視頻處理、編解碼處理以及傳輸分發(fā)的云平臺(tái),包括本次大會(huì)的VR視頻直播也是我們平臺(tái)的產(chǎn)品來(lái)提供,這是比較成熟的應(yīng)用方向。
在此基礎(chǔ)上,2019、2020、2021年,我們不斷探索XR領(lǐng)域跟硬件結(jié)合、跟應(yīng)用結(jié)合的新的解決方案。我們的路線,是從數(shù)字虛擬人的引擎開(kāi)始,再到基于人+虛擬空間的元宇宙的互動(dòng)活動(dòng)平臺(tái)的應(yīng)用。
現(xiàn)在大家都談數(shù)字人,為什么大家都在談、也還有人去做呢?這個(gè)問(wèn)題我們從2019年就開(kāi)始思考了。目前數(shù)字人的引擎沒(méi)有成為通用能力的情況下,一個(gè)企業(yè)想要做好XR領(lǐng)域的應(yīng)用和解決方案,是無(wú)法繞過(guò)一些基礎(chǔ)核心技術(shù)的積累和突破的。
說(shuō)元宇宙,首先會(huì)說(shuō)到數(shù)字人,說(shuō)得最多的也是數(shù)字人。其實(shí)在五年前、十年前,虛擬仿真的技術(shù),包括游戲的應(yīng)用就已經(jīng)非常成熟。所以,如果我們繞開(kāi)數(shù)字人的發(fā)展,談元宇宙就是沒(méi)有意義的。
基于數(shù)字人生產(chǎn)的效率和性能的提升,是驅(qū)動(dòng)元宇宙應(yīng)用的基礎(chǔ)邏輯。這里有兩個(gè)案例,一個(gè)是目前行業(yè)中做得非常好的歐美超寫(xiě)實(shí)數(shù)字人,左上角是相對(duì)比較輕量級(jí)的數(shù)字人。在數(shù)字人發(fā)展的基礎(chǔ)上,有各行各業(yè)元宇宙數(shù)字人的探索。
雖然說(shuō)數(shù)字人的建模和渲染技術(shù)不斷提升,也可以做各領(lǐng)域探索,但不代表每一個(gè)領(lǐng)域在一兩年內(nèi)就可以成熟。從我們自己的思考來(lái)講,比如社交的元宇宙,Meta已經(jīng)投入了很長(zhǎng)的時(shí)間,但是目前最高用戶也才達(dá)到20萬(wàn),日活還在不斷下降,所以偏社交、大C端的社交應(yīng)用的方向,不是我們目前想要去拓展的方向。
從技術(shù)角度去看,數(shù)字人從開(kāi)始構(gòu)建,到真正在元宇宙里應(yīng)用起來(lái),具體需要做哪些,以及它的應(yīng)用趨勢(shì)是怎樣的?拆解出來(lái)是以下五個(gè)階段。
第一,把人生產(chǎn)出來(lái),這就是建模的技術(shù)。建模技術(shù)發(fā)展的趨勢(shì),首先是要達(dá)到更高的精度,其次是以更小的成本和更小的算力去獲得更高的精度。從多視角幾何,純數(shù)字算法的模式,向深度學(xué)習(xí)大模型去發(fā)展。
第二,人建出來(lái)之后,需要使面部的動(dòng)作動(dòng)起來(lái),動(dòng)作的方向是更加輕便,讓人無(wú)感知地應(yīng)用起來(lái),才能在消費(fèi)級(jí)有更好的應(yīng)用,所以從傳統(tǒng)的光學(xué)、慣性動(dòng)作捕捉等往更加輕量的可以消費(fèi)級(jí)應(yīng)用的單RGB攝像頭的精細(xì)化驅(qū)動(dòng)方向發(fā)展。
第四,在把人生產(chǎn)、動(dòng)作、周邊服飾都做出來(lái)以后,重要的方向是能夠把這些很好地渲染出來(lái)。
第五,前面四個(gè)階段生產(chǎn)完以后,只能說(shuō)有了這樣的形象出來(lái),可以有基礎(chǔ)的活動(dòng)交互,而最終還是要用AI給它賦能,讓它具有靈魂。最近有很多人討論ChatGPT,ChatGPT結(jié)合數(shù)字人一定是可以的,并且很快能夠改變很多行業(yè)的應(yīng)用方向,尤其是數(shù)字智能化的助手方向,替代一些人力,更好地展現(xiàn)效率。
從數(shù)字人的劃分來(lái)講,我們做了一個(gè)分類:從最基礎(chǔ)的風(fēng)格化的數(shù)字人,到寫(xiě)實(shí)數(shù)字人,再到超寫(xiě)實(shí)數(shù)字人。
風(fēng)格化數(shù)字人,目前國(guó)外已經(jīng)有很多通用的模型,很多行業(yè)應(yīng)用都在基于這些模型去做。我們認(rèn)為,它更加適合偏游戲、偏輕量化的娛樂(lè)性方向,而不適合行業(yè)級(jí)的應(yīng)用方向。
2020年,海信推出了自己的第一個(gè)元宇宙電視行業(yè)發(fā)布會(huì),當(dāng)時(shí)也是風(fēng)格化數(shù)字人。但近一兩年我們想要進(jìn)行行業(yè)應(yīng)用拓展和規(guī)?;?,就一定要往寫(xiě)實(shí)和更加超寫(xiě)實(shí)的方向推進(jìn)。寫(xiě)實(shí)和超寫(xiě)實(shí)數(shù)字人這兩個(gè)部分是有交叉的,這取決于具體的應(yīng)用場(chǎng)景。
比如寫(xiě)實(shí)的數(shù)字人,基于單張的圖片,基于1萬(wàn)以內(nèi)的面片數(shù)去生產(chǎn)數(shù)字人的形象,才有可能在目前的終端算力下,做到幾百上千的并發(fā),去進(jìn)行交互和這個(gè)范圍內(nèi)的應(yīng)用。
這是我們自己打造的其中一個(gè)超寫(xiě)實(shí)形象,它現(xiàn)在承載著我們流量代理人的角色。我們自己的超寫(xiě)實(shí)數(shù)字人的打造技術(shù),從學(xué)術(shù)到真正能落地的趨勢(shì)是一致的,就是高精度掃描以后,AI能夠自動(dòng)化的建模,可以把原來(lái)需要專業(yè)團(tuán)隊(duì)做幾個(gè)月的工作量縮短到兩周以內(nèi)。我們說(shuō)超寫(xiě)實(shí),不僅僅是代表它有8K的貼圖和毛孔級(jí)的精度,更重要的是面部的表情,還有身體和骨骼動(dòng)作的精細(xì)化處理。
這是我們最近兩周的案例,背景是中亞五國(guó)在集團(tuán)的采訪。這個(gè)場(chǎng)景需要長(zhǎng)達(dá)6分鐘的俄語(yǔ)播報(bào)內(nèi)容,常規(guī)的展廳不太可能完成,但是現(xiàn)在通過(guò)AI數(shù)字人,包括語(yǔ)音的技術(shù)和自動(dòng)的動(dòng)作捕捉,2個(gè)小時(shí)以內(nèi)可以生產(chǎn)這樣的內(nèi)容,滿足應(yīng)用場(chǎng)景的需求。我們說(shuō)元宇宙、數(shù)字人,還是要考慮到底是在什么樣的場(chǎng)景下提供了什么樣的價(jià)值。
另一個(gè)案例是更輕量級(jí)的模型,精度相對(duì)沒(méi)有那么高,但是一切的技術(shù)都是服務(wù)具體落地的場(chǎng)景。比如今天的大會(huì),我們有兩路不同的直播,一路是基于VR視頻的直播,另一路是基于元宇宙活動(dòng)的直播,當(dāng)面臨上百或者是上千虛擬人在同一個(gè)空間里進(jìn)行活動(dòng)和交互的時(shí)候,就必須要平衡它千人千面的追求,以及算力、精度、實(shí)時(shí)互動(dòng)的流暢。在不同的場(chǎng)景需要不同的寫(xiě)實(shí)度,這是我們?cè)趹?yīng)用落地場(chǎng)景的結(jié)合探索中得出的經(jīng)驗(yàn)。大部分場(chǎng)景可能不需要達(dá)到95%的寫(xiě)實(shí)度,可能只需要達(dá)到60%以上的寫(xiě)實(shí)度就可以達(dá)到流暢、體驗(yàn)感平衡的效果。
我們對(duì)技術(shù)服務(wù)場(chǎng)景這個(gè)方向的思考,它不是適合于通用的、想把所有的企業(yè)和用戶都放在一個(gè)公共的大空間里的應(yīng)用,而是要聚焦于某一個(gè)很小的細(xì)分場(chǎng)景,比如會(huì)議的活動(dòng),虛擬的教研活動(dòng),或者其他的展覽展示活動(dòng)。
現(xiàn)在大家都在談數(shù)字人的技術(shù),但3年以后,基礎(chǔ)數(shù)字人的能力,無(wú)論是建模、驅(qū)動(dòng),還是結(jié)合云以后整個(gè)AI的生成能力,可能馬上就會(huì)成為基建的技術(shù),它會(huì)像現(xiàn)在云計(jì)算和大數(shù)據(jù)公共算力一樣,成為一種基礎(chǔ)能力。但是在這段時(shí)間里,整個(gè)行業(yè)的從業(yè)者如果要做到真正的落地和實(shí)現(xiàn),還是要明確自己的方向,以及對(duì)關(guān)鍵領(lǐng)域進(jìn)行突破。
引用一個(gè)報(bào)告的數(shù)據(jù),后疫情時(shí)代,虛擬活動(dòng)的場(chǎng)景占比和用戶接受度在逐漸增高。在這種情況下,我們有基礎(chǔ)的面向一個(gè)一個(gè)活動(dòng)場(chǎng)景的產(chǎn)品架構(gòu),在這樣的架構(gòu)里面,無(wú)論是數(shù)字人,還是云渲染,都已經(jīng)是基礎(chǔ)的技術(shù)能力。傳統(tǒng)的虛擬仿真教育,也面臨著往基于多人的互動(dòng)遠(yuǎn)程空間更加真實(shí)和更具沉浸感的發(fā)展方向,這也是未來(lái)我們發(fā)力的細(xì)分場(chǎng)景。
謝謝大家!
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權(quán)不得轉(zhuǎn)載。如需轉(zhuǎn)載請(qǐng)聯(lián)系微信:vrtuoluo233 申請(qǐng)授權(quán),并在轉(zhuǎn)載時(shí)保留轉(zhuǎn)載來(lái)源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉(zhuǎn)載法律必究。文中有圖片、視頻素材來(lái)自互聯(lián)網(wǎng)或無(wú)法核實(shí)出處,如涉及版權(quán)問(wèn)題,請(qǐng)聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息
上一篇: FBEC大會(huì) | 佳創(chuàng)視訊VR事業(yè)部總經(jīng)理朱鋒:VR 直播將成為輕量化內(nèi)容建設(shè)突破口
下一篇: FBEC大會(huì) | 至格科技 CEO 孟祥峰:AR衍射光波導(dǎo)技術(shù)的四大發(fā)展趨勢(shì)