4月13日下午,由武漢東湖新技術(shù)開發(fā)區(qū)管理委員會(huì)主辦,陀螺科技聯(lián)合主辦的2023武漢元宇宙開發(fā)者高峰論壇在武漢光谷舉辦。
論壇以“元生萬物,智匯光谷”為主題,聚焦元宇宙內(nèi)容發(fā)展趨勢、前沿開發(fā)技術(shù)及項(xiàng)目實(shí)戰(zhàn)經(jīng)驗(yàn),Unity、中國移動(dòng)咪咕公司、盛天網(wǎng)絡(luò)、TCL華星、聚好看科技、MultiMetaVerse、比鄰星球、維亞環(huán)球科技、彼真科技、佳創(chuàng)視訊、VeeR、鈴空游戲等行業(yè)先鋒代表為與會(huì)來賓帶來精彩分享。
其中,聚好看科技AR/VR事業(yè)部總經(jīng)理 吳連朋為與會(huì)來賓帶來了“虛擬空間及數(shù)字人交互的技術(shù)應(yīng)用趨勢”的主題演講。
以下為演講實(shí)錄:
大家好!我是來自海信的吳連朋。我的演講題目是《虛擬空間及數(shù)字人交互的技術(shù)應(yīng)用趨勢》,會(huì)從偏向技術(shù)方面,從元宇宙的“人+場”的技術(shù)趨勢,再到海信在探索的行業(yè)應(yīng)用場景跟大家做分享。
首先簡單介紹一下聚好看。聚好看公司是海信旗下的互聯(lián)網(wǎng)科技公司,有連續(xù)五年的獨(dú)角獸榮譽(yù)。我今天主要介紹的是云服務(wù)板塊。
從2016年海信集團(tuán)開始布局AR、VR產(chǎn)業(yè),成立了相關(guān)的實(shí)驗(yàn)室,其演進(jìn)過程就是聚好看云XR的三個(gè)階段:1、偏向VR全景超高清直播平臺(tái)的技術(shù)研發(fā),我們更多是偏文旅方面;2、基于未來元宇宙的趨勢,AI數(shù)字人的便捷生產(chǎn)和交互能力是未來核心應(yīng)用場景的基礎(chǔ),以我們做了數(shù)字人的智能化生產(chǎn)平臺(tái);3、元宇宙的虛擬活動(dòng)平臺(tái),在一些行業(yè)的場景做落地。
元宇宙最先火起來的是數(shù)字人,為什么?從我的理解,如果元宇宙沒有AI化、便捷批量化生產(chǎn)以及互動(dòng)的數(shù)字人的能力,那其實(shí)就不能叫元宇宙。那只是十年前就非常成熟的虛擬仿真技術(shù),是游戲的應(yīng)用場景,它跟未來元宇宙可以產(chǎn)生的價(jià)值是沒有關(guān)系的。
為什么元宇宙未來可以逐漸地改變各行各業(yè)?我們認(rèn)為,正是因?yàn)樗闹悄芑a(chǎn)能力,在交叉的科學(xué)演進(jìn)趨勢下開始成為可能。
第一是快速的生產(chǎn)能力,比如基于單圖AI數(shù)字人的生成,可以做到40秒生成70%的相似度,就有可能在各種商業(yè)場景下應(yīng)用。比如行業(yè)典型的MetaHuman,可以把本來需要幾個(gè)月時(shí)間打造的數(shù)字人縮短到數(shù)天,甚至幾分鐘,從而使得辦公、工業(yè)和社交方面的元宇宙應(yīng)用成為可能。
數(shù)字人到底包含了哪些?它的生產(chǎn)過程為什么可以逐漸成為各個(gè)行業(yè)應(yīng)用的可能性?我們將其分解為五個(gè)步驟:建模技術(shù)、動(dòng)捕/面捕技術(shù)、物理仿真技術(shù)、渲染技術(shù)、AI技術(shù)賦能。從左到右是一個(gè)逐漸的支撐過程。
最左邊是建模,傳統(tǒng)建模需要3D美術(shù),需要數(shù)天甚至幾個(gè)月的時(shí)間生產(chǎn)出來,它的演進(jìn)趨勢非常清晰,就是要往AI、往NeRF(神經(jīng)輻射場)、往更高精度的方向演進(jìn),讓建模AI化、智能化。
第二步是讓數(shù)字人動(dòng)起來,無論是身體的行動(dòng)還是面部表情,這兩塊是核心。目前的趨勢就是從傳統(tǒng)需要有面捕設(shè)備、動(dòng)捕設(shè)備,開始往單個(gè)攝像頭和兩個(gè)攝像頭這種輕量級(jí)的重定向能力發(fā)展,讓它更加輕便,才能在各個(gè)行業(yè)應(yīng)用。
當(dāng)一個(gè)數(shù)字人完成建模并動(dòng)起來以后,接下來就是仿真和渲染,其趨勢是更真實(shí)和實(shí)時(shí)。前幾個(gè)過程以后,一個(gè)AI數(shù)字人就可以給用戶完整展現(xiàn)了。最終能讓它從“好看的皮囊”到“有趣靈魂”的演進(jìn),就是更智能化,結(jié)合大模型能力可以讓它很快實(shí)現(xiàn)智能化的升級(jí)。
數(shù)字人又具體細(xì)分為三個(gè)方向:風(fēng)格化數(shù)字人、寫實(shí)數(shù)字人、超寫實(shí)數(shù)字人。
行業(yè)里很多應(yīng)用場景都能看到這種風(fēng)格化的模型,它在國外已經(jīng)非常成熟,可以拿來就用。我們從2020年開始第一次用風(fēng)格化的數(shù)字人,后來逐漸出現(xiàn)基于AI的寫實(shí)數(shù)字人,拓展到會(huì)議會(huì)展和教研活動(dòng)的應(yīng)用場景。我們現(xiàn)在做的是基于單圖以及超寫實(shí)的高精度掃描,由AI自動(dòng)生成和綁定的數(shù)字人方向。
超寫實(shí)的數(shù)字人,先需要生成超高精度的模型。這個(gè)模型的生成基本上只需要2天的時(shí)間,通過我們自己的一整套設(shè)備,掃描以后用AI自動(dòng)綁定,并結(jié)合單個(gè)攝像頭實(shí)現(xiàn)的面捕,就可以把數(shù)字人驅(qū)動(dòng)起來。
最近兩周我們還有一個(gè)案例,需要用俄語對(duì)集團(tuán)展廳進(jìn)行播報(bào),我們的講解員無法完成。公司就基于超寫實(shí)的數(shù)字人生產(chǎn)能力,以及利用AI語音生成能力,在4個(gè)小時(shí)內(nèi)就可以生成俄語版的全集團(tuán)播報(bào),并由數(shù)字人來承擔(dān)這樣的任務(wù)。從中可以看到數(shù)字人真正給這個(gè)場景帶來了實(shí)際價(jià)值。
下面是單圖寫實(shí)數(shù)字人方面的趨勢。傳統(tǒng)常見的是基于風(fēng)格化的千人一面的預(yù)置形象。我們更趨向于在會(huì)議、活動(dòng)和展會(huì)的一些實(shí)際應(yīng)用,這些場景對(duì)數(shù)字人的要求是更寫實(shí),能看出是自己,能更有沉浸感和真正面對(duì)面的交互感,所以這些數(shù)字人基于單圖寫實(shí)的AI建模。在2021年開始做時(shí),我向團(tuán)隊(duì)提的要求是要有90%以上的寫實(shí)度,能真正看到是自己,經(jīng)過半年左右的探索以后,發(fā)現(xiàn)實(shí)際的應(yīng)用場景并不需要90%的寫實(shí)度,而是要結(jié)合美型和寫實(shí)的綜合形象,才能滿足用戶的需求?,F(xiàn)在我們能達(dá)到70%以上的相似度,40秒的生成效率。
數(shù)字人無論是AI的建模還是驅(qū)動(dòng)的技術(shù),在未來三年以內(nèi)就會(huì)成為基建技術(shù),成為在文旅、工業(yè)、教育等各行各業(yè)里可以拿來就用的技術(shù),但目前還是不行的。所以海信會(huì)在某些方向上積累自己的技術(shù)能力。
講完核心的數(shù)字人,分享幾個(gè)我們在行業(yè)里做的應(yīng)用場景。
首先看一個(gè)調(diào)研,美國有一家公司采訪了1250+虛擬活動(dòng)組織者和參會(huì)者,51%以上的虛擬活動(dòng)主辦方有繼續(xù)舉辦的意愿,并且復(fù)合年增長率23%。這是市場的情況。
基于前面的調(diào)研,我們在虛擬活動(dòng)方面發(fā)布了產(chǎn)品——聚云境。這是一個(gè)跨終端的虛擬活動(dòng)平臺(tái),在這個(gè)平臺(tái)上我們的應(yīng)用場景主要有5個(gè)方面,我會(huì)重點(diǎn)和大家介紹其中的2~3個(gè)。
第一個(gè)是元宇宙的設(shè)計(jì)協(xié)作。這是我們近兩年做的應(yīng)用場景里我個(gè)人最看好的一個(gè)場景,要解決的痛點(diǎn)是在傳統(tǒng)的工業(yè)設(shè)計(jì)領(lǐng)域,工業(yè)設(shè)計(jì)師在作品建模以后給用戶展現(xiàn)的方式近20年來是從來沒有變化過的,就是建模完以后通過高精度的渲染輸出圖片,再以當(dāng)面匯報(bào)呈現(xiàn)的方式給客戶展現(xiàn),這個(gè)非常依賴于設(shè)計(jì)師本人的表達(dá)能力以及他的溝通能力。
我們在這個(gè)痛點(diǎn)的基礎(chǔ)上,結(jié)合海信自己的硬件能力做了設(shè)計(jì)協(xié)作平臺(tái),這是活動(dòng)平臺(tái)其中的一個(gè)應(yīng)用場景,目前已經(jīng)有20多個(gè)客戶,我們的客戶是設(shè)計(jì)師和設(shè)計(jì)公司。平臺(tái)的基礎(chǔ)能力和效果呈現(xiàn)能夠滿足預(yù)期。
在這個(gè)場景里,它與會(huì)議等活動(dòng)的區(qū)別在于,其內(nèi)容是來自于傳統(tǒng)行業(yè)本來就需要做的內(nèi)容,把內(nèi)容經(jīng)過我們的工具和平臺(tái)的轉(zhuǎn)化加工以后,在硬件終端上呈現(xiàn),從而解決近20年來從沒變化過的設(shè)計(jì)師的作品呈現(xiàn)和匯報(bào)方式。
虛擬教研方面是我們探索的另外一個(gè)核心場景。海信公司跟高職校的老師合作,他是新聞采編專業(yè)。老師希望讓學(xué)生們不斷能去到各行各業(yè)的工廠拓展見識(shí),但現(xiàn)實(shí)情況下這個(gè)成本非常高,所以我們通過建模、全景圖和全景視頻等各種形式,通過我們的平臺(tái)可以快速切換,使用配套的虛擬教研工具,就能很好地滿足這個(gè)場景需求。通過和這位老師的合作,我們目前已經(jīng)幫助他拿到了高職教教研大賽的特等獎(jiǎng)。
謝謝大家,我的分享就到這里。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權(quán)不得轉(zhuǎn)載。如需轉(zhuǎn)載請聯(lián)系微信:vrtuoluo233 申請授權(quán),并在轉(zhuǎn)載時(shí)保留轉(zhuǎn)載來源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉(zhuǎn)載法律必究。文中有圖片、視頻素材來自互聯(lián)網(wǎng)或無法核實(shí)出處,如涉及版權(quán)問題,請聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息
上一篇: VR語言學(xué)習(xí)平臺(tái)Immerse宣布與英偉達(dá)合作,為PC用戶提供流式傳輸服務(wù)
下一篇: 元宇宙開發(fā)者高峰論壇 | 彼真科技創(chuàng)始人兼CEO張超彥:如何打造虛擬演唱會(huì)的分工體系