圖源:詮視科技
元宇宙的概念將過去十年中多領(lǐng)域的技術(shù)融會貫通,為未來十年的發(fā)展指明了方向,業(yè)界為此振奮不已。它既是互聯(lián)網(wǎng)應(yīng)用的延伸,也孕育著新的社會形態(tài)。元宇宙拓展了人類生存的空間:將有限的現(xiàn)實(shí)世界延伸到無限的虛擬世界;同時(shí)也拓展了人類的感官體驗(yàn):人們可以沉浸式地與虛擬的信息交互。因而與此相關(guān)的技術(shù),被認(rèn)為是構(gòu)建通往元宇宙必由之路的基石。
詮視科技 Xvisio Technology(上海詮視傳感技術(shù)有限公司)是一家創(chuàng)立于硅谷的海歸初創(chuàng)公司,多年來專注空間感知交互領(lǐng)域核心技術(shù)與產(chǎn)品。從核心技術(shù)研發(fā)、ODM服務(wù)到產(chǎn)品平臺打造積累了20余項(xiàng)核心IP,實(shí)現(xiàn)了從算法、傳感器件、硬件平臺、應(yīng)用SDK到系統(tǒng)優(yōu)化等環(huán)節(jié)的自主可控與融會貫通。聯(lián)合行業(yè)伙伴賦能了大量行業(yè)客戶構(gòu)建XR系統(tǒng)及生態(tài),是構(gòu)建元宇宙生態(tài)的重要推手。在今年的9月的世界互聯(lián)網(wǎng)大會上,詮視科技推出的企業(yè)級AR眼鏡SlimEdge E34RB受到了業(yè)界的關(guān)注。
10月的世界ARVR產(chǎn)業(yè)大會上,詮視科技推出了多款A(yù)R HMD新品,并在第四屆進(jìn)博會上聯(lián)手愛普生,推出面向文旅行業(yè)的AR導(dǎo)覽解決方案,完成了一次數(shù)字化文旅的成功實(shí)踐,也是對元宇宙技術(shù)落地的積極探索。
那么,詮視科技是憑借什么得以在通往元宇宙的征途中持續(xù)發(fā)力的呢?
一、高性能的VSLAM技術(shù)是空間感知交互的基礎(chǔ)
對現(xiàn)實(shí)空間的理解與重構(gòu)是通向元宇宙的第一步。
VSLAM(Simultaneous Localization And Mapping,同步定位與地圖構(gòu)建)是實(shí)現(xiàn)6DOF沉浸式空間感知交互體驗(yàn)的核心,感知交互與近眼顯示一起被列為XR的兩大支柱技術(shù)。VSLAM技術(shù)雖然在學(xué)術(shù)界歷史悠久,但受限于產(chǎn)品平臺算力,近兩年才在產(chǎn)品端實(shí)現(xiàn)落地。詮視科技在業(yè)界以其高性能的VSLAM技術(shù)及方案部署而見長,其特點(diǎn)是由獨(dú)立VPU/DSP計(jì)算單元承載算力和傳感器融合的任務(wù), 提高了系統(tǒng)性能和設(shè)計(jì)的靈活性。目前微軟Hololens,Magicleap和傳聞即將發(fā)布的Apple MR頭顯中均采用類似架構(gòu)以保證性能。詮視科技早在2018年就實(shí)現(xiàn)了基于這種結(jié)構(gòu)的器件級部署,同年被工信部評為“關(guān)鍵技術(shù)突破類”企業(yè)。近年來持續(xù)迭代,目前已經(jīng)在多個(gè)芯片平臺上實(shí)現(xiàn)部署。在今年的世界ARVR產(chǎn)業(yè)大會上,詮視科技發(fā)布了支持雙目和四目VSLAM的產(chǎn)品方案,精度對標(biāo)Hololens。迄今為止詮視科技以其感知交互核心技術(shù)為基礎(chǔ)的ODM服務(wù)及相應(yīng)的平臺產(chǎn)品賦能了大批行業(yè)客戶,包括多個(gè)行業(yè)標(biāo)桿客戶。
基于四目VSLAM的 SlimEdge B50R Pro AR 眼鏡
二、全鏈條底層技術(shù)支持豐富產(chǎn)品平臺
要實(shí)現(xiàn)沉浸式的交互體驗(yàn),空間感知交互的精度、速度和交互的維度(手勢、手柄)是極其重要的基礎(chǔ),而目前大多數(shù)產(chǎn)品開發(fā)商都不具備如此全面的系統(tǒng)整合、綜合研發(fā)和產(chǎn)品部署能力,這也限制了AR/MR產(chǎn)品的大規(guī)模普及。詮視科技在過去的三年中完成了原生VSLAM算法的持續(xù)迭代,實(shí)現(xiàn)了在Intel、高通、MTK等主流硬件平臺上的部署, 全鏈路低延時(shí)多次渲染優(yōu)化技術(shù)的研發(fā), 以及與全光學(xué)系列的近眼顯示方案對接,形成了基于空間智能感知層+交互層的XR系統(tǒng)架構(gòu)。詮視科技構(gòu)建的基于獨(dú)立芯片處理的XR感知層,實(shí)現(xiàn)了包括雙目、四目魚眼、TOF、RGB、紅外相機(jī)、微光相機(jī)、IMU等多傳感器的端處理與融合,提供了高速VSLAM、高速深度檢出、物體姿態(tài)檢出、物體識別、音視頻交互的本地化處理能力,極大地方便了系統(tǒng)的模塊化設(shè)計(jì)與部署,適用于多形態(tài)空間感知交互場景的落地,包括:XR終端、可穿戴設(shè)備、機(jī)器人等。面向應(yīng)用場景的交互能力由Xvisio AR foundation SDK結(jié)合感知層能力實(shí)現(xiàn),提供和XR交互的主要功能,包括空間錨定、平面檢出、地圖創(chuàng)建、虛實(shí)結(jié)合、三維重建、手勢交互、多人協(xié)同及端云結(jié)合等交互能力,支持Android、Windows、Linux主流操作系統(tǒng)平臺,豐富了元宇宙的入口。
圖源: 詮視科技
三、精準(zhǔn)空間錨定及虛實(shí)結(jié)合
虛實(shí)結(jié)合是AR/MR設(shè)備在元宇宙中的核心價(jià)值, 是通向元宇宙的入口, 也是最有挑戰(zhàn)的環(huán)節(jié)。實(shí)現(xiàn)精準(zhǔn)的虛實(shí)結(jié)合、空間錨定,除了要有精準(zhǔn)的VSLAM技術(shù),還要有高精度光學(xué)透視的系統(tǒng)標(biāo)定及低延遲的系統(tǒng)優(yōu)化。詮視科技在這一領(lǐng)域已形成完整的高精度定位與虛實(shí)疊加的技術(shù)體系與作業(yè)流程,并支持全光學(xué)路徑的硬件終端平臺部署(PC、Android、Linux)。這一系列技術(shù)積累為業(yè)界提供了多種技術(shù)選擇,拓寬了元宇宙的入口。
四、打通手機(jī)“任督二脈”,開啟流暢的6DOF體驗(yàn)
手機(jī)作為移動互聯(lián)網(wǎng)入口的橋頭堡,有大量的存量市場。而AR眼鏡作為手機(jī)附件,一直被認(rèn)為是XR的最佳落地場景。但目前市面上的大量AR眼鏡仍以投屏觀影為主,原因是要獲得流暢的沉浸式6DOF體驗(yàn),目前的主流方案都需要修改手機(jī)底層代碼以實(shí)現(xiàn)低延遲處理,需要手機(jī)廠商開放root權(quán)限。這對于通用型AR眼鏡來說無疑是個(gè)巨大的挑戰(zhàn)。詮視科技基于其獨(dú)特的端處理分體式架構(gòu),實(shí)現(xiàn)了在非root手機(jī)上的低延遲處理,達(dá)到了和定制化設(shè)備同樣的體驗(yàn)。這一技術(shù)打破了6DOF AR眼鏡在手機(jī)市場落地的僵局,可迅速拉動基于手機(jī)平臺的內(nèi)容生態(tài),將大大拓展元宇宙的落地場景。
五、頭手協(xié)同6DoF交互增強(qiáng)沉浸式體驗(yàn)
在沉浸式交互形態(tài)上,AR與VR的共通之處是都需要頭部的6DOF追蹤定位。區(qū)別是AR偏重對環(huán)境的理解,而VR偏重于空間信息的獲取。在手部交互方式上,AR傾向于自然手勢,而VR傾向于手柄,目前6DOF手柄已經(jīng)成為VR設(shè)備的標(biāo)配。近期Facebook(Meta)發(fā)表的自帶攝像頭的主動追蹤方式的手柄是基于獨(dú)立VSLAM計(jì)算單元的產(chǎn)品,代表著業(yè)界的技術(shù)方向。詮視科技早在2018年就推出了同類產(chǎn)品的設(shè)計(jì), 并獲得了美國專利授權(quán)。與此同時(shí),詮視科技也可支持基于CV的6DOF手柄方案,基于四目相機(jī)的頭手6DOF的方案已經(jīng)在產(chǎn)品化中。
在自然手勢交互領(lǐng)域,詮視科技開發(fā)了基于AI算法的高速手勢識別技術(shù),其產(chǎn)品平臺也兼容市場上其他手勢方案。
六、多人協(xié)同,端云結(jié)合,實(shí)現(xiàn)跨時(shí)空交互
元宇宙將改變我們的工作方式和生存空間, 跨時(shí)空的協(xié)同作業(yè)將是XR設(shè)備帶給我們的全新的交互能力, 其中快速環(huán)境理解與三維空間重建是實(shí)現(xiàn)跨時(shí)空協(xié)同作業(yè)的重要基礎(chǔ),傳統(tǒng)的三維重建要經(jīng)過掃描與后處理兩個(gè)階段,詮視科技基于其強(qiáng)大的端處理傳感器融合與VSLAM技術(shù)的結(jié)合,已實(shí)現(xiàn)實(shí)時(shí)三維重建、地圖創(chuàng)建與分享、場景識別、端云結(jié)合,為多人遠(yuǎn)程協(xié)作奠定了基礎(chǔ)。為虛擬仿真、數(shù)字孿生提供了快速部署的平臺。在2021進(jìn)博會上,詮視科技展示了云端渲染的三維虛擬沙盤技術(shù)、基于端云結(jié)合的沉浸式三維空間AR導(dǎo)航與場景識別技術(shù),完成了基于輕量化AR設(shè)備的端云結(jié)合大場景導(dǎo)覽的落地實(shí)踐?;?G的高帶寬低延遲云渲染技術(shù),讓多場景復(fù)雜模型的重渲染工作得以在云端實(shí)現(xiàn),不受系統(tǒng)算力影響,可多人共享云端渲染內(nèi)容和互動,提升了跨時(shí)空的交互體驗(yàn)。
七、沉浸式體積視頻內(nèi)容生成
基于強(qiáng)大的端處理傳感器融合能力,詮視科技的SlimEdge XR平臺支持提供帶有高精度同步深度點(diǎn)云和姿態(tài)信息的RGB視頻流,可用于體積視頻(Volumetric Video)的拍攝、XR內(nèi)容的快速制作以及三維物體重建,為元宇宙時(shí)代沉浸式UGC(User Generated Contents)生成提供了便利。制作者可以用頭戴XR設(shè)備進(jìn)行第一人稱視角拍攝,也可用詮視科技的獨(dú)立拍攝設(shè)備進(jìn)行第三視角拍攝。
八、核心技術(shù)平臺化助力元宇宙應(yīng)用落地
詮視科技從創(chuàng)立之初就堅(jiān)持算法與硬件相結(jié)合,從底層傳感器到產(chǎn)品平臺的發(fā)展路徑。在服務(wù)行業(yè)標(biāo)桿客戶的過程中,打造了全鏈條的核心技術(shù)與產(chǎn)品部署能力,相繼推出了多款A(yù)R/VR產(chǎn)品方案、機(jī)器視覺模組產(chǎn)品系列,目前以面向XR行業(yè)的基于感知交互核心技術(shù)的定制化ODM服務(wù)及標(biāo)準(zhǔn)化平臺產(chǎn)品交付兩個(gè)核心業(yè)務(wù)模式,助力元宇宙應(yīng)用落地。
“創(chuàng)新機(jī)器視覺感知能力,超越人類視覺極限”,是詮視科技團(tuán)隊(duì)的共同愿景。在元宇宙概念如火如荼的當(dāng)下,詮視科技將與所有生態(tài)伙伴一起,構(gòu)建通向元宇宙之路。
*聲明:新聞稿非VR陀螺官方稿,法律問題一律與VR陀螺無關(guān)。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文經(jīng)原作者授權(quán)發(fā)布,不代表VR陀螺立場,如需轉(zhuǎn)載請直接聯(lián)系原作者
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息