文/VR陀螺
“我等這一天已經(jīng)等了10年”。Misa在Rokid Jungle發(fā)布會上激動地說到。8月26日,不論是對于Rokid,還是對于Misa來說,都是具有歷史意義的一天。
時間撥回到25日晚上10點,經(jīng)過多輪時間調(diào)整,筆者終于抵達Rokid公司見到Misa。此時他還在就一些產(chǎn)品細節(jié)與技術(shù)Battle。從公司的創(chuàng)始人、技術(shù)負責人以及產(chǎn)品經(jīng)理、市場負責人,為了即將到來的一年一度的盛會“Rokid Jungle”正緊張有序地準備著。
歷時3個多小時,凌晨一點半這場采訪終于順利結(jié)束。本文除了帶來Rokid的新品體驗和點評之外,還更多融合了時勢下,Misa對市場的觀點與判斷,以及今后Rokid的走向。
凌晨1點,Misa與產(chǎn)品、技術(shù)正在調(diào)試
新增4800萬像素鏡頭,Rokid產(chǎn)品還在升級
雖然依舊是市場上常見的Birdbath光學的AR眼鏡,但此次軟硬件方面不乏諸多可圈可點之處。
此次發(fā)布的新品為主打空間計算的Rokid AR Studio套裝,包含一臺Rokid Max Pro以及獨立主機Rokid Station Pro,首先這兩款終端的硬件配置都相比上一代有所提升。
Station Pro使用高通XR2+ Gen1,該CPU是高通2022年10月推出的最新方案,較上代驍龍XR2性能提升了50%,散熱提升 30%,并且采用了全新的圖像處理管線,能夠?qū)崿F(xiàn)低于10ms的延遲。
主性能大幅提升之外,Station Pro還新增了一顆4800萬像素的攝像頭,完全可以代替手機使用,甚至性能、續(xù)航以及內(nèi)容豐富性各方面超過手機,而且還能為手機反向充電。
AR眼鏡連接手機的形態(tài)自2019年面世,以共享手機內(nèi)容生態(tài)、即插即用、Birdbath輕薄外形加上親民價格等諸多優(yōu)勢,很快成為AR眼鏡消費市場的主流形態(tài)之一。
是否真的有必要為其增加獨立的主機?這一問題困擾了團隊很久。據(jù)說Station這個項目最初立項時曾經(jīng)被斃掉3次,在Misa看來,這樣的產(chǎn)品并不符合Rokid的產(chǎn)品原則——Always on(始終開啟)、Quick in Quick out,Rich content(豐富內(nèi)容),但是嘗試之后沒想到這款產(chǎn)品竟然帶來了意想不到的效果,甚至掀起移動主機潮流。
根據(jù)Misa提供的數(shù)據(jù),超過90%的用戶選擇使用Station連接AR眼鏡,而非使用手機。
Station Pro還內(nèi)置了9軸IMU,可讓主機實現(xiàn)3DoF追蹤,使其作為操控手柄使用。在Misa看來,目前雖然暫時還無法完全實現(xiàn)Always on,至少已經(jīng)朝著Always Standby進步中。
作為公司的創(chuàng)始人,Misa如今是自己產(chǎn)品的重度用戶,他堅信,只有把自己放在用戶的角度,才能真正挖掘產(chǎn)品的價值。他也經(jīng)常與其他消費用戶交流獲取反饋,因此這次發(fā)布會上非常多Rokid的忠實粉絲到場應援,包括Rokid Max Pro攝像頭向下15度設計的idea都是來自用戶體驗反饋。
Rokid Station Pro搭配的AR眼鏡——Rokid Max Pro相對于上一代在參數(shù)上并無變化,只新增了一顆用于空間定位的攝像頭,其目的是為了能夠讓交互更為自然舒適。
此外,Max Pro在新增一顆攝像頭的前提下,重量比上一代僅增加了1g,依舊保持了非常輕薄的形態(tài)。
相對以上硬件,Rokid Jungle上圍繞軟件方面的進步要有意思得多。
十年蟄伏,與蘋果空間計算的“不謀而合”
“Rokid本質(zhì)上是一家系統(tǒng)軟件公司。”
“Rokid本質(zhì)上是一家隱藏在精美硬件產(chǎn)品中的系統(tǒng)軟件公司。”Misa在交流中和發(fā)布會上多次強調(diào)Rokid的定位。
2023年對于產(chǎn)業(yè)來說注定是被歷史銘記的一年,今年蘋果帶著Vision Pro正式加入戰(zhàn)局。而這一年,對于Rokid來說,也是具有轉(zhuǎn)折意義的一年。
“我等這一天已經(jīng)等了10年”。
“2013年在硅谷參加google發(fā)布會,現(xiàn)場第一次戴上谷歌眼鏡,兩個感受:1、非常棒的創(chuàng)新;2、我們可以做得更好。也正是這時候萌生了離開阿里創(chuàng)業(yè)的想法。2018年Rokid Jungle我們發(fā)布Rokid Glass第一代產(chǎn)品,第一次將思考變成真正的產(chǎn)品,又過五年后的今天,我們才真正交出答卷。”
“一群瘋子,一個夢想,十年光陰。”Misa感慨到。
夢想驅(qū)動的人身上總是閃耀著無形的光芒,交談之中溢于言表。提到蘋果的入局,Misa言談之中洋溢著興奮,對于這位消費電子市場的老大哥,除了尊敬、憧憬、敬佩之外,似乎還有某種默契。這些默契,最終在產(chǎn)品上呈現(xiàn)出來。
雖然是兩種完全不同的技術(shù)路徑,一種是基于VST(Video See Through)的VR產(chǎn)品形態(tài),另一種是基于OST(Optical See Through)的AR產(chǎn)品形態(tài),但在Rokid AR Studio的產(chǎn)品交互和功能上,的確看到了與蘋果“不謀而合”之處。Misa將其總結(jié)為以下3點。
1、完全兼容2D安卓內(nèi)容生態(tài)
首先是對2D內(nèi)容的兼容與空間化。在蘋果對外演示的Vision Pro視頻中,原有的2D應用可以變成空間中的一個程序框展現(xiàn),通過桌面空間可以將2D生態(tài)內(nèi)容直接轉(zhuǎn)化到3D空間中。
而基于Rokid最新的YodaOS-Master系統(tǒng),則是可以兼容所有安卓應用直接在系統(tǒng)中運行,發(fā)布會現(xiàn)場展示了在釘釘中直接打開APK文件安裝運行的視頻。Misa稱,在YodaOS-Master的系統(tǒng)上,以AOSP為底層,上面的整個Framework、引擎、框架都進行了大量的改造。
“比如我們一個Camera要做多個任務,既要做空間定位,又要實現(xiàn)手勢,都用一顆Camera,這個里面就對原來的安卓的整個操作系統(tǒng)做了大量的改進,而原來舊的2D生態(tài)內(nèi)容什么代碼都不用改就可以直接跑過來,讓他跑在底層的Sandbox里,所以應用在運行的時候,它以為自己跑在一個手機或者電腦上,實際上它是跑在一個Sandbox里面的,然后我們把它的交互再融匯到3D空間里面去。”
如今Rokid已經(jīng)積累了130多款內(nèi)容,Rokid專屬版應用包括bilibili、隨樂游、無影云電腦、影牛牛3D電影、咪視界等,涵蓋了絕大部分用戶日常工作、生活、娛樂中的應用類型。
2、自然頭手交互+微手勢
其次是更自然的交互方式,不過與Vision Pro主打手眼協(xié)同+語言交互不同的是,Rokid Max Pro支持多模態(tài)的交互方式。包括頭手交互、微手勢、3DoF手柄以及語音等多種交互方式。
頭手交互調(diào)用眼鏡的6DoF定位作為光標瞄準,結(jié)合簡單的“捏合”微手勢,類似PC的鼠標指針與鼠標點擊動作配合,不過指針移動轉(zhuǎn)變?yōu)轭^控。得益于眼鏡上向下傾斜15度的攝像頭設計,可以讓手在更舒適的位置被捕捉到。
在Misa看來,VR形態(tài)的設備上可以通過多傳感器來實現(xiàn)更精準的空間定位和交互,但是在需要保持輕薄的AR眼鏡產(chǎn)品上,考慮到重量、功耗、設計的復雜度,要盡可能減少Sensor,所以Rokid一直在推進單攝Slam。
在Rokid內(nèi)部,對于產(chǎn)品重量有著及其嚴苛的管理,以0.2g為單位,只要調(diào)整重量幅度達到0.2g就必須向Misa匯報。所以單攝也成為了Rokid踐行的“執(zhí)念”。
關于單攝Slam的難點可以參考VR陀螺之前發(fā)布的內(nèi)容:《單攝實現(xiàn)SLAM定位與3D手勢背后的難點與突破》
“AR實驗室”是Rokid內(nèi)容生態(tài)中以空間交互為核心的AR內(nèi)容合集。在現(xiàn)場,筆者體驗了諸多AR內(nèi)容,其中讓筆者印象比較深刻的包括以下幾款:
《完美弧線》:這是一看籃球投籃游戲,在眼鏡前伸手,球就會自動吸到手中,面向前面的籃筐擺出投籃姿勢,即可將籃球投出去。內(nèi)容簡單有趣,球設置了物理機制,根據(jù)手揮動的速度和角度,模擬真實的拋物線,或許是由于命中率比較高,成為了眾多AR游戲中最有人氣的一款。
《飛鏢大賽》:與籃球相似,擺出捏取飛鏢的手勢,虛擬飛鏢即可附著在手上,瞄準、扔出,同樣非常簡單有趣。
《指尖戰(zhàn)爭》:PVP策略塔防游戲,兩人各據(jù)一方,利用不同兵種的士兵、武器以及道具研究作戰(zhàn)策略,應對敵方攻擊,守住己方城墻。對戰(zhàn)沙盤呈現(xiàn)在眼前,用手捏住士兵或者投石車,將其放置到沙盤中,小兵和車就會自行前進攻擊敵人。
諸如此類有意思的小游戲還有很多,如用手勢捏合就能控制跳躍力度的《跳一跳》、握拳就能變成錘子打地鼠的《打地鼠》游戲、通過手勢控制拼合方向的《2048》、寓教于樂的天體教學內(nèi)容《上帝之手》,將宇宙行星玩弄于鼓掌之中……
整體體驗來看,單目Slam的穩(wěn)定性和精準度現(xiàn)階段必然比不上多傳感器方案,這也是Rokid在接下來的軟件算法迭代中需要持續(xù)改進的部分,但對于日常使用和體驗小游戲來說影響不大,特別是“微手勢”融合后,整體交互的舒適度大幅提升,在筆者體驗過程中也從未出現(xiàn)手勢誤判、誤操作等情況。
3、3D空間內(nèi)容呈現(xiàn)
當我們與信息的交互方式從二維變成三維,它所展現(xiàn)的形式也應該有所變化。
“空間搜索”功能是Rokid Max Pro中極其有亮點的功能之一,相對于其他產(chǎn)品最大的變化在于改變了信息在空間中的組織和呈現(xiàn)方式,正如信息大爆炸一樣,如使用語音說“搜索Rokid Station”,系統(tǒng)將自動識別“搜索”兩字并理解用戶指令,從而呈現(xiàn)出與Rokid Station相關的所有網(wǎng)頁和視頻,而基于一定的算法,使內(nèi)容按照相關性前后排列。
選中其中一個視頻或者內(nèi)容,通過手捏合后,該窗口將被至于最前方并放大,同時其中的音視頻畫面也同步開始播放;而切換至其他內(nèi)容也只需重復同樣的操作即可。
“Rokid在做空間計算的時候,我們空間交互是用來回答一個什么問題,就是真正在空間里面信息的組織跟呈現(xiàn)方式會不會有一個巨大的變化,所以搜索就是一個幾乎到今天為止,所有體驗過的人都非常喜歡的功能。”
當筆者問到,未來Rokid是否要推出AR時代的瀏覽器,Misa表示,“空間搜索”所呈現(xiàn)出來的是一種信息的組織和呈現(xiàn)方式,這個框架將作為底層,延展到其他更多的應用中去。如短視頻內(nèi)容、文章內(nèi)容、圖片信息等等,組織與呈現(xiàn)都可以采用該框架來實現(xiàn)。
相對于傳統(tǒng)的平面展示,“空間搜索”將空間巧妙地利用起來,結(jié)合頭手交互,帶來了極其自然且便捷的信息搜索展示方式,而這也是眾多科幻電影中經(jīng)常出現(xiàn)的場景,在Rokid Max Pro中成為現(xiàn)實。
在Rokid AR Studio套裝體驗過程中,筆者發(fā)現(xiàn)了很多細節(jié)部分,如攝像頭向下傾斜15度以便更好地捕捉用戶手勢;桌面模式內(nèi)可以放置至多5個應用窗口,切換多種查看模式;窗口操作按鍵位于窗口下方,方便頭控使用;為了更好地識別語音指令,采用雙線性降噪麥克風;舍棄傳統(tǒng)語音喚醒詞,直接以“搜索xxx”作為指令格式……
誠然,它的配置與蘋果Vision Pro仍有一定的差距,但在Rokid的產(chǎn)品上,我們看到了在硬件極度受限的當下,團隊在軟件與交互上的思考與用心。
AR進入“個人計算平臺”第二階段,三大戰(zhàn)略迎接持久戰(zhàn)
“克制”,在與Misa交流的過程中頻繁聽到的一個詞。
“我們跟其他的廠商最大的區(qū)別就是‘克制’。我們的產(chǎn)品都非??酥?,比如像當時我們出Station的時候,所有人都不明白為什么要出一個Station,但等到出來之后大家就明白了,原來這個才是用戶真的現(xiàn)階段最想要的東西。雖然想上的東西很多,但消費者不會買單,所以Max Pro你會發(fā)現(xiàn)它也特別克制,沒有放ToF這一堆傳感器,只加了一顆普通的攝像頭,然后把能力限定在當前它能做的這幾件事的范圍內(nèi)。”
“我們考慮的重點就是,把重點放在一個稍微不受資源限制的領域——軟件,硬件是整個生態(tài)的能力,Rokid沒有辦法通過一己之力改變整個硬件生態(tài),至少今天做不到。但是軟件是我們所有的人可以發(fā)力,并且相對來說可以擺脫當前的限制。”
“所以你可以想象一下,當我們這個產(chǎn)品的FOV變得更大的時候,我們的操作系統(tǒng)其實早就適應在這里了。未來隨著硬件底層技術(shù)推進,F(xiàn)OV越來越大,硬件越來越輕,續(xù)航力越來越強,算力越來越高,硬件的門檻變得越來越低且同質(zhì)化,但是從軟件和操作系統(tǒng)上,我們該準備的早就準備好了,所以這是Rokid的延伸變化。”
空間計算時代的“Android”,Misa給自己與公司定下了這樣一個宏大的目標。
在Misa看來,無論是VST實現(xiàn)的AR還是OST所實現(xiàn)的AR,殊途同歸,所有人都在朝著一個目標前進。
“未來分成兩撥,這是一個地圖的中間,有兩撥人從不同的出發(fā)點往中間出發(fā),最后就看誰先到,我個人覺得今天都可能在半路中。VST的AR、我們OST的AR,傳統(tǒng)大家理解的AR都在半路中,就看誰先到,因為最后誰先到誰會占有生態(tài)優(yōu)勢。實際上這兩撥人,不管外面打的多兇,都是為了實現(xiàn)一個效果——虛實融合。”
“AR領域已經(jīng)進入第二階段——系統(tǒng)軟件和生態(tài)之爭。當然AR還是有人會去做一些工具類的特定場景的應用,但是從未來的個人計算平臺來講,它一定是變成一個操作系統(tǒng),整個生態(tài)競爭。與智能手機不同的是,眼鏡必須強調(diào)個性化,Spec與交互必須統(tǒng)一,所以這也是Rokid將重心放在軟件系統(tǒng)的核心所在。”
未來Rokid計劃將系統(tǒng)開放,為更多硬件產(chǎn)品賦能,從底層系統(tǒng)到開發(fā)工具、算法能力、內(nèi)容生態(tài)全方位提供支持。
知易行難,創(chuàng)業(yè)公司要實現(xiàn)空間計算時代的“Android”談何容易,持久戰(zhàn)不光需要號召力,還需要充足的糧草和彈藥。
不過此次發(fā)布會上,我們看到了Rokid的號召力。Google、高通、Unity、Bilibili、移動咪咕、釘釘、英偉達等知名企業(yè)高管、眾多內(nèi)容開發(fā)團隊,以及伴隨著Rokid一路成長的忠實粉絲們紛紛到場,共同見證Rokid這一“里程碑”式的盛會。
Rokid也向他們展示了這一路走來的耀眼成績。據(jù)稱,Rokid AR眼鏡服務用戶數(shù)量已經(jīng)超過100萬,日活用戶超3萬,月活用戶超過40%,用戶單日人均使用時長大于1小時,且應用、內(nèi)容付費率達到20%;在車載AR娛樂領域,Rokid在新勢力汽車品牌中市占率達到70%。Misa表示,去年Rokid在C端的產(chǎn)品銷量為6萬臺,今年有望達到15-20萬臺。
即便如此,與智能手機等其他成熟的消費電子市場相比,AR仍是個嗷嗷待哺的寶寶。加上經(jīng)濟環(huán)境下行,未來幾年仍逃不過“熬”的局面。
“今年有消費力,沒有消費欲,真正的挑戰(zhàn)是明年。”為了迎接更為嚴峻的市場挑戰(zhàn),Misa早早準備了三大戰(zhàn)略:
1、以B帶C
“以B帶C就是在B端打磨新的技術(shù)放到C端驗證。一個新的技術(shù)出來到底靠不靠譜,讓用戶去實驗是很麻煩的,它的代價很大。但這個技術(shù)我們知道明確能解決一個非常具體的問題,我們就把特別需要解決這個具體問題的客戶先作為科技產(chǎn)品的踐行者,驗證這個沒問題我們就把這個技術(shù)引過來。”
2、以輕帶重
“Rokid在2021年推出的AR產(chǎn)品,并不是真正意義上的AR,它是眼鏡形態(tài),也可以叫它智能眼鏡。它的定義是非常輕的,不是重量輕,比如說觀影、娛樂,還是回到舊生態(tài),大家把佩戴舒適性放在第一位。然后逐漸的,眼鏡能不能加一些比如空間定位,我們聽到很多用戶的聲音,再把這些聲音變成產(chǎn)品的結(jié)構(gòu),所以這個叫以輕帶重,這是一個非常具有歷史意義的東西。”
3、以硬帶軟
“以硬件為載體來不斷驗證軟件能力,為公司帶來現(xiàn)金流收入的同時,能夠投入更多精力開發(fā)軟件系統(tǒng)。我不做別人已經(jīng)做得非常優(yōu)秀的東西,即便我跟他做得一樣優(yōu)秀我都不會碰,這是一個基本原則,因為我沒有必要去浪費社會的資源和人的才華。我們要做就做別人做不到或者做得到,但做得不夠好,我們可以做得更好的東西。”
結(jié)語
縱觀這些年的AR市場,相比傳統(tǒng)科技、手機巨頭,創(chuàng)業(yè)公司似乎更為激進,更敢于創(chuàng)新。
面對大廠都保守謹慎的當下,以及這條全新的賽道,創(chuàng)業(yè)公司往往要承擔更大的風險和不確定性,而這些往往是致命的。
“我覺得如果我是那些大公司可能也會做相同的決策,一家企業(yè)的發(fā)展,什么時候比較健康或者符合我們的預期,它有能夠不斷的推動自己往前發(fā)展的力量就夠了,過大過小都不一定是好事。尤其是對于制造型的企業(yè),對于硬件產(chǎn)品型的企業(yè)還是要遵循客觀的規(guī)律,你的品牌分銷、營銷、用戶場景、用戶價值之類的東西都需要考慮到。”
“但是對于Rokid來說,50萬臺、100萬臺、200萬臺可能就是一個非常好的能夠保持自己健康往前循環(huán)的結(jié)果,但是放到大公司可能就非常尷尬,所以時間不完全是技術(shù)決定的,還跟他的使命,跟他整個團隊所能夠獲得到的支持也有關系。”
在Misa看來,當下,就是創(chuàng)業(yè)者最好的時機。引用埃隆馬斯克的一句話:“創(chuàng)新就是企業(yè)最大的門檻,而不是供需,你今天所有的守舊的東西未來都會變成你的枷鎖。”
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權(quán)不得轉(zhuǎn)載。如需轉(zhuǎn)載請聯(lián)系微信:vrtuoluo233 申請授權(quán),并在轉(zhuǎn)載時保留轉(zhuǎn)載來源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉(zhuǎn)載法律必究。文中有圖片、視頻素材來自互聯(lián)網(wǎng)或無法核實出處,如涉及版權(quán)問題,請聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息