VR陀螺編譯/Frida.WS
日前,谷歌已經(jīng)向研究人員和開發(fā)團隊發(fā)布了一種可用于移動設備的手部追蹤方法,谷歌研究工程師Valentin Bazarevsky和范張(音譯)稱其為“手勢識別的新方法”。
早在今年6月份,谷歌就在CPVR 2019上首次發(fā)布了在線即時手部追蹤工具,供開發(fā)者們研究探索。這是一種開源的跨平臺工具,開發(fā)者們可以自己創(chuàng)建加工管道來處理視頻和音頻等感知數(shù)據(jù)。
據(jù)稱,這種方法可以通過機器實現(xiàn)高保真的手部和手指追蹤,僅從一幀圖像就可以推斷出手部的21個三維“關鍵點”。
Bazarevsky 和Zhang在一篇博客中說到,“目前先進的追蹤方法依然要依賴強大的桌面環(huán)境來推斷手部動作,但是我們的方法已經(jīng)可以在手機上實現(xiàn)實時識別,甚至可以擴展到多個手。”谷歌開發(fā)團隊希望這種手部追蹤方法能激發(fā)出“更有創(chuàng)造性的案例,以及新的應用程序和新的研究途徑”。
Bazarevsky和Zhang解釋說,在他們的手部跟蹤方法中主要有三個作用系統(tǒng),一個手掌探測器模型(稱為Blaze Palm),一個“手部標識”模型,帶有高保真的三維手部關鍵點,以及一個手勢識別器,可以把手部關鍵點的布局圖劃分為獨立手勢集。
以下是從博客全文中提煉出來的幾個細節(jié):
研究人員聲稱,在掌心檢測方面BlazePalm技術可以達到95.7%的平均檢測精準度。
模型已經(jīng)存入一致的內(nèi)部手勢,甚至可以識別部分遮擋的手部動作。
可以識別多種文化下的手勢含義,如美國、歐洲和中國,“拇指向上”、握拳、“OK”、“Rock”和“蜘蛛俠”等手勢。
Google是開源的,它在MediaPipe中的手部追蹤和手勢識別系統(tǒng)需要配合相關的首尾相連的使用場景和源代碼。
Bazarevsky和Zhang說,谷歌未來的研究計劃仍將放在手部追蹤方面,探索更強大和更穩(wěn)定的追蹤功能,并希望擴充可以檢測到的手勢數(shù)量。此外,他們還希望支持動態(tài)手勢追蹤識別,可能會為機器手語翻譯和流體手勢控制帶來好處。
不僅如此,配備更可靠的手持追蹤設備是AR頭顯向前邁進的必要條件;因為頭顯依然需要外部攝像頭來呈現(xiàn)虛擬世界,所以如何讓機器理解這個世界將一直是個待解決的問題。
原文鏈接:
https://www.roadtovr.com/google-hand-tracking-mediapipe/ |
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息