編譯/VR陀螺
今天,美國專利商標(biāo)局正式授予蘋果公司一項專利,該專利涉及提供精煉的合成數(shù)據(jù)的方法、系統(tǒng)和/或技術(shù),例如用于訓(xùn)練機器學(xué)習(xí)模型。蘋果公司的專利描述了機器學(xué)習(xí)如何與設(shè)備上的3D運動相機結(jié)合使用,以更好地準(zhǔn)確解釋手勢、姿勢等。
蘋果公司的專利圖1是一個邏輯框圖,說明了一個被配置為實現(xiàn)一個或多個系統(tǒng)、方法和/或技術(shù)的系統(tǒng);圖2說明了合成圖像和相應(yīng)的真實圖像之間的數(shù)據(jù)分布差距;圖9A和9B說明了一個示例的深度幀和相應(yīng)的合成圖像,用于一個例子的手部姿勢數(shù)據(jù)集。
圖源:patentlyapple
蘋果公司指出,生成器(圖1,#120)可以與合成器#110耦合,從而允許合成數(shù)據(jù)(例如,合成圖像)被細化,例如使其更加真實。根據(jù)各種實施方案,所得到的精煉合成數(shù)據(jù)可用作其他機器學(xué)習(xí)應(yīng)用的訓(xùn)練數(shù)據(jù)(而不是真實數(shù)據(jù)),如文本檢測、文本分類、字體識別、物體檢測、物體分類、手部姿勢檢測、手部姿勢估計、手部姿勢分類、場景識別、人體姿勢檢測、人體姿勢估計和/或人體姿勢分類。
更具體地說,根據(jù)一個實施方案,蘋果公司的上述圖9A說明了一個示例深度幀,圖9B說明了手部姿勢數(shù)據(jù)集的相應(yīng)合成圖像。例如,在一個示例性實施例中,合成器#110可以被配置為基于包括由多個三維運動捕捉相機(例如,一個正面和2個側(cè)面視圖)捕獲的訓(xùn)練幀的手部姿勢數(shù)據(jù)集生成合成手部姿勢圖像。例如,在一個例子中,可以使用來自正面相機的深度幀。
蘋果公司的專利圖10說明,根據(jù)一個實施方案,來自手勢數(shù)據(jù)集的真實圖像樣本。
蘋果公司描述了手勢被解釋為 "通用計算機系統(tǒng)",如iMac和 "其他設(shè)備",這也可能適用于他們未來的混合現(xiàn)實頭顯,眾所周知,混合現(xiàn)實頭顯提供上述的多個三維運動捕捉相機系統(tǒng)。
至少從2016年開始,蘋果就一直在研究手勢識別。想了解更多關(guān)于這項技術(shù)性很強的專利細節(jié),請查閱蘋果的授權(quán)專利US 11475276 B1。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息