編譯/VR陀螺
近日,一份蘋果公司的新專利曝光,該專利與一個新的轉(zhuǎn)錄應(yīng)用有關(guān),更具體地說,與對話和環(huán)境轉(zhuǎn)錄的生成和協(xié)助有關(guān)。蘋果公司的專利描述了生成轉(zhuǎn)錄和提供主動及被動的轉(zhuǎn)錄協(xié)助的技術(shù)。該應(yīng)用程序?qū)⒂糜趇Devices、Mac和蘋果未來MR頭顯上的FaceTime通話或辦公室電話會議。
蘋果公司在其專利背景中指出,傳統(tǒng)系統(tǒng)不能有效地根據(jù)這些轉(zhuǎn)錄內(nèi)容提供主動和被動協(xié)助,這種系統(tǒng)也不能有效地根據(jù)對話背景或環(huán)境因素生成轉(zhuǎn)錄內(nèi)容。例如,傳統(tǒng)系統(tǒng)沒有為用戶提供有效的手段,使其能夠根據(jù)特定的參數(shù),如對話主題、環(huán)境條件等,快速審查轉(zhuǎn)錄的部分內(nèi)容。這樣的系統(tǒng)也沒有根據(jù)用戶的注意力狀態(tài)為用戶提供幫助,例如當用戶從對話中分心時為用戶提示等等。因此,需要一種用于轉(zhuǎn)錄和轉(zhuǎn)錄輔助的改進系統(tǒng)。
蘋果公司的專利描述了生成轉(zhuǎn)錄和提供主動及被動轉(zhuǎn)錄協(xié)助的技術(shù)。
一般來說,轉(zhuǎn)錄可以幫助用戶回顧和總結(jié)與對話或各方之間其他互動有關(guān)的信息。鑒于設(shè)備間對話交流的增加,以及此類設(shè)備上的技術(shù)進步,現(xiàn)在人們可以有效利用對話轉(zhuǎn)錄。
此外,各種技術(shù)可以有助于關(guān)于環(huán)境的有效翻譯,例如與擴展現(xiàn)實或類似技術(shù)有關(guān)的環(huán)境。
總的來說,蘋果公司的專利涵蓋了轉(zhuǎn)錄和轉(zhuǎn)錄協(xié)助的系統(tǒng)和流程。例如,獲得用戶和至少一個對話參與者之間的對話文本表述。基于該文本表述,確定與該對話相關(guān)的內(nèi)容,其中該內(nèi)容包括用戶的第一輸入和至少一個對話參與者的第二輸入中的至少一個。響應(yīng)于該內(nèi)容與預(yù)定義內(nèi)容相關(guān)聯(lián)的確定內(nèi)容,基于該內(nèi)容確定文本表示法的一部分。基于確定的部分,提供響應(yīng)于第一輸入和第二輸入中至少一個的輸出。
圖源:patentlyapple
蘋果公司的專利圖8A/C/E說明了一個轉(zhuǎn)錄和轉(zhuǎn)錄輔助的過程。
更具體地說,蘋果公司的專利圖8A,說明了在一個用戶和一個或多個其他用戶之間設(shè)置了一個對話。該對話可以對應(yīng)于語音通信(如電話),F(xiàn)aceTime電話會議,通過社交媒體平臺的對話,以及在AR/VR環(huán)境下的對話。
例如,iPhone(電子設(shè)備#800)的用戶可能正在與其他用戶進行電話交談。在對話進行的同時,可以獲得對話的文字表述(例如,轉(zhuǎn)錄)。
這個應(yīng)用程序的另一個特點可以包括一個提示,其中包括與對話的轉(zhuǎn)錄有關(guān)的各種選項。例如,該提示可進一步為參與者提供選項,以匿名或以其他方式修改或消除各參與者輸入的識別信息,從而使獲得的文本表示內(nèi)容包括各參與者的修改輸入。
修改后的對話文本表述可以包括各種修改,如匿名的用戶名(例如,"用戶A:你好"),修改后的文本表述也可以省略各種信息項目,如個人信息(例如,地址、電話號碼、賬戶號碼等)。
然后從與各參與者相關(guān)的設(shè)備中接收對所提供的提示的響應(yīng),包括可以批準轉(zhuǎn)錄、拒絕轉(zhuǎn)錄或以其他方式批準各參與者的修改版轉(zhuǎn)錄的響應(yīng)。
轉(zhuǎn)錄的啟動可以以各種方式發(fā)生。例如,在啟動對話和向各用戶發(fā)送轉(zhuǎn)錄批準提示之前,用戶可以通過各種配置或設(shè)置來指示對轉(zhuǎn)錄對話的期望。
用戶也可以在已經(jīng)建立的對話中提供輸入,例如,通過激活圖8A中的活動通話屏幕上描繪的指示(圖標)#802。在一些例子中,該圖標可用于在活動呼叫屏幕和對話的文本表示(部分通過圖8B討論)之間切換,例如,當轉(zhuǎn)錄已經(jīng)開始時。
在一些例子中,轉(zhuǎn)錄的啟動可以根據(jù)各種背景信息發(fā)生。例如,對話的轉(zhuǎn)錄可因超過各自的閾值而啟動,例如噪音閾值(如用戶在擁擠的超市內(nèi)進行視頻通話)。
作為另一個例子,轉(zhuǎn)錄可以根據(jù)對各種觸發(fā)詞或短語的檢測而啟動。具體來說,參與對話的一個或多個用戶可以說出一個短語,如 "你能重復(fù)一下嗎?""再說一遍""那是什么?"等等。在一些例子中,觸發(fā)詞或短語可以對應(yīng)于電子設(shè)備的用戶開始轉(zhuǎn)錄的明確請求,如"現(xiàn)在開始轉(zhuǎn)錄"。
一般來說,可以向用戶提供使用文本表示法的主動和被動協(xié)助,并且可以基于各種因素。參照圖8B,在一些例子中,基于文本表示法識別與對話相關(guān)的內(nèi)容,其中該內(nèi)容包括來自iPhone用戶和/或?qū)υ挼钠渌麉⑴c者的一個或多個輸入。這種輸入通常可以觸發(fā)來自iPhone(和/或與對話相關(guān)的其他設(shè)備)的反應(yīng)性協(xié)助。
特別是,該輸入可以對應(yīng)于語音輸入、文本輸入、來自激活各種圖標的輸入、控制一個或多個輔助設(shè)備等。例如,用戶可以激活一個靜音按鈕,在對話中分享各種媒體項目,控制虛擬環(huán)境中的虛擬對象,等等。
圖源:patentlyapple
蘋果公司的專利圖9A-9B說明了一個轉(zhuǎn)錄和轉(zhuǎn)錄輔助的過程。在共處會話中(例如,在AR/VR環(huán)境中),各種對象或用戶的虛擬化身可以圍繞用戶的觀察視角移動,進入或退出環(huán)境。
MR頭顯內(nèi)的FaceTime通話中的轉(zhuǎn)錄應(yīng)用可以包括附加功能。例如,在專利圖9A中,圖像900可以對應(yīng)于用戶的客廳,該客廳實際位于喬治亞州的亞特蘭大市。還可以獲得與當前位置相對應(yīng)的天氣信息,如 "晴天+70度"。這可以在頭顯圖像中說明正在與你交談的人的情況。
在蘋果公司的專利圖9B中,可以檢測到與表征#900相關(guān)的事件,如第三位用戶進入環(huán)境。相應(yīng)地,可以根據(jù)檢測到的事件檢索一套更新的標識符。例如,一個物理用戶可以到達由#900表示的位置,例如通過走過#902門。
或者,用戶可以進入虛擬會話(例如,使用呼入或登錄信息),這樣,與用戶相關(guān)的頭像就會顯示在#900表示內(nèi)。
想要了解更多詳情,請查閱蘋果公司的專利申請WO2022266209。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息