文/VR陀螺 冉啟行
在 iOS 18.2 Beta 2 上,蘋果 Visual Intelligence(視覺智能)正式登場。
作為 Apple Intelligence 的一部分,Visual Intelligence 是 iPhone 16 系列上的「獨占」功能。主要通過 iPhone 16系列上新增的相機(jī)按鈕,利用攝像頭捕捉物理世界的對象,并通過大模型分析有關(guān)該物體的「深度和有用信息」。
例如,拍攝餐廳的照片,用戶可以立即獲得其營業(yè)時間、評價和菜單等詳細(xì)信息;拍攝活動傳單的照片,該工具可以提取并整理重要詳細(xì)信息,例如活動的名稱、日期和地點。
Visual Intelligence 配合 iPhone 16 系列的相機(jī)按鈕,具有免解鎖、一鍵 AI 的特性,相對之前的 iPhone 或其他設(shè)備而言,具有更高效率。
基于 Visual Intelligence ,蘋果也為接下來的 AI、AR 眼鏡做了足夠的技術(shù)鋪墊、場景探索與用戶習(xí)慣的養(yǎng)成。Ray-Ban Meta 已經(jīng)證明了 AI 眼鏡技術(shù)路徑的可行性,蘋果也于近日啟動了代號為「Atlas」的智能眼鏡項目,一場巨變正在醞釀。
相對文字形式,圖形圖像屬于典型的空間數(shù)據(jù),是人們?nèi)粘+@取信息最主要的方式。Visual Intelligence 的出現(xiàn),讓這種信息獲取現(xiàn)在有了更數(shù)字化的方式。
海外媒體在 iOS 18.2 Beta 的評測信息顯示,當(dāng) Visual Intelligence 界面打開時,只需點擊相機(jī)快門按鈕即可拍照。然后,用戶可以點擊屏幕上的按鈕向 ChatGPT 詢問圖片,也可以按搜索按鈕啟動 Google 搜索。用戶可以選擇在沒有帳戶的情況下使用 ChatGP;如果不登錄,請求將保持匿名。
從下方的三張圖中,分別展示了利用 Visual Intelligence 進(jìn)行「識別物體」,「計算食物卡路里」,以及「提取重要信息」的場景,不管是利用「物體圖片進(jìn)行檢索文字信息」,還是利用「圖片上的文字檢索更深度的圖片、文字信息」,Visual Intelligence 都能很好地給出答案。
不同的是,一些是顯而易見的基礎(chǔ)信息,一些是需要網(wǎng)絡(luò)數(shù)據(jù)的挖掘匹配,還有一些是需要持續(xù)對話進(jìn)行挖掘。當(dāng)然,這些取決于前置的 Prompt,如果有更完善的 AI 工作流設(shè)定,相信它會基于每種不同的物體,甚至不同的用戶,給出千人千面的答案。如:當(dāng)識別圖片物體為「食物」時,自動去分析它的「卡路里」以及相關(guān)營養(yǎng)信息,而不僅僅是告訴我,它是什么,將會進(jìn)一步提升效率。
圖源:CNET
圖源:Future
圖源:Apple
雖然 Visual Intelligence 與 Google Lens,或者百度的 AI 識圖十分相似,但 Visual Intelligence 的與眾不同之處在于它直接在 iPhone 上處理所有內(nèi)容,而不是將數(shù)據(jù)發(fā)送到云端。
蘋果軟件工程高級副總裁 Craig Federighi 指出,Visual Intelligence 使用設(shè)備內(nèi)處理技術(shù)結(jié)合蘋果自己的服務(wù)。這意味著用戶的照片將保持私密,不會上傳到外部服務(wù)器。
iOS 18.2 預(yù)計將于 12 月份第一周面向美國地區(qū)正式推送。Visual Intelligence 是一個非常高效率的工具,將帶來更好的 AI 交互提升與應(yīng)用變革。
對于 AI 圖像圖形識別來說,目前智能手機(jī)無疑是最方便的電子產(chǎn)品,不過從交互維度來說,帶攝像頭的 AI/AR 眼鏡或是更好的載體,至少讓用戶可以空出雙手,不用一直握持 iPhone。
圖源:tomsguide
據(jù)外媒消息,有知情人士透露,蘋果于近日開啟了一項全新的內(nèi)部研究,該研究重點聚焦于智能眼鏡的開發(fā)。
據(jù)稱,這個新項目的代號為 Atlas。蘋果收集了員工對于智能眼鏡的看法,負(fù)責(zé)該計劃的團(tuán)隊也向部分選定的員工發(fā)送了電子郵件,以此確認(rèn)了在這一領(lǐng)域的產(chǎn)品研究情況。
當(dāng)蘋果計劃推出新的品類產(chǎn)品時,通常會組建秘密小組。公司傾向于收集員工而非客戶的反饋,目的在于保持計劃的保密性。這些情況充分表明,蘋果有意大力推進(jìn)開發(fā)自己的智能眼鏡的想法。
值得注意的是,報道稱這項研究由蘋果硬件工程部門的產(chǎn)品系統(tǒng)質(zhì)量團(tuán)隊領(lǐng)導(dǎo),其中并未提及蘋果的 Vision 部門,這意味著蘋果這款智能眼鏡是不帶光機(jī)的 AI 音頻眼鏡,與 Ray-Ban Meta 類似。結(jié)合早前蘋果決定推遲 AR 眼鏡的研發(fā)信息來看,具有較高可信度。
相對于 AR 智能眼鏡而言,AI 音頻眼鏡不僅技術(shù)門檻相對更低,且供應(yīng)鏈也十分成熟,體積重量上也普遍能做到 50g 以內(nèi)的輕薄佩戴體驗。不少業(yè)內(nèi)人士認(rèn)為 AI 音頻眼鏡是未來全彩 AR 眼鏡重要的過渡產(chǎn)品,在目前消費市場中具備較高的市場競爭力。
蘋果擁有一整套最強(qiáng)的生態(tài)聯(lián)動,正如 AirPods 與 iPhone 連接的高效率表現(xiàn)。蘋果如果將 AI 眼鏡定義為 iPhone 的「配件」,內(nèi)置攝像頭與麥克風(fēng),利用 iPhone 的 AI 算力,連接 Visual Intelligence 與加強(qiáng)版 Siri,充分利用自身的硬件生態(tài),那將會是一個更加驚艷的硬件。
在所有可穿戴設(shè)備中,AI 眼鏡擁有諸多先天產(chǎn)品設(shè)計上的優(yōu)勢,可配備第一人稱視角的攝像頭,所見即所得;近嘴的麥克風(fēng),更好地拾音效果;近耳的揚聲器,更好地人機(jī)交互??梢哉f,目前蘋果在 iOS 上所儲備的 Visual Intelligence 與加強(qiáng)版 Siri 等 AI 技術(shù)都能在 AI 眼鏡上得到更好的實現(xiàn)。
一直以來,蘋果的消費級硬件都以「技術(shù)創(chuàng)新」和「場景創(chuàng)新」聞名,在 AI 眼鏡上,我們也可以期待一下,蘋果是否能做出一款真正超越 Ray-Ban Meta 的 AI 眼鏡產(chǎn)品,滿足一些額外的消費需求。
當(dāng)然,與 Ray-Ban Meta 等第三方設(shè)備相比,從使用效率、連接體驗上來看,手機(jī)廠商自身的硬件生態(tài)組合本身就會有一些明顯優(yōu)勢,即使前者具備先發(fā)優(yōu)勢。
眼鏡品類在目前的消費市場的確是一個大眾產(chǎn)品,但也并非完完全全是一個生活「必需品」。對于無需近視矯正、戶外遮陽的用戶來說,佩戴眼鏡事實上是一件非常困難的事。就個人而言,在沒有養(yǎng)成眼鏡佩戴習(xí)慣之前,即使 20-30g 的眼鏡長時間佩戴也是一件非常困難的事,除非它真的能給我?guī)韮r值增量,就像 AirPods 和 Apple Watch 那樣。
在古希臘神話中,Atlas(阿特拉斯)是擎天巨神,屬于泰坦神族,他被宙斯降罪用雙肩支撐蒼天。從命名上來看,蘋果對于這款硬件寄予厚望。然而,蘋果的 AI 眼鏡系列,能否真正支撐其蘋果智能穿戴、甚至計算平臺的下一個十年呢?
答案留給時間。