編譯/VR陀螺 豌豆
Meta CTO兼Reality Labs負(fù)責(zé)人Andrew Bosworth于12月18日在Meta官網(wǎng)發(fā)表一篇以“Living in the Future”為主題的長文,重點(diǎn)提到了2023年Meta在人工智能和元宇宙領(lǐng)域的發(fā)展,并暢想未來生活。以下為文章的核心要點(diǎn)以及正文部分編譯:
比爾·蓋茨曾經(jīng)說過,“我們總是高估在一兩年中能夠取得的成績,而低估了長達(dá)5年甚至10年的能取得的進(jìn)展。”個人的突破往往是以非線性的方式積累起來的,直到突然之間,在未來的某個時刻成為焦點(diǎn)。俗話說,取得突破的方式有:“Gradually, then suddenly”(量變引起質(zhì)變)。在Meta取得了堪稱瘋狂的技術(shù)進(jìn)步12個月之后,我(Andrew Bosworth)認(rèn)為2023年是“suddenly”的一年。
上個月,Meta慶祝了Fundamental AI Research(FAIR)實(shí)驗(yàn)室成立十周年。當(dāng)Meta在2013年啟動該實(shí)驗(yàn)室時,整個行業(yè)都對AI在未來將發(fā)揮的作用感到無比興奮,而早期的機(jī)器學(xué)習(xí)應(yīng)用已經(jīng)在Facebook上發(fā)揮了核心作用。當(dāng)時,很少有人能想象到AI會取得如此令人矚目的進(jìn)展。事實(shí)上,就在兩年前,許多人可能還對此表示質(zhì)疑。
展望2024年,另一個重要的里程碑即將到來:自Meta開始在Reality Labs研發(fā)未來新的計算平臺以來,已經(jīng)過去了10年。AI和元宇宙這兩項(xiàng)新興技術(shù)代表了Meta對未來最大的長期賭注。而在2023年,Meta開始看到這兩項(xiàng)技術(shù)以產(chǎn)品的形式集成在一起,供多數(shù)人使用。
人工智能
這一年的亮點(diǎn)之一是Meta的Llama和Llama 2受到了開發(fā)者社區(qū)的歡迎,下載量超過1億次,目前仍在不斷改進(jìn)。在印度,Jio對其進(jìn)行了快速微調(diào),為其5億多客戶提供了新的服務(wù)工具。在HuggingFace的開放式LLM排行榜上,以Llama 2為基礎(chǔ)構(gòu)建的項(xiàng)目層出不窮,并獲得了較高的關(guān)注度。而這些只是托管在那里的13,000多個Llama變體中的一小部分。
與任何新技術(shù)一樣,如果每個人都能使用AI,那么它將產(chǎn)生更大的影響。就在不久前,大多數(shù)人還無法通過文字提示生成精美的圖片。但如今,我們已經(jīng)在全球數(shù)十億人使用的產(chǎn)品中加入了基于AI的協(xié)同創(chuàng)作生成圖像、聊天助手、寫作助手和智能圖像編輯器等工具。
圖源:Meta
平臺的轉(zhuǎn)變
根據(jù)Meta在過去一年中看到的變化表明,AI已成為人們與機(jī)器互動的主要方式。一切都已準(zhǔn)備就緒,新型設(shè)備能夠以前所未有的方式感知、理解我們周圍的世界并與之互動。
而搭載AI技術(shù)的Ray-Ban Meta智能眼鏡就展示了這樣一條道路。Meta AI助手結(jié)合了視覺和語言理解能力,能夠從用戶的視角觀察并理解現(xiàn)實(shí)世界。Meta正在智能眼鏡上測試新的多模態(tài)AI功能。啟用該功能后,智能眼鏡可以翻譯用戶正嘗試閱讀的外語,或者為用戶拍攝的照片添加有趣的主題。而且,它們可以免抬手完成多種操作,用戶無需掏出手機(jī)或操作應(yīng)用程序。
Andrew Bosworth展示智能眼鏡的多模態(tài)AI新功能 (來源:Meta)
(Andrew Bosworth此前在Instagram透露,新的Meta多模態(tài)AI計劃在2024年正式面向公眾發(fā)布,目前仍在測試階段。并親自佩戴Ray-Ban Meta智能眼鏡測試了該功能:他面朝墻上的壁掛裝飾,向智能眼鏡詢問:“嘿M(fèi)eta,告訴我你看到了什么?”他的手機(jī)則顯示:“我看到一個加利福尼亞州形狀的木雕,上面安裝了LED燈,形成了一個美麗而現(xiàn)代的裝飾品。”)
Meta認(rèn)為,前沿AI最強(qiáng)大的表現(xiàn)形式之一就是像Meta AI這樣的助手,它能理解用戶周圍的世界,做到全天候支持且無需提示。眼鏡是實(shí)現(xiàn)這一目標(biāo)的理想外形,它可以從用戶的視角觀察和聆聽世界,目前已經(jīng)為社會所接受,用戶可以選擇全天佩戴,讓自己時刻保持專注。
在Reality Labs,團(tuán)隊投入了多年時間研究實(shí)現(xiàn)這一目標(biāo)所需的技術(shù),比如超低功耗、始終在線的傳感器和能夠理解用戶所處環(huán)境的機(jī)器感知系統(tǒng)。Meta不僅僅是在開創(chuàng)一種新型AR設(shè)備,還計劃將在未來數(shù)年內(nèi)繼續(xù)推動它的發(fā)展。
圖源:Meta
MR和空間計算代表了另一條發(fā)展道路。這些技術(shù)逐步改進(jìn),成為備受關(guān)注的焦點(diǎn),對過去50年一直占主導(dǎo)地位的個人計算模式產(chǎn)生了根本性影響。
多年來,讓盡可能多的人使用這些新技術(shù)一直是Reality Labs的首要任務(wù),因此在今年9月發(fā)布首款消費(fèi)端MR頭顯是Meta在2023年的另一個亮點(diǎn)。
在Meta Quest 3發(fā)布后的幾個月內(nèi),應(yīng)用榜單排名前20的應(yīng)用程序中有7個是MR內(nèi)容。我們看到了人們重視這些MR體驗(yàn)的強(qiáng)烈信號。目前Quest商店中已經(jīng)有數(shù)百款可體驗(yàn)MR的應(yīng)用,其中大多數(shù)用戶都嘗試過MR功能。當(dāng)多數(shù)人都掌握了這樣一種新技術(shù)時,人們的創(chuàng)作能力將體現(xiàn)出來:
圖源:Meta
隨著越來越多的人接觸到MR技術(shù),開發(fā)者也學(xué)會了如何利用它的強(qiáng)大功能,我們將在2024年看到這一進(jìn)展的加速。無論是在Xtadium上觀看身臨其境的NBA比賽,還是在Pianovision上通過MR學(xué)習(xí)音樂,可以看到MR提供了在其他任何設(shè)備上都不可能實(shí)現(xiàn)的體驗(yàn)。
前瞻性觀點(diǎn)
對新興技術(shù)進(jìn)行長期押注并非易事。它不能保證能取得成功,而且需要花費(fèi)大額投入。但這也是一家技術(shù)公司所能做的最有價值的事情之一,并長期保持影響力。今年,Meta最大的兩個長期技術(shù)押注都趨于成熟并出現(xiàn)了交集,這提醒了我們對未來技術(shù)保持健康投資的重要性,也讓Meta對未來十年的創(chuàng)新計劃有了更清晰的認(rèn)識。
在人工智能領(lǐng)域,下一步將如何發(fā)展?大多數(shù)研究人員都認(rèn)為,我們?nèi)杂泻芏鄼C(jī)會利用現(xiàn)有技術(shù)建立更大更好的語言、圖像和視頻模型。但還有一些根本性的突破和全新的架構(gòu)有待發(fā)現(xiàn),而Meta的AI研究團(tuán)隊正在探索這些架構(gòu),希望取得根本性突破。
這意味著,我們將繼續(xù)研究“具身智能”(embodied AI)等領(lǐng)域,旨在建立能像人類一樣體驗(yàn)世界的模型。我們的研究人員(Meta AI首席AI科學(xué)家Yann LeCun)認(rèn)為,要實(shí)現(xiàn)比擬人類的AI,系統(tǒng)必須對世界的運(yùn)作方式有更深入的了解,而我們的團(tuán)隊已經(jīng)在這方面取得了進(jìn)展,未來幾年仍有大量工作要做。
在Reality Labs,Meta的研究人員正在推進(jìn)一些非常有前景的技術(shù),這些技術(shù)將使下一個計算平臺的實(shí)現(xiàn)成為可能。多年來,這項(xiàng)研究取得了突破性進(jìn)展,例如Quest Pro和Quest 3上的Pancake鏡頭,以及Mark Zuckerberg和Lex Fridman今年嘗試的Codec Avatars原型。而這只是冰山一角,Reality Labs研究的突破將支持Meta能夠在未來幾年推出一系列行業(yè)領(lǐng)先的產(chǎn)品。
但在我提到的所有技術(shù)中,最有價值的技術(shù)是今天已經(jīng)掌握在人們手中的技術(shù)。Meta在2023年取得的進(jìn)展意味著生成式AI正在成為熱門應(yīng)用程序的核心,混合現(xiàn)實(shí)(MR)技術(shù)現(xiàn)已成為市面上主流頭顯的核心,雷朋與Meta合作推出的智能眼鏡首次讓AI以人類的視角看世界。這是Meta建設(shè)未來的過程中激動人心的時刻,更重要的是,我們就生活在這樣一個偉大的時代。
參考文章:
https://about.fb.com/news/2023/12/metas-2023-progress-in-ai-and-mixed-reality/
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息
上一篇: Beautyque NYC將推出交互式VR購物應(yīng)用程序
下一篇: Virtualware 公布 2024-2026 年戰(zhàn)略計劃,將進(jìn)一步擴(kuò)張 AR/VR 領(lǐng)域