文/前方智能
蘋果在7月30日發(fā)布了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的開發(fā)者測試版,這個版本最大的變化就是迎來了備受期待的 Apple Intelligence 功能。這也標志著蘋果的 AI 不再僅僅停留在 Keynote 階段,終于向人人都能用上 AI 的方向邁出了第一步。
圖源:蘋果
如何下載安裝
目前,Apple Intelligence 僅向開發(fā)者開放測試,如果你是注冊開發(fā)者,可以通過以下步驟安裝。蘋果暫時還沒有推出公開測試版,所以想要加入的普通用戶目前還需要多等待一段時間。
圖源:網(wǎng)絡(luò)
圖源:網(wǎng)絡(luò)
Apple Intelligence 目前僅支持 iPhone 15 Pro、iPhone 15 Pro Max,以及搭載 M1 或更新芯片的 iPad 和 Mac 設(shè)備。
圖源:網(wǎng)絡(luò)
使用限制
除了僅支持較新的設(shè)備以外,Apple Intelligence 還有以下使用限制:
主要功能
目前已經(jīng)開放測試的 Apple Intelligence 功能包括:寫作工具、升級后的 Siri、郵件智能功能、照片應(yīng)用增強、轉(zhuǎn)錄總結(jié),下面我們將一一介紹這些功能的具體實現(xiàn)。
首先是 Apple Intelligence 提供支持寫作工具,蘋果目前已將其寫作工具集成到 iOS、iPadOS 和 macOS 中的標準文本系統(tǒng)中,這就意味不僅郵件、備忘錄、Pages 這些蘋果第一方的應(yīng)用程序可以使用這個功能,第三方的應(yīng)用程序無需適配也同樣可以使用這個功能。
要使用新的寫作工具,只需選擇一些文本,然后在彈出菜單或鍵盤上方選項中選擇「寫作工具」。新的寫作工具包含:校對、改寫、友好的、專業(yè)的、簡潔的、總結(jié)等功能。
圖源:網(wǎng)絡(luò)
經(jīng)過「友好」改寫,F(xiàn)* 開頭的粗俗話語被修改成「Strongly disapprove」。
圖源:網(wǎng)絡(luò)
接下來是 Siri,首先映入眼簾的是全新的設(shè)計界面,當激活 Siri 時,整個屏幕周圍會有一圈光效。其次最大的不同在于 Siri 和你說話的方式,如今它是一種更像對話的語氣,聽起來少了一些機器人的生硬感,更偏向真人。
在測試中也能發(fā)現(xiàn),目前 Siri 已經(jīng)能在很多場景測試中直接向用戶展示最終結(jié)果。當然,目前版本的 Siri 并非完全體,也沒有獲得 ChatGPT 加持,在一些特定情況下還是只會提供網(wǎng)頁鏈接,用戶需要自己尋找答案。
從視頻還能看出,新版 Siri 支持在語音和文字兩種輸入方式之間切換,長按電源鍵可以激活語音輸入,雙擊底部觸控條則可以使用文字輸入(以往只能二選一)
圖源:網(wǎng)絡(luò)
第三個獲得 AI 加持的應(yīng)用是郵件,不過郵件中的 AI 功能與寫作工具有部分重疊,包括智能回復(fù)郵件、生成郵件摘要和優(yōu)先顯示緊急郵件,總的來說都是幫助我們節(jié)省時間的好功能
圖源:網(wǎng)絡(luò)
接下來就是照片應(yīng)用的增強,新功能包括自然語言搜索照片、支持視頻內(nèi)容搜索,AI 生成回憶視頻。在當前的系統(tǒng)版本中,從圖片中刪除不需要的物品和對象的功能暫時還沒上線。
圖源:網(wǎng)絡(luò)
最后就是很多國內(nèi)用戶期待的電話錄音功能,通話時,用戶點擊左上角的新增錄音鍵,就能開啟錄音,同時對方的電話里面也會收到錄音已開啟的語音提示。設(shè)備會將錄音和轉(zhuǎn)換后的文本存儲在用戶的備忘錄中,還能一鍵為語音轉(zhuǎn)錄內(nèi)容生成摘要。
尚未實現(xiàn)的功能
上述這些功能只是 Apple Intelligence 的部分功能,還有很多蘋果在 WWDC 2024 上公布的功能在當前版本中暫未實現(xiàn),其中就包括:
圖源:蘋果
蘋果表示,這些功能將在未來一年內(nèi)陸續(xù)推出,也就是說完整版的 Apple Intelligence 可能還需要等到 2025 年才能真正實現(xiàn)。
技術(shù)細節(jié)
在發(fā)布開發(fā)者測試版的同時,蘋果還一同發(fā)布了一份研究論文,論文中詳細介紹了他們開發(fā)的兩個基礎(chǔ)語言模型:AFM-on-device(約 30 億參數(shù),設(shè)計用于設(shè)備上運行)和 AFM-server(更大的服務(wù)器端模型,參數(shù)未知)。這兩個模型是為了支持 Apple Intelligence 系統(tǒng)而設(shè)計的,該系統(tǒng)集成在 iOS 18、iPadOS 18 和 macOS Sequoia 中。
圖源:蘋果
在模型架構(gòu)方面,蘋果采用了基于 Transformer 的密集解碼器模型,但做了多項創(chuàng)新性改進。例如,他們使用共享的輸入/輸出嵌入矩陣來減少參數(shù)內(nèi)存使用,采用預(yù)歸一化和查詢/鍵歸一化來提高訓(xùn)練穩(wěn)定性。特別值得注意的是,他們使用了分組查詢注意力(GQA)機制,這有助于減少 KV 緩存的內(nèi)存占用。同時,他們選擇 SwiGLU 作為激活函數(shù)以提高效率,并使用 RoPE 位置編碼來支持長上下文處理。這些設(shè)計選擇都體現(xiàn)了蘋果在模型效率和性能方面的深思熟慮。
圖源:蘋果
在訓(xùn)練數(shù)據(jù)方面,蘋果展現(xiàn)了對數(shù)據(jù)質(zhì)量和隱私的高度重視。他們的數(shù)據(jù)來源包括授權(quán)的出版商數(shù)據(jù)、精心策劃的公開數(shù)據(jù)集以及通過 Applebot 爬取的網(wǎng)絡(luò)數(shù)據(jù)。值得強調(diào)的是,蘋果明確表示沒有使用任何用戶私人數(shù)據(jù)進行訓(xùn)練。他們對數(shù)據(jù)進行了嚴格的處理,包括質(zhì)量過濾、去重、安全檢查和隱私保護。例如,他們使用啟發(fā)式方法和基于模型的分類器進行安全和質(zhì)量過濾,并采用全局模糊去重技術(shù)。這種嚴謹?shù)臄?shù)據(jù)處理方法反映了蘋果對用戶隱私的承諾和對模型質(zhì)量的追求。
訓(xùn)練過程分為三個主要階段:核心預(yù)訓(xùn)練、持續(xù)預(yù)訓(xùn)練和上下文延長。在核心預(yù)訓(xùn)練階段,AFM-server 從頭開始訓(xùn)練,而 AFM-on-device 則通過從更大模型蒸餾得到。這種方法使得小型設(shè)備模型能夠獲得接近大型模型的性能。在持續(xù)預(yù)訓(xùn)練階段,他們調(diào)整了數(shù)據(jù)混合比例,增加了數(shù)學(xué)和代碼數(shù)據(jù)的權(quán)重。最后的上下文延長階段旨在提高模型處理長序列的能力。
蘋果還詳細介紹了他們的后訓(xùn)練過程,包括監(jiān)督微調(diào)(SFT)和基于人類反饋的強化學(xué)習(xí)(RLHF)。他們提出了一種新的 RLHF 算法 MDLOO,這種方法在實踐中表現(xiàn)出更好的穩(wěn)定性和性能。
圖源:蘋果
為了使模型能夠適應(yīng)不同的任務(wù),蘋果采用了基于 LoRA 的適配器架構(gòu),可以動態(tài)加載和切換,使單個基礎(chǔ)模型能夠靈活地適應(yīng)數(shù)十種不同的任務(wù)。這種設(shè)計大大提高了模型的能力,同時保持了高效率。
圖源:蘋果
在模型評估方面,蘋果進行了全面的測試,包括公開基準測試和大量人工評估。結(jié)果顯示,他們的模型在多個方面表現(xiàn)優(yōu)異,特別是在指令跟隨、工具使用和寫作能力方面。值得注意的是,他們的小型設(shè)備模型 AFM-on-device 在某些任務(wù)上甚至超過了參數(shù)量更大的開源模型。
圖源:蘋果
最后,蘋果強調(diào)了他們在負責任 AI 開發(fā)方面的努力。他們制定了全面的安全分類和政策,在模型開發(fā)的每個階段都考慮到了倫理和安全問題。他們進行了廣泛的紅隊測試,并建立了持續(xù)改進的機制。這反映了蘋果在追求技術(shù)進步的同時,也高度重視 AI 的社會影響和道德問題。
結(jié)語
Apple Intelligence 的推出標志著蘋果正式進軍 AI 領(lǐng)域。雖然目前功能還不夠完善,但蘋果承諾將持續(xù)優(yōu)化和擴展。對于用戶來說,這意味著我們的 iPhone、iPad 和 Mac 設(shè)備將變得更加智能和高效。但對國內(nèi)用戶來說,何時可以用上 Apple Intelligence,以及蘋果會選擇與國內(nèi)的哪家公司合作,目前一切都是未知。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權(quán)不得轉(zhuǎn)載。如需轉(zhuǎn)載請聯(lián)系微信:vrtuoluo233 申請授權(quán),并在轉(zhuǎn)載時保留轉(zhuǎn)載來源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉(zhuǎn)載法律必究。文中有圖片、視頻素材來自互聯(lián)網(wǎng)或無法核實出處,如涉及版權(quán)問題,請聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息