文/VR陀螺 萬里
今日上午,英偉達(dá) CEO黃仁勛發(fā)表了CES 2025活動演講。
除了黃仁勛標(biāo)配的皮衣外,演講現(xiàn)場一口氣丟出了RTX 50系列顯卡、AI PC、自動駕駛系統(tǒng)、世界基礎(chǔ)模型Cosmos等多個新品/解決方案。
從這場發(fā)布會來看,英偉達(dá)的AI雄心,其實(shí)遠(yuǎn)不止芯片制造商。
50系顯卡全系采用Blackwell架構(gòu),升級為PCle 5.0接口、并支持DLSS 4等新特性?,F(xiàn)場具體介紹了RTX 5090顯卡,它相較4090更貴但也更強(qiáng)了:售價(jià):1999美元,國內(nèi)建議零售價(jià)為16499元。
具體參數(shù)方面,RTX 5090擁有920億個晶體管、21760個CUDA核心、配備32GB DDR7內(nèi)存,AI算力最高可達(dá)2375 TOPS。得益于架構(gòu)的改進(jìn),新款顯卡GPU性能基本是上一代顯卡的2倍。
此外,發(fā)布會中提到,RTX 5070顯卡性能可以比肩4090,但售價(jià)只有549美元,新一代真香卡預(yù)定。
據(jù)了解,對于桌面顯卡,RTX 5090、RTX 5080 GPU(8299元)將于1月底上市;RTX 5070 Ti、RTX 5070將于2月份上市。對于筆記本產(chǎn)品,搭載GeForce RTX 5090、RTX 5080和RTX 5070 Ti筆記本電腦將于3月上市,RTX 5070系列筆記本將于今年4月上市。
RTX 50系列具體規(guī)格信息,圖源:網(wǎng)絡(luò)
文章開頭黃仁勛所舉著的這個類似盾牌一樣的東西是為了展示企業(yè)最新的AI服務(wù)器互聯(lián)技術(shù)NVLink72。
基于NVLink72,可以將總計(jì)72個Blackwell GPU和36個 Grace CPU集中在一塊硅基芯片上面,如果按照傳統(tǒng)的架構(gòu)構(gòu)建同類型產(chǎn)品,那么它的體積可能會跟一個衣柜大小相當(dāng)。
NVLink72的主要參數(shù)特性如下:基于Blackwell框架;可以雙向提供1.8TB/秒的總帶寬,是上一代產(chǎn)品的兩倍;NVLink72的總帶寬比PCIe Gen 5高出14倍以上;可以通過NVLink Switch連接多個NVLink72。
Project Digits是英偉達(dá)打造的首個AI超級計(jì)算主機(jī),該產(chǎn)品作為會上的One more thing推出。
Project Digits外觀類似于Mac mini,極為小巧便攜,但是里面卻配備了一顆GB10 Grace Blackwell超級芯片,AI算力高達(dá)1 petaflop,單臺設(shè)備便可運(yùn)行包含200B參數(shù)AI模型。據(jù)悉聯(lián)發(fā)科也參與了GB10的芯片設(shè)計(jì)工作。
此外,Project Digits配備了128 GB RAM,ROM達(dá)到了4TB。主機(jī)搭載Grace CPU,其由20個Arm核心構(gòu)成,并配備了Connectivity、ConnectX NIC等組件。
Project Digits運(yùn)行Nvidia DGX OS,系統(tǒng)基于Linux構(gòu)建,里面集成了英偉達(dá)的系列AI軟件庫。產(chǎn)品售價(jià)3000美元,并計(jì)劃于今年5月上市。會上黃仁勛表示,產(chǎn)品適用于“每一位數(shù)據(jù)科學(xué)家、人工智能研究人員和學(xué)生,將使他們能夠參與和塑造人工智能時代。”
會上推出了兩款全新AI模型,其中NVIDIA Llama Nemotron是一款大語言模型,它基于Llama基礎(chǔ)模型構(gòu)建而成,使用英偉達(dá)的最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行修剪和訓(xùn)練,以增強(qiáng)代理能力。它們擅長指令遵循、聊天、函數(shù)調(diào)用、編碼和數(shù)學(xué),同時經(jīng)過尺寸優(yōu)化,可以在各種英偉達(dá)加速計(jì)算資源上運(yùn)行。
Llama Nemotron包含了Nano、Super、Ultra三個版本。其中Nano版本針對低延遲的實(shí)時應(yīng)用進(jìn)行了優(yōu)化,非常適合部署在PC和邊緣設(shè)備上。該模型即將免費(fèi)對外開放下載,或可通過NVIDIA NIM進(jìn)行調(diào)用。
除了大語言模型外,英偉達(dá)還首度公布了NVIDIA Cosmos,這是一個由先進(jìn)的生成式世界基礎(chǔ)模型(WFM)、tokenizer、護(hù)欄和加速視頻處理管線組成的平臺,旨在加速自動駕駛汽車 (AV)和機(jī)器人等物理 AI系統(tǒng)的開發(fā)。
所謂世界基礎(chǔ)模型,即一個能理解世界語言、物理特性、空間位置以及因果關(guān)系的模型,它是加速智能汽車、具身智能等AI終端普及的關(guān)鍵所在。相較于LLM的蓬勃發(fā)展,世界模型仍處于較為早期的階段。在開發(fā)方面,世界模型背后的開發(fā)同樣涉及到海量的基于現(xiàn)實(shí)世界數(shù)據(jù)的捕獲以及訓(xùn)練工作,因而開發(fā)成本不菲。
而現(xiàn)在,Cosmos模型采用了開放模型許可證的方式對外提供,可通過NVIDIA API、NVIDIA NGC目錄或 Hugging Face下載使用,這對于機(jī)器人等領(lǐng)域的開發(fā)者而言無疑是一個重要的利好消息。
英偉達(dá)Cosmos WFM接受了18000萬億次tokens的訓(xùn)練,包括2000萬小時的真實(shí)世界自動駕駛、機(jī)器人、無人機(jī)鏡頭和合成數(shù)據(jù)。Cosmos WFM為開發(fā)人員提供了一種簡單的方法來生成大量基于物理的真實(shí)照片合成數(shù)據(jù),以訓(xùn)練和評估他們現(xiàn)有的模型。開發(fā)人員還可以通過微調(diào)Cosmos WFM來構(gòu)建自定義模型。
黃仁勛表示:“機(jī)器人技術(shù)的ChatGPT時刻即將到來。與大語言模型一樣,世界基礎(chǔ)模型是推動機(jī)器人和自動駕駛汽車開發(fā)的基礎(chǔ),但并非所有開發(fā)者都擁有自主訓(xùn)練模型所需的專業(yè)知識和資源。我們創(chuàng)建Cosmos是為了普及物理 AI,讓每一位開發(fā)者都能接觸到通用機(jī)器人技術(shù)。”
據(jù)悉,NVIDIA Cosmos的合作伙伴包含了1X、Agile Robots、Agility、Figure AI、Foretellix、小鵬汽車、Uber等機(jī)器人及智駕企業(yè)。
基于NVIDIA Cosmos,黃仁勛還在會上展示了更多令人眼前一亮的用例,如將它與自家數(shù)字孿生平臺Omniverse相結(jié)合,從而打造出合成數(shù)據(jù)倍增引擎,開發(fā)者可輕松生成大量可控、照片級逼真的合成數(shù)據(jù)。開發(fā)者可以在Omniverse中編寫3D場景,并將圖像或視頻渲染為輸出。然后,這些場景可以與文本提示結(jié)合使用,以調(diào)整Cosmos模型,從而生成無數(shù)合成虛擬環(huán)境,用于物理AI訓(xùn)練。
對于自動駕駛以及機(jī)器人,黃仁勛表示,未來的企業(yè)實(shí)際上需要用到三套計(jì)算系統(tǒng),其中DGX用于AI模型訓(xùn)練、Omniverse則用于模擬、合成、強(qiáng)化數(shù)據(jù),而DGX則是應(yīng)用于終端的AI芯片。(實(shí)際上,這也很好概括了英偉達(dá)當(dāng)前以及后續(xù)所聚焦的核心業(yè)務(wù))
提到自動駕駛,黃仁勛指出“這可能是第一個價(jià)值數(shù)萬億美元的機(jī)器人產(chǎn)業(yè)”,今日他宣布的重磅新聞之一是英偉達(dá)將與豐田合作開發(fā)自動駕駛汽車。
此外,會上還推出了新一代智駕芯片DRIVE AGX Thor,芯片基于Blackwell架構(gòu),算力相較上一代提升20倍。今日極氪宣布將首發(fā)該芯片。
NVIDIA DRIVE Hyperion是一個汽車自動駕駛系統(tǒng),今日黃仁勛宣布系統(tǒng)已經(jīng)通過TÜV SÜD和TÜV Rheinland的行業(yè)安全評估,這是業(yè)界首個也是唯一一個端到端自動駕駛平臺,目前合作客戶包括奔馳、路虎、沃爾沃等。
除汽車外,黃仁勛還公布了面向類人機(jī)器人的NVIDIA Isaac GR00T合成運(yùn)動生成藍(lán)圖。目前類人機(jī)器人的一個重要領(lǐng)域是模仿學(xué)習(xí),即通過觀察和模仿人類行為來獲得相應(yīng)的技能。其背后同樣涉及到大量繁瑣的數(shù)據(jù)采集工作。
NVIDIA Isaac GR00T分為了三大板塊:其中GR00T-Teleop工作流程可以基于Vision Pro在數(shù)字孿生中捕捉人類運(yùn)動數(shù)據(jù);而GR00T-Mimic工作流程將捕獲的人類演示用以構(gòu)建更大的合成運(yùn)動數(shù)據(jù)集。最后,基于NVIDIA Omniverse和NVIDIA Cosmos平臺構(gòu)建的GR00T-Gen工作流程通過域隨機(jī)化和3D升級成倍地?cái)U(kuò)展該數(shù)據(jù)集。
基于Vision Pro采集操作數(shù)據(jù),圖源:英偉達(dá)
英偉達(dá)成立于1993年,2006年推出CUDA,這可視為當(dāng)前企業(yè)AI芯片帝國的重要奠基石。
現(xiàn)如今,英偉達(dá)除了顯卡以及AI芯片業(yè)務(wù)外,觸角顯然延伸到了更遠(yuǎn),如正在攻堅(jiān)的自動駕駛系統(tǒng),以及具有很強(qiáng)想象空間的Cosmos。
另外我們從黃仁勛在活動現(xiàn)場的頻頻整活也不難看出,今日的英偉達(dá),依舊朝氣蓬勃。