美國加利福尼亞州圣克拉拉——GTC大會——2021年11月9日——NVIDIA于今日發(fā)布用于生成交互式AI虛擬形象的技術平臺——NVIDIA Omniverse Avatar。
圖源:NVIDIA
Omniverse Avatar能夠連接NVIDIA在語音AI、計算機視覺、自然語言理解、推薦引擎和模擬方面的技術。在該平臺上創(chuàng)建的虛擬形象是具有光線追蹤3D圖像效果的交互式角色,可以看到、說話、談論各種主題,以及合理地理解表達意圖。
Omniverse Avatar為AI助手的創(chuàng)建開辟了道路,而且可以根據各個行業(yè)的需求輕松定制。AI助手可以幫助處理數十億次日??蛻舴栈?,比如餐廳訂單,銀行交易,個人預約和預訂等,帶來更多商機并提升客戶滿意度。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“智能虛擬助手的前景一片光明。Omniverse Avatar將我們的基礎圖像、模擬和AI技術結合在一起,打造出一些復雜的實時應用。協(xié)作機器人和虛擬助手的案例令人難以置信,影響深遠。”
Omniverse Avatar是用于3D工作流程的虛擬世界模擬和協(xié)作平臺——NVIDIA Omniverse™的一部分,Omniverse公測版用戶現(xiàn)已超過7萬人。
在NVIDIA GTC主題演講中,黃仁勛分享了使用Omniverse Avatar的多個例子,包括用于客戶支持的Project Tokkio、用于永久在線車載智能服務的NVIDIA DRIVE Concierge以及用于視頻會議的Project Maxine。
在第一個Project Tokkio演示中,黃仁勛展示了NVIDIA的同事們與一個黃仁勛的卡通虛擬形象進行互動——就生物學和氣候科學等話題開展對話。
在第二個Project Tokkio演示中,黃仁勛著重介紹了餐廳自助服務亭中的一個客戶服務虛擬形象。演示中,有兩名顧客正在訂購素食漢堡、薯條和飲料,該虛擬形象看到了他們、與他們交談并理解了他們。這些演示由NVIDIA AI軟件和目前全球較大的可定制語言模型——Megatron 530B驅動。
在DRIVE Concierge AI平臺演示中,中央儀表盤屏幕上的數字助理幫助駕駛者選擇了最佳駕駛模式以準時到達目的地,然后按照駕駛者的要求,設置在汽車續(xù)航里程下降到100英里以下時進行提醒。
另外,黃仁勛還展示了Project Maxine如何為虛擬協(xié)作和內容創(chuàng)作應用增加先進的視頻和音頻功能。演示中,一個講英語的人在嘈雜的咖啡館里進行視頻通話,但是其他人可以清楚地聽到她所說的話,沒有背景噪音。當她講話時,她的話被實時轉錄并翻譯成德語、法語和西班牙語,并且聲音和語調與原話完全相同。
Omniverse Avatar主要組成部分
Omniverse Avatar 所使用的語音AI、計算機視覺、自然語言理解、推薦引擎、面部動畫和圖像元素,通過以下技術實現(xiàn):
●其語音識別基于NVIDIA Riva。這個軟件開發(fā)工具包可以識別多種語言的語音。Riva還可通過文本語音轉換功能生成接近真人的語音反饋。
●其自然語言理解基于Megatron 530B大型語言模型。該模型可以識別、理解和生成人類語言。Megatron 530B是一個預訓練模型,它可以在很少或沒有訓練的情況下完成句子、回答主題廣泛的問題、總結長而復雜的故事、翻譯成其他語言,并應對許多它未接受過專門訓練的情景。
●其推薦引擎由NVIDIA Merlin™提供。該框架使企業(yè)可以建立能夠處理大量數據的深度學習推薦系統(tǒng),以提出更明智的建議。
●其感知功能來自用于視頻分析的計算機視覺框架——NVIDIA Metropolis。
●其虛擬形象動畫由AI賦能的2D和3D面部動畫和渲染技術——NVIDIA Video2Face和Audio2Face™驅動。
這些技術被集成在一個應用,并使用NVIDIA統(tǒng)一計算框架進行實時處理。這些技術被打包成可擴展、自定義微服務后,能夠通過NVIDIA Fleet Command™在多個地點安全地部署、管理和協(xié)調。
聲明:新聞稿非VR陀螺官方稿,法律問題一律與VR陀螺無關。
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數字產業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息