微信公眾號

VR陀螺微信公眾號

手機端

手機端掃碼訪問

搜索

游戲評測

推廣

AI

微軟展示VASA-1，通過單一肖像圖和語音生成數(shù)字人視頻

發(fā)布時間：2024-04-19 12:03 | 標(biāo)簽：微軟 AI AI數(shù)字人 VASA-1

轉(zhuǎn)載來源：微軟

微信掃一掃：分享

微信里點“發(fā)現(xiàn)”，掃一下
二維碼便可將本文分享至朋友圈

編譯/VR陀螺

微軟發(fā)布VASA-1，官網(wǎng)介紹道：只需使用單張人物肖像照片+一段語音音頻，即可實時生成高仿真的數(shù)字人講話視頻，唇部動作、面部動作和頭部運動都與音頻內(nèi)容同步，其表現(xiàn)高度自然協(xié)調(diào)。

微軟表示，這是一個新的框架，可以在給定單張靜態(tài)圖像和語音音頻的情況下，生成具有吸引人的視覺情感技能（VAS）的逼真的虛擬數(shù)字人說話視頻。

從微軟的演示來看，不僅提供具有逼真的面部和頭部動態(tài)的高質(zhì)量視頻，而且還支持高達40 FPS的在線生成512x512尺寸視頻，并且啟動延遲（前期延遲僅為170ms）可以忽略不計。這項技術(shù)為與模仿人類對話行為的逼真數(shù)字人進行實時互動提供支持。

在示例中可以看到更多基于1分鐘語音音頻生成的視頻，以及輸入不同音頻生成的10~15秒的視頻，既可以讓蒙娜麗莎唱Rap，又能讓素描人像念華強臺詞，數(shù)字人的外觀并不局限于性別、年齡、口音以及種族。

所有微軟展示的VASA-1的肖像圖像都是由StyleGAN2或DALL·E-3生成的虛擬的、不存在的身份（蒙娜麗莎除外）。

VASA-1能夠做到實時渲染，對比目前市面上的同類產(chǎn)，VASA-1效果最好。考慮到相關(guān)技術(shù)的風(fēng)險性，目前該模型只是作為研究預(yù)覽展示，研究重點是為數(shù)字人生成提供視覺情感的積極應(yīng)用，僅供微軟研究團隊的人員使用，并不對外開放，也沒有產(chǎn)品以及API發(fā)布計劃。

來源：微軟

投稿/爆料：tougao@youxituoluo.com

稿件/商務(wù)合作：六六（微信 13138755620）

加入行業(yè)交流群：六六（微信 13138755620）

元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺

下載「陀螺科技」APP，獲取前沿深度元宇宙訊息

上一篇： 《狙擊精英》衍生系列《喪尸軍團》將推出VR游戲，2024年內(nèi)發(fā)售

下一篇： 61屆高博會圓滿結(jié)束，大朋VR多項解決方案成大會焦點

你可能感興趣的文章：

Quest快速連接Windows 11功能將于12月上線

微軟發(fā)布模擬飛行2024，VR漸成模擬游戲主流外設(shè)

微軟將在2027年停止HoloLens 2更新支持

Anduril Industries宣布將與微軟合作，推動軍用AR眼鏡發(fā)展

微軟與三星顯示簽署“數(shù)十萬”級Micro-OLED合同，Vision Pro或再贏勁敵

微軟、索尼、三維家等公司宣布加入OpenUSD聯(lián)盟

熱門文章排行: 1 AI 3D模型初創(chuàng)公司「Descart」估值已超5億美元

2 VR游戲周報 |《異形》IP改編游戲未完待續(xù)，《Grimlord》結(jié)束EA完整發(fā)布

3 Vision Pro精選內(nèi)容每周推薦：Figmin XR、Oto's Planet、Pulsargeist

4 小派科技官宣緊湊頭顯Dream Air，單眼4K，售價1900美元

5 重磅 | 第九屆金陀螺獎獲獎名單正式公布！

6 三星計劃通過基于玻璃基的Micro-OLED來降低VR/MR設(shè)備成本

7 穴居人《Contractors Showdown》開啟全新模式Exfil Zone測試

8 蘋果為Vision Pro上線《冰潛》空間視頻

9 Shiftall發(fā)布全新的全身追蹤設(shè)備HaritoraX 2，售價約1900元

10 射擊游戲《Vail VR》開發(fā)商啟動股權(quán)眾籌，以期為獲得資金支持

推薦專題

蘋果空間計算專題更多


米哈游《絕區(qū)零》1.4版本上線，兼容Vision Pro
蘋果Vision Pro開發(fā)教程更多


【W(wǎng)WDC24】Vision Pro開發(fā)教程：深入研究空間容器和沉浸式空間
Vision Pro精選內(nèi)容推薦更多


Vision Pro精選內(nèi)容每周推薦：Figmin XR、Oto's Planet、Pulsargeist
硬件專業(yè)評測更多


星紀(jì)魅族StarV View AR眼鏡評測：188英寸巨幕體驗，74克輕量隨身影院
陀螺研究院XR產(chǎn)業(yè)報告更多


2024年11月VR/AR行業(yè)月報丨VR陀螺
FBEC2023暨第八屆金陀螺獎更多


FBEC2023 | 華為終端BG AR/VR產(chǎn)品線總裁李騰躍：打造XR極致體驗共創(chuàng)空間計算時代
2023 VR/AR年度專題更多


【年度專題】2023 年最被關(guān)注的九大 XR 技術(shù)
中國VR/AR企業(yè)圖譜更多


中國VR/AR企業(yè)圖譜（新疆、內(nèi)蒙古、西藏、寧夏、甘肅、青海、云南、廣西、海南）丨VR陀螺
XR行業(yè)應(yīng)用案例集更多


陀螺研究院XR行業(yè)應(yīng)用案例集｜基于穿戴式柔性手部動捕設(shè)備的混合現(xiàn)實整形外科手術(shù)教學(xué)訓(xùn)練一體化平臺

人物專訪 更多: Meta CTO：2025將是我們在XR領(lǐng)域成敗攸關(guān)的一年 12-20

VR陀螺對話Fast Travel Games：VR游戲銷量100萬套背后的故事 12-12

庫克：Vision Pro現(xiàn)有最大的考驗是生態(tài)系統(tǒng) 12-06

對話全球頭部VR游戲公司Vertigo Games：IP改編為VR帶來體量更大、更優(yōu)質(zhì)的體驗 11-29

Snap CEO：AR眼鏡廣泛落地時間點可能比我們想象的還要快 11-20

Schell Games CEO談VR的歷史、MR的崛起和數(shù)字世界的潛力 11-16

庫克談Vision Pro：它不是大眾市場產(chǎn)品，但一切都會好起來 10-22

對話《Beat Saber》投資人Tipatat：3D應(yīng)用生態(tài)正成為XR行業(yè)的下一個風(fēng)口 10-06

對話Niantic高級副總裁：從手機到AR再到MR，LBS AR游戲還需要等待幾年 09-30

專訪扎克伯格：關(guān)于Orion的由來以及Ray-Ban Meta的未來 09-27

數(shù)據(jù)報告 更多: TrendForce：2024全球頭顯市場回暖，出貨量約960萬臺 12-26

Unity發(fā)布2025年行業(yè)趨勢報告：沉浸式技術(shù)正在改變游戲規(guī)則 12-19

2024年11月VR/AR行業(yè)月報丨VR陀螺 12-13

CINNO Research：2024Q3國內(nèi)消費級VR/AR市場銷量共計10.8萬臺 11-15

2024年10月VR/AR行業(yè)月報丨VR陀螺 11-14

知名VR游戲工作室透露PS VR2出貨量約200萬臺 10-18

2024年9月VR/AR行業(yè)月報丨VR陀螺 10-16

日本雅虎購物流行榜單：VR銷售額同比增長5.2倍，位居榜首 08-23

TrendForce：2030年AR市場LEDoS滲透率將達44% 08-20

TrendForce：2030年VR/MR設(shè)備出貨量將達到3730萬臺 08-06

融資并購 更多: Micro-OLED廠商昀光科技完成新一輪融資 12-16

耐德佳完成C輪超億人民幣融資 12-10

芬蘭國防企業(yè)Summa Defence收購XR設(shè)備開發(fā)商Lightspace 12-04

獨家|XR芯片制造商「耀宇視芯」完成A輪融資，訂單量已達數(shù)十萬片 11-26

法國微顯示屏制造商Microoled獲新一輪融資 11-25

日本創(chuàng)企KOALA Tech獲5.7億日元融資，開發(fā)用于XR的高亮度OSLD 11-21

TeamViewer以資金支持RealWear收購AR硬件開發(fā)商Almer 11-15

建筑AR軟件平臺GAMMA AR獲Autodesk投資 11-15

Crunchbase數(shù)據(jù)：2024年元宇宙和XR相關(guān)初創(chuàng)公司融資進一步下滑 11-13

Magic Leap創(chuàng)始人再創(chuàng)業(yè)，SynthBee融資2000萬美元擴展計算智能平臺 10-22

官方微信賬號:
VR陀螺

聯(lián)系VR陀螺

加入行業(yè)社群