文/ VR陀螺 靈火
4月15日,華為在上海舉辦了“身臨其境,看見美好”VR音樂媒體品鑒會。郎朗首部VR音樂作品正式上線華為視頻VR專區(qū)和華為VR視頻。除了郎朗的三部作品,華為VR音樂平臺還通過與更多獨立音樂人、樂隊的合作引入高質(zhì)量的VR音視頻內(nèi)容。官方透露,平臺首發(fā)陣容將達到24部作品。
溝通會當(dāng)天,陀螺君受邀來到現(xiàn)場。親身體驗了目前已經(jīng)上線華為VR視頻的八部作品,并對華為VR音視頻生態(tài)平臺提供的端到端VR技術(shù)解決方案有了深入了解,也充分理解了拍攝強沉浸感VR音樂會背后所需要的科技硬實力。
此外,陀螺君還深度對話華為消費者業(yè)務(wù)云服務(wù)副總裁譚東暉、華為VR音視頻平臺總監(jiān)Xinxin。透過他們的分享,了解到關(guān)于華為VR音視頻一站式生態(tài)服務(wù)在前端播放能力、視頻點播VOD服務(wù)、音樂開發(fā)工具及VR內(nèi)容的制作與發(fā)行等更多方面的技術(shù)沉淀及實用價值。
VR音視頻,華為篤定的5G時代新應(yīng)用
5G技術(shù)的快速發(fā)展,使得千行百業(yè)有了一個具備創(chuàng)新基礎(chǔ)的技術(shù)平臺。5G技術(shù)在中國商業(yè)化落地的兩年時間里,其發(fā)展速度遠(yuǎn)超想象。
同樣是這個時間節(jié)點,3G技術(shù)部署后的一年時間里,全球商用網(wǎng)絡(luò)只有9個,3G站點數(shù)僅有2萬個,用戶數(shù)32萬;4G技術(shù)時代略強。相較之下,5G技術(shù)正式部署的第一年里,全球5G商用網(wǎng)絡(luò)數(shù)已經(jīng)超過110多個,站點數(shù)80萬個,用戶數(shù)超過2億。
這背后,在于人們對超大帶寬應(yīng)用、超低延時應(yīng)用以及海量聯(lián)接式應(yīng)用的龐大需求。譚東暉表示:“在超大寬帶應(yīng)用需求下,華為意識到VR/AR、超高清視頻和無線傳影等新科技融合5G商用將催生出第一波改變?nèi)藗兩?、辦公和娛樂方式的產(chǎn)業(yè)。”
華為消費者業(yè)務(wù)云服務(wù)副總裁譚東暉
也就是說,華為相信VR音視頻將成為5G技術(shù)普及下的第一波深度影響用戶行為的產(chǎn)業(yè)。那么,為何會如此篤定呢?
業(yè)界的技術(shù)成熟度曲線認(rèn)為,一項技術(shù)需要經(jīng)過萌芽期、炒作巔峰期、低谷期、平穩(wěn)發(fā)展期以及成熟期。2018年以后,VR技術(shù)被從這條曲線上移除,這意味著其發(fā)展?fàn)顟B(tài)已開始趨于成熟;而看結(jié)果,2020年,全球VR頭戴式顯示器的出貨量達到670萬臺,相比于2019年增長了72%,幾乎翻番。
譚東暉認(rèn)為,技術(shù)的不斷成熟與其VR設(shè)備出貨量的不斷增長,足夠證明VR技術(shù)已經(jīng)跨越了低谷期,進入到規(guī)模應(yīng)用成熟期,這意味著VR已經(jīng)開始接近我們的生活,VR產(chǎn)業(yè)的未來充滿無限想象。
與此同時,人們對于在線服務(wù)及影音的需求也在大幅增長。2020年,人們通過移動設(shè)備觀看在線視頻的時長增長40%,在音樂領(lǐng)域,全球流媒體收入占增長19.9%,成為全球錄制音樂產(chǎn)業(yè)中唯一的收入增長來源。
“人們對于音樂的需求,將不再僅限于如今的便攜性和豐富性,將很快向著更創(chuàng)新的用戶體驗和更優(yōu)質(zhì)的創(chuàng)作內(nèi)容提出更多要求。希望在線上,就能夠體驗到過去在線下音樂會才有的幾倍或者十幾倍的臨場感。”
華為終端云服務(wù)已經(jīng)為全球7億多消費者提供全場景、高品質(zhì)的數(shù)字服務(wù)。這樣的背景之下,正因看到這樣的用戶需求,本著以消費者為中心,打造軟硬件雙輪驅(qū)動的全場景智慧生態(tài)(1+8+N和HMS)理念,正式上線了華為VR音視頻平臺。
13K拍攝、空間音頻,華為VR音視頻方案如何做到低成本高質(zhì)量?
華為VR音視頻平臺是華為終端云服務(wù)推出的全新內(nèi)容平臺,其作用是在全球范圍內(nèi)連接音樂人、音樂創(chuàng)作者,令用戶隨時隨地能夠體驗到由超高清畫質(zhì)、空間音頻等技術(shù)支撐的優(yōu)質(zhì)VR音視頻內(nèi)容。
用戶可以通過VR Glass頭顯或者華為手機體驗華為視頻VR專區(qū)中的所有內(nèi)容。而支撐該平臺的是一整套內(nèi)容制作解決方案。
華為VR音視頻平臺涵蓋了前期制作、后期合成、編解碼適配和上架發(fā)行平臺四個標(biāo)準(zhǔn)流程,其方案涉及前端播放能力、視頻點播VOD服務(wù)、音樂開發(fā)工具及VR內(nèi)容的制作與發(fā)行各階段,實現(xiàn)了端到端一體化全覆蓋。
整體來看,該方案優(yōu)勢可以大致分成三類:
1、超高清畫質(zhì)呈現(xiàn)
顧名思義,VR的音視頻體驗最主要的就是內(nèi)容視覺和聽覺上的感受。提到視覺部分,很多人對于VR的第一印象是不夠清晰、紗窗效應(yīng)嚴(yán)重。成像質(zhì)量方面,在對比度高的高光區(qū)域成像,是多數(shù)拍攝設(shè)備所遇到的老大難問題。
在VR里面的成像和傳統(tǒng)意義上的影視內(nèi)容拍攝不同。人眼在沉浸式數(shù)字環(huán)境下會追求更加接近人眼的成像效果,這種高要求很多平面視頻拍攝設(shè)備都難以企及,而VR需要考慮的是360度范圍內(nèi)的畫面質(zhì)量輸出,無疑難度更大。
在上圖中,左側(cè)和右側(cè)分別放置的是華為VR音視頻內(nèi)容制作解決方案中錄制設(shè)備在高對比度和暗光環(huán)境下的拍攝效果??梢钥吹?,其對于曝光、噪點處理的相對柔和自然,衣衫之上花紋的呈現(xiàn)細(xì)節(jié)豐富。
Xinxin認(rèn)為,無論是1080P、4K還是8K分辨率,其實這只是視頻成像質(zhì)量衡量中的一個維度,它并不是全部。一個視頻的好與壞,固然跟尺寸有一定的關(guān)聯(lián),但更重要的是像素的質(zhì)量、銳度,包括色彩范圍以及幀率,這些是會深深影響視頻觀看質(zhì)量的關(guān)鍵技術(shù)點。
“從這兩張圖可以看出,華為對于VR視頻成像的理解,并非傳統(tǒng)意義上的僅是尺寸上的優(yōu)勢,而是基于對VR類影像的采集和回放技術(shù)的深刻理解。”
2、3D空間音樂效果
目前的VR內(nèi)容(尤其視頻)體驗里面,有時候會有提及一些跟3D聲音有關(guān)的描述,但并未對此有更為深入的研究和認(rèn)知。
將雙手比作聲源,當(dāng)用戶戴上耳機的時候,傳統(tǒng)的立體聲音效是從耳機兩側(cè)進行發(fā)聲。用戶在轉(zhuǎn)動頭部的時候,音源被固定在頭顱兩側(cè),這證明傳統(tǒng)聲音模擬并不包含聲音的空間信息和它的三維空間的位置信息。
所謂實時3D現(xiàn)場聲音,即3D空間音樂效果可以還原聲音的方位信息、聲場信息和環(huán)境信息,可以把不同的相位音源同時在算法中進行處理并提供給用戶。這與5.1、7.1影音設(shè)備不同,除了設(shè)備體積差距外,因為配備數(shù)量有限,這類設(shè)備無法模擬真正意義上360度音效,且成本及操作難度都遠(yuǎn)高于前者。
在上圖中,是華為VR音視頻內(nèi)容制作解決方案現(xiàn)場錄制時的聲道圖解。設(shè)備將現(xiàn)場聲音全部解析成了單獨的通道,提供給用戶去聽,而傳統(tǒng)的立體聲只有雙聲道概念。舉個例子,現(xiàn)場歌手的聲音會由其本人、樂器、音響設(shè)備等發(fā)出,因此至少有四路聲音被記錄和采集的,這在傳統(tǒng)方案中只能是揉在一起。
華為VR有專屬的編解碼音頻信號解析的標(biāo)準(zhǔn),與市面上的無損和標(biāo)準(zhǔn)編解碼信號相對比,前者音頻信號的解析在網(wǎng)絡(luò)帶寬的壓力下并沒有損失音質(zhì)(上訪的點狀物數(shù)量區(qū)分)。這是因為華為增強層編解碼信號允許在體積更小的情況下,傳遞跟原始無損信號更一致的音頻音質(zhì)給到用戶。
3、VR編輯工具
華為VR音視頻內(nèi)容制作軟件可以實現(xiàn)原有錄制文件的整合、打包和輸出。整個文件打包的流程非常傻瓜,其基于傳統(tǒng)行業(yè)的錄音師和后期音視頻制作的流程,可實現(xiàn)時間線編輯、素材管理方式、動畫記錄方式等聲音的軌跡和畫面的特性一同在該軟件里完成編輯。
此外,導(dǎo)出的完成版文件可以被華為VR音視頻平臺所識別,并實現(xiàn)自動上傳和云端全球分發(fā)。
據(jù)介紹,華為VR音視頻內(nèi)容制作軟件相較業(yè)內(nèi)大幅降低了VR音視頻內(nèi)容制作的成本。一部作品的制作成本可以壓到同行業(yè)內(nèi)的1/10,并保證其視聽質(zhì)量達到最佳。
通常的制作成本是指人力成本和現(xiàn)場部分(場地、燈光、舞美、錄回音等)素材采集方面的成本。華為的拍攝設(shè)備及后期制作工具引入自動化操作方案,極大程度節(jié)省了人力成本和現(xiàn)場操作的成本。
Xinxin稱,通常情況下華為的一部作品只需幾個小時就可以完成拍攝。對比傳統(tǒng)的作品錄制流程,華為VR音視頻采集系統(tǒng)的展開和收集效率更高。此外,后期階段里,華為將優(yōu)勢項的音頻處理能力和視頻處理能力工具化,這樣就省去了以前分散在多個工具端處理完后再縫合到一起的過程,這會減少內(nèi)容的生產(chǎn)成本和時間。
未來,華為將運用通訊業(yè)起家的編解碼標(biāo)準(zhǔn)制定優(yōu)勢,更加大力推動VR音視頻工具的標(biāo)準(zhǔn)化。并基于類似音樂Party模式(允許多臺華為手機拼合實現(xiàn)類似多點采集收音的效果)等功能,進一步降低VR音視頻內(nèi)容的錄制階段硬件成本。
實測:空間級感官拔升,這次真不是純堆技術(shù)
會議之后,陀螺君實際體驗了華為VR視頻中現(xiàn)已上線的8款VR音視頻內(nèi)容。下面我以兩款極具代表性的內(nèi)容實際體驗為例,來分享下對于所謂華為VR音視頻黑科技的切實感受。
1、《茉莉花》(郎朗)
第一次體驗,是朗朗的鋼琴曲獨奏茉莉花。這部作品采用類似沙龍演奏的形式,很多觀賞者圍坐在郎朗及鋼琴周圍。美妙的琴聲呼之欲出,而身為觀賞者里的一員,陀螺君則恰好坐在郎朗的正側(cè)面,屬于黃金觀賞位。
這部作品的背景,模擬了類似漆黑環(huán)境聚光燈下的畫面效果。郎朗和眾人在燈光之下,與漆黑深邃的背景區(qū)分開來。值得一提的是,陀螺君可以清楚地看到光照下每位觀賞者的毛孔,郎朗戴著的手套上的纖維和鋼琴背光板折射出的倒影。
在這種極度考驗設(shè)備處理曝光環(huán)境拍攝能力的環(huán)境下,陀螺君看到的不是一片漆黑或者慘白一片,而是在燈光照應(yīng)下,人們的背影和細(xì)枝末節(jié)的微表情。而工作人員告訴陀螺君,雖說觀賞細(xì)膩度已經(jīng)非常震撼,但其實原片分辨率可以達到13K*9K,而目前的影片只是達到了4K級別。可以想象,如果真有頭顯可以原生支持13K的片源,那會是一番更加難忘的體驗,并且該片源也支持適應(yīng)未來3-5年的發(fā)展。
2、《BeatBox Show》(啊鑫)
如果說郎朗給我的第一印象是視覺爆炸,那這段B-BOX就是真正的聽覺爆炸。視頻開始,啊鑫隨即開始自己的表演。我面對著啊鑫,距離只有一拳之隔。隨著嘴唇的抖動,一陣陣爆炸似的聲波傳入陀螺君的耳膜,從聲音來分辨,即使是閉著眼睛甚至腦海里都可以精確浮現(xiàn)處他在發(fā)聲時的嘴型。
而這,還不是最有趣的。
因為現(xiàn)場是坐在一把類似蛋椅的旋轉(zhuǎn)座椅中。因此,陀螺君下意識扭轉(zhuǎn)身體,頭部便跟著向左側(cè)旋轉(zhuǎn)。此時我不再正對啊鑫,而是左耳正對的側(cè)身方式。陀螺君明顯感覺到音場強度的變化,就好像真的在視頻內(nèi)容中轉(zhuǎn)了個身一樣。與之類似的,左轉(zhuǎn)、右轉(zhuǎn)音源變化感知最為明顯,抬頭、低頭則可以感受到聲音輕微發(fā)悶。
這就是所謂華為3D空間音效,實際體驗后陀螺君發(fā)現(xiàn)——其實它實現(xiàn)的就是一句話:讓用戶走進內(nèi)容。正如Xinxin所說,沉浸式體驗是令用戶走進內(nèi)容的最佳方式。
而據(jù)透露,華為已經(jīng)在VR光場拍攝技術(shù)方面研究多年,并會隨著用戶群體的增加,考慮將最新的交互模式(比如語音識別、彈幕交互、眼球追蹤等)加入其中?,F(xiàn)在,還只是視聽維度更上一層樓。也許不久的將來,我們真的可以走到郎朗面前,請他喝杯茉莉花茶;亦或是擺個炫酷的姿勢,和對面啊鑫來一場battle(即6DOF交互)。
總結(jié)
究竟什么才是適合中國VR消費級市場的產(chǎn)品?
Xinxin說:“VR產(chǎn)業(yè)發(fā)展,從來缺的不是技術(shù)的更替和成熟,而是真正能夠?qū)⑿录夹g(shù)帶入舊領(lǐng)域,催生新用戶的人。在VR音視頻這塊,我們愿意投身其中,因為有調(diào)研后實實在在的用戶需求、有華為的技術(shù)優(yōu)勢作為支撐,那何樂而不為呢?”
未來,華為VR音視頻內(nèi)容制作解決方案或?qū)ν忾_放,這意味著未來任何一個普通人、up主或者作曲人,都有機會成為VR音視頻作品的締造者。譚東暉稱,以用戶為導(dǎo)向,不斷創(chuàng)新、發(fā)展和探索正是一直以來華為發(fā)展的愿景。我們希望華為VR音視頻平臺可以開個好頭,并隨著用戶群體的重視度增加,逐漸進行外擴。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息