小議3D 視頻編碼傳輸技術(shù)

時間：2022-12-23 12:29:15 電子信息工程畢業(yè)論文我要投稿

相關(guān)推薦

小議3D 視頻編碼傳輸技術(shù)

　　1 引言

　　隨著網(wǎng)絡(luò)技術(shù)和視頻編解碼技術(shù)的進(jìn)步，視頻和多媒體業(yè)務(wù)得到了廣泛的應(yīng)用。對這類業(yè)務(wù)人們不只追求畫面的高清晰度，業(yè)務(wù)的實時性，更提出了在二維平面的顯示設(shè)備上滿足現(xiàn)實感、臨場感、立體感的要求。這種現(xiàn)實感和立體感正是3D 視頻技術(shù)需要解決的問題。
　　3D 立體感是人眼視覺的重要功能之一，人雙眼的平均瞳距約為65 mm，當(dāng)兩眼從稍微不同的兩個角度去觀察客觀三維世界的景物時,與觀察者不同距離的景物由于光學(xué)投影的原因會在左、右兩眼視網(wǎng)膜上形成不同的位置的像。這種兩眼視網(wǎng)膜上位置差就稱為雙眼視差,它反映了客觀景物的深度。人眼的深度感即立體感就是因為有了這個視差,再經(jīng)大腦加工而形成的。現(xiàn)有的3D 視頻技術(shù)正是基于上述原理，通過技術(shù)手段還原人們對客觀景物的深度感知從而達(dá)到3D 立體的效果。
　　3D 視頻技術(shù)誕生以來便備受關(guān)注，然而由于3D 視頻占用大量帶寬并且觀看時容易疲勞等原因，3D 視頻技術(shù)一直沒有在市場上引發(fā)大規(guī)模商用，僅僅定位于所謂的利基市場，應(yīng)用在專業(yè)領(lǐng)域（科學(xué)模擬、醫(yī)療）和娛樂領(lǐng)域（立體電影、3D 游戲）。近年來由于大量科研力量的投入，技術(shù)上的進(jìn)步拓展了3D 視頻技術(shù)的應(yīng)用，市場上已經(jīng)出現(xiàn)了3DTV，F(xiàn)VV（freeview TV），3D 會議系統(tǒng)等較為成熟的產(chǎn)品。這些進(jìn)步使得更為多樣化的3D 視頻系統(tǒng)和業(yè)務(wù)應(yīng)用進(jìn)入市場成為可能。
　　不同的 3D 視頻系統(tǒng)有著不同的3D 視頻表現(xiàn)格式，無論哪種表現(xiàn)格式都帶來了大量的數(shù)據(jù)需要進(jìn)行存儲，傳輸和保護。大量的數(shù)據(jù)對視頻獲取、編碼、傳輸、到3D 視頻顯示的各個處理環(huán)節(jié)都提出了技術(shù)挑戰(zhàn)。雖然當(dāng)前網(wǎng)絡(luò)技術(shù)已經(jīng)有了很大進(jìn)步，但是帶寬仍然是很稀缺的資源，尤其在無線傳輸環(huán)境中無線終端的功率有限，高效的數(shù)據(jù)壓縮非常必要。實現(xiàn)高效的數(shù)據(jù)壓縮后的比特流會對信道傳輸條件十分敏感。因此，考慮到3D 視頻系統(tǒng)有效性和可靠性，如何實現(xiàn)對數(shù)據(jù)的高效壓縮編碼，如何保證數(shù)據(jù)的可靠傳輸是我們需要重點關(guān)注的問題。本文將結(jié)合研究熱點對當(dāng)前的3D 視頻編碼和傳輸技術(shù)做個概括性的介紹和比較，文章最后會對未來3D 視頻技術(shù)的發(fā)展做個展望。

　　2 3D 視頻編碼技術(shù)

　　2.1 傳統(tǒng)立體視頻編碼
　　傳統(tǒng)立體視頻編碼是目前所知最簡單的3D 視頻表示方法。這種編碼系統(tǒng)通過模擬人雙眼的功能獲取視頻的立體效果。首先將兩部攝像機擺放到稍有差異的位置進(jìn)行拍攝，兩部攝像機獲取的視頻信息經(jīng)過正交化，色彩糾正等處理步驟后，視頻信號直接由3D 視頻系統(tǒng)播放。播放之前不需要在視頻信號中添加視頻場景的幾何信息，各個攝像機的視頻信號可以獨立進(jìn)行編解碼。
　　編碼過程使用時序預(yù)測和視頻序列間預(yù)測可以大大提高編碼效率， MPEG-2 在10 多年前就對這種方法給出了相應(yīng)標(biāo)準(zhǔn)，在最新的編碼標(biāo)準(zhǔn)H.264/AVC 中也給出了類似建議。
　　這種時序預(yù)測和視頻序列間預(yù)測相結(jié)合的方式已經(jīng)成了目前立體視頻編碼的基本原則。
　　傳統(tǒng)立體視頻的編碼對由兩幅圖像組成組成，由于觀看同一景物時視角稍有差異，兩幅圖像有很大的相關(guān)性，因而非常適合壓縮編碼。也就是說，可以把圖像I1 獨立編碼，另一幅圖像P1 通過已編碼的I1 進(jìn)行預(yù)測，這種思想和時序預(yù)測編碼非常相似。
　　由于左右兩個視頻序列3D 場景和相機參數(shù)(焦距)的一致性，對視頻編碼對的兩個圖像（如I1,P1）的編碼，可以采用同一視頻序列中兩個連續(xù)圖像預(yù)測和編碼的方法。相應(yīng)的，兩個圖像（I1,P1）的差異可以當(dāng)作是由于拍攝物移位而產(chǎn)生的，因此圖像的運動估計和運動補償可以采用差值預(yù)測和差值補償?shù)姆椒ā?br /> 　　理想情況下，I1，P1 的差異僅僅是由視角不同引起的，實際應(yīng)用中我們發(fā)現(xiàn)一些細(xì)節(jié)也會帶來兩者的差異。比如，出現(xiàn)在I1 的內(nèi)容可能沒有在另一幅圖像P1 中出現(xiàn)，這種情況出現(xiàn)在I1，P1 之間的概率會大于出現(xiàn)在I1 和B1 之間的概率。兩個攝像機光照條件不同，拍攝物不同角度的反光也能造成圖像差異。這些都是傳統(tǒng)立體視頻編碼需要關(guān)注和解決的問題。
　　實踐表明，兩種預(yù)測方法相結(jié)合的編碼方式并沒有帶來編碼效率的顯著提高，這主要因為，兩個在時間上連續(xù)的兩個圖像比空間上相鄰的兩個圖像有更大的相關(guān)性，因此引入視頻序列間的預(yù)測并不能進(jìn)一步大幅度提高編碼效率。目前傳統(tǒng)立體視頻編碼優(yōu)化朝著多個方向發(fā)展，出現(xiàn)了很多不同的優(yōu)化算法，如優(yōu)化碼率在兩個視頻序列間分配，設(shè)計更有效的序列間預(yù)測結(jié)構(gòu)等。傳統(tǒng)立體視頻的解碼器也大多基于最新的H.264/AVC，MPEG-4 visual 標(biāo)準(zhǔn)。
　　傳統(tǒng)立體視頻技術(shù)相對其他編碼方法有很多缺陷，由于可再現(xiàn)的3D 場景從拍攝時就已經(jīng)確定了，圖像的深度感覺不能隨著的3D 設(shè)備的顯示類型和顯示尺寸做出調(diào)整，輸出的視頻角度也不能變化。這些缺點限制了傳統(tǒng)立體視頻技術(shù)的應(yīng)用，在目前尚未形成立體視頻的大眾市場的背景下，還沒有傳統(tǒng)立體視頻技術(shù)達(dá)到商業(yè)化的水平。

　　2.2 基于深度信息的視頻編碼（V+D）
　　傳統(tǒng)立體視頻系統(tǒng)通過模擬人類視覺的二目成像原理獲得深度信息，在基于深度信息的視頻編碼（Video+Depth）系統(tǒng)中，解碼端接收到一個普通的色彩圖像和一個像素深度信息圖后，根據(jù)深度信息圖重新生成立體圖像對。深度信息圖可以看作一個單色的亮度圖像，每個像素的深度數(shù)值被限定在最大值Zmax 和Zmin 之間，數(shù)值的大小代表相應(yīng)物點到鏡頭的遠(yuǎn)近。一般深度值通過8 比特線性量化，即：用255 代表最近點，0 代表最遠(yuǎn)點，這樣深度信息圖完全可以視為一個灰度圖像。
　　由于灰度圖像比較平滑，圖像邊緣比較銳利，大概色彩圖像10%～20%的比特速率就可以完成對灰度信息的編碼。這種V+D 的編碼方式比傳統(tǒng)立體視頻編碼有更高的效率。V+D視頻編碼方式中的色彩圖像可以直接在傳統(tǒng)的2D 顯示設(shè)備上播放，具有良好的后向兼容性。
　　多年來業(yè)界一致認(rèn)為，對某些3D 視頻業(yè)務(wù)（如3DTV）而言，良好的后向兼容性是關(guān)系到3D 視頻業(yè)務(wù)能否大規(guī)模應(yīng)用的關(guān)鍵。V+D 方式實現(xiàn)了高壓縮率，后向兼容性及更優(yōu)秀的3D視頻顯示功能，是很被看好的3D 視頻編碼方法。
　　V+D 作為目前3D 視頻編碼的研究熱點，已經(jīng)有了很多成熟的算法。這些算法大都利用了深度信息圖像的特征，有的還考慮到了色彩圖像和深度圖像的相關(guān)性等。
　　V+D 系統(tǒng)最終顯示的3D 視頻是由色彩圖像和深度圖像共同恢復(fù)出來的，通過觀察得知，深度圖像質(zhì)量的小幅下降并不會顯著影響所恢復(fù)的3D 視頻質(zhì)量，因此可以在編碼過程中使用較低分辨率的深度圖像，由于解碼端需要原始分辨率的深度信息圖像，人們提出了所謂的DSUS 算法，即在編碼前對深度信息圖像下采樣，解碼之前進(jìn)行上采樣，這種DSUS算法比直接用較低分辨率進(jìn)行編碼取得更好的視頻圖像質(zhì)量。
　　由于色彩圖像和深度圖的像是用來描述同一個視頻場景的內(nèi)容的，色彩圖像包含了顏色表面結(jié)構(gòu)等紋理信息，而深度描述每個像素點相對攝像機的位置。因此有人認(rèn)為在色彩圖像和深度圖像中的物體運動情況是一致的，可以把色彩圖像的運動矢量運用到深度圖像中，實現(xiàn)色彩和深度圖像共用運動矢量。研究結(jié)果證明通過一系列3D 宏塊的匹配算法可以實現(xiàn)碼率的降低，但同時也增加了計算的復(fù)雜度，使用這種共用運動矢量的算法，需要在碼率降低和運算復(fù)雜度提高之間做個折中。
　　這種 V+D 的編碼方式在實際應(yīng)用中也有一定困難，目前存在的最大問題是V+D 視頻的生成質(zhì)量不高。雖然當(dāng)前市場上有了可以自動獲取圖像深度的攝像機，但是攝像機獲取圖像深度信息的能力依然非常有限，深度預(yù)測算法也有許多改進(jìn)的空間�？紤]到深度預(yù)測差值對3D 視頻恢復(fù)有很大影響，改進(jìn)的算法一般都會犧牲編碼效率，因此非常有必要開發(fā)一套完全自動的，準(zhǔn)確，可靠的視頻深度獲取系統(tǒng)。可以說，提高V+D 視頻的獲取質(zhì)量是擴大該編碼方式應(yīng)用范圍的關(guān)鍵所在。

　　2.3 多視角視頻編碼（MVC）

　　多視角視頻即MVC 用多部攝像機從多個角度拍攝同一場景，傳統(tǒng)立體視頻可以當(dāng)作多視角視頻中攝像機數(shù)N=2 的特殊情況。每個攝像機獲取的視頻信息進(jìn)行獨立編碼是最直接的方法，但是由于拍攝的場景一樣，各個視頻間有很大的相關(guān)性，引入時序預(yù)測和視頻序列間預(yù)測能顯著提高編碼效率。
　　現(xiàn)在有很多算法提出了優(yōu)化的預(yù)測結(jié)構(gòu)。目前效率最高的編碼預(yù)測結(jié)構(gòu)是H.264/AVC標(biāo)準(zhǔn)支持的分等級的B 幀預(yù)測，但這種方法的編碼效果很大程度上依賴視頻圖像的內(nèi)容特征，攝像距離，幀率等。這種編碼方法的缺點是預(yù)測結(jié)構(gòu)復(fù)雜，所謂預(yù)測結(jié)構(gòu)復(fù)雜涉及到計算量，存儲空間，延遲等方面，在編碼過程中需要考慮碼率降低和復(fù)雜度升高之間的取舍。
　　現(xiàn)有的 MVC 編碼還出現(xiàn)了很多新的編碼方法，這些編碼算法的基本思想看可以概括為利用視頻序列間的相關(guān)性，提高預(yù)測的準(zhǔn)確性。如基于圖像景深和差值的預(yù)測方法，該方法通過在MVC 編碼中引入景深來提高預(yù)測的準(zhǔn)確度，光照和色彩補償?shù)姆椒ǹ梢蕴岣進(jìn)VC不同視頻序列的相關(guān)性。目前還出現(xiàn)了分布式的MVC 視頻編碼，利用用戶之間的交互性對視頻進(jìn)行有效的編碼和傳輸?shù)榷喾N靈活的編碼方式。
　　MVC 編碼的缺點在于多個視頻序列的控制相對其它編碼方法復(fù)雜，如多個視頻序列間的同步控制，不同序列的延時抖動對顯示端的影響。但是MVC 給用戶提供了多視角的視覺享受，MVC 編碼系統(tǒng)與傳統(tǒng)２D 系統(tǒng)相比，對硬件幾乎沒有特殊要求。應(yīng)用范圍特別廣泛，是很被看好的3D 視頻編碼方法。

　　2.4 多描述編碼（MDC）
　　在典型的通信環(huán)境中，壓縮后的3D 視頻數(shù)據(jù)需要在有突發(fā)錯誤的信道中傳輸，高效壓縮后的數(shù)據(jù)會對信道傳輸狀況十分敏感。為此人們提出了所謂的信源信道聯(lián)合編碼的概念，多描述編碼（MDC）就是其中一種應(yīng)用較為廣泛的信源信道聯(lián)合編碼方式。MDC 首先將原始數(shù)據(jù)分成兩個或者多個可獨立解碼的比特流，每個比特流稱為一個描述，在解碼端接受任何一個描述都可以恢復(fù)出質(zhì)量尚可的原始數(shù)據(jù)，接收到的描述越多，恢復(fù)出的原始數(shù)據(jù)越好。
　　達(dá)到這個效果的代價是需要在所有的描述中加入一定數(shù)量的冗余信息。
　　需要特別指明的是，MDC 編碼并不是一種基本的3D 視頻的表現(xiàn)格式，該方法只是為了實現(xiàn)數(shù)據(jù)的可靠性傳輸而使用的編碼手段。單個視頻編碼，基于深度的視頻編碼，多視角視頻都可以使用這個編碼手段來提高視頻數(shù)據(jù)傳輸?shù)目煽啃浴?br /> 　　多描述編碼（MDC）碼流之間相互獨立，且可以與多種編碼方式結(jié)合使用，通過不同信道傳輸，因而可以在較高的壓縮效率下增強信號的強壯性和靈活性。因此，MDC 已經(jīng)成為視頻圖像數(shù)據(jù)傳輸?shù)挠行Чぞ�。在�?dāng)前互聯(lián)網(wǎng)，無線網(wǎng)等資源受限的系統(tǒng)中，在多描述編碼做為解決問題的可選方案之一，具有很強的生命力。

　　3 3D 視頻傳輸技術(shù)

　　3D 視頻業(yè)務(wù)的蓬勃發(fā)展給傳輸網(wǎng)絡(luò)帶來很大挑戰(zhàn)，實時3D 視頻業(yè)務(wù)對網(wǎng)絡(luò)延時很敏感，立體視頻對不同視頻序列的同步性要求很高。在IP 網(wǎng)或者無線網(wǎng)這樣資源受限的網(wǎng)絡(luò)上實現(xiàn)視頻數(shù)據(jù)有效、可靠傳輸，是3D 視頻傳輸技術(shù)需要解決的問題。
　　視頻傳輸?shù)氖д嬷饕怯尚畔G失和信道錯誤引起的，在有線網(wǎng)絡(luò)中，擁塞引起的丟包是視頻失真的主要原因，而無線網(wǎng)絡(luò)的傳輸失真主要是由帶寬窄和信道干擾大引起的。因此為保證3D 視頻的傳輸質(zhì)量，現(xiàn)有傳輸技術(shù)在IP 網(wǎng)中重點解決丟包問題，無線網(wǎng)中重點關(guān)注差錯恢復(fù)。
　　為了防止數(shù)據(jù)在傳輸過程中發(fā)生數(shù)據(jù)丟失，人們提出了所謂的不對稱差錯保護法。這種算法的基本思想是，給3D 視頻中的重要信息編碼時分配更高的比特率，傳輸過程中給予更高的傳輸優(yōu)先級，進(jìn)行重點保護。例如，在V+D 視頻傳輸過程中，因為色彩圖像包含了絕大部分信息，丟失色彩圖像比丟失深度圖像更讓用戶難以接受，可以給色彩圖像更多的保護，以保證信道條件惡劣的情況下，用戶仍然接收到質(zhì)量尚可的視頻圖像。該方法也可以用在MDC、MVC 視頻編碼中。
　　在視頻傳輸過程中，如果發(fā)生丟幀失，可以用差錯隱藏算法降低丟幀對視頻質(zhì)量的影響，該算法的基本思想是：在視頻序列解碼過程中，如果發(fā)生丟幀或者接收到的某一幀質(zhì)量太差必須丟掉，可以用一個最近正確解碼的幀，通過運動矢量預(yù)測丟掉的幀。為了對丟失幀有更好的預(yù)測效果，一些更為復(fù)雜的預(yù)測方法還會綜合空間時間和頻譜域特點對運動矢量進(jìn)行糾正。
　　傳統(tǒng) IP 網(wǎng)上的信息傳遞采用單播和廣播的方式，兩種傳播方式有效性低且缺乏QoS 保證，廣播方式還會讓用戶被動接收無用信息或者接收到未經(jīng)授權(quán)的信息，尤其在存在路由環(huán)路時還可能引起廣播風(fēng)暴。組播技術(shù)有效彌補單播和廣播的缺陷，被認(rèn)為是解決3D 視頻傳輸?shù)挠行Ы鉀Q方案。
　　在傳送組播數(shù)據(jù)時，路由器需要構(gòu)造一個連接所有組播組成員的樹。根據(jù)這個樹，路由器得出轉(zhuǎn)發(fā)分組的一條唯一路徑，這個樹就是分布樹。根據(jù)構(gòu)造方法的不同，分布樹分為源分布樹和共享分布樹。源分布樹以組播源為根節(jié)點構(gòu)造到所有組播組成員的生成樹。共享分布樹的構(gòu)造方法是以網(wǎng)絡(luò)中的某特定路由器為根節(jié)點，由此根節(jié)點生成包含所有組成員的樹。使用共享分布樹時，組播源需要先把組播分組發(fā)送給集合點路由器，再由這個路由器轉(zhuǎn)發(fā)給其他的組成員。由于成員可以動態(tài)地加入和退出，分布樹也必須動態(tài)更新。動態(tài)分布樹的實現(xiàn)是組播技術(shù)的一個難點，目前已經(jīng)有了很多比較成熟的分布樹生成算法，這些分布樹基本實現(xiàn)了如下功能：能夠提供靜態(tài)預(yù)先計算功能，樹的結(jié)構(gòu)是集中化的，分布樹有自管功能，能夠根據(jù)網(wǎng)絡(luò)性能進(jìn)行調(diào)整。
　　現(xiàn)有組播技術(shù)根據(jù)組播分組的構(gòu)建方法不同可分為IP 組播和覆蓋組播，IP 組播假定每組有唯一確定的組地址，其他主機可以通過向該地址發(fā)消息而把信息傳遞給所有組成員。IP組播技術(shù)需要網(wǎng)絡(luò)中所有的路由節(jié)點都具有組播功能,而現(xiàn)實網(wǎng)絡(luò)中只有部分路由節(jié)點具有組播功能,因此IP 組播技術(shù)目前不能大范圍應(yīng)用到實際網(wǎng)絡(luò)中。覆蓋組播技術(shù)把網(wǎng)絡(luò)中具有組播功能的節(jié)點集看作組播覆蓋網(wǎng)絡(luò),在其上構(gòu)建“核心”組播數(shù)據(jù)分發(fā)樹,組成員以某種規(guī)則接入“核心”組播樹,從而實現(xiàn)組播功能。比較而言，IP 組播效率較高而覆蓋組播更為靈活。
　　組播技術(shù)在應(yīng)用中顯現(xiàn)出了很大的優(yōu)勢。組播技術(shù)可以通過建立合理的動態(tài)路由防止網(wǎng)絡(luò)擁塞，通過增加路由器的復(fù)制能力，防止同樣的數(shù)據(jù)包在線路上重復(fù)傳送�，F(xiàn)在有了很多很成熟的算法優(yōu)化組播傳送路由，有的算法還做到了傳播路由隨網(wǎng)絡(luò)性能調(diào)整，傳送的視頻包大小根據(jù)可用帶寬調(diào)整。
　　組播技術(shù)被認(rèn)為是傳播視頻數(shù)據(jù)業(yè)務(wù)最好的方案， IP 組播的所有路由器都需要記錄每個數(shù)據(jù)流的狀態(tài)，而覆蓋組播的各個分組之間不能共享底層信息，在傳播過程中需要考慮帶寬限制，連接限制和分組動態(tài)。這些問題是目前網(wǎng)絡(luò)傳輸技術(shù)研究的熱點，尤其利用MDC方式所提供的編碼傳輸間的多個接口的研究方向，已經(jīng)有了很成熟的解決方案。另一個研究方向就是根據(jù)應(yīng)用端點和途徑節(jié)點的重要性，找到算法合理分配上行帶寬。覆蓋組播的途徑節(jié)點模式是另一個研究方向，這個模式需要重點解決的問題是途經(jīng)節(jié)點的管理，哪些節(jié)點何時加入組播分組，何時離開組播分組。

　　4 結(jié)論

　　本文著重介紹了三種基本的3D 視頻表現(xiàn)格式，實際應(yīng)用中的3D 視頻編碼格式非常豐富，新的編碼方法不斷涌現(xiàn)，多種編碼方式有互相結(jié)合的趨勢，如在MDC 中的每個描述可以是一個V+D，也可以是MVC 的一個視頻序列，甚至在MVC 的每個視頻序列都可以是V+D 的表現(xiàn)格式。由于組播技術(shù)絕對優(yōu)勢，組播傳輸是未來3D 視頻傳輸?shù)淖钣袧摿Φ慕鉀Q方案，結(jié)合組播特點和3D 視頻業(yè)務(wù)的需求，是未來3D 視頻業(yè)務(wù)發(fā)展需要重點關(guān)注的問題。

【小議3D 視頻編碼傳輸技術(shù)】相關(guān)文章：

Video Object編碼技術(shù)05-29

通信工程中傳輸技術(shù)研究05-14

關(guān)于通信工程傳輸技術(shù)的應(yīng)用分析（精選8篇）07-26

通信工程傳輸技術(shù)探討論文（通用16篇）07-27

小議民事訴權(quán)06-04

小議安溪鐵觀音文化05-29

小議西方文學(xué)的研究趨向論文04-17

淺談廣播電視信息傳輸系統(tǒng)的維護措施08-10

我國信息傳輸、軟件和信息技術(shù)服務(wù)行業(yè)盈利驅(qū)動因素分析05-24

久久久久无码精品,四川省少妇一级毛片,老老熟妇xxxxhd,人妻无码少妇一区二区

小議3D 視頻編碼傳輸技術(shù)