MPEG

動態影像專家小組(英語:Moving Picture Experts Group,簡稱MPEG[1]為一源自國際標準化組織 (ISO) 與國際電工委員會 (IEC) 等國際組織的工作小組,成立於1988年,有超過300名專家一起制定影音壓縮及傳輸的規格標準。MPEG的官方正式命名為ISO/IEC JTC 1/SC 29/WG 11 – Coding of moving pictures and audio (ISO/IEC Joint Technical Committee 1, Subcommittee 29, Working Group 11)。


MPEG相關標準

該小組開發的第一個標準,為MPEG-1,是以大約1.5 Mbit/s的位元速率對音視訊信號進行編碼。這源於1988年一種日漸明朗的前瞻性視野,即將視訊信號存儲在光碟上,且其品質可以媲美VHS錄影帶。至目前為止,已有以下和視訊相關的標準:

  • MPEG-1:第一個官方的視訊音訊壓縮標準,包含5個部分的標準。前三部分依序是系統,視頻和音訊。隨後在Video CD中被采用,其中的音訊壓縮的第三級(MPEG-1 Layer 3)簡稱MP3,成為比較流行的音訊壓縮格式。
  • MPEG-2:廣播品質的視訊、音訊和傳輸協議。被用於無線數位電視-ATSC、DVB以及ISDB、數位衛星電視(例如DirecTV)、數位有线电视信号,以及DVD視訊光碟技術中。
  • MPEG-3:原本目標是為高解析度电视(HDTV)設計,隨後發現MPEG-2已足夠HDTV應用,故MPEG-3的研發便中止。
  • MPEG-4:2003年發布的視訊壓縮標準,主要是擴展MPEG-1、MPEG-2等標準以支援視訊/音訊物件(video/audio "objects")的編碼、3D內容、低位元率編碼(low bitrate encoding)和數位版權管理(Digital Rights Management),其中第10部分由ISO/IEC和ITU-T聯合發布,稱為H.264/MPEG-4 Part 10。
  • MPEG-7:MPEG-7並不是一個視訊壓縮標準,它是一個多媒體內容的描述標準。
  • MPEG-21:MPEG-21是一個正在制定中的標準,它的目標是為未來多媒體的應用提供一個完整的平台。

MPEG建立的壓縮流程

MPEG如何在不影響畫質的情況下大幅度減少數據呢?實際上,電視和電影畫面中的移動錯覺是通過快速連續顯示一系列仍然的圖片,每張圖片與前一張稍有變化來創造的。我們無法檢測個別的圖片 - 我們的大腦將這些動作“平滑化”。傻瓜型模擬電視畫面發送每一部分的每一張圖片,但數位的MPEG視頻更聰明。它會檢查兩張圖片並找出在兩者之間有多少部分是相同的。由於圖片從一張到下一張變化不大,因此有很多重複的部分。重複的部分不需要被保存或傳送,因為它們已經存在於前一張圖片中。這些部分可以被拋棄。數位視頻也包含我們的眼睛看不見的成分,所以這些也可以被拋棄,以下是技術流程。

MPEG(通常指MPEG-1)影像編碼是基於變換的有損編碼。光學信號線經過採樣形成視頻信號,視頻信號基本的單位叫做影格,一個影格就是一個獨立的圖像,然後,這些影格會被進一步分割成稱為大區塊(macroblocks)的小塊,進行後續的編碼處理。首先,這些宏塊會經過色彩空間轉換與色差信息的二次取樣,再來,進行離散餘弦變換(DCT)然後量化,經過量化後,DCT塊中的系數會經過Z字掃描,最後進行運行長度編碼(RLE)與熵編碼

色彩空間轉換與色差信息的二次取樣

在影片壓縮前,將RGB格式的畫面轉換成YCbCr格式,然後對色差信號進行二次取樣。這個步驟根據人眼對亮度變化比對色彩變化更敏感的特性,降低了色差通道的取樣率,從而達到更有效的壓縮。

離散餘弦變換 (DCT)

離散餘弦變換是一種將影格中的空間資訊轉換成頻率資訊的過程。DCT可以將影像從空間域轉換到頻率域,並且大部分能量會集中在低頻區域,這使得高頻區域的細節(通常人眼不太能感知)可以被更加有效地壓縮。

在MPEG-1中,使用8*8的DCT(離散餘弦變換)。利用此變換,可以將一個8x8的像素塊轉換為另一個8x8的塊。一般來說,大部分的能量(值)都集中在左上角。經過量化後的變換矩陣,這個矩陣中的大部分數據可能為零,然後使用Z字掃描和運行長度編碼 (RLE)可以實現高壓縮比。

量化

量化是一種降低資料精度的過程,用於進一步壓縮資料。在量化過程中,離散的數字信號被轉換為有限數量的可能值。

Z字掃描和運行長度編碼 (RLE)

在離散餘弦變換後,我們通常會得到一些零和非零的係數。Z字掃描是一種策略,將2維矩陣轉換為1維序列,然後運行長度編碼 (RLE) 被用來編碼這些連續的零,以達到壓縮的目的。

MPEG壓縮是一種將影片壓縮為更小的大小,但仍保留相對較高的視覺品質的過程。MPEG壓縮使用三種不同的影格類型:I、P、和B影格。

I、P、B 影格

  • I 影格(Intra frames):這些影格是自我含有的,即它們不參考任何其他影格,因此可以被視為是靜態的圖像。他們的壓縮方式與JPEG壓縮架構類似。
  • P 影格(Predictive frames)B 影格(Bidirectional frames):這兩種影格類型都依賴於其他影格,以達到更高的壓縮率。他們透過動態預測,對參考影格與當前影格進行差分編碼,再透過動態補償技術,以去除時間上的冗餘資訊,最後使用JPEG壓縮架構進行壓縮。

多層化檔頭和MPEG檔案

在MPEG壓縮流程的最後,壓縮過的影格資料會被組織成多個層次,每一層包含不同種類的資訊,如同步碼、時間碼等,並加上一個檔頭,以建立成一個MPEG檔案。這個檔案可以被解碼器正確的解讀,以還原成原始的影片。

這樣的壓縮策略,使得MPEG格式能高效的壓縮影片,並確保在壓縮後仍保有足夠的品質,適合進行網路傳輸或儲存。

MPEG-1MPEG-2MPEG-4實際上採用了的動量估計和動量補償技術。在利用了動量補償(圖像)中,被編碼的是經過動量補償的參考幀與當前圖像的差異。與傳統影像編碼技術不同,MPEG不是對每格影像進行壓縮,而是以一秒時段作為單位,將時段內的每一格影像進行比較,由於一般視頻內容的背景變化較小、主體變化較大,MPEG技術就應用這個特點,以一幅影像為主圖,其餘影像格只記錄參考資料及變化數據,從而更有效地記錄動態影像。從MPEG-1到MPEG-4,其核心技術仍然離不開這個原理,之間的差異主要體現在比較的過程和分析的複雜性等。

MPEG只規定位元流的格式與解碼精確度(即规定解码的方法),而任何人可依照MPEG標準以不同方式實現編碼器(程式)。除了可減少因编码專利造成的商業利益糾紛外,MPEG標準的主要目的在於確保不同的編碼器所產生的位元流可被其他解碼器正確的解碼,只要此位元流符合標準。

参见

参考文献

  1. ^ Reader, Cliff. MPEG Patents. MPEG Video Compression Standard. Boston, MA: Springer US. 1997: 357–362. ISBN 978-1-4899-4589-1. 

外部链接

  • MPEG Pointers & Resources
MPEG
  • MPEG-1
  • 2
  • 3
  • 4
  • 7英语MPEG-7
  • 21
  • A英语MPEG-A
  • B
  • C
  • D英语MPEG-D
  • E
  • G英语MPEG-G
  • V
  • M
  • U
  • H
  • I
  • 5英语MPEG-5
MPEG-1部分
  • 第1部分:系统
    • Program stream英语MPEG program stream
  • 第2部分:视频
  • 第3部分:音频
MPEG-2部分
  • 第1部分:系统 (H.222.0)
    • MPEG2-TS
    • Program stream英语MPEG program stream
  • 第2部分:视频 (H.262)
  • 第3部分:音频英语MPEG-2 Part 3
    • Layer I英语MPEG-1 Audio Layer I
    • Layer II
    • Layer III
    • MPEG多通道英语MPEG Multichannel
  • 第6部分:DSM CC英语DSM CC
  • 第7部分:進階音訊編碼
MPEG-4部分
  • 第2部分:视频英语MPEG-4 Part 2
  • 第3部分:音频英语MPEG-4 Part 3
  • 第6部分:DMIF英语Delivery Multimedia Integration Framework
  • 第10部分:高級影片編碼(H.264/MPEG-4 AVC)
  • 第11部分:场景描述英语MPEG-4 Part 11
  • 第12部分:ISO基本媒體文件格式英语ISO base media file format
  • 第14部分:MP4文件格式
  • 第17部分:流式文本格式英语MPEG-4 Part 17
  • 第20部分:LASeR英语MPEG-4 Part 20
  • 第22部分:OpenType字體格式
  • 第33部分:互聯網影片編碼英语Internet Video Coding
MPEG-7部分
  • 第2部分:描述定義語言英语Description Definition Language
MPEG-21部分
  • 第2、3、9部分:數字項目英语Digital Item
  • 第5部分:Rights Expression Language英语Rights Expression Language
MPEG-D部分
  • 第1部分:MPEG Surround英语MPEG Surround
  • 第3部分:統一語音及音頻編碼英语Unified Speech and Audio Coding
MPEG-G部分
  • 第1部分:Transport and Storage of Genomic Information英语MPEG-G
  • 第2部分:Coding of Genomic Information英语MPEG-G
  • 第3部分:APIs英语MPEG-G
  • 第4部分:Reference Software英语MPEG-G
  • 第5部分:Conformance英语MPEG-G
MPEG-H部分
MPEG-I部分
MPEG-5部分
  • 第1部分:基本影片編碼英语Essential Video Coding
  • 第2部分:低複雜度增強影片編碼英语LCEVC(LCEVC)
其它
MPEG标准
由MPEG制定
MPEG-1  · MPEG-2  · MPEG-3  · MPEG-4  · MPEG-7  · MPEG-21  · MPEG-H · MPEG-5 · MPEG-I
ITU-T标准
VCEG制定
H.261  · H.262  · H.263  · H.263v2  · H.264  · H.265  · H.266
IETF标准
IETF制定
NETVC英语NETVC(制定中)
视频壓縮
ISO/IEC
ITU-T
SMPTE
  • VC-1
  • VC-2英语Dirac (video compression format)
  • VC-3英语DNxHD codec
  • VC-5英语CineForm
開放媒體聯盟
On2 Technologies
(现属谷歌公司
苹果公司
  • Apple Video英语Apple Video
  • Apple ProRes
  • QuickTime
    • 动画英语QuickTime Animation
    • 图形英语QuickTime Graphics
中国标准化协会
其他
  • Bink视频英语Bink Video
  • Cinepak英语Cinepak
  • Daala
  • Dirac英语Dirac (video compression format)
  • DV
  • DVI英语Digital Video Interactive
  • FFV1英语FFV1
  • Huffyuv英语Huffyuv
  • Indeo英语Indeo
  • Lagarith
  • Microsoft Video 1英语Microsoft Video 1
  • MSU无损英语MSU Lossless Video Codec
  • OMS Video英语OMS Video
  • Pixlet英语Pixlet
  • RealVideo
  • RTVideo英语RTVideo
  • SheerVideo英语SheerVideo
  • Smacker英语Smacker video
  • Sorenson Video, Spark英语Sorenson codec
  • Theora
  • Thor英语Thor (video codec)
  • WMV
  • XEB英语ratDVD
  • YULS英语YULS
音频壓縮
ISO/IEC
  • MPEG-1 Layer III (MP3)
  • MPEG-1 Layer II
    • Multichannel英语MPEG Multichannel
  • MPEG-1 Layer I英语MPEG-1 Audio Layer I
  • AAC
    • HE-AAC
    • AAC-LD英语AAC-LD
  • MPEG Surround英语MPEG Surround
  • MPEG-4 ALS
  • MPEG-4 SLS英语MPEG-4 SLS
  • MPEG-4 DST
  • MPEG-4 HVXC英语Harmonic Vector Excitation Coding
  • MPEG-4 CELP
  • MPEG-D USAC英语Unified Speech and Audio Coding
  • MPEG-H 3D Audio英语MPEG-H 3D Audio
ITU-T
  • G.711A-law英语A-law algorithm, µ-law英语µ-law algorithm
  • G.718英语G.718
  • G.719
  • G.722
  • G.722.1英语G.722.1
  • G.722.2英语Adaptive Multi-Rate Wideband
  • G.723
  • G.723.1英语G.723.1
  • G.726
  • G.728英语G.728
  • G.729
  • G.729.1英语G.729.1
IETF
3GPP
  • AMR
  • AMR-WB英语Adaptive Multi-Rate Wideband
  • AMR-WB+英语Extended Adaptive Multi-Rate – Wideband
  • EVRC英语Enhanced Variable Rate Codec
  • EVRC-B英语Enhanced Variable Rate Codec B
  • EVS英语Enhanced Voice Services
  • GSM-HR英语Half Rate
  • GSM-FR英语Full Rate
  • GSM-EFR英语Enhanced full rate
ATSC,DVB
中国标准化协会
其他
  • ACELP英语Algebraic code-excited linear prediction
  • ALAC
  • Asao英语Asao (codec)
  • ATRAC
  • CELT
  • Codec2英语Codec2
  • FLAC
  • iSAC
  • Monkey's Audio
  • TTA
    • True Audio
  • TAK
  • MT9英语MT9
  • Musepack
  • OptimFROG
  • OSQ英语Original Sound Quality
  • QCELP英语Qualcomm code-excited linear prediction
  • RCELP英语Relaxed code-excited linear prediction
  • RealAudio
  • RTAudio英语RTAudio
  • SD2英语Avid Audio#Sound Designer file formats
  • SHN英语Shorten (file format)
  • SILK
  • Siren英语Siren (codec)
  • SMV英语Selectable Mode Vocoder
  • Speex
  • SVOPC英语SVOPC
  • TwinVQ英语TwinVQ
  • VMR-WB英语Variable-Rate Multimode Wideband
  • Vorbis
  • VSELP英语Vector sum excited linear prediction
  • WavPack
  • WMA
  • MQA
  • aptX
  • LDAC
  • MLP英语Meridian Lossless Packing
  • LHDC
  • SBC
图像压缩
IEC,ISO,ITU-T,W3C,IETF
其他
封裝格式
ISO/IEC
  • MPEG-ES英语Elementary stream
    • MPEG-PES英语Packetized elementary stream
  • MPEG-PS英语MPEG program stream
  • MPEG-TS
  • ISO基本媒体文件格式英语ISO base media file format
  • MPEG-4 Part 14(MP4)
  • Motion JPEG 2000英语Motion JPEG 2000
  • MPEG-21 Part 9英语Digital Item#File Format
  • MPEG媒体传输英语MPEG media transport
ITU-T
  • H.222.0
  • T.802英语Motion JPEG 2000
IETF
其他
合作
另见压缩方法、数据压缩软件