12.07.2015 Views

Komprimiranje slik - Laboratorij za obdelavo signalov in daljinska ...

Komprimiranje slik - Laboratorij za obdelavo signalov in daljinska ...

Komprimiranje slik - Laboratorij za obdelavo signalov in daljinska ...

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Komprimiranje</strong> <strong>slik</strong>Priloga k vajam iz obdelave <strong>signalov</strong> <strong>in</strong> dalj<strong>in</strong>skega vodenjaPeter Plan<strong>in</strong>šic, Jože Mohorko, Žarko CucejFakulteta <strong>za</strong> elektrotehniko, racunalništvo <strong>in</strong> <strong>in</strong>formatikoSmetanova 17, 62000 MariborInštitut <strong>za</strong> avtomatiko<strong>Laboratorij</strong> <strong>za</strong> <strong>obdelavo</strong> <strong>signalov</strong> <strong>in</strong> dalj<strong>in</strong>ska vodenjamaj, 19981


Spoznali bomo postopek kodiranja staticnih <strong>slik</strong> JPEG <strong>in</strong> kodiranja gibljivih <strong>slik</strong> MPEG <strong>za</strong>kompresijo digitaliziranih <strong>slik</strong>ovnih <strong>in</strong> video podatkov ter obetavno kompresijo <strong>slik</strong> zdiskretno valovno transformacijo DWT.1. UvodZa vec<strong>in</strong>o ljudi ima od vseh <strong>in</strong>formacij, ki jih <strong>za</strong>znavamo s svojimi cutili, <strong>slik</strong>a najvecjo sporocilnomoc. Skica ali <strong>slik</strong>a naprave ali kraja, diagrami potekov dogodkov, shematsko ilustrirani prikazidelovnih postopkov nam povedo vec <strong>in</strong> na razumljivejši nac<strong>in</strong> kot še tako dobri opisi, pa naj sibodo v pisni, torej spet vizualni obliki, ali govorjeni obliki. Zato je izdelava <strong>in</strong> obdelava <strong>slik</strong>,njihovo hranjenje <strong>in</strong> prenašanje nadvse pomembna vsakodnevna naloga na številnih podrocjihnašega življenja.Silovit napredek digitalne tehnologije, ki smo mu prica v <strong>za</strong>dnjem desetletju, posebej pri napravah<strong>za</strong> digitali<strong>za</strong>cijo <strong>slik</strong>, hranjenju podatkov, prikazu ter tiskanju <strong>slik</strong>, je naredil preboj v uporabidigitalnih <strong>slik</strong> na številnih podrocjih. Pri tem je kljucnega pomena velikanska kolic<strong>in</strong>a podatkov, kiso potrebni <strong>za</strong> dolocitev digitalne <strong>slik</strong>e. Tako na primer potrebujemo <strong>za</strong> eno (samo) barvno <strong>slik</strong>ov TV locljivosti okoli milijon bytov, <strong>za</strong> 35 mm film pa (vsaj) deset krat toliko. Zato so se kmalupojavila pri<strong>za</strong>devanja, da z ustreznimi tehnikami kompresije skrcimo digitalni <strong>za</strong>pis <strong>slik</strong>e.Kompresijske metode temeljijo tako na redundanci podatkov, kot na nel<strong>in</strong>earnosti cloveškegavida. Pri mirujocih <strong>slik</strong>ah izkorišcajo koreliranost otipkov <strong>slik</strong>e v prostoru, pri video signalu pa vprostoru <strong>in</strong> casu. Kompresijo v prostoru imenujemo <strong>slik</strong>ovna (<strong>in</strong>traframe) kompresija, kompresijov casu pa med<strong>slik</strong>ovna (<strong>in</strong>terframe) kompresija. Poznamo vec nac<strong>in</strong>ov komprimiranja <strong>slik</strong>. Naizbiro <strong>in</strong> širšo uveljavitev katere od tehnik komprimiranja zraven uc<strong>in</strong>kovitosti, izvedljivosti <strong>in</strong> cenevpliva predvsem standardi<strong>za</strong>cija, ki omogoca pove<strong>za</strong>vo naprav razlicnih proizvajalcev. Vsplošnem kompresijske tehnike delimo v dve druž<strong>in</strong>i:brezizgubno komprimiranje, ki omogoca popolno povrnitev komprimirane <strong>slik</strong>e - povrnjena<strong>slik</strong>a je identicna digitalnemu orig<strong>in</strong>alu.izgubno komprimiranje, kjer je povrnjena <strong>slik</strong>a (dovolj dober) približek orig<strong>in</strong>alne.Pri brezizgubnem komprimiranju odstranjujemo samo redundantne podatke. S takim krcenjemdosegamo kompresijska razmerja približno 3:1. Uporabljamo ga v podrocjih, ki so zeloobcutljiva na popacenja. Recimo v medic<strong>in</strong>i morejo <strong>slik</strong>e (na primer rentgenski posnetki)shranjene z izgubnim komprimiranjem povzrociti napacno diagnosticiranje.Pri izgubnem komprimiranju upoštevamo tudi fiziologijo vida. Vemo, da ima oko vec receptorjevobcutljivih na svetlost kot barvnih palck. Zato lum<strong>in</strong>ancni signal obicajno otipavamo z vecjofrekvenco <strong>in</strong> locljivostjo kot barvni signal. Oko je bolj obcutljivo na energijo <strong>signalov</strong> nižjihfrekvenc kot na energijo <strong>signalov</strong> višjih frekvenc. Zato je anali<strong>za</strong> <strong>slik</strong>e s transformacijskodekompozicijo <strong>in</strong> vrednotenjem pomembnosti "frekvencnih" komponent zelo podobna procesugledanja.2


2. Transformacijsko komprimiranje staticnih <strong>slik</strong>Transformacijsko komprimiranje spada v druž<strong>in</strong>o kodnih tehnik, pri katerih najprej signalrazclenimo v osnovne komponente ali primitive, nakar jih kvantiziramo <strong>in</strong> kodiramo. Izkvantiziranih primitivov potem rekonstruiramo orig<strong>in</strong>alni signal - <strong>slik</strong>o.Orig<strong>in</strong>alna. <strong>slik</strong>a Komprimirana <strong>slik</strong>a Rekonstruirana <strong>slik</strong>aPr<strong>in</strong>cip transformacijske kompresije <strong>slik</strong>eS transformacijo ponazorimo <strong>slik</strong>o z množico baznih funkcij. Njihovo prisotnost <strong>in</strong> vpliv pri opisu<strong>slik</strong>e dolocajo transformacijski koeficienti, ki so obicajno veliko manj medsebojno korelirani kototipki <strong>slik</strong>e. Vec<strong>in</strong>oma je tudi energija koncentrirana le okoli nekaj koeficientov. Zato stransformacijo zelo zmanjšamo odvecnost.Zakaj je potrebna dekompozicija signala? Neenakomerno distribucijo energije signala vfrekvencnem prostoru lahko izkoristimo kot osnovo <strong>za</strong> kompresijo signala. Pr<strong>in</strong>cip je ta, da signalrazstavimo z dekorelacijsko metodo v podspektre oziroma podpasove, ki jih pri nadaljnjiobravnavi lahko loceno obravnavamo. S stališca teorije kodiranja damo vecjo prioriteto oziromatežo podspektrom z vecjo energijo. Z bitno alokacijo dolocimo razlicne kvanti<strong>za</strong>cijske nivoje <strong>za</strong>razlicne podpasove. Razstavitev signala v podpasove vodi preko procesiranja z razlicnimihitrostmi otipanja (multirate) po naravni poti do multiresolucijske razstavitve. V <strong>za</strong>dnjem casu seje kot elegantno orodje <strong>za</strong> multiresolucijsko razstavitev signala pojavila wavelet transformacija. Tatransformacija ima spremenljivo casovno - frekvencno resolucijo, kar je ugodno <strong>za</strong> analizonestacionarnih <strong>slik</strong>ovnih <strong>signalov</strong>.Blokovne <strong>in</strong> prekrivajoce se transformacije lahko opazujemo kot specialne filterske banke.Vecresolucijsko (multirate) signalno procesiranje s perfektno rekonstrukcijskimi filterskimibankami je skupni teoreticni okvir vseh teh tehnik.Od fiksnih blokovnih transformacij, kot so diskretna Fourierjeva (DFT) <strong>in</strong> druge, se je vstandardih <strong>za</strong> kodiranje <strong>signalov</strong> <strong>za</strong>radi ugodnih numericnih <strong>in</strong> dekorelacijskih lastnosti, uveljaviladiskretna kos<strong>in</strong>usna transformacija (DCT).Algoritme novejše tehnike komprimiranja <strong>signalov</strong> z uporabo wavelet transformacije razvijamotudi v našem laboratoriju.2.1 Postopek izgubne kompresije staticnih <strong>slik</strong> pri JPEG3


y+vπ1F ( u , v )=C4JPEG standard podpira razlicne metode kompresije staticnih <strong>slik</strong>. Tukaj bomo opisali osnovno(basel<strong>in</strong>e) metodo. Na kratko povzeto je postopek kompresije s to metodo naslednji:Sliko razdelimo na bloke, velike 8x8 tock. Nad njim izvedemo dvodimenzionalno 8x8 -tockovno diskretno kos<strong>in</strong>usno transformacijo (DCT). Rezultat DCT je 64 - tockovnidiskretni signal, ki je funkcija dveh prostorskih frekvenc (ω , ω ). Element pri kateri sta obeprostorski komponenti enaki 0, imenujemo enosmerni (DC) koeficient, ostalih 63 paimenujemo izmenicne (AC) koeficiente.xyDiskretna kos<strong>in</strong>usna <strong>in</strong> <strong>in</strong>verzna kos<strong>in</strong>usna transformacija7 71 ⎡(2x+ 1) uπ(2y+1) vπυf (, x y) = Cu ( ) Cv () Fuv ( , ) cos cos4ελλ⋅ ⋅ ⋅ ⋅u=0 v16 16⎥⎣υε 1δ ; uv , = 0Cu ( ), C()v = ⎨ vδ⎩ 1; drugod4


DCT - koeficiente uniformno kvantiziramo. Kvanti<strong>za</strong>cija je def<strong>in</strong>irana kot deljenje vsakegakoeficienta DCT s svojim (ustreznim) kvanti<strong>za</strong>cijskim korakom <strong>in</strong> <strong>za</strong>okroževanjem nanajbližje celo število. Pri dolocanju kvanti<strong>za</strong>cijskih korakov upoštevamo fiziološko znacilnostvida, vpisani so v tabelo, morajo imeti celoštevilcno vrednost med 0 <strong>in</strong> 256.Kvantizirane koeficiente pripravimo <strong>za</strong> kodiranje <strong>in</strong> to loceno enosmerni koeficient <strong>in</strong> ostalih63 izmenicnih koeficientov. Enosmerni koeficient, ki je merilo srednje vrednosti bloka 8x8 -tock, je obicajno mocno koreliran z enosmerno komponento sosednjega bloka. Zato ganadomestimo z diferenco z DC - komponento predhodnega bloka. Za tem vse koeficienterazporedimo v cik-cak sekvenco. S takšno razporeditvijo dosežemo, da so koeficienti z višjoenergijo pred visokofrekvencnimi komponentami, ki imajo obicajno nižjo energijo.DCAC 01AC 07DC i −1DC i∆DCi = DCi − DCi−1AC 70AC 77Diferencialno DC kodiranje Cik-cak sekvencaSlika : Priprava kvantiziranih koeficientov <strong>za</strong> entropijsko kodiranjeCik-cak otipane izmenicne komponente verižno kodiramo. S tem postopkom reduciramovsak 8x8 - blok DCT - koeficientov v vmesno sekvenco dogodkov. Obstajata dve vrstidogodkov. Prva so amplitude koeficientov, pri katerih ni predhodnih nicelnih koeficientov,drugi pa so amplitude, pred katerimi je dolocena sekvenca nicelnih amplitud. Ti dogodki se vnaslednje koraku uc<strong>in</strong>kovito kodirajo s Huffmanovo kodo.2.2 Uporaba DWT <strong>za</strong> kompresijo staticne <strong>slik</strong>eWavelet-podpasovno kodiranje je uc<strong>in</strong>kovita metoda izgubnega komprimiranja <strong>slik</strong>. Ciljizgubnega komprimiranja je opis orig<strong>in</strong>alne digitalne <strong>slik</strong>e s cim manj biti, pri tem pa obdržatiželjeno kvaliteto <strong>za</strong> doloceno aplikacijo. Ekvivalentni dualni problem je iskanje m<strong>in</strong>imalnegapopacenja ob željeni stopnji kompresije oziroma željenem številu bitov <strong>za</strong> opis <strong>slik</strong>e. Ob fiksnihizbranih filtrih <strong>za</strong> wavelet-podpasovno kodiranje lahko omenjeno optimi<strong>za</strong>cijo izvedemo zustrezno kvanti<strong>za</strong>cijo <strong>in</strong> entropijskim kodiranjem. Na popacenje oziroma izgubo <strong>in</strong>formacijeneposredno vpliva le kvanti<strong>za</strong>cija, na optimi<strong>za</strong>cijo pa dejansko tudi brezizgubno entropijskokodiranje.Zvezna wavelet <strong>in</strong> <strong>in</strong>verzna zvezna wavelet transformacijab gCWT t, a x( t) h t dt,b gxz<strong>za</strong>>0=z*a,tb gbt, g a,tb gdadtx t = c CWTxa h t2a5


hχt−τ ⎞= ⎜ ⎟χ a ρ*a, τ h ,Razdelitev frekvencnega prostora <strong>za</strong> WT (logaritemsko prekrivanje)Valovna transformacija (WT) je posebno <strong>za</strong>nimiva <strong>za</strong> proucevanje nestacionarnih <strong>signalov</strong>. Jeuc<strong>in</strong>kovita alternativa klasicni casovno kratki Fourierjevi transformaciji (STFT) <strong>in</strong> Gaborjevitransformaciji. Osnovna razlika med WT <strong>in</strong> STFT je v oknu opazovanja signala. Pri analizi signalas STFT ima okno konstantno šir<strong>in</strong>o, pri WT pa je šir<strong>in</strong>a okna pri višjih frekvencah širša, pri nižjihpa ožja. Torej z WT opravimo frekvencno analizo signala s filtri s konstantno relativno pasovnošir<strong>in</strong>o. Slikovni podatki so tipicni nestacionarni signali. Zato daje DWT (diskretna wavelettransformacija) boljše rezultate (PSNR) pri kompresiji <strong>slik</strong> kot DCT, saj je DCT iz druž<strong>in</strong>eFourierjevih transformacij.Postopek kompresije <strong>slik</strong> z uporabo DWT je naslednji:Z dvodimenzionalno DWT izvedemo multiresolucijsko analizo <strong>slik</strong>e.Uporabili smo dvopasovne kvadraturno-zrcalne filterske banke (QMF).V enodimenzionalni piramidni podpasovni razstavitvi signala X ( z) dobimo prvi podpasovni signalkot izhod nizkoprepustnega filtra H ~ ( z ), ki ga podotipamo s faktorjem 2. Podobno dobimo drugipodpasovni signal kot izhod visokoprepustnega filtra G ~ ( z ) , ki ga prav tako podotipamo s~ ~faktorjem 2. Par filtrov H( z)<strong>in</strong> G( z ) imenujemo filtrski par <strong>za</strong> analizo. Ta postopek natoponovimo na nizkoprepustnem izhodu. S takšno piramidno shemo dobimo oktavno razstavitev.Vsak podpas potem <strong>za</strong>kodiramo loceno. Na sprejemni strani se rekonstrukcija pricne znadotipanjem s faktorjem 2, sledi mu filtriranje s filterskim parom <strong>za</strong> s<strong>in</strong>tezo H( z) <strong>in</strong>G( z) <strong>in</strong>seštevanje rezultatov.Izhod dvopasovne filterske banke <strong>za</strong> analizo/s<strong>in</strong>tezo, brez kvanti<strong>za</strong>cije <strong>in</strong> kodiranja, lahko<strong>za</strong>pišemo:Xo( z) . ( H ~ ~= 0 5× ( z) × H( z)+ G ( z ) × G ( z )) × X ( z ). ( H ~ ~+ 0 5× ( z) × H( z)+ G ( - z ) × G ( - z )) × X ( - z )aliXo( z) = T ( z) × X( z) + S( z) × X( - z)Prvi clen v tem izrazu je željeni izhod, drugi pa vsebuje spektralno prekrivanje (alias<strong>in</strong>g). Pogosto<strong>za</strong> celoten sistem <strong>za</strong>htevamo ojacanje ena <strong>in</strong> l<strong>in</strong>earno fazo, torej perfektno (verno) rekonstrukcijo6


(PR) ali skoraj perkfektno rekonstrukcijo. Da se izognemo prekrivanju, postavimo S(z)=0. Tapogoj je enostavno izpoljnjen z izbiro~X( z)G ( z )= - - <strong>in</strong> G z H zDrugi clen mora potem biti:~ ( ) = ( ) .T( z) = c⋅z nOblikovanje filtrov pricnemo s H ~ ( z ) kot nizkoprepustnim filtrom H0 ( z ) . G ~ ( z ) je potem njegovkvadraturno zracalni visokoprepustni filter. Za pove<strong>za</strong>vo med filtroma <strong>za</strong> analizo <strong>in</strong> s<strong>in</strong>tezodobimo:− 0.H ~ ( z ~ ) = H ~ ( z ), G ( z ) = H ( - z ) = H ( -z);0 0H( z) = 2 × H ( z), G( z) = - 2 × H (-z)0 0Pri procesiranju <strong>slik</strong> je ugodno uporabiti FIR filtre z l<strong>in</strong>earno fazo (simetricne). Pokažemo lahko,da izbira netrivijalniega FIR-filtra z l<strong>in</strong>earno fazo <strong>za</strong> filter H0 ( z) povzroci amplitudno popacitevcelotnega sistema. Velikost te popacitve lahko m<strong>in</strong>imiziramo z izbiro ustreznih koeficientov filtra.V naši aplikaciji smo uporabili filtre, ki jih je oblikoval Johnston [14], (Johnstonove filtre 16b).Kot smo omenili, ti filtre ne <strong>za</strong>kotavlajo PR-kvadraturno zrcalne filtrske banke. Vendar privisokih faktorjih kompresije kvanti<strong>za</strong>cijski pogrešek prevladuje pogrešek rekonstrukcije filtrskebanke, ki ga lahko <strong>za</strong>to <strong>za</strong>nemarimo.V kodirni shemi smo uporabili seperabilno podpasovno transformacijo, pri kateri smo elementarnikorak enodimenzionalne piramidne sheme najprej uporabili na vrsticah, nato na kolonah matrikeorig<strong>in</strong>alne <strong>slik</strong>e <strong>in</strong> nato postopek iteriramo na aproksimacijski <strong>slik</strong>i.Slika . Dvodimenzionalna wavelet-podpasovna transformacijaNa naslednji <strong>slik</strong>i je prika<strong>za</strong>na razporeditev detajlnih pod<strong>slik</strong> <strong>in</strong> aproksimacijska pod<strong>slik</strong>a pri rresolucijskih nivojih v transformiranem prostoru.7


Slika . Razporeditev pod<strong>slik</strong> <strong>in</strong> njihovo skaniranjeKer so podatki v preostali aproksimacijski pod<strong>slik</strong>i še vedno precej medsebojno korelirani,izvedemo v naslednjem koraku nad njimi diferencialno pulzno-kodno modulacijo (DPCM),pri kateri tvorimo novo aproksimacijko pod<strong>slik</strong>o, katere vseb<strong>in</strong>a so diference sosednjih tock.Dobljene pod<strong>slik</strong>e multiresolucijske analize otipamo na nac<strong>in</strong>, kot je poka<strong>za</strong>no na <strong>slik</strong>i spodnji- desno. Vzorec otipavanja pod<strong>slik</strong> je pogojen s strukturo podatkov v njih. Izbrani so takšnivzorci, ki <strong>za</strong>gotavljajo po kvanti<strong>za</strong>ciji cim daljše sekvence nicelnih amplitud.V podpasovih (pod<strong>slik</strong>ah) smo uporabili uniformni skalarni kvanti<strong>za</strong>tor. Pre<strong>slik</strong>ovanji pridiskreti<strong>za</strong>ciji ampitude (kvanti<strong>za</strong>ciji) <strong>in</strong> “rekonstrukciji” lahko opišemo kot:t : R → Ζ, x a x / Q + 1/2 ;QrQ: Ζ → R,x a x ⋅ QVsaki pod<strong>slik</strong>i Ti ( i = 1 ,... , K)transformirane <strong>slik</strong>eT dolocimo kvanti<strong>za</strong>cijsko stopnico Q i ,amplitude pod<strong>slik</strong> potem pre<strong>slik</strong>ujemo po pre<strong>slik</strong>avi t Qi. Ceprav lahko v nacelu stopniceQ i izbiramo “prosto”, sta v praksi smiselni dve metodi. Pri enostavnejši uporabimo isto stopnico(korak) kvanti<strong>za</strong>cije v vseh podsalikah transformiranega prostora, torej:Q1 = Q2= ... = QK= Q.Pri drugi metodi nabor kvanti<strong>za</strong>cijskih stopnic Qi ( i = 1 ,..., K)lahko dolocimo na osnovioptimi<strong>za</strong>cije kriterija kvalitete pri podani omejitvi bitne stopnje (kompresije).Na osnovi otipane sekvence kvantiziranih amplitud tvorimo novo (<strong>za</strong>casno) sekvenco, ki jesestavljena iz dogodkov, podobno kot pri JPEG osnovni metodi. Tukaj smo uporabili <strong>za</strong>razliko od JPEG - metode recency rank kodiranje, ki je "poceni" alternativa <strong>za</strong> veliko boljkompleksno kodno shemo, kot je d<strong>in</strong>amicni Huffmanov kodirnik [12]. To kodno shemo jepredlagal Bently at. al [8], pozneje pa jo je analiziral Elias [9]. Poka<strong>za</strong>no je bilo (Filip [10]),da uc<strong>in</strong>kovitost recency rank koderja ne <strong>za</strong>ostaja veliko <strong>za</strong> uc<strong>in</strong>kovitostjo optimalnegafiksnega (Huffmanovega) kodiranja v primeru, ko ga uporabimo na sekvenci neodvisnihidenticno porazdeljenih (i.i.d) dogodkov. Odlocilna prednost recency rank kodiranja je v hitriadaptaciji (prilagajanju) casovno spremenljivi statistiki.8


Slika 4: Prikaz dvodimenzionalne wavelet analize <strong>slik</strong>e z diadicno banko filtrov. Levo jeorig<strong>in</strong>alna <strong>slik</strong>a, desno je rezultat prve stopnje filtriranja.9


10Wavelet - anali<strong>za</strong> standardne testne <strong>slik</strong>e LENA


Slika LENA (262144 bajtov) komprimirana s korakom kvanti<strong>za</strong>cije 120 <strong>in</strong> piramidnovektorsko kvanti<strong>za</strong>cijo na (2973 bajtov)Faktor kompresije 88.38 ( 0.090523 bpp)Srednja vrednost signala (<strong>slik</strong>e) = 124.11MAE = 6.497RMS = 9.200PSNR = 28.85511


393735psnr3331WVTJPEG29270 0.2 0.4 0.6 0.8 1 1.2bppPrimerjava kompresije po JPEG <strong>in</strong> z DWT3. Kompresije gibljivih <strong>slik</strong>Pri kompresiji gibljivih <strong>slik</strong> izkorišcamo koreliranost otipkov <strong>slik</strong>e v sami <strong>slik</strong>i <strong>in</strong> med <strong>slik</strong>ami, ki siv animaciji gibanja v sekvenci sledijo. Vtis gibanja nam ustvari že 12 do 15 <strong>slik</strong> na sekundo, prigeneriranju TV <strong>slik</strong>e se izmenja 25 <strong>slik</strong> na sekundo. Zato so v teh primerih sledece si <strong>slik</strong>e mocnokorelirane, med njim je le malo sprememb. S prenašanjem razlik med njimi dosegajo velikakompresijska razmerja, tudi 200:1 <strong>in</strong> vec.Na tem podrocju sta bila sprejeta dva standarda, H:261, popularno imenovan tudi standard p*64<strong>za</strong> video telefonijo <strong>in</strong> MPEG, ki bo verjetno temelj televizije visoke kakovosti (HDTV). Obauporabljata <strong>za</strong> kompresijo posamezne <strong>slik</strong>e tehniko, ki temelji na osnovnem sistemu JPEG.3.1 MPEG standard <strong>za</strong> kompresijo gibljivih <strong>slik</strong>MPEG - model kodiranja video <strong>signalov</strong> bomo opisali le pregledno. CCITT MPEG skup<strong>in</strong>o soustanovili 1988. leta, da bi razvila standard <strong>za</strong> shranjevanje video <strong>in</strong> pripadajocih avdio <strong>signalov</strong>na digitalnih medijih. Podrobnosti lahko najdete v literaturi [1] <strong>in</strong> standardu ISO [5] iz decembra1991.Video podatke lahko predstavimo kot <strong>za</strong>poredje <strong>slik</strong> oziroma okvirjev I 1 , I 2 ,..., I N . Vsako<strong>slik</strong>o doloca dvodimenzionalna matrika RGB - trojic. RGB - trojica je nabor treh vrednost<strong>in</strong>ivojev tocke na <strong>slik</strong>i, rdecega, zelenega <strong>in</strong> modrega.MPEG video kodiranje uporablja tri tehnike komprimiranja video podatkov:? Prva je transformacijsko kodiranje (transform cod<strong>in</strong>g), podobno tistemu pri JPEG -kompresiji <strong>slik</strong>e [6]. Transformacijsko kodiranje izkorišca dve dejstvi. Prvo je, da jecloveško oko relativno manj obcutljivo na visokofrekvencne <strong>slik</strong>ovne <strong>in</strong>formacije. Drugo, da12


nekatere matematicne transformacije dekompozirajo <strong>slik</strong>o tako, da koncetrirajo energijookrog dolocenih spektralnih koeficientov, kar omogoca predstavitev signala z manj podatki.Ena izmed takšnih je transformacija DCT.Pri MPEG transformacijskem kodiranju vsako RGB - trojico transformiramo v YCrCb -trojico. Vrednost Y je nivo osvetlitve (belo - crno) ali lum<strong>in</strong>anca, vrednosti Cr <strong>in</strong> Cb pa stabarvni <strong>in</strong>formaciji ali krom<strong>in</strong>anca. Ker je cloveško oko manj obcutljivo na krom<strong>in</strong>anco kotlum<strong>in</strong>anco, ravn<strong>in</strong>i Cr <strong>in</strong> Cb podotipamo, <strong>za</strong>to sta njuni dolž<strong>in</strong>i <strong>in</strong> viš<strong>in</strong>i prepolovljeni.Procesiranje poteka z delitvijo <strong>slik</strong>e na makrobloke. Vsak makroblok vsebuje 16x16 - tockorig<strong>in</strong>alne <strong>slik</strong>e. Makroblok vsebuje nabor šestih 8x8 - tockovnih blokov, 4 iz Y-ravn<strong>in</strong>e <strong>in</strong>po eno iz podotipanih ravn<strong>in</strong> Cr <strong>in</strong> Cb. Vsakega od teh blokov procesiramo na enak nac<strong>in</strong>kot pri JPEG: bloke transformiramo z 8x8 - tockovno DCT, dobljene koeficientekvantiziramo <strong>in</strong> jih kodiramo z entopijsko run-lenght kodo (koda s spremenljivo dolž<strong>in</strong>o).Podrobnosti lahko najdete v [5]. Bistveno pa je naslednje:13


1) okvir je zgrajen iz <strong>za</strong>poredja makroblokov.2) vsak blok v makrobloku procesiramo z DCT.3) po kvanti<strong>za</strong>ciji vsebuje vsak blok mnogo nicelnih vrednosti, ki jih je mogoce uc<strong>in</strong>kovitokodirati z run-lenght kodo.Druga tehnika, ki jo MPEG uporablja <strong>za</strong> komprimiranje video signala, je kompen<strong>za</strong>cijagibanja (motion compensation). Ta izkorišca lastnost, da je okvir I k pogosto podobenpredhodnemu okviru I k−1 , ki ga imenujemo referencni okvir. Mnogo makroblokov v okviruI k lahko aproksimiramo s tako imenovanimi 16x16 - tockovnimi mirujocimi podrocji(pieces) v referencni <strong>slik</strong>i. Podobno lahko mnogo blokov v okviru I k+1 aproksimiramo stakšnimi podrocji v I k <strong>in</strong> I k−1 . Vektor oziroma ka<strong>za</strong>lec na takšno podrocje v referencnemokviru lahko kodiramo z manj biti kot orig<strong>in</strong>alne tocke. To kodiranje vidno prispeva hkompresiji podatkov. Pri tem moramo povedati, da desna robova okvirov I k <strong>in</strong> I k+1 nemoremo dobiti iz predhodnega okvira. Nekatera podrocja vsebujejo novo <strong>in</strong>formacijo, ki niprisotna v referencnem okviru. Kadar najdemo takšne makrobloke, te transformacijskokodiramo brez kompen<strong>za</strong>cije gibanja. Nadaljnjo kompresijo lahko dosežemo, ce lahko vtrenutku kodiranja okvira I k uporabimo kot referencna okvira predhodni I k−1 <strong>in</strong> naslednjiokvir I k+1 . To seveda <strong>za</strong>hteva dodatno pomnjenje <strong>in</strong> pr<strong>in</strong>ese <strong>za</strong>kasnitev v kodiranje <strong>in</strong>dekodiranje. ^e uporabimo vecji skupek referencnih okvirjev, lahko kompen<strong>za</strong>cijo gibanjauporabimo <strong>za</strong> vec kodiranih okvirjev. Okvir, ki ga zgradimo iz predhodnega okvirja,imenujemo prediktivni ali P-okvir (forward, predicted), okvir, ki ga dobimo iz obeh,predhodnega <strong>in</strong> naslednjega okvira pa dvosmerni (bidirectional) ali B-okvir. Okvir, ki gakodiramo samo s transformacijskim kodiranjem, brez kompen<strong>za</strong>cije gibanja, imenujemonotranje kodirani (<strong>in</strong>tracoded) ali I-okvir. Kompen<strong>za</strong>cijo gibanja napravimo <strong>za</strong> vsakmakroblok okvirov P <strong>in</strong> B. Ko kodiramo makroblok v okviru P ali B, najdemo najboljprimeren makroblok v razpoložljivih referencnih okvirih <strong>in</strong> potem kodiramo velikost <strong>za</strong>mika x<strong>in</strong> y, to je takoimenovani vektor gibanja (motion vector) <strong>za</strong> makroblok. Vektor gibanja jepodan v enotah celotne ali polovicne velikosti tocke. V <strong>za</strong>dnjem primeru najbližje si ležecetocke povprecimo. Ujemanje med napovedanim <strong>in</strong> dejanskim makroblokom pogosto nipopolno, tako dobimo diference med makrobloki, ki jih imenujemo pogreški (error terms) <strong>in</strong>jih kodiramo s transformacijskim kodiranjem.Tretja tehnika, ki jo MPEG uporablja <strong>za</strong> kompresijo video podatkov, je uporaba kodneknjige (entry cod<strong>in</strong>g). Po kompen<strong>za</strong>ciji gibanja <strong>in</strong> transformacijskem kodiranju sledi <strong>za</strong>dnjiprehod cez podatke, kjer izvedemo Huffmanovo kodiranje.Naslednja <strong>slik</strong>a povzema MPEG - kodiranje video signala. Za rekonstrukcijo YCrCb okvira pamoramo izvršiti naslednje korake:1) izvesti moramo <strong>in</strong>verzni postopek entropijskemu kodiranju.2) <strong>za</strong> okvira P <strong>in</strong> B moramo rekonstruirati vektorje gibanja <strong>in</strong> kopirati ustrezne dele referencnegaokvira.3) pogreške moramo dekodirati <strong>in</strong> jih vkljuciti v rekonstrukcijo, kar pomeni, uporabiti <strong>in</strong>verznokos<strong>in</strong>usno transformacijo (IDCT).Ko dobimo YCrCb okvir, ga pretvorimo v obliko, ki je primerna <strong>za</strong> prikaz. Taimenujemo dither<strong>in</strong>g.postopek14


Okvir IVhodna <strong>slik</strong>aBGYTransformacijskokodiranimakroblokiizhod kodirnajaRCrCb01101100...YUV-konverzijaTransformacijskokodiranjemakroblokovEntropijskokodiranjeVhodna <strong>slik</strong>aBReferen~ni okviriYCr Cbpogre{kiTransformacijskokodiranjepogre{kovTransformacijsko kodiranimakroblokiOkvira P/BRGYCrCb+ +- +110...vektorji gibanjaYUV-konverzijaKompen<strong>za</strong>cijagibanjaSlika 5: MPEG - postopek kodiranja video signalaEntropijskokodiranje<strong>za</strong>poredje <strong>slik</strong>skup<strong>in</strong>a <strong>slik</strong><strong>slik</strong>arez<strong>in</strong>amakroblokblok velikosti8x8-to~kSlika 6: Struktura MPEG - toka podatkov4. PovzetekCeprav tehnike komprimiranja z DWT niso mednarodno standardizirane, se vse bolj uveljavlja vuporabah, kjer želimo kvalitetno dekomprimirane <strong>slik</strong>e pri cimvecjem kompresijskem razmerju.Tako je ta koncept predviden pri fotografiranju kometov, bolj zemeljske aplikacije pa so razne<strong>slik</strong>ovne baze, kot so baze fotografij, <strong>slik</strong>ovni muzejski arhivi, geografske <strong>in</strong>formacijske baze terdalj<strong>in</strong>sko opazovanje <strong>in</strong> nadzor, kjer smo omejeni s pasovno šir<strong>in</strong>o prenosnega sistema itd. Kotsmo že povedali, se uporaba DWT vse bolj uveljavlja pri digitalni obdelavi nestacionarnih<strong>signalov</strong> v merilni tehniki <strong>in</strong> avtomatiki, cemur prav tako posvecamo del naših aplikacijskihraziskav.15


5. Literatura1. Legall, "MPEG - A Video Compression Standard for Multimedia Applications,"Communications of the ACM, April 1991, Vol 34, Num 4, pp 46-58.2. E. Knuth, "Dynamic Huffman Cod<strong>in</strong>g", Journal of Algorithms 6, pp. 163-180, 19853. K. Wallace, "The JPEG still picture compression standard," IEEE Transaction on consumerelectronic4. Huffman, D.A., 1962, "A method for the construction of m<strong>in</strong>imum redundancy codes." Inproceed<strong>in</strong>gs IRE, vol.40, pp. 1098-11015. ISO/IEC, "Coded Representation of Picture, Audio and Multimedia/HypermediaInformation", Committee Draft of Standard ISO/IEC 11172, December 6, 1991.6. ISO/IEC, "Digital Compression and Cod<strong>in</strong>g of Cont<strong>in</strong>ous-Tone Still Images", ISO/IEC DraftInternational Standard 10918-1, January 10, 1992.7. D. Johnston, "A Filter Family Designed for use <strong>in</strong> Quadrature Mirror Filter Banks", <strong>in</strong> Proc.of IEEE ICASSP, pp. 291-294, 19808. L. Bentley, D. Sleator, R. E. Tarjan and V. K. Wei, "A Locally Adaptive Data CompressionScheme"' <strong>in</strong> Proc. of the 22nd Allerton Conference of Communication, Control andComput<strong>in</strong>g, pp. 233-242, October 19849. Elias, "Interval and Recency Rank Source Cod<strong>in</strong>g: Two On-l<strong>in</strong>e Adaptive Variable - LengthSchemes", IEEE Trans. Inform. Theory, Vol. IT-3, pp. 3-10, January 198710. Filip, "An Efficient Method for Image Compression <strong>in</strong> the Wavelet Transform Doma<strong>in</strong>", <strong>in</strong>Proc. of the 38nd SPIE's Int. Symposium on Optics, Imag<strong>in</strong>g and Instrumentation, SanDiego, LA, 11-16 July '9311. Ang, P. A. Ruetz, D. Auld, "Video compression makes big ga<strong>in</strong>s," IEEE specrum12. G. Gallager, "Variations on a Theme by Huffman", IEEE Trans. Inform. Theory, Vol. IT-24, pp.668-674, November 1978MPEG kot osnova digitalne televizijeTrenutno prevladajoca tehnologija analogne TV z redkimi izboljšavami pri resoluciji,barvah <strong>in</strong> tonu, temelji na Bairdsovi <strong>in</strong> Blumle<strong>in</strong>ovi TV izpred druge svetovne vojne. Z razvojemdigitalne kompresije <strong>slik</strong> se je <strong>za</strong>cel prodor digitalne televizije. Kakor koli, <strong>za</strong> razliko odpodatkovne kompresije, tukaj izbubimo nekaj <strong>in</strong>formacije. Producenti visokokvalitetnihprogramov želijo svoje dela shraniti z m<strong>in</strong>imalno izgubo kvalitete. Temu trenutna tehnologijadigitalnega shranjevanja še ne ustre<strong>za</strong>. Poleg tega je današnja TV-<strong>slik</strong>a le bleda predstava realne<strong>slik</strong>e. ^isti digitalni prenos ni alternativa analognemu, saj bi na primer <strong>za</strong> prenos popolne studijkeTV potrebovali preko 140 Mb/s v primerjavi s potrebnimi 6 MHz <strong>za</strong> konvencionalni analogniPAL-signal. Zato vlada takšen entuzijazem pri nadaljnem razvoju digitalne kompresije <strong>slik</strong>. Velikooviro predstavlja tudi trenutni prenosni medij. Za zemeljsko TV je potrebno nekaj MW <strong>za</strong>premagovanje razdalj nekaj kilometrov, pri satelitski pa le nekaj deset watov <strong>za</strong> nekaj tisockilometrov. Pri satelitski TV imamo na voljo prenosno šir<strong>in</strong>o kanala 36 Mhz v primerjavi z okrog8 Mhz pri zemeljski TV. Da bi omogocili kompatibilnost razlicnih metod distribucije digitalne TV<strong>slik</strong>e, so se pojavili mnogi TV-standadi, kot so HDTVT, HD Div<strong>in</strong>e, Spectre, Sterne, System16


2000, Race 203, Daimond <strong>in</strong> drugi. Pojav ameriške direc TV konec 80-tih je imel posledico, daje prakticno standard postal MPEG.MPEG standard (Motion Picture Experts Group of ISO) je zrasel iz JPEG (Jo<strong>in</strong>tPhotographic Expert Group).MPEG-1 v <strong>za</strong>cetku leta 1991 je predvideval zmogljivost 1.5 Mb/s <strong>in</strong> je temeljila natakratnem stanju PC-vodil (Philips CD-Interactive ali CDi, PC-MPEG1 karte).Distributerji profesionalne širokopasovne TV so iskali svoje rešitve. Proucevali so, kolikobi lahko zreducirali <strong>za</strong>htevano prenosno hitrost 140 Mhz <strong>za</strong> cisti digitalni prenos, da bi še dobilisprejemljivo kvaliteto <strong>in</strong> so koncem 80-tih let pristali okrog 25-35 Mb/s.Medtem so MPEG-1 podsistemi na siliciju dosegali tudi hitrosti 15 Mhz <strong>in</strong> še vec. Vodilniproizvajalec MPEG-cipov C-Cube Microsystems iz Californije je razvil dekoder CL450, prikaterem je vec<strong>in</strong>a algoritma implementirana softversko v obliki mikrokode. Vse to je pogojevalonove verzije MPEG-standarda.Istocasno so iskali ceneno rešitev <strong>za</strong> VHS-magnetne trakove <strong>in</strong> kabelsko TV-omrežje. Biliso zbegani s kvaliteto <strong>slik</strong>e, ki so jo dosegli s hitrostjo le 1.5 Mb/s <strong>in</strong> pricakovali še boljšerezultate z nekoliko povišano hitrostjo prenosa, ki bi jo še dopušcala obstojeca pasovna šir<strong>in</strong>akanala 5 ali 6 Mhz. Pri okrog 2 Mb/s je kvaliteta <strong>slik</strong>a približno enaka tisti pri domaci VHS <strong>in</strong> sepribliža širokopasovnemu PAL standardu pri okrog 12 Mb/s.PTT je prav tako želela vkljuciti <strong>slik</strong>o v svoje telekomunikacijske usluge. PTT ima prenosnistandard 1.2 <strong>in</strong> 8 Mb/s. Ali 1.2 Mb <strong>za</strong>došca <strong>za</strong> potrošnike <strong>in</strong> 8 Mb/s <strong>za</strong> širokopasovne potrebe?MPEG je ocitno pokril že vsa ta potrocja <strong>in</strong> njegov razvoj se je <strong>za</strong>to še pospešil. Noveverzije standarda naj bi bile kompatibilne navzdol.Osnutek MPEG-2 se pojavil v letu 1992 <strong>in</strong> je dosegljiv pri telesih <strong>za</strong> standariacijo kot jeBSI. Glavna izbolojšava je možnost d<strong>in</strong>amicnega sprem<strong>in</strong>janja prenosne hitrosti z ozirom nanomo<strong>in</strong>alno 1.5 Mb/s pri MPEG-1. Prav tako MPEG-2 omogoca boljšo izrabo casovneredundance med pove<strong>za</strong>nimi TV <strong>slik</strong>ami. MPEG-2 je def<strong>in</strong>iran kot popolnoma kompatibilen stelekomunikaciskim standardom <strong>za</strong> prenosne hitrosti. Real-time kodirniki se pojavljajo koncem1993. Komercialno dostopni MPEG-2 VLSI produkti pa se pojavljajo v <strong>za</strong>cetku 1994.Instalirana osnova domace, komercialne TV v glavnem ne dopušca sprejem RGB-<strong>signalov</strong>.Tako bo vec<strong>in</strong>a gledalcev verjetno gledala MPEG-širokopasovno TV kot konvencionalne PAL,SECAM ali NTSC preko video-komposit signala ali celo UHF. Sistema DirecTV <strong>in</strong> Digital Skybosta seveda slonela na satelitskem prenosu. Sistem, ki bo omogocal <strong>za</strong>menjavo zemeljskeširokopasovne TV, bo verjetno imel vodilno vlogo v novi tehnologiji <strong>in</strong> delitvi programov. Vdvajstetih letih bo verjetno vsako domac<strong>in</strong>stvo imelo opticni prikljucek <strong>in</strong> nadgradnja UHFverjetno ne bo potrebna vec. MPEG pripomore k povecanemu dobicku <strong>in</strong> efikasnosti. MPEGomogoca pakiranje pet, šest ali vec TV kanalov v prostor, ki ga je do sedaj <strong>za</strong>sedal le eden. Zapovprecnega gledalca bo to pomenilo le vec <strong>in</strong> ne boljše, dokler v nekaj letih ne bo nabavilnovega MPEG televizorja.Na International Television Symposium v Mountreuxu so Evropejci <strong>za</strong>pustili svoj MAC <strong>in</strong>sprejeli MPEG kot standard.17


VideoserverPredhodnoshranjenjen MPEGbitni tokTV ali kabelski studioKodirnikVideo realnega casaVideo-vhodAudio-vhodMPEG2-videokodirnikMPEG2-audioMultiplekserKodiranjekorekcijenapakeModulacijaOddajakodirnikDekodirnikDom, pisarnaVideo-izhodAudio izhodMPEG2-videodekodirnikMPEG2-audioDemultiplekserKorekcijanapakenaprejDemodulacijaSprejemdekodirnikDodatna literatura:13. L. A. Rowe and B.C. S,mith, "A Cont<strong>in</strong>uous Media Player," Proc. 3rd nt'l Workshopon Network and Operat<strong>in</strong>g System Support for Digital Audio nd Video, San Diego, CA,Nov. 1992.14. T. Lane, "JPEG Software," Independent JPEG Group, Dec. 1992.15. R. Ulichney, "Digital Halfton<strong>in</strong>g," MIT Press, Cambridge, Mass. 1987.16. John W. Woods, "Subband Image Cod<strong>in</strong>g;" Kluwer Academic Publisher, 1991.17. Arun N. Netravali & Barry G. Haskell. " Digital Pictures, representation andcompression." Plenum Press, 1988.18. Didier Le Gall MPEG: " A Video Compression Standard for Multimedia Applications."Trans. ACM, April 1991.19. C. Loeffler, A. Ligtenberg, G. S. Moschyitz. " Practical fast 1-D DCT algorithms with11 multiplications." Proceed<strong>in</strong>gs IEEE ICASSP-89, Vol. 2, pp 9888-991, Febr. 198920. IEC Standard Publication 461, Second edition 1986. " Time and control code for videotape recorders."21. CCITT Recommendation H.261. "Codec for audiovisual services at px64 kbits/s."Geneva, 1990.22. ISO/IEC DIS 10918-1. "Digital compression and cod<strong>in</strong>g of cont<strong>in</strong>uous-tone still images- Part 1: Requirements and quidel<strong>in</strong>es."18


23. E. Viscito and C. Gon<strong>za</strong>les. " A Video Compression Algorithm with Adaptive Bit Allocationand Quanti<strong>za</strong>tion." Proc. Spie Visual Communications and Image Proc'91, Boston MANovember 10-15, Vol 1605 205, 1991.24. A. Puri and R. Arav<strong>in</strong>d. "Motion compensated Video Cod<strong>in</strong>g with Adaptive PerceptualQuanti<strong>za</strong>tion." IEEE Trans on Circuits and Systems for Video Technology, Vol 1 pp 351,Dec 1991.25. ISO/IEC 11172-1:1993 Information Technology - Cod<strong>in</strong>g of mov<strong>in</strong>g pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 1: Systems.26. ISO/IEC 11172-1:1993 Information Technology - Cod<strong>in</strong>g of mov<strong>in</strong>g pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 2: Video.27. ISO/IEC 11172-1:1993 Information Technology - Cod<strong>in</strong>g of mov<strong>in</strong>g pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 3: Audio.28. ISO/IEC 11172-1:1993 Information Technology - Cod<strong>in</strong>g of mov<strong>in</strong>g pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 4: Compilance test<strong>in</strong>g.29. ISO/IEC 11172-1:1993 Information Technology - Cod<strong>in</strong>g of mov<strong>in</strong>g pictures andassociated audio for digital media at up to about 1,5 Mbit/s -Annexes A, B, C (<strong>in</strong>tegral part ofISO/IEC 11172) and D, E, F (for <strong>in</strong>formation only).30. CCIR Recommendation 601-2. "Encod<strong>in</strong>g parameters of digital television for studios.31. CCIR Report 624-4. "Characteristics of systems for monochrome and colour television.32. CCIR Recommendation 648. " Record<strong>in</strong>g of audio signals."33. CCIR Report 955-2. "Sound broadcast<strong>in</strong>g by satelite for portable and mobile receivers,<strong>in</strong>clud<strong>in</strong>g Annex IV Summary description of Advanced Digital System II."34. CCITT Recommendation J.17. "Pre-emphasis used on Sound-Programme Circuits."35. IEEE Draft Standard P1180/D2 1990. "Specification for the implementation of 8x8 <strong>in</strong>versediscrete cos<strong>in</strong>e transform."36. IEC publication 908:11987. "CD digital Audio System."19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!