Komprimiranje slik - Laboratorij za obdelavo signalov in daljinska ...

Komprimiranje slikPriloga k vajam iz obdelave signalov in daljinskega vodenjaPeter Planinšic, Jože Mohorko, Žarko CucejFakulteta za elektrotehniko, racunalništvo in informatikoSmetanova 17, 62000 MariborInštitut za avtomatikoLaboratorij za obdelavo signalov in daljinska vodenjamaj, 19981

Spoznali bomo postopek kodiranja staticnih slik JPEG in kodiranja gibljivih slik MPEG zakompresijo digitaliziranih slikovnih in video podatkov ter obetavno kompresijo slik zdiskretno valovno transformacijo DWT.1. UvodZa vecino ljudi ima od vseh informacij, ki jih zaznavamo s svojimi cutili, slika najvecjo sporocilnomoc. Skica ali slika naprave ali kraja, diagrami potekov dogodkov, shematsko ilustrirani prikazidelovnih postopkov nam povedo vec in na razumljivejši nacin kot še tako dobri opisi, pa naj sibodo v pisni, torej spet vizualni obliki, ali govorjeni obliki. Zato je izdelava in obdelava slik,njihovo hranjenje in prenašanje nadvse pomembna vsakodnevna naloga na številnih podrocjihnašega življenja.Silovit napredek digitalne tehnologije, ki smo mu prica v zadnjem desetletju, posebej pri napravahza digitalizacijo slik, hranjenju podatkov, prikazu ter tiskanju slik, je naredil preboj v uporabidigitalnih slik na številnih podrocjih. Pri tem je kljucnega pomena velikanska kolicina podatkov, kiso potrebni za dolocitev digitalne slike. Tako na primer potrebujemo za eno (samo) barvno slikov TV locljivosti okoli milijon bytov, za 35 mm film pa (vsaj) deset krat toliko. Zato so se kmalupojavila prizadevanja, da z ustreznimi tehnikami kompresije skrcimo digitalni zapis slike.Kompresijske metode temeljijo tako na redundanci podatkov, kot na nelinearnosti cloveškegavida. Pri mirujocih slikah izkorišcajo koreliranost otipkov slike v prostoru, pri video signalu pa vprostoru in casu. Kompresijo v prostoru imenujemo slikovna (intraframe) kompresija, kompresijov casu pa medslikovna (interframe) kompresija. Poznamo vec nacinov komprimiranja slik. Naizbiro in širšo uveljavitev katere od tehnik komprimiranja zraven ucinkovitosti, izvedljivosti in cenevpliva predvsem standardizacija, ki omogoca povezavo naprav razlicnih proizvajalcev. Vsplošnem kompresijske tehnike delimo v dve družini:brezizgubno komprimiranje, ki omogoca popolno povrnitev komprimirane slike - povrnjenaslika je identicna digitalnemu originalu.izgubno komprimiranje, kjer je povrnjena slika (dovolj dober) približek originalne.Pri brezizgubnem komprimiranju odstranjujemo samo redundantne podatke. S takim krcenjemdosegamo kompresijska razmerja približno 3:1. Uporabljamo ga v podrocjih, ki so zeloobcutljiva na popacenja. Recimo v medicini morejo slike (na primer rentgenski posnetki)shranjene z izgubnim komprimiranjem povzrociti napacno diagnosticiranje.Pri izgubnem komprimiranju upoštevamo tudi fiziologijo vida. Vemo, da ima oko vec receptorjevobcutljivih na svetlost kot barvnih palck. Zato luminancni signal obicajno otipavamo z vecjofrekvenco in locljivostjo kot barvni signal. Oko je bolj obcutljivo na energijo signalov nižjihfrekvenc kot na energijo signalov višjih frekvenc. Zato je analiza slike s transformacijskodekompozicijo in vrednotenjem pomembnosti "frekvencnih" komponent zelo podobna procesugledanja.2

2. Transformacijsko komprimiranje staticnih slikTransformacijsko komprimiranje spada v družino kodnih tehnik, pri katerih najprej signalrazclenimo v osnovne komponente ali primitive, nakar jih kvantiziramo in kodiramo. Izkvantiziranih primitivov potem rekonstruiramo originalni signal - sliko.Originalna. slika Komprimirana slika Rekonstruirana slikaPrincip transformacijske kompresije slikeS transformacijo ponazorimo sliko z množico baznih funkcij. Njihovo prisotnost in vpliv pri opisuslike dolocajo transformacijski koeficienti, ki so obicajno veliko manj medsebojno korelirani kototipki slike. Vecinoma je tudi energija koncentrirana le okoli nekaj koeficientov. Zato stransformacijo zelo zmanjšamo odvecnost.Zakaj je potrebna dekompozicija signala? Neenakomerno distribucijo energije signala vfrekvencnem prostoru lahko izkoristimo kot osnovo za kompresijo signala. Princip je ta, da signalrazstavimo z dekorelacijsko metodo v podspektre oziroma podpasove, ki jih pri nadaljnjiobravnavi lahko loceno obravnavamo. S stališca teorije kodiranja damo vecjo prioriteto oziromatežo podspektrom z vecjo energijo. Z bitno alokacijo dolocimo razlicne kvantizacijske nivoje zarazlicne podpasove. Razstavitev signala v podpasove vodi preko procesiranja z razlicnimihitrostmi otipanja (multirate) po naravni poti do multiresolucijske razstavitve. V zadnjem casu seje kot elegantno orodje za multiresolucijsko razstavitev signala pojavila wavelet transformacija. Tatransformacija ima spremenljivo casovno - frekvencno resolucijo, kar je ugodno za analizonestacionarnih slikovnih signalov.Blokovne in prekrivajoce se transformacije lahko opazujemo kot specialne filterske banke.Vecresolucijsko (multirate) signalno procesiranje s perfektno rekonstrukcijskimi filterskimibankami je skupni teoreticni okvir vseh teh tehnik.Od fiksnih blokovnih transformacij, kot so diskretna Fourierjeva (DFT) in druge, se je vstandardih za kodiranje signalov zaradi ugodnih numericnih in dekorelacijskih lastnosti, uveljaviladiskretna kosinusna transformacija (DCT).Algoritme novejše tehnike komprimiranja signalov z uporabo wavelet transformacije razvijamotudi v našem laboratoriju.2.1 Postopek izgubne kompresije staticnih slik pri JPEG3

y+vπ1F ( u , v )=C4JPEG standard podpira razlicne metode kompresije staticnih slik. Tukaj bomo opisali osnovno(baseline) metodo. Na kratko povzeto je postopek kompresije s to metodo naslednji:Sliko razdelimo na bloke, velike 8x8 tock. Nad njim izvedemo dvodimenzionalno 8x8 -tockovno diskretno kosinusno transformacijo (DCT). Rezultat DCT je 64 - tockovnidiskretni signal, ki je funkcija dveh prostorskih frekvenc (ω , ω ). Element pri kateri sta obeprostorski komponenti enaki 0, imenujemo enosmerni (DC) koeficient, ostalih 63 paimenujemo izmenicne (AC) koeficiente.xyDiskretna kosinusna in inverzna kosinusna transformacija7 71 ⎡(2x+ 1) uπ(2y+1) vπυf (, x y) = Cu ( ) Cv () Fuv ( , ) cos cos4ελλ⋅ ⋅ ⋅ ⋅u=0 v16 16⎥⎣υε 1δ ; uv , = 0Cu ( ), C()v = ⎨ vδ⎩ 1; drugod4

DCT - koeficiente uniformno kvantiziramo. Kvantizacija je definirana kot deljenje vsakegakoeficienta DCT s svojim (ustreznim) kvantizacijskim korakom in zaokroževanjem nanajbližje celo število. Pri dolocanju kvantizacijskih korakov upoštevamo fiziološko znacilnostvida, vpisani so v tabelo, morajo imeti celoštevilcno vrednost med 0 in 256.Kvantizirane koeficiente pripravimo za kodiranje in to loceno enosmerni koeficient in ostalih63 izmenicnih koeficientov. Enosmerni koeficient, ki je merilo srednje vrednosti bloka 8x8 -tock, je obicajno mocno koreliran z enosmerno komponento sosednjega bloka. Zato ganadomestimo z diferenco z DC - komponento predhodnega bloka. Za tem vse koeficienterazporedimo v cik-cak sekvenco. S takšno razporeditvijo dosežemo, da so koeficienti z višjoenergijo pred visokofrekvencnimi komponentami, ki imajo obicajno nižjo energijo.DCAC 01AC 07DC i −1DC i∆DCi = DCi − DCi−1AC 70AC 77Diferencialno DC kodiranje Cik-cak sekvencaSlika : Priprava kvantiziranih koeficientov za entropijsko kodiranjeCik-cak otipane izmenicne komponente verižno kodiramo. S tem postopkom reduciramovsak 8x8 - blok DCT - koeficientov v vmesno sekvenco dogodkov. Obstajata dve vrstidogodkov. Prva so amplitude koeficientov, pri katerih ni predhodnih nicelnih koeficientov,drugi pa so amplitude, pred katerimi je dolocena sekvenca nicelnih amplitud. Ti dogodki se vnaslednje koraku ucinkovito kodirajo s Huffmanovo kodo.2.2 Uporaba DWT za kompresijo staticne slikeWavelet-podpasovno kodiranje je ucinkovita metoda izgubnega komprimiranja slik. Ciljizgubnega komprimiranja je opis originalne digitalne slike s cim manj biti, pri tem pa obdržatiželjeno kvaliteto za doloceno aplikacijo. Ekvivalentni dualni problem je iskanje minimalnegapopacenja ob željeni stopnji kompresije oziroma željenem številu bitov za opis slike. Ob fiksnihizbranih filtrih za wavelet-podpasovno kodiranje lahko omenjeno optimizacijo izvedemo zustrezno kvantizacijo in entropijskim kodiranjem. Na popacenje oziroma izgubo informacijeneposredno vpliva le kvantizacija, na optimizacijo pa dejansko tudi brezizgubno entropijskokodiranje.Zvezna wavelet in inverzna zvezna wavelet transformacijab gCWT t, a x( t) h t dt,b gxzza>0=z*a,tb gbt, g a,tb gdadtx t = c CWTxa h t2a5

hχt−τ ⎞= ⎜ ⎟χ a ρ*a, τ h ,Razdelitev frekvencnega prostora za WT (logaritemsko prekrivanje)Valovna transformacija (WT) je posebno zanimiva za proucevanje nestacionarnih signalov. Jeucinkovita alternativa klasicni casovno kratki Fourierjevi transformaciji (STFT) in Gaborjevitransformaciji. Osnovna razlika med WT in STFT je v oknu opazovanja signala. Pri analizi signalas STFT ima okno konstantno širino, pri WT pa je širina okna pri višjih frekvencah širša, pri nižjihpa ožja. Torej z WT opravimo frekvencno analizo signala s filtri s konstantno relativno pasovnoširino. Slikovni podatki so tipicni nestacionarni signali. Zato daje DWT (diskretna wavelettransformacija) boljše rezultate (PSNR) pri kompresiji slik kot DCT, saj je DCT iz družineFourierjevih transformacij.Postopek kompresije slik z uporabo DWT je naslednji:Z dvodimenzionalno DWT izvedemo multiresolucijsko analizo slike.Uporabili smo dvopasovne kvadraturno-zrcalne filterske banke (QMF).V enodimenzionalni piramidni podpasovni razstavitvi signala X ( z) dobimo prvi podpasovni signalkot izhod nizkoprepustnega filtra H ~ ( z ), ki ga podotipamo s faktorjem 2. Podobno dobimo drugipodpasovni signal kot izhod visokoprepustnega filtra G ~ ( z ) , ki ga prav tako podotipamo s~ ~faktorjem 2. Par filtrov H( z)in G( z ) imenujemo filtrski par za analizo. Ta postopek natoponovimo na nizkoprepustnem izhodu. S takšno piramidno shemo dobimo oktavno razstavitev.Vsak podpas potem zakodiramo loceno. Na sprejemni strani se rekonstrukcija pricne znadotipanjem s faktorjem 2, sledi mu filtriranje s filterskim parom za sintezo H( z) inG( z) inseštevanje rezultatov.Izhod dvopasovne filterske banke za analizo/sintezo, brez kvantizacije in kodiranja, lahkozapišemo:Xo( z) . ( H ~ ~= 0 5× ( z) × H( z)+ G ( z ) × G ( z )) × X ( z ). ( H ~ ~+ 0 5× ( z) × H( z)+ G ( - z ) × G ( - z )) × X ( - z )aliXo( z) = T ( z) × X( z) + S( z) × X( - z)Prvi clen v tem izrazu je željeni izhod, drugi pa vsebuje spektralno prekrivanje (aliasing). Pogostoza celoten sistem zahtevamo ojacanje ena in linearno fazo, torej perfektno (verno) rekonstrukcijo6

(PR) ali skoraj perkfektno rekonstrukcijo. Da se izognemo prekrivanju, postavimo S(z)=0. Tapogoj je enostavno izpoljnjen z izbiro~X( z)G ( z )= - - in G z H zDrugi clen mora potem biti:~ ( ) = ( ) .T( z) = c⋅z nOblikovanje filtrov pricnemo s H ~ ( z ) kot nizkoprepustnim filtrom H0 ( z ) . G ~ ( z ) je potem njegovkvadraturno zracalni visokoprepustni filter. Za povezavo med filtroma za analizo in sintezodobimo:− 0.H ~ ( z ~ ) = H ~ ( z ), G ( z ) = H ( - z ) = H ( -z);0 0H( z) = 2 × H ( z), G( z) = - 2 × H (-z)0 0Pri procesiranju slik je ugodno uporabiti FIR filtre z linearno fazo (simetricne). Pokažemo lahko,da izbira netrivijalniega FIR-filtra z linearno fazo za filter H0 ( z) povzroci amplitudno popacitevcelotnega sistema. Velikost te popacitve lahko minimiziramo z izbiro ustreznih koeficientov filtra.V naši aplikaciji smo uporabili filtre, ki jih je oblikoval Johnston [14], (Johnstonove filtre 16b).Kot smo omenili, ti filtre ne zakotavlajo PR-kvadraturno zrcalne filtrske banke. Vendar privisokih faktorjih kompresije kvantizacijski pogrešek prevladuje pogrešek rekonstrukcije filtrskebanke, ki ga lahko zato zanemarimo.V kodirni shemi smo uporabili seperabilno podpasovno transformacijo, pri kateri smo elementarnikorak enodimenzionalne piramidne sheme najprej uporabili na vrsticah, nato na kolonah matrikeoriginalne slike in nato postopek iteriramo na aproksimacijski sliki.Slika . Dvodimenzionalna wavelet-podpasovna transformacijaNa naslednji sliki je prikazana razporeditev detajlnih podslik in aproksimacijska podslika pri rresolucijskih nivojih v transformiranem prostoru.7

Slika . Razporeditev podslik in njihovo skaniranjeKer so podatki v preostali aproksimacijski podsliki še vedno precej medsebojno korelirani,izvedemo v naslednjem koraku nad njimi diferencialno pulzno-kodno modulacijo (DPCM),pri kateri tvorimo novo aproksimacijko podsliko, katere vsebina so diference sosednjih tock.Dobljene podslike multiresolucijske analize otipamo na nacin, kot je pokazano na sliki spodnji- desno. Vzorec otipavanja podslik je pogojen s strukturo podatkov v njih. Izbrani so takšnivzorci, ki zagotavljajo po kvantizaciji cim daljše sekvence nicelnih amplitud.V podpasovih (podslikah) smo uporabili uniformni skalarni kvantizator. Preslikovanji pridiskretizaciji ampitude (kvantizaciji) in “rekonstrukciji” lahko opišemo kot:t : R → Ζ, x a x / Q + 1/2 ;QrQ: Ζ → R,x a x ⋅ QVsaki podsliki Ti ( i = 1 ,... , K)transformirane slikeT dolocimo kvantizacijsko stopnico Q i ,amplitude podslik potem preslikujemo po preslikavi t Qi. Ceprav lahko v nacelu stopniceQ i izbiramo “prosto”, sta v praksi smiselni dve metodi. Pri enostavnejši uporabimo isto stopnico(korak) kvantizacije v vseh podsalikah transformiranega prostora, torej:Q1 = Q2= ... = QK= Q.Pri drugi metodi nabor kvantizacijskih stopnic Qi ( i = 1 ,..., K)lahko dolocimo na osnovioptimizacije kriterija kvalitete pri podani omejitvi bitne stopnje (kompresije).Na osnovi otipane sekvence kvantiziranih amplitud tvorimo novo (zacasno) sekvenco, ki jesestavljena iz dogodkov, podobno kot pri JPEG osnovni metodi. Tukaj smo uporabili zarazliko od JPEG - metode recency rank kodiranje, ki je "poceni" alternativa za veliko boljkompleksno kodno shemo, kot je dinamicni Huffmanov kodirnik [12]. To kodno shemo jepredlagal Bently at. al [8], pozneje pa jo je analiziral Elias [9]. Pokazano je bilo (Filip [10]),da ucinkovitost recency rank koderja ne zaostaja veliko za ucinkovitostjo optimalnegafiksnega (Huffmanovega) kodiranja v primeru, ko ga uporabimo na sekvenci neodvisnihidenticno porazdeljenih (i.i.d) dogodkov. Odlocilna prednost recency rank kodiranja je v hitriadaptaciji (prilagajanju) casovno spremenljivi statistiki.8

Slika 4: Prikaz dvodimenzionalne wavelet analize slike z diadicno banko filtrov. Levo jeoriginalna slika, desno je rezultat prve stopnje filtriranja.9

10Wavelet - analiza standardne testne slike LENA

Slika LENA (262144 bajtov) komprimirana s korakom kvantizacije 120 in piramidnovektorsko kvantizacijo na (2973 bajtov)Faktor kompresije 88.38 ( 0.090523 bpp)Srednja vrednost signala (slike) = 124.11MAE = 6.497RMS = 9.200PSNR = 28.85511

393735psnr3331WVTJPEG29270 0.2 0.4 0.6 0.8 1 1.2bppPrimerjava kompresije po JPEG in z DWT3. Kompresije gibljivih slikPri kompresiji gibljivih slik izkorišcamo koreliranost otipkov slike v sami sliki in med slikami, ki siv animaciji gibanja v sekvenci sledijo. Vtis gibanja nam ustvari že 12 do 15 slik na sekundo, prigeneriranju TV slike se izmenja 25 slik na sekundo. Zato so v teh primerih sledece si slike mocnokorelirane, med njim je le malo sprememb. S prenašanjem razlik med njimi dosegajo velikakompresijska razmerja, tudi 200:1 in vec.Na tem podrocju sta bila sprejeta dva standarda, H:261, popularno imenovan tudi standard p*64za video telefonijo in MPEG, ki bo verjetno temelj televizije visoke kakovosti (HDTV). Obauporabljata za kompresijo posamezne slike tehniko, ki temelji na osnovnem sistemu JPEG.3.1 MPEG standard za kompresijo gibljivih slikMPEG - model kodiranja video signalov bomo opisali le pregledno. CCITT MPEG skupino soustanovili 1988. leta, da bi razvila standard za shranjevanje video in pripadajocih avdio signalovna digitalnih medijih. Podrobnosti lahko najdete v literaturi [1] in standardu ISO [5] iz decembra1991.Video podatke lahko predstavimo kot zaporedje slik oziroma okvirjev I 1 , I 2 ,..., I N . Vsakosliko doloca dvodimenzionalna matrika RGB - trojic. RGB - trojica je nabor treh vrednostinivojev tocke na sliki, rdecega, zelenega in modrega.MPEG video kodiranje uporablja tri tehnike komprimiranja video podatkov:? Prva je transformacijsko kodiranje (transform coding), podobno tistemu pri JPEG -kompresiji slike [6]. Transformacijsko kodiranje izkorišca dve dejstvi. Prvo je, da jecloveško oko relativno manj obcutljivo na visokofrekvencne slikovne informacije. Drugo, da12

nekatere matematicne transformacije dekompozirajo sliko tako, da koncetrirajo energijookrog dolocenih spektralnih koeficientov, kar omogoca predstavitev signala z manj podatki.Ena izmed takšnih je transformacija DCT.Pri MPEG transformacijskem kodiranju vsako RGB - trojico transformiramo v YCrCb -trojico. Vrednost Y je nivo osvetlitve (belo - crno) ali luminanca, vrednosti Cr in Cb pa stabarvni informaciji ali krominanca. Ker je cloveško oko manj obcutljivo na krominanco kotluminanco, ravnini Cr in Cb podotipamo, zato sta njuni dolžini in višini prepolovljeni.Procesiranje poteka z delitvijo slike na makrobloke. Vsak makroblok vsebuje 16x16 - tockoriginalne slike. Makroblok vsebuje nabor šestih 8x8 - tockovnih blokov, 4 iz Y-ravnine inpo eno iz podotipanih ravnin Cr in Cb. Vsakega od teh blokov procesiramo na enak nacinkot pri JPEG: bloke transformiramo z 8x8 - tockovno DCT, dobljene koeficientekvantiziramo in jih kodiramo z entopijsko run-lenght kodo (koda s spremenljivo dolžino).Podrobnosti lahko najdete v [5]. Bistveno pa je naslednje:13

1) okvir je zgrajen iz zaporedja makroblokov.2) vsak blok v makrobloku procesiramo z DCT.3) po kvantizaciji vsebuje vsak blok mnogo nicelnih vrednosti, ki jih je mogoce ucinkovitokodirati z run-lenght kodo.Druga tehnika, ki jo MPEG uporablja za komprimiranje video signala, je kompenzacijagibanja (motion compensation). Ta izkorišca lastnost, da je okvir I k pogosto podobenpredhodnemu okviru I k−1 , ki ga imenujemo referencni okvir. Mnogo makroblokov v okviruI k lahko aproksimiramo s tako imenovanimi 16x16 - tockovnimi mirujocimi podrocji(pieces) v referencni sliki. Podobno lahko mnogo blokov v okviru I k+1 aproksimiramo stakšnimi podrocji v I k in I k−1 . Vektor oziroma kazalec na takšno podrocje v referencnemokviru lahko kodiramo z manj biti kot originalne tocke. To kodiranje vidno prispeva hkompresiji podatkov. Pri tem moramo povedati, da desna robova okvirov I k in I k+1 nemoremo dobiti iz predhodnega okvira. Nekatera podrocja vsebujejo novo informacijo, ki niprisotna v referencnem okviru. Kadar najdemo takšne makrobloke, te transformacijskokodiramo brez kompenzacije gibanja. Nadaljnjo kompresijo lahko dosežemo, ce lahko vtrenutku kodiranja okvira I k uporabimo kot referencna okvira predhodni I k−1 in naslednjiokvir I k+1 . To seveda zahteva dodatno pomnjenje in prinese zakasnitev v kodiranje indekodiranje. ^e uporabimo vecji skupek referencnih okvirjev, lahko kompenzacijo gibanjauporabimo za vec kodiranih okvirjev. Okvir, ki ga zgradimo iz predhodnega okvirja,imenujemo prediktivni ali P-okvir (forward, predicted), okvir, ki ga dobimo iz obeh,predhodnega in naslednjega okvira pa dvosmerni (bidirectional) ali B-okvir. Okvir, ki gakodiramo samo s transformacijskim kodiranjem, brez kompenzacije gibanja, imenujemonotranje kodirani (intracoded) ali I-okvir. Kompenzacijo gibanja napravimo za vsakmakroblok okvirov P in B. Ko kodiramo makroblok v okviru P ali B, najdemo najboljprimeren makroblok v razpoložljivih referencnih okvirih in potem kodiramo velikost zamika xin y, to je takoimenovani vektor gibanja (motion vector) za makroblok. Vektor gibanja jepodan v enotah celotne ali polovicne velikosti tocke. V zadnjem primeru najbližje si ležecetocke povprecimo. Ujemanje med napovedanim in dejanskim makroblokom pogosto nipopolno, tako dobimo diference med makrobloki, ki jih imenujemo pogreški (error terms) injih kodiramo s transformacijskim kodiranjem.Tretja tehnika, ki jo MPEG uporablja za kompresijo video podatkov, je uporaba kodneknjige (entry coding). Po kompenzaciji gibanja in transformacijskem kodiranju sledi zadnjiprehod cez podatke, kjer izvedemo Huffmanovo kodiranje.Naslednja slika povzema MPEG - kodiranje video signala. Za rekonstrukcijo YCrCb okvira pamoramo izvršiti naslednje korake:1) izvesti moramo inverzni postopek entropijskemu kodiranju.2) za okvira P in B moramo rekonstruirati vektorje gibanja in kopirati ustrezne dele referencnegaokvira.3) pogreške moramo dekodirati in jih vkljuciti v rekonstrukcijo, kar pomeni, uporabiti inverznokosinusno transformacijo (IDCT).Ko dobimo YCrCb okvir, ga pretvorimo v obliko, ki je primerna za prikaz. Taimenujemo dithering.postopek14

Okvir IVhodna slikaBGYTransformacijskokodiranimakroblokiizhod kodirnajaRCrCb01101100...YUV-konverzijaTransformacijskokodiranjemakroblokovEntropijskokodiranjeVhodna slikaBReferen~ni okviriYCr Cbpogre{kiTransformacijskokodiranjepogre{kovTransformacijsko kodiranimakroblokiOkvira P/BRGYCrCb+ +- +110...vektorji gibanjaYUV-konverzijaKompenzacijagibanjaSlika 5: MPEG - postopek kodiranja video signalaEntropijskokodiranjezaporedje slikskupina slikslikarezinamakroblokblok velikosti8x8-to~kSlika 6: Struktura MPEG - toka podatkov4. PovzetekCeprav tehnike komprimiranja z DWT niso mednarodno standardizirane, se vse bolj uveljavlja vuporabah, kjer želimo kvalitetno dekomprimirane slike pri cimvecjem kompresijskem razmerju.Tako je ta koncept predviden pri fotografiranju kometov, bolj zemeljske aplikacije pa so razneslikovne baze, kot so baze fotografij, slikovni muzejski arhivi, geografske informacijske baze terdaljinsko opazovanje in nadzor, kjer smo omejeni s pasovno širino prenosnega sistema itd. Kotsmo že povedali, se uporaba DWT vse bolj uveljavlja pri digitalni obdelavi nestacionarnihsignalov v merilni tehniki in avtomatiki, cemur prav tako posvecamo del naših aplikacijskihraziskav.15

5. Literatura1. Legall, "MPEG - A Video Compression Standard for Multimedia Applications,"Communications of the ACM, April 1991, Vol 34, Num 4, pp 46-58.2. E. Knuth, "Dynamic Huffman Coding", Journal of Algorithms 6, pp. 163-180, 19853. K. Wallace, "The JPEG still picture compression standard," IEEE Transaction on consumerelectronic4. Huffman, D.A., 1962, "A method for the construction of minimum redundancy codes." Inproceedings IRE, vol.40, pp. 1098-11015. ISO/IEC, "Coded Representation of Picture, Audio and Multimedia/HypermediaInformation", Committee Draft of Standard ISO/IEC 11172, December 6, 1991.6. ISO/IEC, "Digital Compression and Coding of Continous-Tone Still Images", ISO/IEC DraftInternational Standard 10918-1, January 10, 1992.7. D. Johnston, "A Filter Family Designed for use in Quadrature Mirror Filter Banks", in Proc.of IEEE ICASSP, pp. 291-294, 19808. L. Bentley, D. Sleator, R. E. Tarjan and V. K. Wei, "A Locally Adaptive Data CompressionScheme"' in Proc. of the 22nd Allerton Conference of Communication, Control andComputing, pp. 233-242, October 19849. Elias, "Interval and Recency Rank Source Coding: Two On-line Adaptive Variable - LengthSchemes", IEEE Trans. Inform. Theory, Vol. IT-3, pp. 3-10, January 198710. Filip, "An Efficient Method for Image Compression in the Wavelet Transform Domain", inProc. of the 38nd SPIE's Int. Symposium on Optics, Imaging and Instrumentation, SanDiego, LA, 11-16 July '9311. Ang, P. A. Ruetz, D. Auld, "Video compression makes big gains," IEEE specrum12. G. Gallager, "Variations on a Theme by Huffman", IEEE Trans. Inform. Theory, Vol. IT-24, pp.668-674, November 1978MPEG kot osnova digitalne televizijeTrenutno prevladajoca tehnologija analogne TV z redkimi izboljšavami pri resoluciji,barvah in tonu, temelji na Bairdsovi in Blumleinovi TV izpred druge svetovne vojne. Z razvojemdigitalne kompresije slik se je zacel prodor digitalne televizije. Kakor koli, za razliko odpodatkovne kompresije, tukaj izbubimo nekaj informacije. Producenti visokokvalitetnihprogramov želijo svoje dela shraniti z minimalno izgubo kvalitete. Temu trenutna tehnologijadigitalnega shranjevanja še ne ustreza. Poleg tega je današnja TV-slika le bleda predstava realneslike. ^isti digitalni prenos ni alternativa analognemu, saj bi na primer za prenos popolne studijkeTV potrebovali preko 140 Mb/s v primerjavi s potrebnimi 6 MHz za konvencionalni analogniPAL-signal. Zato vlada takšen entuzijazem pri nadaljnem razvoju digitalne kompresije slik. Velikooviro predstavlja tudi trenutni prenosni medij. Za zemeljsko TV je potrebno nekaj MW zapremagovanje razdalj nekaj kilometrov, pri satelitski pa le nekaj deset watov za nekaj tisockilometrov. Pri satelitski TV imamo na voljo prenosno širino kanala 36 Mhz v primerjavi z okrog8 Mhz pri zemeljski TV. Da bi omogocili kompatibilnost razlicnih metod distribucije digitalne TVslike, so se pojavili mnogi TV-standadi, kot so HDTVT, HD Divine, Spectre, Sterne, System16

2000, Race 203, Daimond in drugi. Pojav ameriške direc TV konec 80-tih je imel posledico, daje prakticno standard postal MPEG.MPEG standard (Motion Picture Experts Group of ISO) je zrasel iz JPEG (JointPhotographic Expert Group).MPEG-1 v zacetku leta 1991 je predvideval zmogljivost 1.5 Mb/s in je temeljila natakratnem stanju PC-vodil (Philips CD-Interactive ali CDi, PC-MPEG1 karte).Distributerji profesionalne širokopasovne TV so iskali svoje rešitve. Proucevali so, kolikobi lahko zreducirali zahtevano prenosno hitrost 140 Mhz za cisti digitalni prenos, da bi še dobilisprejemljivo kvaliteto in so koncem 80-tih let pristali okrog 25-35 Mb/s.Medtem so MPEG-1 podsistemi na siliciju dosegali tudi hitrosti 15 Mhz in še vec. Vodilniproizvajalec MPEG-cipov C-Cube Microsystems iz Californije je razvil dekoder CL450, prikaterem je vecina algoritma implementirana softversko v obliki mikrokode. Vse to je pogojevalonove verzije MPEG-standarda.Istocasno so iskali ceneno rešitev za VHS-magnetne trakove in kabelsko TV-omrežje. Biliso zbegani s kvaliteto slike, ki so jo dosegli s hitrostjo le 1.5 Mb/s in pricakovali še boljšerezultate z nekoliko povišano hitrostjo prenosa, ki bi jo še dopušcala obstojeca pasovna širinakanala 5 ali 6 Mhz. Pri okrog 2 Mb/s je kvaliteta slika približno enaka tisti pri domaci VHS in sepribliža širokopasovnemu PAL standardu pri okrog 12 Mb/s.PTT je prav tako želela vkljuciti sliko v svoje telekomunikacijske usluge. PTT ima prenosnistandard 1.2 in 8 Mb/s. Ali 1.2 Mb zadošca za potrošnike in 8 Mb/s za širokopasovne potrebe?MPEG je ocitno pokril že vsa ta potrocja in njegov razvoj se je zato še pospešil. Noveverzije standarda naj bi bile kompatibilne navzdol.Osnutek MPEG-2 se pojavil v letu 1992 in je dosegljiv pri telesih za standariacijo kot jeBSI. Glavna izbolojšava je možnost dinamicnega spreminjanja prenosne hitrosti z ozirom nanomoinalno 1.5 Mb/s pri MPEG-1. Prav tako MPEG-2 omogoca boljšo izrabo casovneredundance med povezanimi TV slikami. MPEG-2 je definiran kot popolnoma kompatibilen stelekomunikaciskim standardom za prenosne hitrosti. Real-time kodirniki se pojavljajo koncem1993. Komercialno dostopni MPEG-2 VLSI produkti pa se pojavljajo v zacetku 1994.Instalirana osnova domace, komercialne TV v glavnem ne dopušca sprejem RGB-signalov.Tako bo vecina gledalcev verjetno gledala MPEG-širokopasovno TV kot konvencionalne PAL,SECAM ali NTSC preko video-komposit signala ali celo UHF. Sistema DirecTV in Digital Skybosta seveda slonela na satelitskem prenosu. Sistem, ki bo omogocal zamenjavo zemeljskeširokopasovne TV, bo verjetno imel vodilno vlogo v novi tehnologiji in delitvi programov. Vdvajstetih letih bo verjetno vsako domacinstvo imelo opticni prikljucek in nadgradnja UHFverjetno ne bo potrebna vec. MPEG pripomore k povecanemu dobicku in efikasnosti. MPEGomogoca pakiranje pet, šest ali vec TV kanalov v prostor, ki ga je do sedaj zasedal le eden. Zapovprecnega gledalca bo to pomenilo le vec in ne boljše, dokler v nekaj letih ne bo nabavilnovega MPEG televizorja.Na International Television Symposium v Mountreuxu so Evropejci zapustili svoj MAC insprejeli MPEG kot standard.17

VideoserverPredhodnoshranjenjen MPEGbitni tokTV ali kabelski studioKodirnikVideo realnega casaVideo-vhodAudio-vhodMPEG2-videokodirnikMPEG2-audioMultiplekserKodiranjekorekcijenapakeModulacijaOddajakodirnikDekodirnikDom, pisarnaVideo-izhodAudio izhodMPEG2-videodekodirnikMPEG2-audioDemultiplekserKorekcijanapakenaprejDemodulacijaSprejemdekodirnikDodatna literatura:13. L. A. Rowe and B.C. S,mith, "A Continuous Media Player," Proc. 3rd nt'l Workshopon Network and Operating System Support for Digital Audio nd Video, San Diego, CA,Nov. 1992.14. T. Lane, "JPEG Software," Independent JPEG Group, Dec. 1992.15. R. Ulichney, "Digital Halftoning," MIT Press, Cambridge, Mass. 1987.16. John W. Woods, "Subband Image Coding;" Kluwer Academic Publisher, 1991.17. Arun N. Netravali & Barry G. Haskell. " Digital Pictures, representation andcompression." Plenum Press, 1988.18. Didier Le Gall MPEG: " A Video Compression Standard for Multimedia Applications."Trans. ACM, April 1991.19. C. Loeffler, A. Ligtenberg, G. S. Moschyitz. " Practical fast 1-D DCT algorithms with11 multiplications." Proceedings IEEE ICASSP-89, Vol. 2, pp 9888-991, Febr. 198920. IEC Standard Publication 461, Second edition 1986. " Time and control code for videotape recorders."21. CCITT Recommendation H.261. "Codec for audiovisual services at px64 kbits/s."Geneva, 1990.22. ISO/IEC DIS 10918-1. "Digital compression and coding of continuous-tone still images- Part 1: Requirements and quidelines."18

23. E. Viscito and C. Gonzales. " A Video Compression Algorithm with Adaptive Bit Allocationand Quantization." Proc. Spie Visual Communications and Image Proc'91, Boston MANovember 10-15, Vol 1605 205, 1991.24. A. Puri and R. Aravind. "Motion compensated Video Coding with Adaptive PerceptualQuantization." IEEE Trans on Circuits and Systems for Video Technology, Vol 1 pp 351,Dec 1991.25. ISO/IEC 11172-1:1993 Information Technology - Coding of moving pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 1: Systems.26. ISO/IEC 11172-1:1993 Information Technology - Coding of moving pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 2: Video.27. ISO/IEC 11172-1:1993 Information Technology - Coding of moving pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 3: Audio.28. ISO/IEC 11172-1:1993 Information Technology - Coding of moving pictures andassociated audio for digital media at up to about 1,5 Mbit/s - Part 4: Compilance testing.29. ISO/IEC 11172-1:1993 Information Technology - Coding of moving pictures andassociated audio for digital media at up to about 1,5 Mbit/s -Annexes A, B, C (integral part ofISO/IEC 11172) and D, E, F (for information only).30. CCIR Recommendation 601-2. "Encoding parameters of digital television for studios.31. CCIR Report 624-4. "Characteristics of systems for monochrome and colour television.32. CCIR Recommendation 648. " Recording of audio signals."33. CCIR Report 955-2. "Sound broadcasting by satelite for portable and mobile receivers,including Annex IV Summary description of Advanced Digital System II."34. CCITT Recommendation J.17. "Pre-emphasis used on Sound-Programme Circuits."35. IEEE Draft Standard P1180/D2 1990. "Specification for the implementation of 8x8 inversediscrete cosine transform."36. IEC publication 908:11987. "CD digital Audio System."19

Komprimiranje slik - Laboratorij za obdelavo signalov in daljinska ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?