Mjukvarurealiserad bildtelefoni - Umeå universitet

More documents

Recommendations

Info

Temporal redundans Hitintills har komprimering av stillbilder eller enskilda bildrutor i videosekvenser och de tekniker för detta som används diskuterats. Det finns dock stora effektivitetsvinster att göra i kompression av rörliga bilder genom att studera hur temporal redundans, d.v.s. överflödig och över tiden dåligt representerad information i bildsekvenser, kan reduceras. När det gäller kompression av videosekvenser finns det ett flertal olika format och tekniker att använda, både för lagring och för överföring av video. Vissa kan användas för båda områden men den stora skillnaden dem emellan brukar som tidigare vara att vid lagring är det möjligt att göra större antaganden om den klient som skall spela upp eller använda bildsekvensen. Inom bildtelefon avses naturligtvis överföring av bilder och noteras bör att de tekniker som används för detta ofta även kan användas för lagring även om det motsatta sällan är fallet. Ett enkelt och illustrativt exempel på temporal redundans är vid överföring av bilder – om övre halvan av en bild inte har förändrats sedan föregående bildruta så finns det ju ingen anledning att sända den delen av bilden igen, mottagaren instrueras helt enkelt istället att återanvända den övre halvan från föregående bildruta. Naturligtvis finns det en stor nackdel med denna typ av resonemang – förlitar systemet sig på att föregående bildruta verkligen nått fram till mottagaren intakta begränsas möjligheten till att återhämta sig från fel som beror på paketbortfall eller temporära förkastningar av hela bildrutor. Det senare (s.k. frame drops) är för övrigt ett vanligt problem även för användning av lokala filmsekvenser som dyker upp när den codec (kodare / avkodare) som används för att (av)koda filmsekvensen inte hinner med. Denna typ av fel, som uppstår när referenser till föregående bildrutor är ogiltiga, kan även fortplanta sig till efterföljande bildrutor i en kaskadeffekt av fel. För att motverka denna effekt är det därför brukligt att regelbundet sätta in s.k. reference frames som sänds i sin helhet och inte har några beroenden av tidigare bildrutor. Det är även viktigt att notera att det vid kompression för överföring finns stora skillnader i kraven på temporala komponenter inom systemet. Handlar det om envägskommunikation (exempelvis videoöverföring för television) så kan det i förväg läggas ner mycket tid på att identifiera temporal redundans och koda undan denna. Handlar det om tvåvägskommunikation så kommer svarstiden för kommunikationskanalen att stå för en stor del av användarnas uppfattning av systemets effektivitet. Eftersom temporal redundans kan vara mycket kostsam att identifiera men även samtidigt ge stora möjligheter till kompression så bör denna del designas noggrant. Som tidigare noterades beror den stora effektiviteten för transformbaserad kompression på den höga korrelationen mellan närliggande pixlar i naturliga bilder. Det är faktiskt även möjligt att använda en tredimensionell DCT för att komprimera en bild som förändras över tiden, d.v.s. en videosekvens. Framgången för denna metod beror då på att även korrelationen över den tredje dimensionen (tiden) för närliggande pixlar är hög. Detta är speciellt sant för bildsekvenser med hög bildfrekvens eftersom rörliga objekt i bilden då inte hinner förflytta sig lika långt i bilden som de skulle med en lägre bildfrekvens. Med andra ord tenderar rörelserna av objekt i bilden att minska när signalens bildfrekvens ökar. Detta ökar i sin tur korrelationen mellan pixlar i närliggande bildrutor. Denna observation är viktig även om metoden med tredimensionell DCT är olämplig för kompression för överföring (man skulle då behöva flera bilder innan det var möjligt att ens komprimera ett enda block i den första). Även för kompression för lagring är denna metod sällan använd, här dock eftersom det finns andra och mer effektiva metoder för elimination av temporal redundans. Det går även att öka den temporala redundansen i rörliga bilder med hjälp av förbehandling, ofta genom att modellera en fysisk störningskälla och kompensera för denna. Ett exempel på detta är de s.k. skakfilter som idag är vanliga på handhållna videokameror. Dessa är dock sällan med i <strong>bildtelefoni</strong>system eftersom dess kameror (av just den anledningen) monteras fixt. När det generellt gäller system som utnyttjar temporal redundans är det värt att notera att en bildkälla av hög kvali- 48
tet kan göra mycket för systemets totala effektivitet. En lätt störning som introduceras av bildkällan kan störa kompressionparametrarna mycket. Typiska exempel på detta är de billiga webkameror som idag ofta används för bildkommunikation över Internet. På grund av bristande optik och bildsensorer finns det ofta i dessa automatiska algoritmer för bildförbättring eller ljuskompensation inbyggda i drivrutinerna. I ett system för <strong>bildtelefoni</strong> vore det bättre om dessa algoritmer användes i mottagarens ände, efter att alla kompressionselement passerats. Att identifiera temporal redundans är ett oerhört effektivt sätt att komprimera rörliga bilder och mycket arbete läggs därför ner på den delen av kompressionssystemet. Notera speciellt att detta angreppssätt erbjuder möjlighet till effektiv förlustfri komprimering. Det finns många olika sätt att angripa temporal redundans, från det allra enklaste – att jämföra pixel för pixel vilka som förändrats sedan föregående bildruta – till de mest avancerade sätt att försöka identifiera objekt i bilden och sedan förutsäga hur de kommer att röra sig i framtida bildrutor. Vissa av dessa ansatser kan vara mycket oförutsägbara och beräkningsintensiva (och därmed variera mycket i exekveringstid). Av denna anledning är de mer avancerade varianterna populärare i system riktade mot kompression för lagring. Om kompression av rörliga bilder bör även nämnas att betraktandet av rörliga bilder som sekvenser av stillbilder inte är optimalt för mänskliga slutanvändare. Det mänskliga synsystemet är konstruerat för sanna rörliga bilder och kan i rörelse lättare detektera vissa fel som är osynliga i stillbilder (något som även ibland kan fungera till systemets fördel då vissa fel förminskas i rörelse). Interlaced frames En äldre metod för reduktion av temporal redundans som tidigare var vanlig inom television var att växelvis bara ta med varannan linje i bilden för varje bildruta, s.k. interlacing. Detta är svårt för det mänskliga ögat att uppfatta och ger en enkel form av komprimering. Tyvärr påverkar denna metod samtidigt bildens kvalitet och döljer mycket av den redundans som senare delar av kompressionssystemet hoppas kunna komma åt. Pixel coding En av de enklaste metoderna för att beskära temporal redundans är att jämföra bildrutor pixel för pixel och endast koda de som förändrats. Denna metod är effektiv för enklare animeringar och kan användas tillsammans med ett adaptivt filtervärde för naturliga bildsekvenser. Den är dock svår att kombinera med andra komprimeringsansatser och används därför mer sällan för videokodning. Motion prediction Motion prediction är en vanlig metod för att komma åt temporal redundans och bygger på antagandet att det i de flesta videosekvenser finns objekt som rör sig och inte förändras mycket mellan bildrutor. Denna metod söker därför att identifiera dessa objekt och koda s.k. rörelsevektorer för dem istället för att repetitivt koda själva bildinformationen för dem. Identifieringen av dessa objekt sker genom att dela in varje bildruta i block (observera att detta sker före en eventuell kompression av bilden och att dessa block inte är samma block som diskuterats i samband med DCT) och i efterföljande bildrutor söka och försöka identifiera hur dessa objekt rört sig. Parametrarna till denna metod är dels ett mått på hur mycket blocket förändrats (oftast med RMSE) och dels ett mått på hur mycket det förflyttat sig. Ifall dessa två mått skulle understiga gränserna för parametrarna anses blocket vara identifierat och en rörelsevektor för blocket kodas, om inte så anses blocket vara förlorat och den portionen av bilden kodas med sedvanlig bildkodning. En avancerad version av denna metod utnyttjar tanken att det från tidigare rörelser går att extrapolera 49
Page 1 and 2: Mjukvarurealiserad bildtelefoni Exa
Page 3 and 4: Innehållsförteckning Abstract 2 I
Page 5 and 6: programvara som tagits fram för pe
Page 7 and 8: Vad är ett bildtelefonisystem? Cen
Page 9 and 10: Kryptering Motiv för kryptering Da
Page 11 and 12: Egenskaper hos en krypteringsalgori
Page 13 and 14: På samma vis illustreras detta med
Page 15 and 16: Asymmetrisk kryptering Asymmetrisk
Page 17 and 18: Certifieringssystem Den mest spridd
Page 19 and 20: Idag talas det om autenticering, ce
Page 21 and 22: Komprimering Komprimering syftar ti
Page 23 and 24: Redundans Den generella definition
Page 25 and 26: Huffman kodning Huffman kodning är
Page 27 and 28: statistiska urval, oftast brukar ar
Page 29 and 30: Subband Coding En annan komprimerin
Page 31 and 32: För utförligare introduktion till
Page 33 and 34: Transformbaserad komprimering Frekv
Page 35 and 36: med motsvarande invers Beräkningen
Page 37 and 38: Original, förstoringsfaktor 10 Blo
Page 39 and 40: Trunkering av transformkoefficiente
Page 41 and 42: magnitudmetoden. I Tröskeltrunkeri
Page 43 and 44: Kvantifiering av transformkoefficie
Page 45 and 46: segmenterade bilder som används so
Page 47: Att komma åt spektral redundans in
Page 51 and 52: Ett bildtelefonisystem Den modell a
Page 53 and 54: Bildkälla Med klientens bildkälla
Page 55 and 56: Figur 12. Tillståndsmaskinen för
Page 57 and 58: Komprimeringsmodul Komprimeringsmod
Page 59 and 60: Färgrymdsomvandlingen, som sker fr
Page 61 and 62: När denna blockvalidering utförts
Page 63 and 64: C1 kontaktar C2 och skickar C2 ett
Page 65 and 66: ningar i TCP är stora nog att orsa
Page 67 and 68: kompression men kan även resultera
Page 69 and 70: Den del av krypteringssystemet som
Page 71 and 72: då på andelen block som porträtt
Page 73 and 74: Ordlista AE Absolute Error, absolut
Page 75 and 76: Källhänvisningar [1] Ahlberg, Jö
Page 77 and 78: Appendix A - Systembeskrivning komp
Page 79 and 80: FrameTransformImpl basklass som imp
Page 81 and 82: QuantizationFrameTransformImpl abst
Page 83 and 84: ImageGenerator klass som förgenere
Page 85 and 86: Measurement gränssnitt för mätme
Page 87 and 88: Pad Demo Detta program demonstrerar
Page 89 and 90: DCT Demo Detta program demonstrerar
Page 91 and 92: Frame Compression Demo Detta progra
Page 93 and 94: Stream Compression Demo Detta progr

Mjukvarurealiserad bildtelefoni - Umeå universitet

Create successful ePaper yourself

Delete template?

Save as template?