Mjukvarurealiserad bildtelefoni - Umeå universitet
Mjukvarurealiserad bildtelefoni - Umeå universitet
Mjukvarurealiserad bildtelefoni - Umeå universitet
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Temporal redundans<br />
Hitintills har komprimering av stillbilder eller enskilda bildrutor i videosekvenser och de tekniker<br />
för detta som används diskuterats. Det finns dock stora effektivitetsvinster att göra i kompression<br />
av rörliga bilder genom att studera hur temporal redundans, d.v.s. överflödig och över tiden dåligt<br />
representerad information i bildsekvenser, kan reduceras. När det gäller kompression av videosekvenser<br />
finns det ett flertal olika format och tekniker att använda, både för lagring och för överföring<br />
av video. Vissa kan användas för båda områden men den stora skillnaden dem emellan<br />
brukar som tidigare vara att vid lagring är det möjligt att göra större antaganden om den klient som<br />
skall spela upp eller använda bildsekvensen. Inom bildtelefon avses naturligtvis överföring av<br />
bilder och noteras bör att de tekniker som används för detta ofta även kan användas för lagring<br />
även om det motsatta sällan är fallet.<br />
Ett enkelt och illustrativt exempel på temporal redundans är vid överföring av bilder – om övre<br />
halvan av en bild inte har förändrats sedan föregående bildruta så finns det ju ingen anledning att<br />
sända den delen av bilden igen, mottagaren instrueras helt enkelt istället att återanvända den övre<br />
halvan från föregående bildruta. Naturligtvis finns det en stor nackdel med denna typ av<br />
resonemang – förlitar systemet sig på att föregående bildruta verkligen nått fram till mottagaren<br />
intakta begränsas möjligheten till att återhämta sig från fel som beror på paketbortfall eller<br />
temporära förkastningar av hela bildrutor. Det senare (s.k. frame drops) är för övrigt ett vanligt<br />
problem även för användning av lokala filmsekvenser som dyker upp när den codec (kodare /<br />
avkodare) som används för att (av)koda filmsekvensen inte hinner med. Denna typ av fel, som<br />
uppstår när referenser till föregående bildrutor är ogiltiga, kan även fortplanta sig till efterföljande<br />
bildrutor i en kaskadeffekt av fel. För att motverka denna effekt är det därför brukligt att<br />
regelbundet sätta in s.k. reference frames som sänds i sin helhet och inte har några beroenden av<br />
tidigare bildrutor.<br />
Det är även viktigt att notera att det vid kompression för överföring finns stora skillnader i kraven<br />
på temporala komponenter inom systemet. Handlar det om envägskommunikation (exempelvis<br />
videoöverföring för television) så kan det i förväg läggas ner mycket tid på att identifiera temporal<br />
redundans och koda undan denna. Handlar det om tvåvägskommunikation så kommer svarstiden<br />
för kommunikationskanalen att stå för en stor del av användarnas uppfattning av systemets<br />
effektivitet. Eftersom temporal redundans kan vara mycket kostsam att identifiera men även samtidigt<br />
ge stora möjligheter till kompression så bör denna del designas noggrant.<br />
Som tidigare noterades beror den stora effektiviteten för transformbaserad kompression på den<br />
höga korrelationen mellan närliggande pixlar i naturliga bilder. Det är faktiskt även möjligt att<br />
använda en tredimensionell DCT för att komprimera en bild som förändras över tiden, d.v.s. en<br />
videosekvens. Framgången för denna metod beror då på att även korrelationen över den tredje<br />
dimensionen (tiden) för närliggande pixlar är hög. Detta är speciellt sant för bildsekvenser med<br />
hög bildfrekvens eftersom rörliga objekt i bilden då inte hinner förflytta sig lika långt i bilden som<br />
de skulle med en lägre bildfrekvens. Med andra ord tenderar rörelserna av objekt i bilden att<br />
minska när signalens bildfrekvens ökar. Detta ökar i sin tur korrelationen mellan pixlar i närliggande<br />
bildrutor. Denna observation är viktig även om metoden med tredimensionell DCT är<br />
olämplig för kompression för överföring (man skulle då behöva flera bilder innan det var möjligt<br />
att ens komprimera ett enda block i den första). Även för kompression för lagring är denna metod<br />
sällan använd, här dock eftersom det finns andra och mer effektiva metoder för elimination av<br />
temporal redundans.<br />
Det går även att öka den temporala redundansen i rörliga bilder med hjälp av förbehandling, ofta<br />
genom att modellera en fysisk störningskälla och kompensera för denna. Ett exempel på detta är de<br />
s.k. skakfilter som idag är vanliga på handhållna videokameror. Dessa är dock sällan med i <strong>bildtelefoni</strong>system<br />
eftersom dess kameror (av just den anledningen) monteras fixt. När det generellt<br />
gäller system som utnyttjar temporal redundans är det värt att notera att en bildkälla av hög kvali-<br />
48