Mjukvarurealiserad bildtelefoni - Umeå universitet

More documents

Recommendations

Info

transformen till att beräknas som en sekvens av beräkningar av den endimensionella transformen (vilken i sig går att rulla ut, alternativt optimeras hårdvarunära). De transformkoefficienter som DCT resulterar i är spatiellt ordnade i ett tvådimensionellt block, med låga frekvenser centrerade mot det övre vänstra hörnet och de höga mot det nedre högra hörnet av transformspektrat. Den första (översta vänstra) transformkoefficienten har oftast ett större värde än de övriga och kallas av den anledningen ibland likströmskomponenten efter hur växelströmmar representeras på oscilloskop. De övriga transformkoefficienterna har positiva eller negativa värden vilket motsvarar att dess motsvarande sinusoid skall adderas till eller dras från den första. Normalisering av transformkoefficienterna Vid kompression av bilder genom trunkering av transformkoefficienter dyker det upp ett svårt val mellan motstridiga intressen. För kvalitetens skull är det önskvärt att behålla så många transformkoefficienter som möjligt men samtidigt för kompressionsgradens skull för bör så många som möjligt förkastas. Den lämpliga kompromissen här är att behålla de som är viktigast för slutanvändarens uppfattning av bilden, varför det är lämpligt att börja i den änden – genom att bestämma vilka de är samt hur de skall lokaliseras. Är slutanvändaren en industrirobot som inte klarar av att uppfatta förändringar över en viss frekvens görs detta enkelt men då slutanvändaren är en människa blir uppgiften betydligt svårare. I avsaknaden av matematiska formler eller uttryck som med tillförlitlighet kan avgöra till vilken noggrannhet en människa kan uppfatta specifika delar av en signal (vilket även är något som varierar stort från individ till individ) så är det bästa tillgängliga verktyget statistiska studier av slutanvändargruppen. En vanlig metod för att få data om hur olika bilder uppfattas av människor är att ta en referensgrupp människor (som är jämnt fördelad över kön, ålder och andra fysiska faktorer) och visa dem ett urval av bilder där olika typer av störningar av olika storlek introducerats och låta dem själva avgöra vilken bild som de uppfattar som tydligast. På detta vis kan exempelvis en uppfattning om huruvida suddighet uppfattas mer störande än grynighet i en bild bildas. Nackdelen med att använda statistiska metoder som denna är att det är tidsödande samt att resultaten kan vara mycket svårtolkade. Ett känt exempel på dylikt arbete som genomförts är de normaliseringsmatriser som JPEG konsortiet tagit fram inom JPEG standarden för kompression av stillbilder. När väl en uppfattning om vilken typ av fel som finns i systemet bildats är det möjligt att vikta de beräknade transformkoefficienterna före de trunkeras efter de egenskaper de förväntas ha. Denna process kallas normalisering och kan användas utan att introducera en alltför hög beräkningskomplexitet (eller implementationskomplexitet för den delen). Exempelvis är det möjligt att skala ner transformkoefficienter som bedöms generellt oviktiga för bildkvalitet så att de sällan tar sig genom trunkeringen. En annan möjlighet är att skala ner koefficienter som ofta har höga värden så att de är värdemässigt bättre anpassade för den kommande kvantifieringen för huffmankodning, detta då för att reducera storleken på huffmankodningens uppslagstabell. Detta steg implementeras enklast genom att multiplicera koefficientblocket med en viktningsmatris innan trunkeringen och på motsvarande vis multiplicerar med inversen av den matrisen i slutet av dekomprimeringsfasen. Notera att en stor del av blocket i dekomprimeringsfasen kommer att innehålla nollor varför en optimeringsvinst går att göra i implementationen genom hårdkodning och utrullning av den matrismultiplikationen. Om variansmetoden använts i trunkeringen gäller detta även i komprimeringsfasens skede. 38
Trunkering av transformkoefficienter Det finns många ansatser och varianter på hur val av transformkoefficienter för förkastning skall göras, även hur mycket var och en av de kvarvarande skall användas är en viktig punkt här. Normalt sett brukar en enda del av systemet ha hand om både valet av vilka som skall förkastas och hur mycket de kvarvarande skall användas – här delas dessa val dock upp i två delar och benämns trunkering respektive kvantifiering av transformkoefficienter. Eftersom dessa, just valet och behandlingen av transformkoefficienter, är den största källan till kompression i transformbaserade kompressionssystem så anpassas oftast resten av systemet efter just dessa. Grundparametrarna för systemet (krav på kompressionsgrad, maximal beräknings intesitet och liknande) kan ju vara oföränderliga, men inom ramen för dessa är förändras gärna för att öka prestanda. Som en förtydligande fotnot kan påpekas att ofta används endast en kvantifieringsansats gentemot transformkoefficienterna och inte någon trunkering, detta eftersom en kvantifiering i kombination med en bitallokeringskodning i sig kan erbjuda tillräcklig trunkering. Trunkering är dock fristående medan kvantifiering ofta sker i samverkan med bitallokeringsprocessen. Trunkering efter magnitud Vid trunkering efter magnitud (även kallad n’th percent coding) så trunkeras transformkoefficienterna efter en viss önskad kompressionsgrad eller beräkningsintensitet. Som namnet antyder skall n procent bildinformation sparas och för varje block behålles de transformkoefficienter som har högst magnitud (och därmed innehåller mest information). Observera att eftersom transformkoefficienter kan vara negativa (vilket motsvarar att den sinusoiden skall subtraheras från totalsignalen istället för adderas) så används magnituden på koefficienten, d.v.s. storleken (i praktiken absolutbeloppet) och inte det aktuella värdet. Detta motsvaras geometriskt av att välja de sinusoider som kommer att påverka den rekonstruerade funktionen mest. Den uppenbara nackdelen med trunkering efter magnitud är att samtliga transformkoefficienter måste beräknas för att kunna avgöra vilka som är störst. Både detta och att lokalisera de n största är beräkningsintensiva operationer, varför denna ansats sällan används i praktiken. Denna ansats ger dock ett ganska bra mått på hur en viss generell kompressionsgrad kommer att påverka en bild, samt ger givetvis även möjligheten att se var det mesta av bildinformationen finns. 33 2 9 − 6 −4 1 3 4 −9 − 7 2 −1 6 2 1 5 ⇒ 39 33 0 9 0 0 0 0 0 −9 − 7 Figur 6. Trunkering efter magnitud av en godtycklig 4 · 4 matris, 25 procent (4 av 16) transformkoefficienter sparas 0 0 0 0 0 0
Page 1 and 2: Mjukvarurealiserad bildtelefoni Exa
Page 3 and 4: Innehållsförteckning Abstract 2 I
Page 5 and 6: programvara som tagits fram för pe
Page 7 and 8: Vad är ett bildtelefonisystem? Cen
Page 9 and 10: Kryptering Motiv för kryptering Da
Page 11 and 12: Egenskaper hos en krypteringsalgori
Page 13 and 14: På samma vis illustreras detta med
Page 15 and 16: Asymmetrisk kryptering Asymmetrisk
Page 17 and 18: Certifieringssystem Den mest spridd
Page 19 and 20: Idag talas det om autenticering, ce
Page 21 and 22: Komprimering Komprimering syftar ti
Page 23 and 24: Redundans Den generella definition
Page 25 and 26: Huffman kodning Huffman kodning är
Page 27 and 28: statistiska urval, oftast brukar ar
Page 29 and 30: Subband Coding En annan komprimerin
Page 31 and 32: För utförligare introduktion till
Page 33 and 34: Transformbaserad komprimering Frekv
Page 35 and 36: med motsvarande invers Beräkningen
Page 37: Original, förstoringsfaktor 10 Blo
Page 41 and 42: magnitudmetoden. I Tröskeltrunkeri
Page 43 and 44: Kvantifiering av transformkoefficie
Page 45 and 46: segmenterade bilder som används so
Page 47 and 48: Att komma åt spektral redundans in
Page 49 and 50: tet kan göra mycket för systemets
Page 51 and 52: Ett bildtelefonisystem Den modell a
Page 53 and 54: Bildkälla Med klientens bildkälla
Page 55 and 56: Figur 12. Tillståndsmaskinen för
Page 57 and 58: Komprimeringsmodul Komprimeringsmod
Page 59 and 60: Färgrymdsomvandlingen, som sker fr
Page 61 and 62: När denna blockvalidering utförts
Page 63 and 64: C1 kontaktar C2 och skickar C2 ett
Page 65 and 66: ningar i TCP är stora nog att orsa
Page 67 and 68: kompression men kan även resultera
Page 69 and 70: Den del av krypteringssystemet som
Page 71 and 72: då på andelen block som porträtt
Page 73 and 74: Ordlista AE Absolute Error, absolut
Page 75 and 76: Källhänvisningar [1] Ahlberg, Jö
Page 77 and 78: Appendix A - Systembeskrivning komp
Page 79 and 80: FrameTransformImpl basklass som imp
Page 81 and 82: QuantizationFrameTransformImpl abst
Page 83 and 84: ImageGenerator klass som förgenere
Page 85 and 86: Measurement gränssnitt för mätme
Page 87 and 88: Pad Demo Detta program demonstrerar
Page 89 and 90:
DCT Demo Detta program demonstrerar
Page 91 and 92:
Frame Compression Demo Detta progra
Page 93 and 94:
Stream Compression Demo Detta progr
show all

Mjukvarurealiserad bildtelefoni - Umeå universitet

Create successful ePaper yourself

Delete template?

Save as template?