- Danmarks Tekniske Universitet

- Danmarks Tekniske Universitet - Danmarks Tekniske Universitet

from etd.dtu.dk More from this publisher

25.09.2013 Views

Metodeudvikling af kantrutiner til klassificering af fisk Et metodestudie med otolitter fra sild som eksempel af Mads Esholdt Wiemann, s072937 Danmarks Tekniske Universitet Institut for Informatik Bachelorprojekt Bjarne Ersbøll 25. juni 2010

Metodeudvikling af

kantrutiner til klassificering

af fisk

Et metodestudie med otolitter fra sild som eksempel

af Mads Esholdt Wiemann, s072937

Danmarks Tekniske Universitet

Institut for Informatik

Bachelorprojekt

Bjarne Ersbøll

25. juni 2010

Forord

Denne rapport er blevet til i samarbejde med Henrik Mosegaard, DTU, Aqua

og Bjarne Ersbøll, DTU,IMM. Klassificering af fisk er et vigtigt redskab til

at kunne bestemme mængden af fisk fra en bestemt population og dermed

kunne udtale sig om bæredygtigheden af en fiskepopulation. Dette er ikke

muligt ud fra blot at tælle antallet af en fiskeart et sted da fiskestimer flytter

sig og blandes sammen. For at kunne udtale sig om mængden af fisk i en given

population er der derfor brug for et redskab til at kunne finde ud af dette.

Rapporten omhandler metoder til at bestemme kanten af otolitter med, og

hvordan man ud fra disse kanter kan klassificere hvilken population en given

sild kommer fra.

Til udarbejdelse af rapporten er der blevet brugt et datasæt bestående af 5

populationer fra henholdsvis den centrale Nordsø,Berwick Bank, den centrale

Nordsø Flamborough, Femern Østersøen,Rügen og , Kattegat,Lillebælt nord.

De omtales fra nu af som population 1, 2, 3 osv. Datasættet består af enrække

otolitter hvorpå der på nogen er en otolit, andre to otolitter, og andre to

plus en rest af en tredje otolit. Der er i det givne datasæt 105 otolitter fra

population 1, 148 fra population 2, 139 fra population 3, 100 fra population

4 og 5. Der haves yderligere et datasæt bestående af fundne kanter fra en

allerede eksisterende metode. Dette sæt består af af 84 kanter ud af de 105

otolitter fra population 1, 136 fra population 2 og 100 fra population 4.

Da der kun haves data med kanter fra DTU Aqua for population 1,2, og

4 vil klassificeringen blive foretaget på baggrund af disse tre. Jeg har valgt

til sammenligning af kantrutiner at dele disse populationer op i to dele. Et

trænningssæt bestående af de første 75 otolitter for hver af de tre populationer

og et testsæt på de resterende otolitter for populationerne. Diskriminant

funktionen laves så baggrund af trænningssættet hvor efter det valideres med

testsættet.

Ved sammenligning mellem højre og venstre har jeg valgt at et mindre

trænningssæt på 50 og dernæst et testsæt bestående af resten af otolitterne.

abstract

resume

Elliptik fourier er blevet brugt til at klassificere en række sild baseret på

form analyse af silde otolitter. Der er udviklet to forskellige kantrutiner der er

blevet sammenlignet med den eksisterende metode fra DTU,Aqua med hensyn

til formen og klassifikationen. En baseret på chain code og en baseret på

Active contour models.. Resultaterne viste at den mest præcise kant fås ved

metoden fra ”DTU Aqua’. Metoden baseret på chain code gav ofte nogle meget

præcise kanter som mindede noget om dem fra DTU Aqua, men kanten havde

lidt større problemer end den eksisterende metode ved kanter med svag gradient.

AC modellens var generelt god , men havde problemer pga. startgættet

hvilket betød den ikke altid gav nogle helt præcise estimeringer af omridset.I

klassifikationen blev succesraten bestemt til 50, 38 og 36 procent for metoden

baseret på chain code, Active contour models, og DTU Aqua. Til sidst er der

blevet sammenlignet klassifikationsraten for imellem højre og ventre otolitter.

Resultaterne viste overodnet en succes rate på 38 og 36 procent og dermed

meget ens. Det kunne yderligere ses at der med undtagelse af population 5 så

var der de samme klassificeringstendenser for høre og venstre.

abstract

Elliptic Fourier analysis have been used to classify heerings based on shape

analysis from otoliths. Two edge detection methods have been developed. One

based on a chain code algoritmen and one based on active contour models.

These two methods have been compared to the one used by DTU,Aqua from

the program ”Image pro”. The method based on a chain code algoritme gave often

af very accurate detection of the boundary of the otolith. The method from

”Image pro” have some problems with weak edges. The chain code algoritmen

also have problems with weak edges, but seems to be magnified compared to

the ”image pro” algoritmen. The AC model was in general reasonable accurate.

It had however some problems with the starting curve sometimes being

inside the otolith. In the classification the succesrate was 50,38 and 36 procent

for the chain code algoritmen, the AC model and the aloritmen used by

iii

iv ABSTRACT

DTU,Aqua from ”image pro”. In the end the left handside otoliths were compared

with the righthand side otoliths. The succesrate for the the left hand

side and right handside were 36 and 38 procent and therefore almost equal.

Population 1 differs a bit between the right hand side and the left hand side

but in general the right hand side and the left hand side otoliths seems the

make the same classification descisions.

Indhold

Forord i

abstract iii

resume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

Indhold v

Figurer vi

Tabeller vii

1 Indledning 1

1.1 Problemfelt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Problemformulering . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Metoder 5

2.1 Metoder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Form analyse 7

3.1 chain code . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.2 Active contour models . . . . . . . . . . . . . . . . . . . . . . . 8

3.3 Eksterne kræfter . . . . . . . . . . . . . . . . . . . . . . . . . . 12

4 Fourier 15

4.1 Elliptic fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

5 Diskriminant analyse 21

5.1 diskriminant med multiple populationer . . . . . . . . . . . . . 23

6 Implementering 25

6.1 premodellering . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6.2 EFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

6.3 Active contour model . . . . . . . . . . . . . . . . . . . . . . . . 27

6.4 Diskriminant . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

7 Resultater 31

7.1 kanter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

7.2 lav correlation analyse . . . . . . . . . . . . . . . . . . . . . . . 34

7.3 klassifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

7.4 sammenligning af højre og venstre otolit . . . . . . . . . . . . . 36

8 Diskussion 39

8.1 Kanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

8.2 Klassifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

8.3 Sammenligning af højre og venstre . . . . . . . . . . . . . . . . 41

9 Konklusion 43

Litteratur 45

A Appendiks 47

Bilag 46

Figurer

1.1 otolitter fra fisk fra silde population í rügen . . . . . . . . . . . . . 1

1.2 eksempel på manuel metode til klassifikation på baggrund af otolitter 2

1.3 otolitter fra fisk fra silde population í rïgen . . . . . . . . . . . . . 3

2.1 diagram over forløbet for analysen . . . . . . . . . . . . . . . . . . 6

3.1 illustration af ne chain code algoritme . . . . . . . . . . . . . . . . 7

3.2 eksempel på den første afledtes og brug af α . . . . . . . . . . . . . 9

3.3 eksempel på den 2.afledtes virkning og brug af β . . . . . . . . . . 10

3.4 bandmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.5 gaussian external force . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.6 gaussian external force . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.7 illustration af iterationsforløb for snake(A),klassisk ekstern kraft

(B), zoom på den konkave område (C), [?] . . . . . . . . . . . . . 13

4.1 fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4.2 eksempel på opbyggelsen af elliptisk fourier . . . . . . . . . . . . . 16

4.3 eksempel på opbyggelsen af elliptisk fourier, [8] . . . . . . . . . . . 17

5.1 gaussian distribrution . . . . . . . . . . . . . . . . . . . . . . . . . 22

5.2 diskriminantillustration . . . . . . . . . . . . . . . . . . . . . . . . 23

6.1 histogram over pixelværdier i billedet . . . . . . . . . . . . . . . . . 25

6.2 diagram over forløbet for Active contour modellen . . . . . . . . . 27

7.1 billed UK − 11773 − 05x25x1 med kant fra original model . . . . . 31

7.2 billed 88 − 03 − 70 − 05x25x1 med kant fra ACM model . . . . . . 31

7.3 billed 88 − 03 − 70 − 05x25x1 med kant fra ændret chain code . . . 32

7.4 billed UK − 11772 − 05x25x1 med kant fra original model . . . . . 32

7.5 billed UK − 11772 − 05x25x1 med kanter fra chain code model . . 32

7.6 billed UK − 11772 − 05x25x1 med AC model . . . . . . . . . . . . 33

7.7 billed 88 − 03 − 51 − 05x25x1 AC model hvor startgæt var inde i

model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

7.8 billed 88 − 03 − 51 − 05x25x1 chain code model . . . . . . . . . . . 33

7.9 billed 88 − 03 − 36 − 05x25x1 illustrerende hvor tætte otolitterne

kan lægge på hinanden . . . . . . . . . . . . . . . . . . . . . . . . . 34

Tabeller

7.1 klassifkation af otolitter med den ændrede chain code algoritme på

trænnningssæt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

7.2 klassifkation af otolitter med den ændrede chain code algoritme på

testsæt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

7.3 klassifkation af otolitter med ACM algoritmen på trænnningssæt . 35

7.4 klassifkation af otolitter med ACM algoritme på testsæt . . . . . . 35

7.5 klassifkation af otolitter med original model på trænningsæt . . . . 35

7.6 klassifkation af otolitter med original model på testsæt . . . . . . . 35

7.7 klassifkation af venstre otolitter fra trænningssæt . . . . . . . . . . 36

7.8 klassifkation af venstre otolitter fra testsæt . . . . . . . . . . . . . 36

7.9 klassifkation af højre otolitter fra trænningsæt . . . . . . . . . . . 36

7.10 klassifkation af højre otolitter fra trænningsæt . . . . . . . . . . . 36

vii

Kapitel 1

Indledning

1.1 Problemfelt

Otolitter også kaldet øresten på dansk befinder sig inde i det indre øre og er

en del af balancesystemet og ser for sild ud som følgende:

Figur 1.1: otolitter fra fisk fra silde population í rügen

Alle fisk har alt efter det territorium de lever i, forskelligt behov for brug af

balanceevnen. Dette giver sig udslag i at otolitternes form og størrelse varier

meget blandt forskellige racer og forskellige populationer. Det medfører nogle

unikke matematiske kendetegn. Det kan være placeringen af en pixel eller den

geometriske form af kanten ved denne kant pixel. Otolitterne vokser igennem

hele livet. De består primært af gelatine og carbion carbonat og strukturmæssigt

består de af en masse ringe [5]. Ringene inde i midten af otolitten kaldes

dagringe. De næste udover disse kaldes årringe. Fordelen ved brug af otolitter

er at der er en sammenhæng mellem fisken vækst og otolittens. Otolitters

vækst er dog ikke jævn. Hvis vandet er koldt eller der ikke er adgang til mad,

vil fiskens vækst sættes ned og ringene vil blive mindre. Om sommeren hvor

vandet er varmere og der er større adgang til mad, vil fisken, vokse mere og

ringene vil blive tykkere. Det er muligt ved at tælle disse ringe at afgøre hvor

2 KAPITEL 1. INDLEDNING

gammel den er samt hvor mange dage den er, som vist i figur 1.2 og der fra

bestemme hvilken population den så tilhører[4].

Figur 1.2: eksempel på manuel metode til klassifikation på baggrund af otolitter

Denne metode er sammenlignet med de fleste andre tilgængelige metoder

meget præcis. Til gengæld er det en manuel process og der skal derfor bruges en

del tid på at klassificere dem. For at løse dette problem, bruges ”formanalyse”

til at klassificere fiskene på baggrund af otolitterns form. For at sammenligne

otolitterne og deres kendetegn er det nødvendigt at de er invariante overfor

skala, vinklen otolitterne er placeret i på billedet, placeringen af otolitterne

på billerne samt det startpunkt der er valgt for kanten på billederne. Dette

er nødvendigt for at sikre at en pixel har samme placering på alle billederne.

For at gøre dette kan der bl.a. bruges wawelets eller fourier analyse til at lave

en approksimation af kurven. I denne opgave har jeg valgt fourier fordi den er

nem at gøre invariant for de nævnte ting ovenfor.

Otolitter består primært af gelatine og carbion carbonat [5]. Ved tværsnit

til analysering af formen kan give sig udslag i at de er noget gennemsigtige og

gradienten i kanterne derfor ikke er tydelig samt at der er skarpe konstraster

inde i otolitterne der angiver årringene. Det gør at et gradient filter også vil

finde kanter inde i otolitten. Et eksempel på dette er angivet ved 1.3: Et andet

problem der kan opstå er at, der kan være meget smalle aflange huller, der

går fra kanten og ind i otolitterne. Dette giver sig udslag i at kanten fundet

ved brug af et gradientfilter, vil betragte disse huller som en del af kanten af

otolitten. Men da det ikke er en del af omridset af otolitten er dette en fejl.

Et eksempel på dette er angivet ved

1.2. PROBLEMFORMULERING 3

Figur 1.3: otolitter fra fisk fra silde population í rïgen

1.2 Problemformulering

1. Bestem omridset af otolitterne og sammenlign med metode brugt af

DTU,aqua.

2. Klassificer otolitterne ved hjælp af koefficienterne for fourierrækkerne i

elliptisk fourier analyse

3. Sammenlign højre og venstre otolith for om der er den samme information

i højre og venstre otolith.

Hovedformålet med denne rapport er at udvikle nogle andre mere robuste

kantrutiner til klassificering af fisk end den givet ved DTU,Aqua.

Kapitel 2

Metoder

2.1 Metoder

I det følgende vil jeg først beskrive hvordan jeg vurdere at DTU Aqua’a metode

fungerer. Dernæst vil jeg beskrive to andre måder at finde kanten af objektet

på. Den metode DTU Aqua bruger som jeg vil problematisere, til at klassificere

fisk ud fra er en ”kantrutine” algoritime fra programmet ”imagepro”. Da

dette program er købt software er det ikke muligt at se kildekoden og dermed

være sikker på hvordan metoden er opbygget. Denne metode fungere ved at

brugeren indtaster en pixel på kanten, en retning for billedet i det område

samt hvorvidt den skal bevæge sig med eller mod uret. Dernæst vurdere jeg

at gradienten af billedet bestemmes, hvorefter billedet gøres binært. Når det

er gjort, bruges en chain code Algoritme. Den bevæger sig givet et startpunkt,

en retning for kanten lokalt,rundt i den lukkede kurve startende og sluttende

ved startpunktet. Da der først bruges et gradientfilter hvorefter det binariseres,

vil evt. steder med lav densitet i kanten af otolitten have så lav gradient

i det billede at de ikke fremkommer i billedet. Det betyder at kanten ikke er

sammenhængende og dermed vil Chain Code algoritmen stoppe med at virke.

Figur 2.1 illustrerer den overodnede process for de to metoder jeg har lavet.

Først laves der en premodellering. Dernæst findes kanten. For den ene metode

er der tale om brug af en chain code algoritme og i den anden er der tale

om en chain code + en active contour model som er den illustreret ovenfor.

Dernæst bestemmes de elliptiske fourier koefficienter og derfra foretages en

klassificering.

Den første kantrutine der beskrives nedenfor er et forsøg på viderudvikling af

metoden fra DTU Aqua. For ikke at gøre dette manuelt er der først en premodelleringsdel,

hvor billedet binariseres. Der sørges for ved valg af startgæt

at identificere otolitter der er ødelagte og så vidt muligt automatisk vende

otolitter om der er vender forkert. Når det er gjort bestemmes gradienten

af billedet, hvorefter en chain code algoritme køres. Der er valgt at bruges

6 KAPITEL 2. METODER

Figur 2.1: diagram over forløbet for analysen

matlabs indbyggede funktion bwtraceboundary.

Der laves yderligere en model kaldet Active contour model. Forløbet for

denne model er angivet i figuren 2.1. Den skal have en startkurve angivet og ud

fra nogle krafter deformeres den så indtil den når et lokalt minimum i billedet.

En af fordelene er at algoritmen ikke bevæger sig ind i meget smalle konkave

områder, og hvis startgættet har gjort det, vil metoden, udrette kurven i dette

område. En anden fordel er at metoden deformeres således at den tilpasser

sig objektet omrids, hvorfor metoden, selvom otolitten har en lav densitet

i kanten, stadig vil tilpasse sig kanten. En af ulemperne er så at metoden

vil stoppe ved enhver given kraftig pixel. Så hvis der er for meget støj på

billedet eller baggrunden ikke er ens, vil metoden stoppe ved disse pixels.

Hvordan startkurven skal se ud afhænger af de eksterne kræfter der er valgt.

De eksterne kræfter er dem der sørger for minimummet i billedet er i kanten.

Ved brug af en ekstern kraft kaldet gaussian vil kurven skulle have et startgæt

hvor alle punkterne er uden for otolitten. Ved tilføjelse af en ballonkræft vil

modellen kunne startes inden i otolliten og derfra udvides til den når kanten

eller uden for kanten af otolitterne og dernæst bevæge sig mod kanten. Den

sidste er en GVF,Gradient Vector Flow model der som den eneste tillader at

modellens startgæt må være både inde i otolitten og udenfor. Dette er en stor

fordel da det er en risiko ved brug af startgæt som er meget tæt på løsningen.

De eksterne kræfter nævnt ovenfor forklares nærmere senere i afsnittet om

eksterne kræfter.

Kapitel 3

Form analyse

I dette afsnit præsenteres teorien bag de forskellige kantrutiner der gøres brug

af i rapporten.

3.1 chain code

Figur 3.1: illustration af ne chain code algoritme

Metoden der bruges på nuværende tidspunkt på DTU Aqua til at finde kanten

med tager et startpunkt, en retning, for hvordan kanten bevæger sig området

og så hvorvidt bestemmelsen af kanten skal foregå mod eller meduret. Dette

svare til inputs til en chain code algoritme. Chain code er en metode der givet

et binært billede af kanten, et startpunkt på kanten, den retning kanten skal

bevæge sig lokalt, og den retning metoden skal bevæge sig rundt om kanten

på bevæger sig rundt i kanten som vist i figur 4.2. Den tager så udgangspunkt

i den angivne pixel og leder i alle 8 nabo punkter efter endnu et punkt. Hver

retning har en værdi 0 er øst, 1 er sydøst osv. Hvis startretningen er 0, så vil

den starte med at lede i 0 dernæst 1 osv. I metoden fra DTU,Aqua fås højst

sandsynligt et billede af otolitten fremkommet ved hjælp af gradienten fra det

gråtonede billede og derefter binært. Dermed vil de steder i gråtonebilledet

med lav densitet i kanten ikke frekomme i kantbilledet og metoden vil fejle

fordi kanten på billedet ikke er en lukket kurve. I tilfælde af at billedet indeholder

smalle konkave huller vil metoden også betragte dem som en del af

8 KAPITEL 3. FORM ANALYSE

kanten og derfor lave et omrids af kanten der går ind i objektet. Der er i

programmet brugt metoden bwtraceboundary til at gøre dette.

3.2 Active contour models

Med mindre der er lavet en henvisning er der i dette afsnit gjort brug af [3]

Der findes to forskellige derformerbare modeller henholdsvis parametrisk og

geometrisk. Geometriske modeller har den fordel at den kan splittes og sættes

sammen igen hvilket isært er nyttigt ved eksempelvis skanninger hvor kanterne

af objekterne kan være splittet i flere del. Ved brug af en parametriseret model

vil modellen når den møder en stor gradient i billedet, som ved støj eller huller

automatisk, stoppe ved den og antage den er at den er en del af omridset af

otolitten. I dette projekt er har objekterne en klar og tydelig ensformig sort

baggrund kun indeholdende otolitterne, hvorfor en parametriseret model er

blevet valgt.

Defomerbare modeller bevæger sig under påvirkning af interne kræfter Fint

og potentielle krafter Fpot. Fpot bestemmes ud fra kurven på billedet billedet

og sørger for at billedet derformeres mod kanten. De interne kræfter sørger

for at kurven holdes blød og glat under deformeringen. dvs.differentiabel og

samtidig sørger for at modellen skrumper. Da Active contour modeller under

deformation er blød og glat og fordi det er muligt at indkorporerer viden om

kanterne i billedet betyder det at disse modeller generelt set er robuste over

for støj og huller i billedet.

Minimering

Active contour modeller fungerer ved at der opstilles en lukket kurve omkring

objektet af formen X (s) = (X (s) , Y (s)) , s ∈ [0, 1].

Kurven deformeres så indtil den når det ønskede objekt. Præmissen for dette

er at se modellen som en fysisk balance equation af formen nedenfor, hvor

målet er at minimere disse kræfter så meget som muligt.

(3.1)

Ftot (X) = Fint + Fpot

Fint er givet ved:

Fint = 1

2 ·

1

α (s) ·

∂X 2

∂

0 ∂s + β (s) ·

2X ∂s2

ds (3.2)

Fint repræsenterer de kræfter der sørger for at kurven under deformeringen er

tilpas blød og glat, således at den ikke strækkes for meget i en given reting

3.2. ACTIVE CONTOUR MODELS 9

eller indeholder knæk. Det første led i udtrykket for Fint er den afledte af X,

∂X

∂s . Den har en retning og en størrelse som angiver retningen for kurven i

det pågældende punkt. Det andet led er den 2.afledte af X, ∂2X ∂2 , hvis værdi

s

afhænger af hvor meget kurven er bøjet i det pågældende punkt. Det andet

led vil kunne minimeres indtil kurven er så lige som muligt. Det første led vil

kunne minimere kurven indtil den kun er en cirkel. Tilsammen vil de kunne

defomere kurven indtil den kun er et punkt.

Fpot sørger for kurven bevæger sig mod omridset af objektet og er defineret

som følgende:

1

Fpot =

0

P (X (s)) ds = −∇ · P (x) (3.3)

P (x) kommes nærmere ind på i afsnittet om eksterne kræfter på i afsnittet om

eksterne kræfter ligningen 3.3 bestemmes ud fra billedet og har lokale minima

i kantpixelsene.

I 3.4 er det samlede udtryk opskrevet. Nedenfor kommes nu nærmere ind

på de interne kræfter.

Ftot = 1

2 ·

1

α (s) ·

∂X 2

∂

0 ∂s + β (s) ·

2X ∂s2

1

ds + P (X (s)) ds (3.4)

0

For at beskrive de forskellige led for den interne kræft i ligningen ovenfor

og deres indvirkning på modellen benyttes finitte differens til approksimation

af de forskellige udtryk.

∂X

∂s

∂X

∂s

≈ X (s + h) − X (s)

h

↔ X (s + h) ≈ X (s) + ∂X

∂s

Figur 3.2: eksempel på den første afledtes og brug af α

· h (3.5)

er tangenten i det pågældende punkt, der har en retning og en størrelse.

Som det fremgår af 3.5 og 3.2 vil en større tangent betyde ved approksimation

10 KAPITEL 3. FORM ANALYSE

af punkterne at kurven bliver strækket. Når modellen minimeres, sørges der

for at tangentens størrelse mindskes således at modellen bevæger sig i mindre

skridt imellem hvert s og at modellen derfor bliver mindre strakt i en given

retning. α angiver hvor stor en del af tangenten der skal minimeres. Dvs. jo

større α jo mindre må kurven strækkes. Det skal hertil nævnes at α og β er

vektorer der angiver hvor meget henholdsvis ∂X

∂s og ∂2X ∂2 skal vægtes. I prak-

s

sis er de dog en konstant, hvorfor de i rapporten vil blive betragtet som sådan.

Nu findes via central differens en approksimation til den 2.afledte:

∂2X X (s + h) − 2 · X (s) + X (s − h)

≈ ↔

∂s2 h

X (s + h) − X (s) X (s) − X (s − h)

−

h

(3.6)

Figur 3.3: eksempel på den 2.afledtes virkning og brug af β

Ud fra 3.6 kan det ses at central differens er det samme som forward

differens minus backward differens. De to udtryk vil have samme fortegn når

hældningen på hver side er modsat og det følger heraf at den 2.afledte vil

vokse, jo mere kurven er bøjet. Da ligningen 3.4 skal minimeres vil kurven jo

større udtrykket er, blive rettet mere ud til en ret linje, som illustreret i figur

3.3. β siger derfor noget om hvor lige kurven skal være. Jo højere den er jo

mere lige bliver kurven.

Det følger af [1] at enhver ligning af formen J = f (t, y, ˙y) hvor ˙y ≡ dy

dt har

et nulpunkt hvis følgende ligning er opfyldt: ∂f d ∂f

∂y - dt ∂ ˙y

Da J= f (t, y, ˙y) = 1

2 ·

1

0 α (s) · ∂X

∂s 2

+ β (s) · ∂2X ∂s2

ds + 1

0 P (X (s)) ds

hvor t=s,y = ∂X

∂S og y· er lig ∂2X ∂S2 følger det at kurven der minimere Ftot må

opfylde følgende ligning:

∂

α ·

∂s

∂X

−

∂s

∂2

∂s2

β · ∂2X ∂s2

− ∇P (X) = 0 (3.7)

For at løse dette tilføjes tiden som ny variabel kaldet t og konstanten γ

således at man får:

γ · ∂X

∂

= α ·

∂t ∂s

∂X

−

∂s

∂

∂s2

β · ∂2X ∂s2

− ∇P (X) (3.8)

3.2. ACTIVE CONTOUR MODELS 11

.

∂X

∂t

er en værdi for hvor meget kurven bevæger sig ved hver iteration. Når

kurven nærmer sig den ønskede kant vil dette led nærme sig 0 og man får 3.7

Herfra er det så muligt ud fra finit differens at lave en approksimation af

∂X

∂s og ∂2X ∂s2 og derfra isoleres Xi :

γ · Xi n+1−Xi−1 n

∆t

X i n+1 −2·Xi n +Xn−1

∆S 4

γ· Xi n+1−Xi n

∆t

= α · (Xi n+1 −Xi n)−(X i n−X i n−1)

∆S 2

+ Xi n−2·X i n−1 +Xi n−2

∆S 4

= α· (Xi n+1 −Xi n)−(X i n−X i n−1)

∆S 2

− ∇P X i−1 ↔

− β · Xi n+2 −2·Xi n+1 +Xi n∆s 4

∆s 4

− 2 ·

−β· (Xi n+2−4·Xi n+1 +6·Xi n−4·X i n−1 +Xi n+2)

∆S4 −

∇P X i−1

Nu omskrives ligningen således at koefficienterne for X i n+2 ,Xi n+1 ,Xi n,X i n−1 ,Xi n−2

således destår hver for sig.

= −β · Xi n−2

∆S 4 +

−α·X i n−1

∆S 2

+ 4 · β·Xi n−1

∆S 4

γ · Xi n+1−Xi n

∆t

−α·Xi n+1

∆S2 + 4 · β·Xi n+1

∆S4

− β · Xi n+2

∆S4 − ∇P Xi−1

+

−2·α·X i n

∆s 2

+ 6·β·Xi n

∆S4

+

Dette kan omformuleres til: γ · Xi n+1−Xi n

∆t = A · Xi − ∇P Xi−1 Heraf kan det ses at højresiden bestående af de interne kræfter vil være en

båndmatrix af formen:

Nu isoleres X i :

Figur 3.4: bandmatrix

X i = (I − τ · A) −1

· X i−1

− τ · P X i−1

hvor A er pentadiagonalmatricen illustreret i 3.4 i og τ er γ

δt

(3.9)

12 KAPITEL 3. FORM ANALYSE

3.3 Eksterne kræfter

Gaussian

Hvis man kun minimerer de interne kræfter vil modellen ikke vide hvornår den

skal stoppe, og vil først stoppe ved centrum af den pågældende startkurve da

det er det minimum for den cirkel. Det er derfor nødvendigt med eksterne

kræfter for at sørge for modellen stopper i kanten. Et eksempel på en ekstern

kræft der har minimum i kanten er givet ved 3.5

Figur 3.5: gaussian external force

P = −κ · ∇ [Gσ (x, y) · I (x, y)] 2 (3.10)

Den eksterne kraft danner en matrix der ud fra den afledte og det negative

fortegn, har store negative værdier i de pixels hvor der er skarpe farvemæssige

overgange, og er tæt på nul de steder hvor billedet er ensfarvet. Da gradienten

af billedet kun er stor i kanter betyder det kræften kun har betydning hvis

kurven er meget tæt på løsningen. Derfor sløres billedet før gradienten findes

således at overgange i billedet der repræsentere store gradient værdier vil

spredes over flere pixels og dermed sørge for at kræften kan bruges længere

udefra. Hvis der er støj i billedet, vil Active contour modellen stoppe ved den

pixel da den har en stor gradient. Dette betyder samtidig at metoden kun ved

brug af denne eksterne kraft ikke er særlig robust. Figur 3.10 er et eksempel

på en ekstern kræft der har minimum i kanten.

Ballonkraft

Et problem ved kun at benytte den ovenstående eksterne kraft er at den

eksterne kraft som nævnt kun virker meget tæt på selve otolitten. Indtil da er

det de interne krafter der deformere kurven, hvilket går ud over hastigheden

af modellen. Ved at tilføje endnu en ekstern kræft kaldet ballonkraften kan

dette problem fjernes. Ballonkraften har formlen 3.11

Fp (X) = ωp · N (X) (3.11)

3.3. EKSTERNE KRÆFTER 13

hvor N er den indadrettede normalkræft ved et givent punkt som illustreret i

figur 3.6.

Figur 3.6: gaussian external force

Det ses ud fra formlen at til hver punkt findes den normalkraft der er er

ortogonal på retningsvektoren og som er indadrettet mod den deformerbare

model. Den kan ikke bruges alene da den ikke har minimum i kanten, men kan

med succes kombineres med den ovenfor givne kræft. Den sørger for kurven

hele tiden bevæger sig indad eller udad alt efter ønsket og hvis den vægtes

højt nok vil den sørge for at modellen ikke stopper i områder med støj men

vil fortsætte sin deformation igennem disse pixels. Til gengæld vil metoden

ligeledes gå igennem den rigtige kant hvis den vægtes for højt og der brug for

en grad af finjustering for at få den helt optimale løsning, der gør man mister

noget robusthed. En anden fordel der er med brug af denne yderligere kraft

er at den kan være med til at tvinge modellen ind i konkave områder hvor det

ellers vil være nødvendigt med eksempelvis gradient vector flow. Dette gør til

gengæld metoden mere robust. En ulempe med denne kræft og den forrige, er

at startkurven altid skal være placeret udenfor eller inden i modellen. Den må

ikke placeres således at startkurven både kan være inde i objektet og uden for

objektet.

Gradient vector flow

Figur 3.7: illustration af iterationsforløb for snake(A),klassisk ekstern kraft

(B), zoom på den konkave område (C), [?]

14 KAPITEL 3. FORM ANALYSE

Der er givet en energi ligning af formen:

E =

µ u 2 x + y 2 y + v 2 x + v 2

y |∇f| 2 · |g − ∇f| dxdy (3.12)

GVF der er givet ved g (x, y) = (u (x, y) , v (x, y)) minimerer funktionen 3.12.

Da den ligning er et variational problem som i 3.9 har derfor formen ∂f

∂y

- d

dt

∂f

∂ ˙y :

µ · ∇ 2

· u − (u − fx) f 2 x + f 2

y = 0 (3.13)

µ · ∇ 2

· v − (v − fx) f 2 x + f 2

y = 0 (3.14)

Disse ligninger løses nu ved at tilføje tiden som variabel således at man får :

gt = µ · 2

·g − (g − ∇ · f) · fx 2 + fy 2

(3.15)

hvor µ er en konstant, g er gradient vector funktionen og fx, fy er gradienten

af billedet i x og y retningen. Når kurven er langt fra løsningen vil udtrykket

blive nul. Det betyder at når kurven er lang fra løsningen vil GVF kræften

være defineret af laplacian operatoren ∇2 = ∂2g(x,y) ∂x2 + ∂2g(x,y) ∂y2 . Det specielle

ved denne operator er at den i modsætning til ∇ ikke har en retning, men

blot en størrelse. Dette betyder den har den samme størrelse i alle retninger

Dermed vil informationen fra kanten bliver diffust spredt over hele billedet. I

tilfælde af at modellen nærmer sig kanten, vil udtrykket (u − fx) sørge for at

det bliver negativt og dermed minimerer modellen

En problemstilling der er ved brug af ovenstående eksterne kræfter er at

hvis der er nogle konvave områder kan de have svært ved at komme ind i

dette område. Det skyldes som vist på figuren 3.7 at modellen i de konkave

områder ikke bevæger sig nedad, men til siderne hvorfor modellens ekterne

kraft aldrig trækker den nedad. Gradient vektor flow sørger for at gradienten

bliver diffust spredt således at kurven ved et konkavt hul ikke kun går ud til

sidderne, men helt ned i bunden af det konkave områder. Dete gør samtidig

ballonkræften unødvendig. Ved at den kender retningen den skal bevæge sig

sørges for at modellen hele tiden bevæger sig mod kanten. Dermed er det

underordnet hvorvidt startkurven er indenfor en given radius af objektet og om

startgættet placeres indenfor eller udenfor objektet, som med de ovenstående

eksterne kræfter.

Kapitel 4

Fourier

Dette afsnit bygger på afsnittet [6] Fourier analyse er en måde at reproducere

en periodisk stykvis kontinuert kurve. Der er to forskellige fourier algoritmer

der kan bruges til at estimere en lukket kurve med. Den ene er i polære

koordinatter ud fra en enkel fourier række [2]. Den er beskrevet nedenfor:

R (θ) =

∞

An · cos (n · θ − Φ) (4.1)

n=1

Figur 4.1: fourier

hvor Φ er centeret af objektet, n er den givne harmonik og θ er vinklen

til et givent punkt. For at bestemme punkterne beskrives punkterne i polære

koordinater i forhold til centeret. Dernæst beregnes afstanden til punktet. Og

ud fra vinklen er det så muligt at beskrive kurven. Når der er meget konvekse

områder i billedet vil denne metode dog ikke kunne fungere da der så vil være

flere punkter på linjen og dermed vil der til samme vinkel være to forskellige

punkter. Ved at benytte sig af elliptisk fourier slippes for dette da modellen

er en parametrisk model der beskriver kanten som en sum af ellipser ud fra to

fourierrækker. En for x koordinattet og en for y koordinattet. Ved at beskrive

dem på denne måde slippes for ovennævnte problemstilling.

16 KAPITEL 4. FOURIER

4.1 Elliptic fourier

Fourierrækker som dem omtalt nedenfor er en bestemt type af funktioner der

er særdeles velegnet til at beskrive periodiske funktioner. Formelt set er der

brug for uendelig mange harmoniks,n, og der skal derfor stå ∼ i stedet for

lighedstegnet i 4.2 og 4.3. I praksis så kan der ved valg af n opnå en så lille

fejl at der i praksis blot benyttes lighedstegn.

Figur 4.2: eksempel på opbyggelsen af elliptisk fourier

Nedenfor er beskrevet X og Y ligningen for ellipserne.

N

2 · n · π · t

x (t) = A0 + an · cos

+ bn · sin

T

n=1

N

2 · n · π · t

y (t) = C0 + cn · cos

+ dn · sin

T

n=1

2 · n · π · t

T

2 · n · π · t

T

(4.2)

(4.3)

Koefficienterne er amplituderne for cos og sin leddet og bestemmer derfor

også amplituden for x(t) og y(t). n angiver antallet af ellipser de skal bruges

til at rekonstruktere signalet. Jo større n er jo højere bliver frekvensen og

dermed flere svingninger på kurven. Da koefficienterne bliver mindre som omtalt

nedenfor følger det at modellens ellipser her beskrevet også bliver mindre

og mindre.

t er i denne sammmenhæng den afstand det kræver at bevæge 1 pixels i

den lukkede kurve således at tp−1 < t < tp hvortil det gælder at 1 ≤ p ≤ k

hvor k er antallet af punkter på kurven. 4.2 danner et signal hvor an og bn

tilsammen angiver aplituden for signalet i x retningen og cn og dn danner amplituden

danner amplituden for y’s signal i y retningen.Dette er illustreret i 4.3

4.1. ELLIPTIC FOURIER 17

Figur 4.3: eksempel på opbyggelsen af elliptisk fourier, [8]

2·n·π·t

Hver ellipse bestemmes af de to signaler cos T + dn · sin T

og

N 2·n·π·t

2·n·π·t

n=1 cn · cos T + dn · sin T .

Disse to signaler er funktioner af t og for hvert t findes et nyt punkt hvilket

tilsammen danner en lukket elliptisk kurve. Når alle n ellipser adderes som i

4.2 og 4.3 lægges de sammen som i figuren 4.1. 2∗n∗π∗t

T er vinklen med x aksen

til et givent punkt t, hvor T er den samlede længde af kurven. Jo større n

er jo højere bliver frekvensen af svingningerne A0 og C0 angiver centrum for

den første ellipse og dermed centrum for figuren. Hvis A0 og C0 derfor sættes

lig 0 så vil alle billederne have samme placering i billedet . N er antallet af

harmoniks. Jo større n er jo flere ellipser vil blive brugt til at rekonstruere

kurven. Nedenfor er koefficienternes formler opskrevet:

an =

bn =

cn =

dn =

T

2 · n2 ·

· π2 T

2 · n2 ·

· π2 T

2 · n2 ·

· π2 T

2 · n2 ·

· π2 K ∆Xp

p=1

∆tp

K ∆Xp

p=1

∆tp

K ∆Yp

p=1

∆tp

K ∆Yp

p=1

∆tp

· cos

· sin

· cos

· sin

2 · n · π · tp

T

2 · n · π · tp

T

2 · n · π · tp

T

2 · n · π · tp

T

− cos

− sin

− cos

− sin

2 · n · π · tp−1

T

2 · n · π · tp−1

T

2 · n · π · tp−1

T

2 · n · π · tp−1

T

(4.4)

(4.5)

(4.6)

(4.7)

hvor tp er den samlede afstand imellem de første p pixels, ∆yp og ∆xp er

afstanden imellem pixel p og pixel p-1 i x og y retningen. ∆tp er den euklidiske

afstand fra pixel p-1 til pixel p. Jo større antallet af harmoniks er jo flere

ellipser vil der være og disse fourier koefficienter vil der angiver amplituden

18 KAPITEL 4. FOURIER

i x og y retninge vil og dermed også bestemmer éllipsen akser bliver mindre

og mindre for hver n. Dette betyder ellipserne vil kunne gengive flere og flere

detaljer i rekonstruktionen af kanten. Dette ses ovenfor ved at akserne generelt

bliver mindre og mindre jo større n er da n 2 i det konstante led vil få ledende

til at koefficienterne ovenfor til at mindskes jo større n er. Dermed give nogle

mindre og mindre ellipser til at lave mindre og mindre detaljer.

Invarians

For at kunne sammenligne koefficienterne er det nødvendigt at objektets kant

som der rekonstrueres alle er placeret ens, således at en given kantpixel svare

til den samme pixel i det andet billede. Det er som nævnt ovenfor derfor nødvendigt

at gøre otolitterne invariante over for rotation, placering, startpunkt

og skala.

Invarians over for startplacering opnås ved at betragte den første led i

ligningen 4.2 og 4.3 Herudfra kan afstanden til punktet bestemmes ved hjælpe

af E = √ x1 + y1 Derfra findes gradienten og sættes lig 0 hvorved vinklen theta

der som nævnt ovenfor angiver vinklen fra hovedaksen til punktet kan isoleres

på den ene side og bestemmes til:

θ = 1

⎡

· arctan ⎣

2 2 ( ⎤

a1 · b1 − c1 · d1

⎦ (4.8)

a 2 1 + c2 1 − b2 1 − d2 1

Det gælder at udtrykket ovenfor altid finder storeaksen for den første harmonic

der bevæger sig væk fra startpunktet i samme rotationsretning som figuren

dvs. vinklen altid er negativ. Der vil derfor både for rotation med hensyn til

θ og for ψ blive brugt en rotations der drejer ellipserne mod uret. Det følger

hermed at:

a∗ n c∗ n

b∗ n d∗

cos (θ1) sin (θ1)

=

·

n −sin (θ1) cos (θ1)

an cn

(4.9)

bn dn

Næste skridt er at sørge for de er roteret ens således at hovedaksen for den

første harmonic er parallel med x-aksen. Da der er opnået invarians over for

startpunkt vides det at t∗ =0. Derfor vil

X ∗ 1 (t ∗ ) = a ∗

2π · t∗

1 · cos + b

T

∗

2 · π · t∗

1 · sin

(4.10)

T

Y ∗

1 (t ∗ ) = c ∗

2π · t∗

1 · cos + d

T

∗

2 · π · t∗

1 · sin

(4.11)

T

Da der gælder følgende for vinklen med x-aksen: tanψ = y

x

bestemmes til:

kan vinklen

4.1. ELLIPTIC FOURIER 19

ψ = arctan y∗ 1 (0)x∗ 1 (0)] = arctan c∗ 1

a∗ koefficienterne roteres med en rota-

1

tionsmatrix mod uret og man får:

cos (ψ1)

=

−sin (ψ1)

sin (ψ1)

·

cos (ψ1)

(4.12)

a∗∗ n

b∗∗ n

c∗∗ n

d∗∗ n

a ∗ n c ∗ n

b ∗ n d ∗ n

Invarians over for placering fås ved som før nævnt at undlade bruge udtrykkende

A0 og C0

Da akserne som før nævnt bliver mindre og mindre jo større n er, kan

metoden gøres uafhængig af skala. Det gøres ved at dividere alle koefficienter

med størrelsen af storeaksen af den første harmonic. Da metoden er blevet

gjort invariant over for startpunkt og derfor starter ved hovedaksen vil det

sige at for t ∗ = 0 fås hovedaksen for ellipsen:

E ∗ (0) =

x ∗ 1 (0) 2 + y ∗ 1

2 2

1 (0) = a ∗2

1 + c ∗2

1

2

1

(4.13)

Nedenfor er illustreret rekonstruktionen af billedet ved 1 2 16 og 32 harmonics.

Kapitel 5

Diskriminant analyse

nedenstående afsnit bygger på artiklen [10]

Hvis der er n forskellige populationer af formen πi = N (µi,

i ) og der

ønskes at klassificere alle objekter til en given klasse kan der gøres brug af

diskriminant analyse. Der er for at kunne gøre dette lavet en antagelse om at

populationerne følger en normalfordeling af formen

fi (x) =

1

√

2 · φp ·

1

det

· exp −

i

1

2 ·

x − µi) T ·

−1

i

· (x − µi)

(5.1)

Det følger af baysian theorem [7] at den betingede sandsynliged for en begivenhed

er :

P (Ai|B) = P (B|Ai) · P (Ai)

j P (B|Aj)

. (5.2)

· P (Aj)

Posteorior distribrutionen er derfor givet ved

k (πi|x) =

pv·fv

pi·fi+...pk·fk

hvor pi er den på forhånd givne prior sandsynlighed for at tilhøre den i’te

population og f er distribrutionen. Det følger af 5.2 at den population som en

given x skal vælge som klasse er den hvor den betingede sandsynlig er størst.

Som det desuden fremgår af ligningen 5.1 vil fi give størst værdier ved den

distribrution hvor den er tættest på centrum set i forhold til standardafvigelsen

da den måler hvor stor distribrutionen er. Dette føre til bayes løsning:

Sv > Sifor∀ihvorSi = pi · fi

Nedenfor er illustreret en normaldistribrution i 2d

21

(5.3)

22 KAPITEL 5. DISKRIMINANT ANALYSE

Figur 5.1: gaussian distribrution

Det følger af udtrykket ovenfor og af tegningen at afstanden fra x til centrum

skal måles i forhold til standardafvigelsen da det er den der siger noget

om hvor stor distribrutionen er. Hvis variansen er stor vil distribrutionen som

vist ovenfor blive breddere og derfor mere sandsynligt at det er den distribrution

der skal vælges. Hvis man har en viden om at en given population ikke er

lige så sandsynlig at få vil der være en øget risiko for at x ikke tilhøre denne

population. For at tage højde for dette beregnes derfor prior distribrutionen

for p = Ni

N

Ud fra antagelsen om at der er equal losses dvs. der ikke er nogen grund til

at x specielt ikke må lande i en speciel population ved en fejl. Dette kunne være

tilfældet hvis der var en risiko forbundet ved at lave en forkert bestemmelse

af dets population. Udtrykket ovenfor i 5.1 kan forkortes ved at fjerne det

1

konstante led √2·φ

p · 1

det ·. Ved at bruge logaritmen af det udtryk fås:

Si = − 1

2

ln (Det (

i

1 )) − 2 (x − µi) T · −1 i (x − µi) + ln (p)

Da x bliver ganget med sig selv i ovenstående ligning vil der opstå led af

x 2 hvorfor dette er en kvadratisk diskriminant funktion Hvis man kan lave antagelsen

om at de forskellige distribrutioner har samme varians kan udtrykket

forkortes yderligere til: Si = x T · −1 ·µi − 0.5 · µ T i · −1 ·µi + ln (p)

Da x kun optræder en gang i denne diskriminant funktion er der derfor

tale om en lineær diskriminant funktion

Det mest optimale som før nævnt er at klassificere ved at maksimere afstanden

imellem middelværdierne for populationerne i forhold til standardafvigelsen

således at distribrutionerne kommer så langt væk fra hinanden som

muligt. I praksis er det hvad leddet 0.5·µ T i · −1 ·µi ovenfor gør og som måles i

posteorior distribrutionen. Og man vælger så den diskriminant tilhørende den

population der har størst værdi og derfor maksimere denne afstand mest. En

anden måde er ved at lave den forudsætning at de har samme distribrution

og bruge koefficienterne som er isometrisk ens således at koordinaterne bliver

sfæriske og topografisk ens. Dermed vil variansen imellem hver af populationerne

være enhedsmatricen og man kan bruge fishers diskriminant funktion

der bruger afstanden til den nærmeste middelværdi til at klassificere. Det er

vigtigt at tage p med i denne betragtning da som det ses af ligningerne ovenfor

p flytter diskriminant funktionen tættere på en population med høj prior og

5.1. DISKRIMINANT MED MULTIPLE POPULATIONER 23

væk fra populationer med lav prior, med den konsekvens at der oftere vil blive

klassificeret som den population med høj prior sandsynlighed.

5.1 diskriminant med multiple populationer

hvis der er givet K populationer som lægger i et P dimensionalt rum, hvor P

er antallet af variable. Så er det muligt at beskrive diskrimiant analysen maksimalt

i K-1 dimensioner. Dette er isært brugbart jo større antallet af variable

er, da dette i sådanne tilfælde vil nedbringe antallet af dimensioner drastisk.

Fishers diskriminant handler om at finde det mest optimale underrum af K-

1 uden at miste information. Dvs. målsætningen er at finde egenvektorerne

Wi, + . . . +, Wm der udspænder dette underrum mest muligt således at koordinatterne

i underrummet

U = W t · X = d j=1 wi · xi

kan udregnes med så lidt tab af information som muligt. Dette er forsøgt

illustreret i 5.2

Figur 5.2: diskriminantillustration

Funktion bygger den ide at det mest optimale for en diskriminant funktion

er at middelværdierne for hver gruppe har størst mulig afstand i forhold til

deres spredning, således at det mindste overlap finder sted, hvilket svare til at

maksimere forskellen i variansen imellem grupperne B i forhold til variansen i

grupperne W. Det følger af [7] at hvis matricen B er positive semidefinite, og W

er positive definite. Så har B/W egenværdierne lambdai > + . . . + > lambdam

med egenvektorerne Vi, . . . , Vm der udspænder rummet R m . hvor vi ·B ·vj = 0

og i . Heraf følger det at B/W kan skrives som:

φ (d) = d′ · B · d

d ′ · W · d

(5.4)

hvortil det følger at: sup φ (d) = φ (d1) = λ1infφ (d) = φ (dm) = λm Det vil

sige at egenvektorerne d1 ,d2 for B

W vil være dem der maksimerer variansen

mest. Punkterne samt Middelværdier og covarians matrix kan nu udregnes for

det nye underrum og plottes grafisk. Hvis der ønskes en klassifikation så fås

de nye diskriminant variable som Zi = . i · X. Hvorfra en klassisk diskriminant

24 KAPITEL 5. DISKRIMINANT ANALYSE

funktion som ovenfor kan benyttes. Hvor mange variable der ønskes benyttes

afhænger af hvor stor deres betydning er for at maksimerer variansen . Dette

kan ses ud fra egenværdierne jo mindre de er jo mindre betydning har dens

egenvektor. Når det nævnes at der vælges de egenvektorer der maksimere

variansen og dermed beskriver mest information om objekterne, så er der

tale om den varians som er mest generel. Den information der gør otolitterne

unikke svare ikke til en særlig stor del af variansen, hvilket gør noget af den

information der skal bruges til klassifikation kan gå tabt ved denne måde

at vælge variable på. Derfor vil denne metode samt metoder som ”stepwise

forward regression” i [11] ikke blive brugt i denne rapport.

Kapitel 6

Implementering

Nedenfor er forklaret implementationen af nogle af funktionerne og hvilke

overvejelser der har været.

6.1 premodellering

I premodelleringen orienteres billederne således at otolitterne altid vender

samme vej. Til at starte med vælges en mappe hvor billederne der skal køres

lægger i. Der køres dernæst et for loop som iterere igennem billederne og indlæser

dem. Når et billede er indlæst binæriseres billedet med en treshold

værdi på 103.

Figur 6.1: histogram over pixelværdier i billedet

Dette skyldes at baggrundstøjen er placeret meget centralt fra omkring 50

til omkring 100 hvilket figur 6.1 netop viser. Der er lidt støj på billedet hvilket

betyder at der er i det binære billede optræder flere objekter på billedet.

Derudover er der også billeder hvor der er mere end to otolitter på billedet.

Der beregnes dernæst via regionprops arealet, centeret for punkterne af pixels.

Til sidst approksimeres alle objekter i billedet med ellipser og store aksen

26 KAPITEL 6. IMPLEMENTERING

bestemmes. Der vælges dernæst de klumper af pixels som er større end 90000

pixels for at fjerne støj og mindre objekter. Ved at sætte værdien så højt sikres

at det center,areal og store akse er for otolitten/otolitterne på billedet.

Hvis der kun er et indeks checkes dernæst om dens store akse er mindre end

570, hvis det er tilfældet vendes billedet med metoden im = fliplr (im) og

den anden otolit vælges.

Når det er gjort fjernes enkeltpunkter via filteret spur fra bwmorph og kanten

bestemmes. Dernæst bruges chain code algoritmen bwtraceboundary. Det er

ikke lykkedes at lave en stabil algoritme der kan finde ud af om den er højre

eller venstre vendt. Der er derfor lavet en metode kaldet

punkter = flippunkter ([x, y] , dim, direction) som givet dimensionerne af

billedet samt kurven drejer kurven så den vender rigtigt.

Ved at spejle kurven i y-aksen betyder det koefficienterne for y-koordinattet

ændrer fortegn. I langt de fleste tilfælde har otolitterne når de vender korrekt

positivt fortegn på c3 og d3 og modsat fortegn på c2 og d2. Dette gælder dog

ikke i alle billederne, hvorfor denne metode ikke er implementeret. Men det

er klart at der er en sammenhæng og at det bør være muligt ud fra cn og dn

at finde et stabilt gæt for om billederne er højre vendt eller venstre vendt. Til

sids checkes om der er 2 otolitter på billedet. I dette tilfælde beregnes omridset

af denne og gemmes i et andet cell array.

6.2 EFA

Elliptisk fourier analysis består af to funktioner en til at beregne koefficienterne

og en til at rekonstruerer signalet. Funktionen der beregner koefficienterne

og som kan gøre dem invariante har følgende form:

functioncoefmatrix = efa(kant, harmonics, startpunkt, rotate, skalar, translation)

kant er en m · 2 matrix hvor første søjle er x koordinattet og anden søjle er y

koordinattet. Harmonics er antallet af harmonics n der skal bruges i modellen.

startpunkt,skalar, translation skal være 1 eller 0 og angiver om koefficienterne

skal være invariante over for dette.

coefmatrix er en 4· antal harmoniks matrix, hvor hver række er henholvis

koefficienterne for a, b,c, og d. kant er en matrix med n · 2 matrix med henholdsvis

x og y koodinatterne. Harmonics er antallet af harmoniks der ønskes

brugt og startpunkt,rotate, skalar, translation skal være 1 elller 0 og angiver

hvorvidt man ønsker invarians over for disse ting.

Der startes med at beregne koefficienterne an,bn,cn og dn ud fra formen

4.4,4.5,4.6 og 4.7. Hvis der ønskes invarians over for translation betyder det

så at A0 og C0 ikke beregnes. Hvis der dernæst ønskes invarians over for

startpunkt beregnes (4.8). Der checkes dernæst om det er vinklen til hoved

eller lille aksen ved at lægge π til i beregningen af vinklen og dernæst checke

afstanden til startpunktet. Der vil være størst afstand ved hovedaksen og

derfor vælges så den der har størst afstand. Når vinklen er bestemt benyttes

6.3. ACTIVE CONTOUR MODEL 27

dernæst en rotationsmatrix for moduret til at beregne de nye koefficienter, som

i (4.1). Hvis der ønskes invarians over for rotation bestemmes ligeledes vinklen

ψ angivet i 4.1 og der checkes ligeledes om vinklen er den korrekte. Til sidst

hvis der ønskes invarians over for Skalar bruges ved at dividere koefficienterne

med (4.13).

Til at estimere antallet af harmonics der skal bruges, er summen af fejlene

imellem kanten og rekonstruktionen fra harmonic = 20 til 50 blevet bestemt

og plottet. Der er valgt det N hvor fejlen er mindst i forhold til antallet af

ellipser N. Der fås:

Det ses ud fra grafen at kurven har det mindste forhold imellem fejl og n

ved omkring 35. I det efterfølgende kapitel med resultater er disse opnået på

baggrund af 35 harmonics, dvs. 140 variable i alt. ´

6.3 Active contour model

Der er ved implementationen af snake modellen blevet taget udgangspunkt i

noget kode fra [9]. I tilfælde af gvf og resam er koden blot blevet kopieret og

brugt uden at lave ændringer.

Figur 6.2: diagram over forløbet for Active contour modellen

active contour har som formel:

function [x, y] = snake (x, y, alpha, beta, gamma, fx, fy, img, numbers, tol, maxiter, , omega, ballon)

x,y angiver koordinatterne for startkurven. alpha og beta er konstanterne

nævnt i afsnit 3.2. Disse er sat til 0.1 og 0.1. gamma er konstanten for den

eksterne kræft, angivet ved fx og fy. Afstand er den ønskede afstand imellem

pixels i kurven og tol samt maxiter er den minimale residual imellem to iterationer

der må være før modellen stoppes samt maksimale antal iterationer.

ballon er en konstant som enten er 1 eller 0 alt efter om den ønskes brugt i

beregningen.

28 KAPITEL 6. IMPLEMENTERING

Funktionen er opbygget omkring en while løkke. Før while løkken beregnes

koefficienterne til pentadiagonalmatricen A. Når kurven deformere vil punkterne

have en tendens til at samle sig i områder [3]. For at undgå dette og

sørge for der hele tiden er den samme afstand imellem pixels kaldes funktionen

resam (x, numbers).

resam (x, numbers) er en funktion jeg har brugt fra [9]. Der ønskes at koordinatterne

er placeret jævnt på kurven med ens afstand. Inde i funktionen laves

der derfor en vektor med afstanden 3 af samme længde som kurven. For denne

vektor bruges interpolation til at få x og y koordinatter. Det vil være muligt

at flytte denne beregning ud af kurven hvis man ved hvor mange punkter der

skal bruges, til beregningen for at få en god løsning. I praksis varierer størelsen

af otolitterne dog meget hvilket betyder at afstanden imellem pixels i et sådan

tilfælde også vil varierer meget. Hvis afstanden er for stor kan det betyde at

modellen ikke stopper ved kanten, hvis afstanden er for lille kan det betyde

at modellen bliver alt for langsomt. Det giver derfor en mere robust metode

ved at den ønskede afstand imellem pixels som input i stedet for.

Derefter bestemmes de eksterne kræfter for de nye x og y værdier ved hjælp

bilinear interpolation vf = linear2(ExtrapV al, f, x, y);. Det næste skridt i

funktionen er at bestemmer A matricen for de nye koordinatter. Dette gøres

ved at give koefficienterne og punkterne på kurven som input. De nye x

og y koodinatter beregnes dernæ ud fra ligningen 3.9. Til sidst bestemmes

forskellen imellem x og y koordinatterne for de sidste to iterationer som

((xn−xn−1) 2 +(yn−yn−1) 2 )

n

, hvor n er antallet af punkter. Hvis forskellen er mindre

end . . . eller maks antal iterationer er nået stoppes modellen.

6.4 Diskriminant

Der er implementeret en diskriminant funktion der kan beregne lineær og

kvadratisk diskriminant. DA har følgende input og output

[Sanswermatrix, Ac, acc] = DA (coef, method, centroids, p, Nk)

hvor en matrix med observationerne i rækken og variablende i søjlerne. Det

andet input er navnet på den ønskede model. Det tredje input er variabel gennemmsnitsne

for de forskellige populationer. De fjerde input er prior sandsynlighederne

og til sidst en vektor med størrelsen for hver population. Outputtet

x er en matrix med alle de forskellige diskriminants score. Scores er en vektor

af samme længde som antallet af observationer. Matrix er konfusionmatricen

for modellen. AC er et succeskriterium af typen nedenfor:. acc er et estimat

for succesraten for hver enkel population. Til bestemmelse af fejlraten af klassificeringen

beregnes en succesrate der vægter populationerne efter deres antal

af observationer:

AC= A+D

A+B+C+D hvor A og D er diagonal elementerne.

Der bestemmes også en succesrate forkortet TP i resultaterne ved at dividere

6.4. DISKRIMINANT 29

elementerne i konfusionmatricen med antallet af observationer for dens rigtige

population. Derved opnås nogle resultater der er vægtet ens.

Kapitel 7

Resultater

7.1 kanter

Figur 7.1: billed UK − 11773 − 05x25x1 med kant fra original model

Figur 7.2: billed 88 − 03 − 70 − 05x25x1 med kant fra ACM model

32 KAPITEL 7. RESULTATER

Figur 7.3: billed 88 − 03 − 70 − 05x25x1 med kant fra ændret chain code

Figur 7.4: billed UK − 11772 − 05x25x1 med kant fra original model

Figur 7.5: billed UK − 11772 − 05x25x1 med kanter fra chain code model

7.1. KANTER 33

Figur 7.6: billed UK − 11772 − 05x25x1 med AC model

Figur 7.7: billed 88 − 03 − 51 − 05x25x1 AC model hvor startgæt var inde i

model

Figur 7.8: billed 88 − 03 − 51 − 05x25x1 chain code model

34 KAPITEL 7. RESULTATER

Figur 7.9: billed 88 − 03 − 36 − 05x25x1 illustrerende hvor tætte otolitterne

kan lægge på hinanden

7.2 klassifikation

I tabellerne nedenfor er søjlerne de rigtige populationer observationerne tilhøre

og rækkerne er hvad de er blevet bestemt til.

LDA Population1 Population2 Population 4

Population1 68 11 1

population2 6 64 0

population3 1 0 74

TP rate 0.9067 0.8533 0.9867

Tabel 7.1: klassifkation af otolitter med den ændrede chain code algoritme på

trænnningssæt

LDA Population1 Population2 Population 4

Population1 20 33 6

population2 6 30 5

population4 4 10 14

TP rate 0.6667 0.4109 0.56

Tabel 7.2: klassifkation af otolitter med den ændrede chain code algoritme på

testsæt

AC= 0.5

7.2. KLASSIFIKATION 35

LDA Population1 Population2 Population 4

population1 72 2 1

population2 2 72 0

population4 0 1 74

TP rate 0.9733 0.9600 0.9867

Tabel 7.3: klassifkation af otolitter med ACM algoritmen på trænnningssæt

AC= 0.9733

LDA Population1 Population2 Population 4

population1 15 39 7

population2 13 21 5

population4 2 13 13

TP rate 0.5 0.2877 0.5200

Tabel 7.4: klassifkation af otolitter med ACM algoritme på testsæt

AC = 0.38

LDA Population1 Population2 Population 4

Population1 75 0 0

population2 0 75 11

population4 0 0 64

TP rate 1 1 0.8533

Tabel 7.5: klassifkation af otolitter med original model på trænningsæt

AC = 0.9511

LDA Population1 Population2 Population 4

Population1 2 28 4

population2 5 18 6

population4 2 15 15

TP rate 0.2222 0.2951 0.600

Tabel 7.6: klassifkation af otolitter med original model på testsæt

AC = 0.36

36 KAPITEL 7. RESULTATER

7.3 sammenligning af højre og venstre otolit

LDA Population1 Population2 Population3 Population 4 Population5

Population1 45 3 1 1 0

population2 4 44 1 0 0

population3 1 3 47 0 0

population4 0 0 0 48 2

population5 0 0 1 1 48

Tabel 7.7: klassifkation af venstre otolitter fra trænningssæt

LDA Population1 Population2 Population3 Population 4 Population5

Population1 17 26 18 7 7

population2 12 20 6 2 2

population3 10 10 29 7 6

population4 3 11 7 18 8

population5 2 7 18 10 19

AC=0.3652

Tabel 7.8: klassifkation af venstre otolitter fra testsæt

LDA Population1 Population2 Population3 Population 4 Population5

Population1 45 3 0 0 2

population2 3 46 0 1 0

population3 1 1 49 0 0

population4 0 0 0 49 2

population5 1 0 1 0 46

Tabel 7.9: klassifkation af højre otolitter fra trænningsæt

LDA Population1 Population2 Population3 Population 4 Population5

Population1 14 28 8 4 11

population2 11 23 15 7 3

population3 4 1 39 3 6

population4 4 11 3 18 8

population5 11 11 13 12 14

Tabel 7.10: klassifkation af højre otolitter fra trænningsæt

7.3. SAMMENLIGNING AF HØJRE OG VENSTRE OTOLIT 37

AC= 0.38

Kapitel 8

Diskussion

8.1 Kanten

Generelt set fungerer DTU,Aqua’s metode rigtig godt. Kanten den finder er

ofte meget præcis og kurven er nogenlunde blød og glat, som 7.1 er et godt

eksempel på. Der er enkelte problemstillinger ved DTU,Aqua’s meode som ved

7.4 hvor kanten ikke er skarp og kant rutinen bevæger sig ind i otolitten. Det

er ikke lykkedes at identificere nogle otolitter hvor den fejlede. Men fordi jeg

har vurderet kantrutinen fra ”DTU,Aqua” er en chain code algoritme ligesom,

vil jeg komme med eksempler på steder den vil fejle ud fra min egen verison af

chain code funktionen. I det tilsvarende billede med den ændrede chain code

7.5 og ved 7.6 er dette dog ikke et problem. Ved nabo otolitten har chain code

algoritmen tilgengæld problemer med at finde kanten. Dette skyldes kanten

er meget svag og mørk. Fordi chain code algoritmen bestemmer billedet på

baggrund af et binært billede kan den nogle gange give en takket kant eller

en kant indeholdende små bobler, hvilket netop er tilfældet øverst oppe til

venstre i 7.5.

På enkelte billeder så som otolitten til venstre i 7.2 er der et hak ind i

objektet. Ved brug af den originale model vil dette blive betragtet som en

del af kanten og vil følge denne kant hele vejen rundt og dermed fejle. Ved

den ændrede Chain code model er denne fejl blevet væsentligt reduceret som

illustreret ved 7.2. Baggrunden i billedet er mørkere end hullerne i otolitterne

hvorfor det meste af dem bliver fjernet. Ved brug af ACM er den dog helt

fjernet og betragtes ikke længere som en del af kanten7.3 Et anden problem

er startgættet for ACM. Der er typisk store farveforskellige og huller inde i

otolitterne, hvilket forhindre denne model i at starte inde i otolitten. Hvis

startgættet fundet ved chain code tilgengæld er for tæt op ad en skarp kant i

otolitten som i 7.7 vil AC modellen ikke nødvendigvis bevæge sig ud til kanten,

men blive inde ved kanten inde i otolitten som illustreret i 7.8. En forhindring

for at sætte startgættet udenfor otolitten er dog at der er billeder så som

7.9 eller blot er placeret tæt på hinanden. Da baggrunden af billederne er så

40 KAPITEL 8. DISKUSSION

homogen vil et startgæt placeret udenom otolitterne dog højst sandsynligt

give nogle bedre resultater da den første skarpe gradient den vil møde altid er

kanten. En af fordelene ved disse to algoritmer er at de altid finder en kant.

Chain code algoritmen finder altid en kant pga. billedet blev binariseret. Hvor

AC modellen altid bevæger sig mod de steder på billedet givet ved den eksterne

kraft som har størst gradient.

Et andet problem DTU,Aqua havde var hvis gradient var lav. Hvis der er et

hul et sted hvor gradienten ikke er stor, vil den stadig tilpasse sig kanten fordi

kurven som nævnt skal være glat og blød. En anden fordel er at fordi metoden

forsøger at holde kurven differentiabel undervejs betyder det også at kurven

ikke kan bevæge sig ind i meget konkave områder. . En problemstilling der kan

være ved brug af AC modellen er den ikke er helt stabil omkring løsningen.

Det gør at residualen går op og ned omkring løsningen og at residualen som

stopkriterie ved mange iterationer ikke altid er robust. Dette er ikke et problem

ved denne metode da der kun foretages op til 100 iterationer.

Der er i ACM model blevet brugt differens til at approksimere den afledte.

Det er muligt bl.a. at bruge splines i stedet for. Dette vil evt. kunne betyde

at steder hvor kurven er meget bøjet, vil blive bedre approksimeret

8.2 Klassifikation

Hvis der tages udgangpunkt i AC raten så har den ændrede chain code en

værdi på 50 procent hvorimod den er på 38 procent og 36 procent for acm

metoden og for dtu aqua’s metode. Hvis man tager udgangspunkt i tp raten

for DTU Aquas metode så population 4 bestemt rigtig godt. Population 2

bliver generelt bestemt noget dårligere og har en nogle flere fejl klassificeringer.

Dette skyldes dog højst sandsynligt at diskriminant funktionen er bygget på

equal priors men der er væsentlig flere observationer i testsættet tilhørende

denne gruppe. Population 1 lægger for DTU,aqua’s metode væsentlig under

klassifikationsniveauet for de andre. Dette kan dog skyldes at testsættet for

population 1 kun er på 9 otolitter og der derfor bliver lagt for meget vægt

på enkelte fejl og støj. Generelt set fungere den ændrede chain code sig bedst

hvilket AC raten og Tp raten begge viser. Hvis der tages udgangspunkt i AC

raten så er den dog ikke væsentlig bedre for chain code algoritmen.

En af ulemperne ved brug af en lineær diskrimiant funktion er at den

er meget fleksibel i tilfælde af mange korrelerede variable[10]. Da det er et

generelt problem betyder det at der vil blive lagt mere vægt på tilfældige sammenhænge

grundet korrelationen. Dette giver sig udslag i at fejlen vil stige i

testsættet, hvilket ses af resultaterne. Det er dog som nævnt i kapitel 5 ikke

muligt udfra denne type af reduktion af bestemme det bedste antal parameter

uden at kunne miste vigtig information. Dette er en problemstilling som der

er forsøgt løst ved hjælp af diskriminant funktion kaldet penalized diskriminant.

Denne metoder er lavet med henblik på problemstillinger med mange

8.3. SAMMENLIGNING AF HØJRE OG VENSTRE 41

korrelerede variable og syntes derfor som en rigtig god model for fremtidige

klassifkationer. [10].

8.3 Sammenligning af højre og venstre

Begge metoder har en AC rate op omkring 40 procent. De venstre otolitter

bliver ud fra AC raten kvalificeret lidt bedre, men det er meget lidt. Hvis der

tages udgangspunkt i tabellen så ses det at klassifikationsraten for population

2 til 4 er meget ens. Population 1 skiller sig lidt ud med en lidt lavere klassifkations

rate for højre otolitter og nogle flere fejl med hensyn til population

5. Der er nogle stigninger forskelle rundt omkring med hensyn til klassifikation

men samlet set er klassifikationsraten den samme, og det fremgår klart af

diagrammerne at der er de samme klassifikationstendenser for begge metoder.

Der er lidt udsving hvorfor de ikke er helt ens. Dette kan dog som før nævnt

også skyldes at lineær diskriminant analyse ikke egner sig til klassifikationer

med mange korrelerede variable.

Kapitel 9

Konklusion

Det kan ud fra diskussionen konkluderes at den metode der gav de bedste

resultater af kanten var DTU Aqua’s metode. Metoden jeg har lavet baseret

på chain code gav tit nogle resultater der var ligeså gode og som var meget lig

dens. Metoden baseret på Active contour models, gav de dårligste resultater.

Dette skyldes primært at metoden blev startet typisk blev startet lidt inde i

otolitten, og med nogle skarpe kanter inde i otolitterne gav dette problemer.

For fremtiden vil det være en fordel af lave en funktion som kan finde objekter

med konvekse huller og en der kan finde ud af om kanten på en otolit

er meget lav og i disse tilfælde køre AC rutinen. Evt. med et startgæt placeret

udenom otolitten. Klassifikationen af otolitterne svinger fra 0.36 til 0.5,

hvor Dtu,aqua’s metode generelt lidt dårligere. Generelt set var population

2 den dårligst klassificerede. Dette kan skyldes at diskriminant funktionen

var lavet på equal priors. Hvis størrelserne på populationer i dette datasæt

er generelle er dette et sted hvor metoden vil kunne forbedres. En anden stor

fejlkilde kan være at der blev brugt for mange variable til udledelse af diskriminant

funktionen hvilket kan have medført at der blev lagt for meget vægt på

tilfældige former i udarbejdelsen af diskriminant funktionen. Dette sammen

med at datasættet var lidt mindre for DTU,aqua’s ,metode kan have gjort en

forskel.

I sammenligning af højre og venstre otolit kan det konkluderes at det

omtrent havde den samme AC rate og der generelt var de samme tendenser

med hensyn til fejlklassifkationer. De venstre blev generelt bestemt lidt bedre.

Population 2 til 4 var generelt meget ens. 1 og 5 skilte sig lidt ud, med en

dårligere klassifikation for højre otolitter. En del af fejlen kan skyldes at jeg

har valgt at bruge alle variablene i til modellen, hvilket kan have givet sig

udslag i at tilfældige former har fået for meget indflydelse.

Litteratur

[1] Euler - lagrange differential equation. http://www.mathworld.wolfram.

com/Euler-LagrangeDifferentialEquation.html.

[2] Ole Christensen. Differentialligninger og uendelige rækker. Danmarks

Tekniske Universitet, 2005.

[3] Ramus Larsen. Deformable template models, 02505.

[4] Henrik Mosegaard. Manual of fish Schlerochronology, pages 216–228.

[5] Giorgio Pannella. Fish otoliths: Daily growth layers and periodical patterns.

Science, 173(4002):1124–1127, 1971.

[6] ’Frank P.Kuhl and Charles R.Giardina. Elliptic fourier features of a closed

contour, 1981.

[7] Bjarne Kjær Ersbø ll and Knut Conradsen. An introduction to Statistics

vol. 2. DTU informatics, Department of informatics and Mathematical

Modelleling, 2007.

[8] George Stetten.

[9] Tomas Svoboda, Jan Kybic, and Vaclac Hlavac. Image Processing, Analysis,

and Machine Vision: a MATLAB companion, chapter 7. Thomson

Learning, Toronto, Ontario, 2008.

[10] Robert Tibshirani Trevor Hastie and Jerome H. Friedman. The elements

of statistical learning: data mining, inference, and prediction, chapter 4-8.

[11] Larry Wasserman. All of Statistics A Concise Course in Statistical Inference,

chapter 13. Springer, 2004.

Bilag A

Appendiks

Se vedlagte cd-rom

- Danmarks Tekniske Universitet

- Danmarks Tekniske Universitet ... View more - Danmarks Tekniske Universitet

Delete template?

Save as template ?

- Danmarks Tekniske Universitet - Danmarks Tekniske Universitet