Kunstig Intelligens til Brætspillet Taiji - Danmarks Tekniske Universitet

09.09.2013 Views
92 Konklusion selv n˚a igennem et helt spil p˚a omkring et minut. Den samme opgave tager for Néstor Romeral Andrés’ kraftigste AI næsten 20 minutter. Men p˚a trods af at Néstor Romeral Andrés’ AI anvender godt 20 gange s˚a lang tid til sine beregninger som Growth, lykkedes det kun at vinde et ud 10 spil, og dette var ud fra de officielle regler, hvor et uafgjort resultat tæller som en sejr for sort. Growth vinder ni ud af ti gange, hvor den sidste en ud af ti endte uafgjort eller tabt afhængigt af reglerne. Og dette gjorde den p˚a kun ca. 5% af den tid Néstor Romeral Andrés’ AI anvendte. Desværre er resultatet ikke lige s˚a overbevisende mod en erfaren menneskelig spiller, hvor den vinder en tre-fire gange ud af ti spil, hvilket dog ogs˚a er et ganske glimmerende resultat sammenlignes med de andre AI’ers resultater. Min overordnede konklusion er derfor, at ved at benytte flere AI-teorier og kombinere disse p˚a gennemtænkt og gennemtestet m˚ade, kan man opn˚a væsentlige forbedringer vedr. afviklingshastighed uden at sætte ’intelligensen’ over styr. Dette er netop bevist med min AI. Derfor mener jeg ogs˚a det er rimeligt at konkludere at AI vil kunne anvendes med fordel i flere gennemanalyserede situationer. Disse situationer kan netop h˚andteres med AI uden at der behøves at anvendes overvældende computerkraft. Men ligesom det kan konkluderes at den kunstig intelligens kan bruges med fordel p˚a gennemanalyserede situationer, kan det tilsvarende konkluderes at: For situationer, hvor der ikke ligger en grundig analyse, der har afdækket alle udfaldsrum for en given situation, vil de typer AI som er anvendt i denne opgave ikke fungere. I situationer hvor ’spilbrættet’ ikke er kendt vil der være behov for andre metoder, der kan simulere en anden type intelligens, den type vi i daglig tale kalder intuition. 8.0.1 Fremtidige udviklingsmuligheder: I fremtidsperspektivet for AlphaBeta AI’en er der mulighed at lave yderligere forbedringer, disse kun komme p˚a flere fronter, men det bedste resultat ville formentligt komme af kombinationer mellem nye tiltag og gamle fungerende metoder. Et omr˚ade hvor der kan indføres nogle nye tiltag er heuristikken. Nye heuristikker kunne laves, som i stedet for blot at se p˚a scoren, kan g˚a ind og se p˚a udvidelsesmulighederne for de største figurer eller ser p˚a hvor store de tredje største figurer er. Det bedste resultat vil nok ikke komme ved at udskifte den nuværende heuristik med en ny, men netop ved at kombinere den nuværende heuristik med nye, og finde en passende vægtning mellem dem. Vægtningen kunne f.eks. tilpasses ved hjælp af mere avancerede metoder inden for AI, som simuleret nedkøling eller neurale netværk. Vægtningen vil med disse metoder kunne tilpasses ud fra erfaringer med at spille spillet, og hvordan disse

spil med forskellige vægtninger er endt. Ses der p˚a den lidt nærmere fremtid kunne AlphaBeta AI’en forbedres ved hjælp af metoden, der bestemmer hvilke træk der undersøges i Growth AI’en. Dette skulle ske ved at trækkene, som growth nøjes med at undersøge, skulle undersøges først i AlphaBeta AI’en, mens de resterende træk kommer i anden række. Det er nemlig ret sandsynligt, at de bedste træk befinder sig indenfor de træk growth undersøger. Jo hurtigere AlphaBeta AI’en finder et godt træk jo bedre fungerer alpha-beta pruning, da den derved kan stoppe en lang række undersøgelser p˚a et tidligere tidspunkt. I praksis vil denne forbedring kunne betyde, at AlphaBeta AI’en kommer til at kunne klare en dybere søgning ned i spiltræet. Skulle det hermed lykkedes AlphaBeta AI’en at n˚a den samme søgedybde, som Growth AI’en leverer, vil AlphaBeta AI’en sandsynligvis g˚a hen og blive et bedre valg, fordi Growth AI’ens begrænsede søgning i vise tilfælde skader kvaliteten af dens resultat. Forbedringer for Growth AI’en kunne best˚a i at lade dens træk g˚a ud fra de tre største figurer for hver farve i stedet for blot de to største, som det har været hidtil. En forbedring af justeringen af søgedybden kunne ogs˚a hjælpe, da nogle træk bliver beregnet s˚a hurtigt, at det formentligt ville være muligt at tage en generation mere med i beregningen i disse tilfælde. Dette vil dog kræve en grundigere analyse af brættilstanden, da det ikke umiddelbart er til at gennemskue, i hvilke tilfælde beregningerne er hurtigt overst˚aet og hvorn˚ar de ikke er. 93

Page 1 and 2: Kunstig Intelligens til Brætspille

Page 3: Summary This project concerns the d

Page 7: Forord Dette speciale er udarbejdet

Page 10 and 11: viii INDHOLD 5.3 Hash funktioner .

Page 12 and 13: 2 Taiji Figur 1.1: Standard Taiji b

Page 14 and 15: 4 Taiji 1.1.1 Forskelle mellem de o

Page 16 and 17: 6 Taiji Alts˚a kan der maksimalt f

Page 18 and 19: 8 Taiji Figur 1.9: Et standard Taij

Page 20 and 21: 10 Taiji Der er dog en række speci

Page 22 and 23: 12 Taiji Figur 1.15: Eksempel p˚a

Page 24 and 25: 14 Taiji 1.4 Spillets kompleksitet

Page 26 and 27: 16 Taiji Figur 1.18: Alle trækmuli

Page 28 and 29: 18 Taiji Figur 1.21: Denne figur vi

Page 30 and 31: 20 Taiji

Page 32 and 33: 22 Design og brugervenlighed Figur

Page 34 and 35: 24 Design og brugervenlighed naturl

Page 36 and 37: 26 Design og brugervenlighed muligh

Page 38 and 39: 28 Design og brugervenlighed 2.2.2

Page 40 and 41: 30 Design og brugervenlighed uprakt

Page 42 and 43: 32 Kunstig Intelligens 3.1.1 TaijiD

Page 44 and 45: 34 Kunstig Intelligens 3.1.10 Figur

Page 46 and 47: 36 Kunstig Intelligens 3.2.1 Nodes:

Page 48 and 49: 38 Kunstig Intelligens at udvide de

Page 50 and 51: 40 Minimax først søgningen, da de

Page 52 and 53: 42 Minimax 4.3 Spilgraf for 3x3 Tai

Page 54 and 55: 44 Minimax Herunder ses spilgrafen

Page 56 and 57: 46 Minimax Herunder ses spilgrafen

Page 58 and 59: 48 Minimax Som det kan ses ender sp

Page 60 and 61: 50 Minimax Det kan ses at alle de e

Page 62 and 63: 52 Optimering af Minimax Figur 5.1:


Page 66 and 67: 56 Optimering af Minimax som et uni

Page 68 and 69: 58 Optimering af Minimax Det er der

Page 70 and 71: 60 Optimering af Minimax klarer sig

Page 72 and 73: 62 Optimering af Minimax IF v < m T

Page 74 and 75: 64 Optimering af Minimax er tilfæl


Page 78 and 79: 68 Optimering af Minimax vigtigt at

Page 80 and 81: 70 Optimering af Minimax

Page 82 and 83: 72 Begrænsning af antallet af unde



Page 88 and 89: 78 Test og sammenligning af de impl







Page 104 and 105: 94 Konklusion

Page 106 and 107: 96 Bilag A 19 20 // i n i t i a l i

Page 108 and 109: 98 Bilag A 120 nodes [ p [ 0 ] ] [

Page 110 and 111: 100 Bilag A 218 i f ( n . a > beta

Page 112 and 113: 102 Bilag A 319 p [2]= nodes [ p [

Page 114 and 115: 104 Bilag A 419 420 421 422 423 424

Page 116 and 117: 106 Bilag A 517 n . wr = tModel . n

Page 118 and 119: 108 Bilag A 61 } 62 } 63 64 // c h

Page 120 and 121: 110 Bilag A 155 b [ c +1][ r −1]

Page 122 and 123: 112 Bilag A 251 b [ c −1][ r −1

Page 124 and 125: 114 Bilag A 347 r e = placePieceMax

Page 126 and 127: 116 Bilag A 443 r e = placePieceMax

Page 128 and 129: 118 Bilag A 537 b [ c +1][ r −1]

Page 130 and 131: 120 Bilag A 633 b [ c −1][ r −1

Page 132 and 133: 122 Bilag A 729 beta = r e [ 2 ] ;

Page 134 and 135: 124 Bilag A 825 beta = r e [ 2 ] ;

Page 136 and 137: 126 Bilag A 916 i f ( n . a > v ) 9

Page 138 and 139: 128 Bilag A 997 Root . wc=0; // tMo

Page 140 and 141: 130 Bilag A 1097 n . bc = tModel .

Page 142 and 143: 132 Bilag A 93 i f ( rowEnd >= tMod

Page 144 and 145: 134 Bilag A 192 alpha = n . a ; 193

Page 146 and 147: 136 Bilag A 291 } 292 293 // Min−

Page 148 and 149: 138 Bilag A 391 n . c h i l d r e n

Page 150 and 151: 140 Bilag A 493 i f ( Root . c h i

Page 152 and 153: 142 Bilag A 593 r e t u r n ( n ) ;

Page 154 and 155: 144 Bilag A 90 b [ c ] [ r ] = 0 ;

Page 156 and 157: 146 Bilag A 185 // System . out . p

Page 158 and 159: 148 Bilag A 280 } 281 282 // f l y

Page 160 and 161: 150 Bilag A 377 // i f ( tTree . ma

Page 162 and 163: 152 Bilag A 481 } 482 r e t u r n (

Page 164 and 165: 154 Bilag A 532 // System . out . p

Page 166 and 167: 156 Bilag A 33 p u b l i c i n t [

Page 168 and 169: 158 Bilag A 137 f o r ( i n t r =0;


Page 172 and 173: 162 Bilag A 353 break ; 354 } 355 i

Page 174 and 175: 164 Bilag A 94 } 95 { // H o r i s

Page 176 and 177: 166 Bilag A 198 p r i v a t e void

Page 178 and 179: 168 Bilag A 303 f [ 1 ] [ 0 ] [ 1 ]


Page 182 and 183: 172 Bilag A 43 p u b l i c Node cre

Page 184 and 185: 174 Bilag A 27 whiteScore = new Sco

Page 186 and 187: 176 Bilag A 65 bc = 1 ; 66 e l s e

Page 188 and 189: 178 Bilag A 58 p u b l i c void mou

Page 190 and 191: 180 Bilag A 149 S t r i n g t x t =

Page 192 and 193: 182 Bilag A l o a d i n g the f i l

Page 194 and 195: 184 Bilag A 7 p u b l i c AITaijiMi

Page 196 and 197: 186 Bilag A 105 i f ( b l a c k P l

Page 198 and 199: 188 Bilag A 211 tBoard . s e t P i

Page 200 and 201: 190 Bilag A 315 { 316 f o r ( i n t

Page 202 and 203: 192 Bilag A 416 { 417 //Bunden 418

Page 204 and 205: 194 Bilag A 510 p r i v a t e boole

Page 206 and 207: 196 Bilag A 612 } 613 614 // b e r

Page 208 and 209: 198 Bilag A 702 } 703 704 // s a e

Page 210 and 211: 200 Bilag A 802 p u b l i c void ne

Page 212 and 213: 202 Bilag A 59 g . f i l l R e c t

Page 214 and 215: 204 Bilag A 159 { 160 t h i s . set

Page 216 and 217: 206 Bilag A 81 System . out . p r i

Page 218 and 219: 208 Bilag A [ 1 ] [ 7 ] + ” ”+n

Page 220 and 221: 210 Bilag A 176 System . out . p r



Page 226 and 227: 216 Bilag A [ 8 ] [ 2 ] ) ; 277 i f

Page 228 and 229: 218 Bilag A 326 p u b l i c void pr

Page 230 and 231: 220 Bilag A 393 i f ( tModel . noRo

Page 232 and 233: 222 Bilag A 449 i f ( tModel . noRo


Page 236 and 237: 226 Bilag A 30 31 tFrame = frame ;

Page 238 and 239: 228 Bilag A 135 tFrame . tModel . s

Page 240 and 241: 230

Page 242 and 243: 232 Bilag B ”Introduction to Algo

Page 244: 234

nodeboard

tmodel

alpha

beta

nocols

norows

ttree

node

nodes

void

kunstig

intelligens

taiji

danmarks

tekniske

universitet

etd.dtu.dk

Kunstig Intelligens til Brætspillet Taiji - Danmarks Tekniske Universitet

Kunstig Intelligens til Brætspillet Taiji - Danmarks Tekniske Universitet ... View more Kunstig Intelligens til Brætspillet Taiji - Danmarks Tekniske Universitet

Delete template?

Save as template ?

Kunstig Intelligens til Brætspillet Taiji - Danmarks Tekniske Universitet Kunstig Intelligens til Brætspillet Taiji - Danmarks Tekniske Universitet