12.07.2015 Views

Instruktioner - Matematiska institutionen - Stockholms universitet

Instruktioner - Matematiska institutionen - Stockholms universitet

Instruktioner - Matematiska institutionen - Stockholms universitet

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

MATEMATISKA INSTITUTIONENTillämpad statistisk analys, GNSTOCKHOLMS UNIVERSITET VT 2011Avd. Matematisk statistikGB 2011-03-24DATORLABORATION 1: TIDSSERIER.I Tarfala har man under en lång följd av år registrerat bland annat medeltemperaturen förvarje månad. Data för åren 1980-1992 finns som tabseparerad text under länken ”<strong>Instruktioner</strong>och data” i rutan för laborationsdagen på kursens hemsida. För att kunna analysera data i Rgör du på samma vis som när du laddade ner data till laborationerna i Statistisk analys.Nämligen:Skapa först ett underbibliotek för den här laborationen, och kalla det förslagsvis för tsa1:$ mkdir tsa1$ cd tsa1Sedan går du in på ”<strong>Instruktioner</strong> och data” och sparar filen TarfalaTab.txt iunderbiblioteket tsa1 genom att högerklicka på filen på hemsidan och välja ”Save Link TargetAs ...". (Filen finns även kommaseparerad, vilket kan fungera bättre på vissa plattformar, menfrån elevdatasalen är det den tabseparerade versionen du bör välja.)Starta sedan R, och läs in filen genom kommandona> Tarfala Artal Manad Temp help.start()där man kan klicka sig fram till olika hjälpsidor. Man kan, precis som i Matlab, när som helst fåinformation om hur ett visst kommando eller funktion fungerar genom kommandot helpenligt mönstret> help(mean)som ger information om hur man beräknar medelvärde i R.När man sedan är klar med laborationen eller vill göra ett uppehåll skriverman bara> q()Då kommer programmet att fråga om man vill spara sin “workspace image”,det vill säga alla variabler som man har definierat under körningen. Svararman ja (genom att skriva y) så kommer allting att sparas och laddas in i R- 1 -


när man startar det nästa gång.Uppgifterna 1–5 ska besvaras skriftligen. Bifoga den R-kod du skrivit, samt några grafer somvisar vad du har gjort och som illustrerar ditt resonemang.UPPGIFT 1.Plotta temperaturen mot tid (=observationsnummer här). Beskriv grafen i ord!UPPGIFT 2.Skapa en ny variabel innehållande årsvisa medelvärden (se R-tips nedan för hur man gördetta), och gör en graf över dem. Verkar temperaturen ha ökat eller minskat under perioden?Spara grafen!UPPGIFT 3.a) Ange ett viktsystem för centrerade glidande medelvärden. Viktsystemet ska ha egenskapenatt jämna ut den årsvisa säsongvariationen. Hur många värden innehåller viktsystemet?b) Hur många värden kommer serien av centrerade glidande medelvärden att ha?c) Beräkna serien av centrerade glidande medelvärden. Gör en graf över denna serie, ochjämför den med grafen över årsvisa medelvärden du gjorde i Uppgift 2. Vilka skillnader ochlikheter ser du?UPPGIFT 4.Beräkna de justerade säsongkomponenterna. Vilken månad är varmast? Vilken är kallast?UPPGIFT 5.Genomför en säsongrensning av data. Gör en graf över den rensade serien. Lägg in rensadserie, trend och ursprunglig serie i en och samma graf. (Se R-tips I nedan.)- 2 -


R-TIPS.I. Grafisk framställning av tidsserier.I vårt fall har vi ingen variabel i datasetet som specifikt anger löpande tid, så vad vi vill göra äratt plotta olika variabler mot radnummer. Om variabeln heter Y, så kan detta göras genomkommandot> plot(Y,type="l")som ritar serien som en sammanhängande kurva. Vill man ha färg så kan man skrivaexempelvis> plot(Y,type="l", col=”blue”)Bokstaven l (”ell”, inte ”ett”) står för ”line”.Om man vill lägga in två tidsserier Y och Z i samma graf, och färga grafen för Z röd, så kanman skriva> plot(Y,type="l")> lines(Z,col="red")Om de båda tidsserierna har olika längd och/eller ligger ur fas , så måste man komplettera denena serien eller båda med NA (som är R:s beteckning för saknade värden) i början och/ellerslutet. Med hjälp av rep (se nedan under IV) kan man åstadkomma så många NA som behövs,och sedan kombinera ihop dem med tidsserien med hjälp av c(…,…,…). (Se Lab 1, Statistiskanalys GN, ”Enkla numeriska operationer”.)II. Att spara figurer.Om man vill spara en figur — exempelvis den som skapats av det första plot-kommandotovan — måste man först ange kommandona> jpeg("figur.jpg")> plot(Y,type="l")> dev.off()som skapar filen figur.jpg i underbiblioteket tsa1. För att skriva ut filen, öppna först ettnytt terminalfönster, byt katalog till tsa1, och skriv$ lpr figur.jpgPå liknande vis görs en bild i ps-format.III. Att sammanfatta data.Kommandot tapply kan användas för att beräkna medelvärden (och även andra statistikor)över undergrupper av datasetets observationer. Om Y är den variabel vi vill beräknamedelvärden av (exempelvis temperatur), och X för varje observation anger vilkenundergrupp den tillhör (exempelvis månad eller år), så kan gruppvisa medelvärden beräknasgenom> MedelY


Vektorn MedelY av medelvärden kan sedan användas i andra beräkningar. (Det verkar somom R automatiskt antar att så länge vektorerna X och Y har samma längd, så hör värden påmotsvarande platser inom respektive vektor till samma observation.)Om man ska beräkna medelvärden med tapply , och det finns saknade värden — sombetecknas NA i R — så ger tapply värdet NA som svar. Om man istället vill att kommandot skabortse från saknade värden och beräkna medelvärden av de värden som faktiskt finns, så kanman skriva> MedelY u v w x x w dim(M)svaret 2 3. En talsekvens kan även sakna dimension, i vilket fall vi istället får svaret NULL .Om vi nu har en sekvens av 6 tal utan dimension och vill få R att istället betrakta den som en2x3-matris, så skriver vi> dim(M)


På samma vis kan vi förvandla M till en 3x2-matris eller göra den dimensionslös igen genom attskriva, respektive,> dim(M) dim(M) vikt Glid for (j in 1:n){Glid


H H ls()Då får du en lista på de namn du har givit objekten.- 6 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!