07.05.2013 Views

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Análisis</strong> <strong>Estadístico</strong> <strong>de</strong> <strong>Datos</strong><br />

<strong>Climáticos</strong><br />

Técnicas exploratorias para datos apareados:<br />

- scatterplots<br />

- coefs. <strong>de</strong> correlación <strong>de</strong> Pearson y Spearman<br />

- función <strong>de</strong> autocorrelación; persistencia teporal


Técnicas eploratorias para datos<br />

multi-dimensionales<br />

● <strong>Datos</strong> multidimensionales:<br />

✔ una estación con medidas <strong>de</strong> varias variables<br />

diferentes (temp, precip, humedad, etc...)<br />

✔ una variable medida en varias estaciones.<br />

✔ salida <strong>de</strong> un mo<strong>de</strong>lo con la variable en una grilla (lat x<br />

lon). La cantidad <strong>de</strong> variables físicas <strong>de</strong> un mo<strong>de</strong>lo no<br />

es menor a 20.<br />

Entonces tenemos un numero no menor <strong>de</strong><br />

20 x 100 x 50 x 10 = 1x10 6 variables.<br />

● Matriz <strong>de</strong> correlación<br />

● Mapas <strong>de</strong> correlación<br />

● Mapas <strong>de</strong> teleconectividad


Matriz <strong>de</strong> correlación<br />

Consi<strong>de</strong>remos datos <strong>de</strong> precip, humedad relativa, temperatura<br />

mínima, temperatura máxima y temperatura media diarias para la<br />

estación <strong>de</strong> Las Brujas en julio <strong>de</strong> 1975.<br />

%Cargar datos <strong>de</strong> la estación Las Brujas (INIA)<br />

pre=nc_varget('Precip_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','pcpn');<br />

rh=nc_varget('RelatHum_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','rh');<br />

tmi=nc_varget('TempMin_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempmin');<br />

tma=nc_varget('TempMax_LasBrujas_INIA_1Jan197531Dec1995.cdf','tempmax');<br />

tme=nc_varget('TempMedia_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempavg');<br />

%<strong>Datos</strong> para Julio 1975 (es aproximado pues consi<strong>de</strong>ro meses <strong>de</strong> 30 dias)<br />

pre=pre(6*30+1:7*30);<br />

rh=rh(6*30+1:7*30);<br />

tmi=tmi(6*30+1:7*30);<br />

tma=tma(6*30+1:7*30);<br />

tme=tme(6*30+1:7*30);<br />

%Matriz <strong>de</strong> datos y traspongo<br />

datos=[pre; rh; tma; tme; tmi]; % variable x tiempo= 5 x 30<br />

datos=datos'; % tiempo x variable = 30 x 5


Matriz <strong>de</strong> datos<br />

diarios en<br />

Las Brujas<br />

julio <strong>de</strong> 1975<br />

PRE RH TMAX TMED TMIN<br />

7.2000 97.0000 16.2000 13.9000 13.0000<br />

13.5000 98.0000 14.2000 13.8000 13.4000<br />

24.5000 100.000 14.0000 13.3000 11.8000<br />

1.5000 93.0000 15.0000 11.7000 9.8000<br />

0 91.0000 17.4000 11.9000 9.4000<br />

23.4000 71.000 11.8000 10.3000 8.2000<br />

0 67.0000 12.0000 9.5000 5.6000<br />

0 60.0000 17.8000 12.0000 4.0000<br />

0 69.0000 19.6000 12.9000 7.0000<br />

0 78.0000 21.6000 15.4000 10.2000<br />

1.0000 94.0000 17.0000 14.7000 13.1000<br />

0 89.0000 13.4000 12.7000 10.3000<br />

0 75.0000 13.4000 9.8000 6.2000<br />

0 88.0000 15.4000 10.1000 3.8000<br />

6.5000 93.0000 14.6000 12.4000 9.1000<br />

3.8000 51.0000 8.8000 7.6000 2.6000<br />

0 67.0000 7.3000 4.8000 2.0000<br />

1.0000 78.0000 6.9000 4.9000 3.5000<br />

0 78.0000 10.0000 4.3000 0.1000<br />

0 80.0000 12.0000 4.3000 -0.4000<br />

0 74.0000 13.7000 6.4000 0.2000<br />

0 91.0000 13.8000 6.8000 0.1000<br />

0 95.0000 12.2000 7.2000 4.3000<br />

0 95.0000 13.8000 10.3000 6.7000<br />

0 92.0000 10.2000 8.3000 5.9000<br />

2.0000 78.0000 8.4000 6.2000 4.8000<br />

0 72.0000 9.2000 5.2000 0.6000<br />

0 82.0000 9.6000 4.7000 -2.1000<br />

0 84.0000 14.9000 10.3000 7.0000<br />

0 96.0000 12.9000 7.7000 2.4000<br />

tiempo<br />

(30 dias)


Supongamos que quiero hallar la correlacion entre<br />

las diferentes variables<br />

Tengo que correlacionar cada variable con las otras.<br />

Para eso hago:<br />

R=corrcoef(datos); %coef. <strong>de</strong> correlacion <strong>de</strong><br />

Pearson<br />

y obtengo la matriz <strong>de</strong> correlacion R<br />

PRE RH TMAX TMED TMIN<br />

PRE 1.0000 0.1848 0.0028 0.3334 0.4598<br />

RH 0.1848 1.0000 0.2440 0.3341 0.4605<br />

TMAX 0.0028 0.2440 1.0000 0.8114 0.5496<br />

TMED 0.3334 0.3341 0.8114 1.0000 0.9008<br />

TMIN 0.4598 0.4605 0.5496 0.9008 1.0000


Propieda<strong>de</strong>s <strong>de</strong> R<br />

PRE RH TMAX TMED TMIN<br />

PRE 1.0000 0.1848 0.0028 0.3334 0.4598<br />

RH 0.1848 1.0000 0.2440 0.3341 0.4605<br />

TMAX 0.0028 0.2440 1.0000 0.8114 0.5496<br />

TMED 0.3334 0.3341 0.8114 1.0000 0.9008<br />

TMIN 0.4598 0.4605 0.5496 0.9008 1.0000<br />

● Simétrica con respecto a la diagonal. En general se toma el triangulo<br />

inferior para mostrar los resultados.<br />

● La diagonal son siempre 1 pues es la correlación <strong>de</strong> una variable<br />

consigo misma<br />

● Para K variables se tienen K(K-1)/2 coeficientes diferentes<br />

Correlación entre<br />

RH y TMED.<br />

● Notar que TMIN es la variable mas correlacionado con las <strong>de</strong>más.


En general la matriz <strong>de</strong> correlación se<br />

pue<strong>de</strong> escribir como<br />

r ij =r ji


Mapas <strong>de</strong> correlación<br />

Las matrices <strong>de</strong> correlación son útiles para<br />

mostrar la relacion entre diferentes<br />

variables en una estación.<br />

Muchas veces se quiere relacionar la<br />

variabilidad en una estación (o región) con<br />

el resto <strong>de</strong>l globo. En este caso es útil<br />

presentar las correlaciones<br />

gráficamente/espacialmente.


Correlación <strong>de</strong> TS (56W,35S) con TS global en<br />

c/punto. Período: meses Ene1949-Ago2007<br />

La correlación es máxima (=1) sobre (56W,34S) y <strong>de</strong>crece a medida que<br />

nos alejamos. La escala espacial <strong>de</strong> caida <strong>de</strong> correlación nos da la escala<br />

<strong>de</strong> autocorrelacion espacial.


%Código Matlab<br />

temp=nc_varget('sfctemp.cdf','temp'); %size(temp) =704x73x144<br />

X=nc_varget('sfctemp.cdf','X');<br />

Y=nc_varget('sfctemp.cdf','Y');<br />

[clim,anom]=climatology(X,Y,temp,0);<br />

%Calculo correlación d (X,Y)=(52,122)=(35S,56W) con el resto<br />

for i=1:144<br />

for j=1:73<br />

cc(j,i)=corrcoef(anom(:,51,122),anom(:,j,i));<br />

end<br />

end<br />

%Grafico<br />

cont_netcdf(X,Y,cc',0,(-1:0.2:1))<br />

colormap(rednblue3) %seteo paleta <strong>de</strong> colores<br />

set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ...<br />

'50E';'100E';'150E';'160W';'110W';' 60W';' 10W']) %cambio nombres eje x


Correlación <strong>de</strong> Precip (56W,35S) con Precip<br />

global en c/punto. Período: meses Ene1979-<br />

Dic2006<br />

Menor autocorrelación espacial. Mas ruidosa.


Correlación <strong>de</strong> TS (56W,35S) con TS global<br />

en c/punto. Mayos <strong>de</strong> 1949-2007<br />

Este mapa sugiere la presencia <strong>de</strong> un fenómeno ondulatorio que<br />

modula las correlaciones en el hemisferio sur. Regiones lejanas estan<br />

relacionadas = teleconexiones.


%En Matlab<br />

for i=1:144<br />

for j=1:73<br />

cc5(j,i)=corrcoef(anom(5:12:end,51,122),anom(5:12:end,j,i));<br />

end<br />

end<br />

cont_netcdf(X,Y,cc5',0,(-1:0.2:1))<br />

colormap(rednblue3)<br />

set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ...<br />

'50E';'100E';'150E';'160W';'110W';' 60W';' 10W'])


Correlación <strong>de</strong> PS (56W,35S) con PS global<br />

en c/punto. Mayos <strong>de</strong> 1949-2007<br />

Un mapa <strong>de</strong> correlación <strong>de</strong> presion a nivel <strong>de</strong>l mar tambien sugiere el<br />

fenómeno ondulatorio, aunque está concentrado en el Pacifico sur.


Correlacion <strong>de</strong> la TSM en la zona<br />

ecuatorial con el resto <strong>de</strong> los oceanos<br />

La TSM en<br />

el Pacifico<br />

ecuatorial<br />

tien<strong>de</strong> a<br />

covariar en la<br />

direccion<br />

longitudinal<br />

pero esta<br />

restringido<br />

en la direccion<br />

latitudinal.<br />

➢ la zona<br />

ecuatorial<br />

tiene una<br />

dinamica<br />

propia.


La zona ecuatorial tiene correlacion<br />

espacial anisotropica.<br />

Que tiene <strong>de</strong> especial el ecuador?<br />

La fuerza <strong>de</strong><br />

Coriolis es<br />

<strong>de</strong>spreciable.


Para monitorear los<br />

procesos oceanicos<br />

ecuatoriales (El Niño)<br />

basta con una red <strong>de</strong><br />

boyas entre 8°S y 8°N


Generalizaciones <strong>de</strong>l mapa <strong>de</strong><br />

correlacion<br />

La i<strong>de</strong>a básica <strong>de</strong> mapear correlaciones pue<strong>de</strong><br />

exten<strong>de</strong>rse:<br />

● usar variables diferentes: por ejemplo,<br />

correlacionar las anomalías <strong>de</strong> precipitación en<br />

Uruguay con las temperaturas <strong>de</strong> superficie<br />

globales.<br />

● construir una matriz <strong>de</strong> correlación con retraso<br />

temporal.


Los mapas <strong>de</strong> correlacion muestran solo una fila <strong>de</strong> la<br />

matriz <strong>de</strong> correlacion<br />

Vimos que estos mapas pue<strong>de</strong>n mostrar patrones <strong>de</strong><br />

teleconexion. Una forma <strong>de</strong> resumir la informacion sobre<br />

teleconexiones <strong>de</strong> la matriz <strong>de</strong> correlacion es hacer una<br />

mapa <strong>de</strong> teleconectividad T, el cual se <strong>de</strong>fine como,<br />

para cada fila i se <strong>de</strong>termina<br />

dim(R)= Nlon x Nlat


Por ejemplo para la PS en (56W,35S) durante los<br />

mayos <strong>de</strong> 1949-2007, el T (56W,35S) ~|-0.5|=0.5<br />

(ubicado alre<strong>de</strong>dor <strong>de</strong> (100W,70S)).


Mapa <strong>de</strong> teleconectividad para para la<br />

altura <strong>de</strong> geopotencial en 500mb en el<br />

Pacific North<br />

American pattern<br />

North Atlantic<br />

Oscillation<br />

invierno <strong>de</strong>l H.N.<br />

La altura <strong>de</strong> geopotencial<br />

es “casi” la altura a la<br />

cual la presion<br />

atmosferica tiene un<br />

<strong>de</strong>terminado valor.


Patrón <strong>de</strong> teleconexión forzado por El<br />

Niño


● Los mapas <strong>de</strong> teleconectividad son <strong>de</strong> otra<br />

época.<br />

● Fueron usados en meteorología hasta los<br />

años ochenta para encontrar patrones <strong>de</strong><br />

circulación que covaríen.<br />

● Hoy día fueron sustituidos por<br />

metodologías estadísticas mas potentes<br />

como análisis <strong>de</strong> componentes principales y<br />

análisis <strong>de</strong> máxima covarianza que veremos<br />

mas a<strong>de</strong>lante.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!