Análisis Estadístico de Datos Climáticos
Análisis Estadístico de Datos Climáticos
Análisis Estadístico de Datos Climáticos
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Análisis</strong> <strong>Estadístico</strong> <strong>de</strong> <strong>Datos</strong><br />
<strong>Climáticos</strong><br />
Técnicas exploratorias para datos apareados:<br />
- scatterplots<br />
- coefs. <strong>de</strong> correlación <strong>de</strong> Pearson y Spearman<br />
- función <strong>de</strong> autocorrelación; persistencia teporal
Técnicas eploratorias para datos<br />
multi-dimensionales<br />
● <strong>Datos</strong> multidimensionales:<br />
✔ una estación con medidas <strong>de</strong> varias variables<br />
diferentes (temp, precip, humedad, etc...)<br />
✔ una variable medida en varias estaciones.<br />
✔ salida <strong>de</strong> un mo<strong>de</strong>lo con la variable en una grilla (lat x<br />
lon). La cantidad <strong>de</strong> variables físicas <strong>de</strong> un mo<strong>de</strong>lo no<br />
es menor a 20.<br />
Entonces tenemos un numero no menor <strong>de</strong><br />
20 x 100 x 50 x 10 = 1x10 6 variables.<br />
● Matriz <strong>de</strong> correlación<br />
● Mapas <strong>de</strong> correlación<br />
● Mapas <strong>de</strong> teleconectividad
Matriz <strong>de</strong> correlación<br />
Consi<strong>de</strong>remos datos <strong>de</strong> precip, humedad relativa, temperatura<br />
mínima, temperatura máxima y temperatura media diarias para la<br />
estación <strong>de</strong> Las Brujas en julio <strong>de</strong> 1975.<br />
%Cargar datos <strong>de</strong> la estación Las Brujas (INIA)<br />
pre=nc_varget('Precip_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','pcpn');<br />
rh=nc_varget('RelatHum_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','rh');<br />
tmi=nc_varget('TempMin_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempmin');<br />
tma=nc_varget('TempMax_LasBrujas_INIA_1Jan197531Dec1995.cdf','tempmax');<br />
tme=nc_varget('TempMedia_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempavg');<br />
%<strong>Datos</strong> para Julio 1975 (es aproximado pues consi<strong>de</strong>ro meses <strong>de</strong> 30 dias)<br />
pre=pre(6*30+1:7*30);<br />
rh=rh(6*30+1:7*30);<br />
tmi=tmi(6*30+1:7*30);<br />
tma=tma(6*30+1:7*30);<br />
tme=tme(6*30+1:7*30);<br />
%Matriz <strong>de</strong> datos y traspongo<br />
datos=[pre; rh; tma; tme; tmi]; % variable x tiempo= 5 x 30<br />
datos=datos'; % tiempo x variable = 30 x 5
Matriz <strong>de</strong> datos<br />
diarios en<br />
Las Brujas<br />
julio <strong>de</strong> 1975<br />
PRE RH TMAX TMED TMIN<br />
7.2000 97.0000 16.2000 13.9000 13.0000<br />
13.5000 98.0000 14.2000 13.8000 13.4000<br />
24.5000 100.000 14.0000 13.3000 11.8000<br />
1.5000 93.0000 15.0000 11.7000 9.8000<br />
0 91.0000 17.4000 11.9000 9.4000<br />
23.4000 71.000 11.8000 10.3000 8.2000<br />
0 67.0000 12.0000 9.5000 5.6000<br />
0 60.0000 17.8000 12.0000 4.0000<br />
0 69.0000 19.6000 12.9000 7.0000<br />
0 78.0000 21.6000 15.4000 10.2000<br />
1.0000 94.0000 17.0000 14.7000 13.1000<br />
0 89.0000 13.4000 12.7000 10.3000<br />
0 75.0000 13.4000 9.8000 6.2000<br />
0 88.0000 15.4000 10.1000 3.8000<br />
6.5000 93.0000 14.6000 12.4000 9.1000<br />
3.8000 51.0000 8.8000 7.6000 2.6000<br />
0 67.0000 7.3000 4.8000 2.0000<br />
1.0000 78.0000 6.9000 4.9000 3.5000<br />
0 78.0000 10.0000 4.3000 0.1000<br />
0 80.0000 12.0000 4.3000 -0.4000<br />
0 74.0000 13.7000 6.4000 0.2000<br />
0 91.0000 13.8000 6.8000 0.1000<br />
0 95.0000 12.2000 7.2000 4.3000<br />
0 95.0000 13.8000 10.3000 6.7000<br />
0 92.0000 10.2000 8.3000 5.9000<br />
2.0000 78.0000 8.4000 6.2000 4.8000<br />
0 72.0000 9.2000 5.2000 0.6000<br />
0 82.0000 9.6000 4.7000 -2.1000<br />
0 84.0000 14.9000 10.3000 7.0000<br />
0 96.0000 12.9000 7.7000 2.4000<br />
tiempo<br />
(30 dias)
Supongamos que quiero hallar la correlacion entre<br />
las diferentes variables<br />
Tengo que correlacionar cada variable con las otras.<br />
Para eso hago:<br />
R=corrcoef(datos); %coef. <strong>de</strong> correlacion <strong>de</strong><br />
Pearson<br />
y obtengo la matriz <strong>de</strong> correlacion R<br />
PRE RH TMAX TMED TMIN<br />
PRE 1.0000 0.1848 0.0028 0.3334 0.4598<br />
RH 0.1848 1.0000 0.2440 0.3341 0.4605<br />
TMAX 0.0028 0.2440 1.0000 0.8114 0.5496<br />
TMED 0.3334 0.3341 0.8114 1.0000 0.9008<br />
TMIN 0.4598 0.4605 0.5496 0.9008 1.0000
Propieda<strong>de</strong>s <strong>de</strong> R<br />
PRE RH TMAX TMED TMIN<br />
PRE 1.0000 0.1848 0.0028 0.3334 0.4598<br />
RH 0.1848 1.0000 0.2440 0.3341 0.4605<br />
TMAX 0.0028 0.2440 1.0000 0.8114 0.5496<br />
TMED 0.3334 0.3341 0.8114 1.0000 0.9008<br />
TMIN 0.4598 0.4605 0.5496 0.9008 1.0000<br />
● Simétrica con respecto a la diagonal. En general se toma el triangulo<br />
inferior para mostrar los resultados.<br />
● La diagonal son siempre 1 pues es la correlación <strong>de</strong> una variable<br />
consigo misma<br />
● Para K variables se tienen K(K-1)/2 coeficientes diferentes<br />
Correlación entre<br />
RH y TMED.<br />
● Notar que TMIN es la variable mas correlacionado con las <strong>de</strong>más.
En general la matriz <strong>de</strong> correlación se<br />
pue<strong>de</strong> escribir como<br />
r ij =r ji
Mapas <strong>de</strong> correlación<br />
Las matrices <strong>de</strong> correlación son útiles para<br />
mostrar la relacion entre diferentes<br />
variables en una estación.<br />
Muchas veces se quiere relacionar la<br />
variabilidad en una estación (o región) con<br />
el resto <strong>de</strong>l globo. En este caso es útil<br />
presentar las correlaciones<br />
gráficamente/espacialmente.
Correlación <strong>de</strong> TS (56W,35S) con TS global en<br />
c/punto. Período: meses Ene1949-Ago2007<br />
La correlación es máxima (=1) sobre (56W,34S) y <strong>de</strong>crece a medida que<br />
nos alejamos. La escala espacial <strong>de</strong> caida <strong>de</strong> correlación nos da la escala<br />
<strong>de</strong> autocorrelacion espacial.
%Código Matlab<br />
temp=nc_varget('sfctemp.cdf','temp'); %size(temp) =704x73x144<br />
X=nc_varget('sfctemp.cdf','X');<br />
Y=nc_varget('sfctemp.cdf','Y');<br />
[clim,anom]=climatology(X,Y,temp,0);<br />
%Calculo correlación d (X,Y)=(52,122)=(35S,56W) con el resto<br />
for i=1:144<br />
for j=1:73<br />
cc(j,i)=corrcoef(anom(:,51,122),anom(:,j,i));<br />
end<br />
end<br />
%Grafico<br />
cont_netcdf(X,Y,cc',0,(-1:0.2:1))<br />
colormap(rednblue3) %seteo paleta <strong>de</strong> colores<br />
set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ...<br />
'50E';'100E';'150E';'160W';'110W';' 60W';' 10W']) %cambio nombres eje x
Correlación <strong>de</strong> Precip (56W,35S) con Precip<br />
global en c/punto. Período: meses Ene1979-<br />
Dic2006<br />
Menor autocorrelación espacial. Mas ruidosa.
Correlación <strong>de</strong> TS (56W,35S) con TS global<br />
en c/punto. Mayos <strong>de</strong> 1949-2007<br />
Este mapa sugiere la presencia <strong>de</strong> un fenómeno ondulatorio que<br />
modula las correlaciones en el hemisferio sur. Regiones lejanas estan<br />
relacionadas = teleconexiones.
%En Matlab<br />
for i=1:144<br />
for j=1:73<br />
cc5(j,i)=corrcoef(anom(5:12:end,51,122),anom(5:12:end,j,i));<br />
end<br />
end<br />
cont_netcdf(X,Y,cc5',0,(-1:0.2:1))<br />
colormap(rednblue3)<br />
set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ...<br />
'50E';'100E';'150E';'160W';'110W';' 60W';' 10W'])
Correlación <strong>de</strong> PS (56W,35S) con PS global<br />
en c/punto. Mayos <strong>de</strong> 1949-2007<br />
Un mapa <strong>de</strong> correlación <strong>de</strong> presion a nivel <strong>de</strong>l mar tambien sugiere el<br />
fenómeno ondulatorio, aunque está concentrado en el Pacifico sur.
Correlacion <strong>de</strong> la TSM en la zona<br />
ecuatorial con el resto <strong>de</strong> los oceanos<br />
La TSM en<br />
el Pacifico<br />
ecuatorial<br />
tien<strong>de</strong> a<br />
covariar en la<br />
direccion<br />
longitudinal<br />
pero esta<br />
restringido<br />
en la direccion<br />
latitudinal.<br />
➢ la zona<br />
ecuatorial<br />
tiene una<br />
dinamica<br />
propia.
La zona ecuatorial tiene correlacion<br />
espacial anisotropica.<br />
Que tiene <strong>de</strong> especial el ecuador?<br />
La fuerza <strong>de</strong><br />
Coriolis es<br />
<strong>de</strong>spreciable.
Para monitorear los<br />
procesos oceanicos<br />
ecuatoriales (El Niño)<br />
basta con una red <strong>de</strong><br />
boyas entre 8°S y 8°N
Generalizaciones <strong>de</strong>l mapa <strong>de</strong><br />
correlacion<br />
La i<strong>de</strong>a básica <strong>de</strong> mapear correlaciones pue<strong>de</strong><br />
exten<strong>de</strong>rse:<br />
● usar variables diferentes: por ejemplo,<br />
correlacionar las anomalías <strong>de</strong> precipitación en<br />
Uruguay con las temperaturas <strong>de</strong> superficie<br />
globales.<br />
● construir una matriz <strong>de</strong> correlación con retraso<br />
temporal.
Los mapas <strong>de</strong> correlacion muestran solo una fila <strong>de</strong> la<br />
matriz <strong>de</strong> correlacion<br />
Vimos que estos mapas pue<strong>de</strong>n mostrar patrones <strong>de</strong><br />
teleconexion. Una forma <strong>de</strong> resumir la informacion sobre<br />
teleconexiones <strong>de</strong> la matriz <strong>de</strong> correlacion es hacer una<br />
mapa <strong>de</strong> teleconectividad T, el cual se <strong>de</strong>fine como,<br />
para cada fila i se <strong>de</strong>termina<br />
dim(R)= Nlon x Nlat
Por ejemplo para la PS en (56W,35S) durante los<br />
mayos <strong>de</strong> 1949-2007, el T (56W,35S) ~|-0.5|=0.5<br />
(ubicado alre<strong>de</strong>dor <strong>de</strong> (100W,70S)).
Mapa <strong>de</strong> teleconectividad para para la<br />
altura <strong>de</strong> geopotencial en 500mb en el<br />
Pacific North<br />
American pattern<br />
North Atlantic<br />
Oscillation<br />
invierno <strong>de</strong>l H.N.<br />
La altura <strong>de</strong> geopotencial<br />
es “casi” la altura a la<br />
cual la presion<br />
atmosferica tiene un<br />
<strong>de</strong>terminado valor.
Patrón <strong>de</strong> teleconexión forzado por El<br />
Niño
● Los mapas <strong>de</strong> teleconectividad son <strong>de</strong> otra<br />
época.<br />
● Fueron usados en meteorología hasta los<br />
años ochenta para encontrar patrones <strong>de</strong><br />
circulación que covaríen.<br />
● Hoy día fueron sustituidos por<br />
metodologías estadísticas mas potentes<br />
como análisis <strong>de</strong> componentes principales y<br />
análisis <strong>de</strong> máxima covarianza que veremos<br />
mas a<strong>de</strong>lante.