22.03.2015 Views

Análisis Estadístico de Datos Climáticos Aplicaciones regresión ...

Análisis Estadístico de Datos Climáticos Aplicaciones regresión ...

Análisis Estadístico de Datos Climáticos Aplicaciones regresión ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Análisis</strong> <strong>Estadístico</strong> <strong>de</strong> <strong>Datos</strong><br />

<strong>Climáticos</strong><br />

<strong>Aplicaciones</strong> <strong>regresión</strong>-composición<br />

Marcelo Barreiro - Mario Bi<strong>de</strong>gain - Alvaro Diaz<br />

Universidad <strong>de</strong> la República, 2009<br />

1


Analisis Exploratorio<br />

Distribuciones<br />

Pruebas <strong>de</strong> Hipotesis<br />

Composites<br />

Regresion lineal<br />

Juntemos todo esto!


Composites<br />

El método <strong>de</strong> “composites” consiste en clasificar los<br />

datos en categorías y comparar p. ej. los valores medios<br />

o anomalías <strong>de</strong> otras variables para las distintas<br />

categorías.<br />

Pue<strong>de</strong> servir para i<strong>de</strong>ntificar “señales” no muy fuertes<br />

que están ocultas <strong>de</strong>bido a la existencia <strong>de</strong> “ruido”.


Composite<br />

Eventos calidos<br />

[82; 86; 87; 91; 94; 97]<br />

Composite<br />

Eventos frios<br />

[84; 88; 95; 98; 99]<br />

Linealidad en las<br />

anomalias!


Como sé cuales anomalias son<br />

estadísticamente significativas?<br />

<br />

Hay que hacer un Stu<strong>de</strong>nt T­test para comparar la diferencia entre las<br />

dos medias muestrales.<br />

<br />

<br />

<br />

H0: misma media; H1: media es diferente<br />

Se asume las muestras proce<strong>de</strong>n <strong>de</strong> la misma población, tienen<br />

distribucion normal, son in<strong>de</strong>pendientes y tienen igual <strong>de</strong>sviación<br />

típica.<br />

Que muestras comparo?<br />

<br />

<br />

Años Niño [82; 86; 87; 91; 94; 97]<br />

Años Neutros, aquellos que no son ni Niños ni Niñas.<br />

<br />

El test es:


Anomalias significativas al 5%<br />

1 extremo 2 extremos<br />

Como<br />

tenemos<br />

menos<br />

informacion<br />

el test <strong>de</strong>be<br />

ser mas<br />

fuerte


%Matlab Co<strong>de</strong><br />

[clim,anom]=climatology(pre,X,Y,0);<br />

anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+...<br />

anom(12:12:end,:,:))/3;<br />

%Anos Nino<br />

nino=[82; 86; 87; 91; 94; 97]­78;<br />

nina=[84; 88; 95; 98; 99]­78;<br />

%Anos Neutros<br />

neutros=(79:106)­78; neutros(nino)=NaN; neutros(nina)=NaN;<br />

neutros=neutros(~isnan(neutros))';


%%% T­test<br />

anomONDnino=mean(anomOND(nino,:,:));<br />

anomONDneut=mean(anomOND(neutros,:,:));<br />

nino_neu=anomONDnino­anomONDneut;<br />

dof=length(nino)+length(neutros)­2;<br />

sp=sqrt((var(anomOND(nino,:,:))*(length(nino)­1)+...<br />

var(anomOND(neutros,:,:))*(length(neutros)­1) )/dof);<br />

tt=nino_neu./(sp*sqrt(1/length(nino)+1/length(neutros)));<br />

tt=squeeze(tt); tt2=tt;


%­­5% level 1 si<strong>de</strong>d<br />

jj10=find(abs(tt2)


Correlaciones<br />

<br />

Mapa <strong>de</strong> correlacion entre anomalias <strong>de</strong> PP_artigas5102 y<br />

TSM en OND.


Como sé qué correlaciones<br />

son significativas?<br />

<br />

Para la correlacion <strong>de</strong> Pearson existe el siguiente test.<br />

<br />

H0: r=0<br />

<br />

H1: r dif <strong>de</strong> 0<br />

T =∣r∣ n−2<br />

1−r 2 <br />

<br />

n es la longitud <strong>de</strong> la serie (consi<strong>de</strong>rados in<strong>de</strong>pendientes).<br />

<br />

se compara T con valores criticos <strong>de</strong> la distribucion t con n­2<br />

grados <strong>de</strong> libertad.


Regiones <strong>de</strong> TSM con correlacion significativa<br />

con pp_artigas5102 en OND.


%Codigo Matlab<br />

anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)...<br />

+anom(12:12:end,:,:))/3;<br />

anompOND=(anomp(:,10)+anomp(:,11)+anomp(:,12))/3;<br />

%Calcula correlacion<br />

for i=1:96<br />

for j=1:48<br />

correl(j,i)=corr(anompOND,anomOND(:,j,i));<br />

end<br />

end<br />

%Que correlacion es significativa?<br />

%Test Ho: r=0 (compare to T distribution)<br />

% 2 extremos al 5% <strong>de</strong> significancia<br />

T =∣r∣ n−2<br />

1−r 2 <br />

tt=correl*sqrt(52-2)./sqrt((1-correl.^2));<br />

jj=find(abs(tt)


Regresion<br />

<br />

<br />

<br />

Supongamos que quiero saber cual es la relacion entre el estado<br />

<strong>de</strong>l Pacifico ecuatorial y la precipitacion en Sudamerica en<br />

OND. Tomo Nino3.4 como indice.<br />

Una forma <strong>de</strong> ver esto es hacer composites, como ya hicimos.<br />

Otra forma es calcular un mapa <strong>de</strong> regresion: hacer una regresion<br />

lineal entre cada punto <strong>de</strong> grilla <strong>de</strong> precipitacion y Nino3.4.


Observacion: Es muy útil trabajar con anomalías estandarizadas:<br />

z=x/ σ.<br />

En la regresion<br />

y = a + bx<br />

las unida<strong>de</strong>s <strong>de</strong><br />

[b]=(Unida<strong>de</strong>s <strong>de</strong> y)/(Unida<strong>de</strong>s <strong>de</strong> x)<br />

En este ejemplo: [b]=mm/dia / °C<br />

<br />

<br />

Si x está estandarizada, no tiene unida<strong>de</strong>s y tiene <strong>de</strong>sviación<br />

estandard=1<br />

Así, b se pue<strong>de</strong> interpretar como la anomalía <strong>de</strong> y asociada<br />

(<strong>de</strong>pendiendo <strong>de</strong>l r) a una <strong>de</strong>sviacion estandard <strong>de</strong> la variable<br />

in<strong>de</strong>pendiente x.


Nino3.4<br />

Eventos calidos<br />

[82; 86; 87; 91; 94; 97]<br />

Eventos frios<br />

[84; 88; 95; 98; 99]<br />

Azul: original<br />

Rojo:estandarizado<br />

Los dos indices son tan parecidos pues σ~1 C


Regresion <strong>de</strong> precipitaciones<br />

con Nino3.4 estandarizado<br />

Una anomalia <strong>de</strong> 1mm/dia esta asociada<br />

con 1 <strong>de</strong>sviacion estandard <strong>de</strong> TSM en Nino3.4.<br />

O sea, si Nino3.4 se calienta ~1C, tien<strong>de</strong> a llover<br />

1 mm/dia mas <strong>de</strong> lo normal en el norte <strong>de</strong> Uruguay.


Pero cómo sabemos en qué<br />

regiones es la <strong>regresión</strong><br />

estadísticamente significativa?<br />

●<br />

El coeficiente <strong>de</strong> multiple <strong>de</strong>terminacion R2<br />

S XY<br />

R²= SSR<br />

S XY<br />

SST = S XX<br />

= S ² XY<br />

= ∑ x i<br />

− x y i<br />

− y ²<br />

S YY<br />

S XX<br />

S YY ∑ x i<br />

− x ²∑ y i<br />

− y ² =r²<br />

y representa la habilidad <strong>de</strong> la recta estimada en representar<br />

las variaciones en los datos.<br />

●<br />

Entonces para saber la significancia estadística calculamos el<br />

mapa <strong>de</strong> correlacion y aplicamos el test<br />

T =∣r∣ n−2<br />

comparando con la distribucion t.<br />

1−r 2


Regresion y significancia estadistica al 5%


%Anomalias <strong>de</strong> Precipitacion<br />

anompOND=(anomp(10:12:end,:,:)+anomp(11:12:end,:,:)+anomp(12:12<br />

:end,:,:))/3;<br />

%Anomalias <strong>de</strong> TSM<br />

anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+anom(12:12:end,<br />

:,:))/3;<br />

%Niño3.4<br />

figure<br />

plot((1979:2006),nino34,'linewidth',2)<br />

hold<br />

nino34s=nino34/std(nino34);<br />

%Estandarizo el indice Nino34<br />

plot((1979:2006),nino34s,'r','linewidth',2)<br />

grid; axis tight<br />

%Calculo Correlacion y Regresion<br />

for i=1:144<br />

for j=1:72<br />

p=polyfit(nino34s',anompOND(:,j,i),1); b(j,i)=p(1);<br />

r(j,i)=corr(nino34s',anompOND(:,j,i));<br />

end<br />

end


figure<br />

%Que correlacion es significativa?<br />

%Test Ho: r=0 (compare to T distribution)<br />

tt=r*sqrt(28-2)./sqrt((1-r.^2));<br />

jj=find(abs(tt)


Diferencias entre<br />

composites y regresion<br />

<br />

<br />

<br />

En un composite se toman los extremos y se comparan con<br />

los años “neutros”. El composite se pue<strong>de</strong> hacer para<br />

extremos positivos y negativos y estos resultados no tienen<br />

por que ser opuestos (respuesta no­lineal).<br />

En la regresion solo se consi<strong>de</strong>ra la relacion lineal entre el<br />

predictando (y) y el predictor (x).<br />

El composite <strong>de</strong> (max­min)/2 da la respuesta lineal y <strong>de</strong>beria<br />

ser similar al mapa <strong>de</strong> regresion

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!