13.07.2015 Views

La recta de mínims quadrats. - Departament de matemàtiques

La recta de mínims quadrats. - Departament de matemàtiques

La recta de mínims quadrats. - Departament de matemàtiques

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2 <strong>La</strong> <strong>recta</strong> <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>.20090Mortalitat infantil (morts per 1000 naixements): y180160140120100806040200405060708090Pes al final <strong>de</strong> la competició: y80706050405060708090Esperança <strong>de</strong> vida femenina: xPes a l'inici <strong>de</strong> la competició: xA cada núvol <strong>de</strong> punts li hem superposat la <strong>recta</strong> <strong>de</strong> regressió que <strong>de</strong>sprés<strong>de</strong>finirem. <strong>La</strong> <strong>recta</strong> proporciona un mo<strong>de</strong>l senzill, més o menys benaproximat, per a la relació entre les dues variables i es pot utilitzar per ferprediccions <strong>de</strong> noves observacions <strong>de</strong> la variable y quan només coneixem elvalor <strong>de</strong> la variable x. Per exemple, la predicció <strong>de</strong>l pes final <strong>de</strong>sconegut, sipartim d’un cert pes inicial donat, serà el valor que situarà sobre la <strong>recta</strong> elpunt <strong>de</strong>terminat pels dos pesos.2 El criteri <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>Quan hom es fixa l’objectiu <strong>de</strong> predir els valors <strong>de</strong> y a partir <strong>de</strong>ls valors <strong>de</strong>x, el criteri <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong> diu que la <strong>recta</strong> que millor aproxima el núvol<strong>de</strong> punts és la que fa mínima la suma <strong>de</strong> <strong>quadrats</strong> següent:k∑(y i − (mx i + n)) 2 .i=1És a dir, la <strong>recta</strong> que fa mínimes les diferències al quadrat entre els valors realsi les seves prediccions. <strong>La</strong> figura inferior il . lustra les diferències que es volen fermínimes: per a cada punt, y i −(mx i +n) és la diferència entre el valor realmentobservat, y i , i el valor predit sobre la <strong>recta</strong>, mx i + n. Aquestes diferències,anomena<strong>de</strong>s residus <strong>de</strong> la predicció, po<strong>de</strong>n ser positives o negatives segons elpunt es situï per sota o per sobre <strong>de</strong> la <strong>recta</strong>. Per evitar que les diferènciespositives i negatives es compensin i la suma sigui nul . la, es prenen <strong>quadrats</strong>.


4 <strong>La</strong> <strong>recta</strong> <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>.⎛⎞⎛ ⎞k∑k x ( )k∑i⎜i=1̂ṋ y i⎟ = ⎜ i=1⎟⎝ k∑ k∑x i x 2 ⎠ m ⎝ k∑ ⎠ ,ix i y ii=1 i=1i=1aleshores y = ̂mx + ̂n és la <strong>recta</strong> que millor aproxima el conjunt <strong>de</strong> punts,{(x i , y i ), i = 1, 2, . . . , k}, segons el criteri <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>.<strong>La</strong> solució explícita <strong>de</strong>l sistema és:( ) ( )∑k k k∑ k∑x i y i − x i y ii=1i=1 i=1̂m =( )∑k k k∑ 2i ̂n =x 2 i − x ii=1 i=1k∑ k∑y i x ii=1 i=1− ̂m.k kEl coeficient ̂m és el pen<strong>de</strong>nt <strong>de</strong> la <strong>recta</strong> i, com a tal, ens indica l’increment<strong>de</strong>l valor <strong>de</strong> y quan x s’incrementa en una unitat. Aquest increment <strong>de</strong> y s’had’entendre en mitjana ja que no totes les observacions s’ajusten a la <strong>recta</strong>.El coeficient ̂n és el valor predit <strong>de</strong> y quan x és zero, és a dir, l’or<strong>de</strong>nadaa l’origen. També s’anomena intercepció.4 Un primer exemple d’aplicació<strong>La</strong> <strong>recta</strong> <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong> té múltiples utilitats en el camp <strong>de</strong> les ciènciesexperimentals, socials i humanes, tant en l’especificació <strong>de</strong> mo<strong>de</strong>ls <strong>de</strong> relaciócom en l’obtenció <strong>de</strong> prediccions. Vegem-ne una aplicació a l’estudi <strong>de</strong> lesmarques d’atletisme. <strong>La</strong> taula següent conté els rècords mundials <strong>de</strong> la prova<strong>de</strong> 1500 m <strong>de</strong>s <strong>de</strong>l 1912 fins al 1995.Any min s Any min s Any min s1912 3 55.8 1943 3 45 1967 3 33.11917 3 54.7 1944 3 43 1974 3 32.21924 3 52.6 1947 3 43 1979 3 32.111926 3 51 1952 3 43 1980 3 31.361930 3 49.2 1954 3 41.8 1983 3 30.771933 3 49 1955 3 40.8 1985 3 29.461934 3 48.8 1956 3 40.5 1992 3 28.861936 3 47.8 1957 3 38.1 1995 3 27.371941 3 47.6 1958 3 361942 3 45.8 1960 3 35.6


Mercè Farré 5<strong>La</strong> qüestió és si a partir d’aquestes da<strong>de</strong>s podríem haver previst el rècordmundial <strong>de</strong> la prova assolit l’any 1998. Amb aquesta finalitat calculem la<strong>recta</strong> <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>, y = ̂mx + ̂n. Per tal <strong>de</strong> fer menys càlculs prendremcom a valors x i els anys 12, 17, 24, . . . , 95, i com a marques només elssegons 55.8, 54.7, 52.6, . . . , 27.37. Aleshores, els valors ̂m i ̂n seran la solució<strong>de</strong>l sistema d’equacions:(28 14761476 91768Explícitament,) ( ̂ṋm)=(1154.3355744.27̂m = −0.36567 i ̂n = 60.50222.Per tant, po<strong>de</strong>m consi<strong>de</strong>rar com a possible aproximació al rècord <strong>de</strong>l món <strong>de</strong>1998 la predicció:3 minuts i (−0.36567 × 98 + 60.50222) segons.És a dir, 3 min 24.67 s, aproximadament. Ara bé, el rècord <strong>de</strong>l món assolit eljuliol <strong>de</strong>l 1998 és <strong>de</strong> 3 min 26 s. <strong>La</strong> previsió és bastant bona, amb un residu<strong>de</strong> 1.33 s. Quina previsió <strong>de</strong> rècord <strong>de</strong>l món faríeu per a l’any 2010?El mèto<strong>de</strong> <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong> per trobar la <strong>recta</strong> <strong>de</strong> regressió s’ha incorporatals fulls <strong>de</strong> càlcul i a la major part <strong>de</strong>l programari estadístic i matemàtic.El següent resultat, coeficients i diagrama <strong>de</strong> dispersió amb la <strong>recta</strong><strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>, correspon al mateix exemple <strong>de</strong> les proves d’atletismefet amb l’Excel. Alternativament, es podria obtenir utilitzant programarilliure (OpenOffice, per exemple).).Recta <strong>de</strong> regressió o <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>605040segons30201000 20 40 60 80 100any (segle XX)Coeficients60,5022227-0,36567225El primer coeficient és l’or<strong>de</strong>nada a l’origen i el segon el pen<strong>de</strong>nt <strong>de</strong> la<strong>recta</strong>.MATMATerials MATemàticsVolum 2006, treball no. 1, 14 pp.2 Publicació electrònica <strong>de</strong> divulgació <strong>de</strong>l <strong>Departament</strong><strong>de</strong> la Universitat Autònoma <strong>de</strong> Barcelonawww.mat.uab.cat/matmat


6 <strong>La</strong> <strong>recta</strong> <strong>de</strong> <strong>mínims</strong> <strong>quadrats</strong>.5 Un segon exemple d’aplicació: transformació<strong>de</strong> les da<strong>de</strong>sPer a acabar aquesta secció, consi<strong>de</strong>rem una situació lleugerament diferent,encara en el món <strong>de</strong> l’atletisme masculí. A la taula inferior hi figuren elsrècords <strong>de</strong>l món vigents (juny <strong>de</strong> 2006) <strong>de</strong>s <strong>de</strong>ls 100 m, fins els 20 000 m.Prova h min s100 m 9.77200 m 19.32400 m 43.18800 m 1 41.111 000 m 2 11.961 500 m 3 26.003 000 m 7 20.675 000 m 12 37.3510 000 m 26 17.5320 000 m 56 55.6Pretenem predir el rècord(segons)vigent <strong>de</strong>ls 25 000 m; rècord que d’altra bandadistància temps lndistància lntempsés conegut: 1 h 13 min 55.80 s. En primer lloc, passem els temps a segons100 9,77 4,6051700 2,279316466(vegeu la taula inferior), 200 i seguidament 19,32 5,2983170 ajustem 2,961140829 dos mo<strong>de</strong>ls. El primer mo<strong>de</strong>lés la <strong>recta</strong> <strong>de</strong> regressió 800 101,11 <strong>de</strong>l temps 6,6846120 (segons) 4,616209033 respecte <strong>de</strong> la distància. Per400 43,18 5,9914650 3,7653774251000 131,96 6,9077550 4,882498846obtenir el segon mo<strong>de</strong>l, 1500prèviament 206,00 7,3132200 hem5,327876169transformat el temps i la distància3000 440,67 8,0063680 6,088296296aplicant logaritmes neperians obtenint dues variables noves, lntemps i lndistància.Po<strong>de</strong>u veure les gràfiques i els coeficients <strong>de</strong>ls dos mo<strong>de</strong>ls a les5000 757,35 8,5171930 6,62982549810000 1577,53 9,2103400 7,36361561220000 3415,60 9,9034880 8,136108452figures següents. 25000 4435,80 10,12663 8,397463262Mo<strong>de</strong>l 1: temps = - 44.91872 + 0.170278 distància(segons)distància temps4000100 9,773500200 19,323000400 43,18 2500Coeficients800 101,11 -44,9187207620001000 131,96 0,1702780291500 206,0015003000 440,6710005000 757,3550010000 1577,53020000 3415,600 5000 10000 15000 20000 25000temps (segons)distànciaMo<strong>de</strong>l 2: lntemps = - 2.87048827 + 1.11481857 lndistància9lndistància lntemps84,6051700 2,2793164775,2983170 2,9611408365,9914650 3,7653774356,6846120 4,61620903 Coeficients46,9077550 4,88249885 -2,870488273lntemps


Mo<strong>de</strong>l 1: temps = - 44.91872 + 0.170278 distància(segons)distància temps4000100 9,773500200 19,323000400 43,18 2500Coeficients800 101,11 -44,9187207620001000 131,96 0,1702780291500 206,0015003000 440,6710005000 757,3550010000 1577,53020000 3415,600 5000 10000 15000 20000 25000temps (segons)Mercè Farré 7distànciaMo<strong>de</strong>l 2: lntemps = - 2.87048827 + 1.11481857 lndistància9lndistància lntemps84,6051700 2,2793164775,2983170 2,9611408365,9914650 3,7653774356,6846120 4,61620903 Coeficients46,9077550 4,88249885 -2,8704882737,3132200 5,32787617 1,1148185728,0063680 6,0882963018,5171930 6,6298255009,2103400 7,363615619,9034880 8,13610845lntemps0,00000002,00000004,00000006,0000000lndistància8,000000010,00000 12,0000000 00Quin mo<strong>de</strong>l proporciona una millor previsió <strong>de</strong>l rècord real <strong>de</strong>ls 25 000 m,sabent que el vigent és <strong>de</strong> 1 h 13 min 55.8 s?Observació: Tingueu en compte que les prediccions <strong>de</strong>l segon mo<strong>de</strong>l sónen logaritmes i que cal retornar-les a les unitats <strong>de</strong> temps inicials.Si esteu interessats en marques mundials d’atletisme, po<strong>de</strong>u visitar l’adreçad’Internet següenthttp://www.alltime-athletics.comMercè FarréDept. <strong>de</strong> MatemàtiquesUniversitat Autònoma <strong>de</strong> Barcelona08193 Bellaterrafarre@mat.uab.catPublicat el 18 <strong>de</strong> setembre <strong>de</strong> 2006MATMATerials MATemàticsVolum 2006, treball no. 1, 14 pp.2 Publicació electrònica <strong>de</strong> divulgació <strong>de</strong>l <strong>Departament</strong><strong>de</strong> la Universitat Autònoma <strong>de</strong> Barcelonawww.mat.uab.cat/matmat

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!