12.07.2015 Views

Ejemplos y ejercicios de Estad´ıstica Descriptiva y Análisis de Datos

Ejemplos y ejercicios de Estad´ıstica Descriptiva y Análisis de Datos

Ejemplos y ejercicios de Estad´ıstica Descriptiva y Análisis de Datos

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 2<strong>Ejemplos</strong> y <strong>ejercicios</strong> <strong>de</strong>Estadística <strong>Descriptiva</strong>yAnálisis <strong>de</strong> <strong>Datos</strong>Diplomatura en EstadísticaCurso 2007/082 Descripción estadística <strong>de</strong> una variable.<strong>Ejemplos</strong> y <strong>ejercicios</strong>.2.1 <strong>Ejemplos</strong>.Ejemplo 2.1 Se han medido el grup sanguíneo <strong>de</strong> 40 individuos y se hanobservado las siguientes frecuencias absolutas para cada categoría: 12 parax 1 = A, 11parax 2 = B, 8 para x 3 = AB y 9 para x 4 = O.a) ¿De qué tipo es la variable estudiada? Construir la tabla <strong>de</strong> frecuenciascorrespondiente.b) ¿Qué porcentaje <strong>de</strong> individuos son <strong>de</strong>l grupo A?c) ¿Qué porcentaje <strong>de</strong> individuos no son <strong>de</strong>l grupo O?d) ¿Cuántos individuos no son <strong>de</strong>l grupo B?Respuestas: a) Categórica nominal.grupo n i f iA 12 0.3B 11 0.275AB 8 0.2O 9 0.225Total 40 1b) El 30%, c)el100 − 22.5 =77.5%, d)40 − 11 = 29 obien12+8+9=29.Ejemplo 2.2 La siguiente tabla muestra la clasificación <strong>de</strong> 901 individuossegún la variable satisfacción en el trabajoAurea GranéDpto. EstadísticaUniversidad Carlos III <strong>de</strong> Madridx in imuy insatisfecho 62mo<strong>de</strong>rama<strong>de</strong>mte insatisfecho 108mo<strong>de</strong>radamente satisfecho 319muy satisfecho 412Total 901a) ¿De qué tipo es la variable <strong>de</strong> estudio? Calcular la tabla <strong>de</strong> frecuenciascorrespondiente.b) ¿Qué porcentaje <strong>de</strong> individuos están mo<strong>de</strong>radamente satisfechos?c) ¿Cuántos individuos están a lo sumo mo<strong>de</strong>radamente insatisfechos?¿Qué porcentaje representan?d) ¿Cuántos individuos están por lo menos mo<strong>de</strong>radamente satisfechos?¿Qué porcentaje representan?


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 32ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 4Respuestas: a) Categórica ordinal,x i n i f i N i F imuy insatisfecho 62 0.07 62 0.07mo<strong>de</strong>rama<strong>de</strong>mte insatisfecho 108 0.12 170 0.19mo<strong>de</strong>radamente satisfecho 319 0.35 489 0.54muy satisfecho 412 0.46 901 1Total 901 1b) El 35%, c)170 y representan el 19%, d)319+412 = 731 obien901−170 =731, que representan el 35 + 46 = 81% (o bien 100 − 19 = 81%).Ejemplo 2.3 Se quiere estudiar la eficacia <strong>de</strong> un nuevo insecticida paraplantas <strong>de</strong> interior. Se seleccionan 50 plantas y se cuenta el número <strong>de</strong>hojas que han sido atacadas <strong>de</strong>spués <strong>de</strong> haber tratado la planta con el nuevoproducto. Los resultados son:Hojas atacadas n i0 61 102 123 84 55 46 38 110 1a) ¿De qué tipo es la variable <strong>de</strong> estudio? Construir la tabla <strong>de</strong> frecuenciascorrespondiente.b) ¿Qué porcentaje <strong>de</strong> plantas tienen sólo 3 hojas atacadas?c) ¿Cuántas plantas tienen como máximo 3 hojas atacadas?d) ¿Cuántas plantas tienen como mínimo 6 hojas atacadas?e) ¿Qué porcentaje <strong>de</strong> plantas tienen entre 3 y 5 hojas atacadas?f) ¿Qué porcentaje <strong>de</strong> plantas tienen al menos 8 hojas atacadas?g) ¿Qué porcentaje <strong>de</strong> plantas tienen a lo sumo 2 hojas atacadas?Respuestas: a) Cuantitativa discreta,Hojas atacadas n i f i N i F i0 6 0,12 6 0,121 10 0,20 16 0,322 12 0,24 28 0,563 8 0,16 36 0,724 5 0,10 41 0,825 4 0,08 45 0,906 3 0,06 48 0,968 1 0,02 49 0,9810 1 0,02 50 1b) el 16%, c)36, d)3+1+1 = 5 obien50 − 45 = 5, e)el16 + 10 + 8 = 34%obien(8+5+4)/50 · 100 = 34%, f)el2+2=4% obien100 − 96 = 4%,g) el 56%.Ejemplo 2.4 En veinte vuelos <strong>de</strong> Barcelona a Madrid se han contado elnúmero <strong>de</strong> asientos vacíos en cada vuelo. Se han agrupado los datos enintervalos <strong>de</strong> longitud 4.asientos vacíos n i0 − 3 94 − 7 58 − 11 412 − 16 2a) ¿De qué tipo es la variable estudiada? Construir la tabla <strong>de</strong> frecuenciascorrespondiente.b) ¿En cuántos vuelos hay menos <strong>de</strong> 8 asientos vacíos? ¿Qué porcentajerepresentan?c) ¿En cuántos vuelos hay como mínimo10asientosvacíos? ¿Qué porcentajerepresentan?Respuestas: a) Cuantitativa discreta,intervalos x i n i f i N i F i[0, 4) 2 9 0,45 9 0,45[4, 8) 6 5 0,25 14 0,70[8, 12) 10 4 0,20 18 0,90[12, 16] 14 2 0,10 20 1,00Total 20 1b) En 14 vuelos, y representan el 70% <strong>de</strong> los vuelos, c) Aproximadamenteen 2+4· (10 − 8)/(12 − 8) = 4 vuelos, que representan el 4/20 · 100 = 20%<strong>de</strong> los vuelos.


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 52ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 6<strong>Ejemplos</strong> <strong>de</strong> representaciones gráficasFigure 3: Gráfico <strong>de</strong> Pareto. <strong>Datos</strong> <strong>de</strong>l ejemplo 2.2Figure 1: Diagrama <strong>de</strong> barras y polígono <strong>de</strong> frecuencias. <strong>Datos</strong> <strong>de</strong>l ejemplo2.3.900800700100%89%78%60067%12 polígono <strong>de</strong> frecuencias50040055%44%diagrama <strong>de</strong> barras30033%1020022%810011%600%muy satisfecho mod. satisfecho mod. insatisfecho muy insatisfecho42Figure 4: Histograma y polígono <strong>de</strong> frecuencias. <strong>Datos</strong> <strong>de</strong>l ejemplo 2.4.0 1 2 3 4 5 6 7 8 9 102.52polígono <strong>de</strong> frecuenciashistograma1.5Figure 2: Diagrama <strong>de</strong> sectores. <strong>Datos</strong> <strong>de</strong>l ejemplo 2.130%23%10.5ABABO0 4 8 12 1628%20%Ejemplo 2.5 Con los siguientes datos construir un diagrama <strong>de</strong> tallo yhojas.<strong>Datos</strong> recogidos (en cm):11.357, 12.542, 11.384, 12.431, 14.212, 15.213, 13.300, 11.300, 17.206,12.710, 13.455, 16.143, 12.162, 12.721, 13.420, 14.698.Respuesta:<strong>Datos</strong> redon<strong>de</strong>ados y expresados en mm:114, 125, 114, 124, 142, 152, 133, 113, 172, 127, 135, 161, 122, 127, 134,147.


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 72ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 8Diagrama <strong>de</strong> tallo y hojas (datos en mm):11 34412 2457713 34514 2715 216 117 2Ejemplo 2.6 Un inversor tiene ahorros repartidos en 3 <strong>de</strong>pósitos con 2000,5000 y 10000 euros, respectivamente. si el primero le rin<strong>de</strong> un 5% anual, elsegundo un 4% anual y el tercero un 2% anual, ¿cuál es el tipo <strong>de</strong> interésmedio que recibe?Respuesta: La variable <strong>de</strong> estudio es el interés anual. Los valores quetoma esta variable son 5, 4, 2 con pesos 2000, 5000, 10000, respectivamente.El interés medio esx P =5 · 2000 + 4 · 5000 + 2 · 100002000 + 5000 + 10000= 5000017000 =2.94.Ejemplo 2.7 Calcular la mediana y la moda <strong>de</strong> los conjuntos <strong>de</strong> datos siguientes:a) 18, 18, 19, 17, 23, 20, 21, 18b) 20, 21, 18, 19, 18, 17, 18Respuestas: a) Or<strong>de</strong>nados los datos en or<strong>de</strong>n creciente,17, 18, 18, 18, 19, 20, 21, 23,el valor <strong>de</strong> la mediana es Me = (18 + 19)/2 =18.5 ylamodaesMo =18.b) Or<strong>de</strong>nados los datos en or<strong>de</strong>n creciente,17, 18, 18, 18, 19, 20, 21,el valor <strong>de</strong> la mediana es Me =18ylamodaesMo =18.Ejemplo 2.8 Con los datos <strong>de</strong>l ejercicio 2.2 (habitantes <strong>de</strong> las provinciasespañolas) calcular la media aritmética y la mediana.Respuestas: Utilizando la tabla <strong>de</strong> frecuencias calculada en el apartado b)<strong>de</strong>l ejercicio 2.2, tenemos quex = 1 nk∑i=1x i n i = 4305000052= 827884.62,que significa que, en promedio, hay 827884.62 habitantes por provincia.Para el cálculo <strong>de</strong> la mediana, buscamos primero el intervalo mediano.Puesto que n/2 =26, el intervalo mediano es [500000, 750000). Aplicandola fórmula <strong>de</strong> la mediana:26 − 24Me = 500000 + 250000 ·34 − 24 = 550000,esto significa que el 50% <strong>de</strong> las provincias españolas tienen menos <strong>de</strong> 550000habitantes.Recor<strong>de</strong>mos que la distribución <strong>de</strong> esta variable es bastante asimétrica comomuestra el histograma <strong>de</strong> frecuencias <strong>de</strong> la figura 6, por tanto, resultará másfiable utilizar la mediana y no la media como medida <strong>de</strong> ten<strong>de</strong>ncia central.Ejemplo 2.9 Cálculo <strong>de</strong> algunas características numéricas con los datos <strong>de</strong>lejemplo 2.3.Medidas <strong>de</strong> ten<strong>de</strong>ncia central:hojas atacadas n i N i x i n i x 2 i n i0 6 6 0 01 10 16 10 102 12 28 24 483 8 36 24 724 5 41 20 805 4 45 20 1006 3 48 18 1088 1 49 8 6410 1 50 10 100Total 50 134 582x = 134 =2.68,50Me =2, Mo =2.Medidas <strong>de</strong> posición:Q 1 =1, Q 3 =4,P 35 =2, P 80 =4, P 95 =6.


2 2 ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 9ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 101.25Mo =0+(4− 0)0+1.25 =4. utilizando la tabla <strong>de</strong> frecuencias <strong>de</strong>l ejemplo 2.4. Recor<strong>de</strong>mos cómo era latabla:Medidas <strong>de</strong> dispersión:s 2 n = 58250 − 2.682 =4.46, s n = √ 4.46 = 2.11,Medidas <strong>de</strong> posición:4(5 − 0)Q 1 =0+ =2.22,9 − 04(15 − 14)Q 3 =8+ =9,18 − 14R =10− 0=10, RI =4− 1=3.4(6 − 0)4(11.4 − 9)P 30 =0+ =2.67, P 57 =4+ =5.92.9 − 014 − 9La mediana <strong>de</strong> <strong>de</strong>sviaciones absolutas, MEDA, se obtiene calculando laMedidas <strong>de</strong> dispersión:mediana <strong>de</strong> los valores absolutos <strong>de</strong> x i − Me(X). Empezamos calculandoestas diferencias:s 2 n = 100820 − 5.82 =16.76, s n = √ 16.76 = 4.09,x i − Me(X) -2 -1 0 1 2 3 4 6 8R =16− 0=16, RI =9− 2.22 = 6.78.n i 6 10 12 8 5 4 3 1 12.2 Ejercicios.y i = |x i − Me(X)| n i (y) N i (y)Ejercicio 2.1 Con los datos <strong>de</strong>l ejemplo 2.4 trazar la curva <strong>de</strong> frecuencias0 12 12relativas acumuladas. Determinar el número <strong>de</strong> vuelos que tienen como1 10+8=18 30máximo 10 asientos vacíos.2 6+5=11 413 4 45Respuesta: La figura 5 contiene la curva <strong>de</strong> frecuencias acumuladas. En4 3 48el eje horizontal se representan los valores que toma la variable, en este6 1 49caso el número <strong>de</strong> asientos vacíos, y en el eje vertical se representan las8 1 50frecuencias relativas acumuladas. Utilizando esta figura vemos que al valorPuesto que n =50es par, la MEDA es la media aritmética entre el dato10 le correspon<strong>de</strong> una altura <strong>de</strong> 0.8. Por tanto, el 80% <strong>de</strong> los vuelos tienen25 y el dato 26, es <strong>de</strong>cir:como máximo 10 asientos vacíos. Puesto que en total hay 20 vuelos, el 80%<strong>de</strong> los vuelos son 20 (0.8) = 16 vuelos. Este mismo cálculo pue<strong>de</strong> realizarseMEDA = y (25) + y (26)=12Figure 5: Curva <strong>de</strong> frecuencias acumuladas o polígono <strong>de</strong> frecuencias acumuladas.<strong>Datos</strong> <strong>de</strong>l ejemplo 2.4.Ejemplo 2.10 Cálculo <strong>de</strong> algunas características numéricas con los datos<strong>de</strong>l ejemplo 2.4.1intervalo x i n i N i x i n i x 2 i n i n i /L i[0, 4) 2 9 9 18 36 2.250.80.75[4, 8) 6 5 14 30 180 1.25[8, 12) 10 4 18 40 400 1[12, 16) 14 2 20 28 392 0.50.5Total 20 116 10080.25Medidas <strong>de</strong> ten<strong>de</strong>ncia central:x = 11610 − 9=5.8, Me =4+(4− 0)20 14 − 9 =4.8,0 4 8 10 12 16


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 112ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 12Intervalo x i n i f i N i F i[0, 4) 2 9 0,45 9 0,45[4, 8) 6 5 0,25 14 0,70[8, 12) 10 4 0,20 18 0,90[12, 16] 14 2 0,10 20 1,00Total 20 1El número <strong>de</strong> vuelos que tienen a lo sumo 10 asientos vacíos lo obtendremossumando las frecuencias observadas en el intervalo [0, 4) más las frecuenciasobservadas en el intervalo [4, 8) más una parte <strong>de</strong> las frecuencias observadasen el intervalo [8, 12). Es<strong>de</strong>cir,9+5+ 10 − 812 − 8 · 4=16.Ejercicio 2.2 Clasificadas las provincias españolas por su número <strong>de</strong> habitantesen 2001, se obtuvieron los siguientes datos:Num. habitantes Num. provincias<strong>de</strong> 1 a 100 000 3<strong>de</strong> 100 000 a 250 000 8<strong>de</strong> 250 000 a 500 000 13<strong>de</strong> 500 000 a 750 000 10<strong>de</strong> 750 000 a 1 000 000 7<strong>de</strong> 1 000 000 a 2 000 000 8<strong>de</strong> 2 000 000 a 3 000 000 1<strong>de</strong> 3 000 000 a 4 000 000 0<strong>de</strong> 4 000 000 a 6 000 000 2a) Constuir una tabla estadística con las marcas <strong>de</strong> clase, las frecuenciasabsolutas y las frecuencias relativas.b) ¿Cuántas provincias tienen menos <strong>de</strong> 500 000 habitantes? ¿Qué porcentajerepresentan?c) ¿Cuántas provincias tienen entre 800 000 y 1 300 000 habitantes?d) Construir el histograma <strong>de</strong> frecuencias absolutas.Respuestas: a) La tabla <strong>de</strong> frecuencias con una columna adicional que seráútil para la construcción <strong>de</strong>l histograma es la siguiente:intervalos x i n i f i N i F i n i /L i[0, 100000) 50000 3 0.058 3 0.058 3 · 10 −5[100000, 250000) 175000 8 0.154 11 0.212 5.3 · 10 −5[250000, 500000) 375000 13 0.250 24 0.462 5.2 · 10 −5[500000, 750000) 600000 10 0.192 34 0.654 4 · 10 −5[750000, 1000000) 875000 7 0.135 41 0.789 2.8 · 10 −5[1000000, 2000000) 1500000 8 0.154 49 0.943 0.8 · 10 −5[2000000, 3000000) 2500000 1 0.019 50 0.962 0.1 · 10 −5[3000000, 4000000) 3500000 0 0 50 0.962 0[4000000, 6000000) 5000000 2 0.038 52 1 0.1 · 10 −5b) 24 provincias, que representan el 46.2%.c) El intervalo [800000, 1300000] está situado encima <strong>de</strong> dos intervalos <strong>de</strong>clase:800000 1300000[ )[ )[ ]750000 10 6 2 · 10 6Por tanto, el número <strong>de</strong> provincias que tienen entre 800000 y 1300000 habitanteses aproximadamente1000000 − 800000− 1000000× 7+13000001000000 − 750000 2000000 − 1000000 × 8=0.8 × 7+0.3 × 8=8provincias.d) La figura 6 contiene el histograma <strong>de</strong> frecuencias absolutas.Ejercicio 2.3 Los siguientes datos correspon<strong>de</strong>n a las medidas <strong>de</strong> 15 individuossobre la variable cuantitativa peso:62, 74, 86, 53, 49, 71, 68, 67, 69, 70, 58, 59, 73, 74, 78.a) Construid una tabla <strong>de</strong> frecuencias absolutas, relativas, absolutas acumuladasy relativas acumuladas.b) Realizad un diagrama <strong>de</strong> tallo y hojas.Respuestas: a) Agrupamos los datos en k = √ 15 ≈ 4 intervalos <strong>de</strong> clase:


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 132ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 14Figure 6: Histograma <strong>de</strong> frecuencias absolutas. <strong>Datos</strong> <strong>de</strong>l ejercicio 2.2.4 · 10 −53 · 10 −5240/10 = 24. En la cuarta columna obtenemos las <strong>de</strong>sviaciones respecto <strong>de</strong>la media, y en la quinta pon<strong>de</strong>ramos por la frecuencia observada en cadaintervalo.[l i−1 ,l i ) x i n i x i n i x i − x (x i − x) n i[0, 10) 5 1 5 -19 -19[10, 20) 15 2 30 -9 -18[20, 30) 25 4 100 1 4[30, 40] 35 3 105 11 33Total 10 240 05 · 10 −5 intervalos x i n i f i N i F i2 · 10 −510 −5Ejercicio 2.5 Una empresa está interesada en seleccionar entre dos candidatospara un puesto <strong>de</strong> trabajo. Las valoraciones que han obtenido en lasentrevistas y pruebas a que han sido sometidos son las siguiente:0 1 2 3 4 5 6millones <strong>de</strong> habitantes[49, 59) 54 3 0.2 3 0.2[59, 69) 64 4 0.267 7 0.467[69, 79) 74 7 0.467 14 0.934[79, 89] 84 1 0.067 15 1.001b) El diagrama <strong>de</strong> tallo y hojas es:4 95 3896 27897 0134488 6Ejercicio 2.4 Obtener las <strong>de</strong>sviaciones con respecto a la media en la siguientedistribución y comprobar que su suma es cero.intervalo frecuencia0-10 110-20 220-30 430-40 3Respuesta: Primeramente construimos la tabla <strong>de</strong> frecuencias. Con latercera columna <strong>de</strong> la tabla calculamos la media aritmética, que es x =Aspecto Candidato A Candidato Bexperiencia 8 7conocimientos 6 7psicontécnico 4 5Si la empresa da una importancia <strong>de</strong>l 60% a la experiencia, <strong>de</strong>l 25% a losconocimientos y <strong>de</strong>l 15% a la habilidad psicotécnica, ¿cuál <strong>de</strong> los dos candidatosva a escoger?Respuesta: Calculamos las medias pon<strong>de</strong>radas para cada candidato, conpesos 60, 25 y 15, respectivamente para cada categoría. El candidato queobtenga una media po<strong>de</strong>rada mayor será el candidato escogido.x P (A) =x P (B) =8 · 60 + 6 · 25 + 4 · 151007 · 60 + 7 · 25 + 5 · 15100=6.9,=6.7Ejercicio 2.6 Dada la siguiente distribución en el número <strong>de</strong> hijos <strong>de</strong> cienfamilias, calcular sus cuartiles.x i n i N i0 14 141 10 242 15 393 26 654 20 855 15 100


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 152ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 16Respuesta: Puesto que n =100es par,Me = x (50) + x (51)=3,2que coinci<strong>de</strong> con Q 2 . Para calcular Q 1 y Q 3 <strong>de</strong>bemos buscar los valores n/4y 3 n/4 en la columna <strong>de</strong> las frecuencias acumuladas:n4 =25⇒ Q 1 =2,3n4 =75⇒ Q 3 =4.Ejercicio 2.7 Calcular la varianza y la <strong>de</strong>sviación típica <strong>de</strong> las siguientescantida<strong>de</strong>s en metros: 3, 3, 4, 4, 5.Respuesta:x i n i x i n i x 2 i x 2 i n i3 2 6 9 184 2 8 18 325 1 5 25 25total 5 19 75La media aritmética es x =19/5 =3.8 m, la media <strong>de</strong> cuadrados es x 2 =75/5 =15m 2 , la varianza muestral es s 2 n = x 2 − x 2 =15− (3.8) 2 =0.56 m 2y la <strong>de</strong>sviación típica muestral es s n = √ 0.56 = 0.75 m.Puesto que hay pocos valores, los cálculos <strong>de</strong> la media y <strong>de</strong> la varianza sepodían haber hecho directamente:s 2 n = 1 nx = 1 nn∑i=1n∑i=1x i = 3+3+4+4+55=3.8,x 2 i − x 2 = 9+9+16+16+25 − (3.8) 2 =0.56.5Ejercicio 2.8 De los ocho empleados <strong>de</strong> una oficina, se han consi<strong>de</strong>rado lasdistribuciones <strong>de</strong> sus eda<strong>de</strong>s y sus años<strong>de</strong>antigüedad en la empresa:Edad 40 22 19 30 62 32 45 51Antigüedad 15 3 1 8 39 13 17 24Calcular lor rangos <strong>de</strong> estas dos distribuciones. ¿Cuál <strong>de</strong> las dos tiene mayorgrado <strong>de</strong> dispresión?Respuesta:R(edad) =62− 19 = 43, R(antigüedad) =39− 1=38.Aunque el rango <strong>de</strong> la variable edad sea mayor que el rango <strong>de</strong> la variableantigüedad, esto no significa que el grado <strong>de</strong> dispersión <strong>de</strong> edad sea tambiénmayor. Para <strong>de</strong>cidir qué variable tiene un mayor grado <strong>de</strong> dispersión <strong>de</strong>bemoscalcular el coeficiente <strong>de</strong> variación. Así, para la variable edad tenemosque:x = 1 n∑x i = 301n 8 =37.6,i=1s 2 n = x 2 − x 2 = 12839 − (37.6) 2 = 189.23,8s n = √ 189.23 = 13.8,CV = s n 13.8× 100 = × 100 = 36.7%,x 37.6mientras que para la variable antigüedad:x = 1 n∑x i = 120n 8 =15,i=1s 2 n = x 2 − x 2 = 2854 − (15) 2 =131.75,8s n = √ 131.75 = 11.48,CV = s n 11.48× 100 = × 100 = 76.5%.x 15Por tanto, la variable antigüedad tiene una mayor dispresión, a pesar <strong>de</strong> quesu rango es menor.Ejercicio 2.9 Una empresa inmobiliaria ofrece apartamentos en régimen<strong>de</strong> alquiler con los siguientes precios (en euors):precio alquiler (mensual) número <strong>de</strong> apartamentos700-1000 211000-1100 271100-1300 341300-1500 141500-1800 81800-2000 112000-2100 10


2ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 19Ejercicio 2.10 Con los datos <strong>de</strong>l ejemplo 2.3, calcular los coeficientes <strong>de</strong>asimetría <strong>de</strong> Pearson y <strong>de</strong> Fisher.Respuesta:hojas atacadas n i x i − x (x i − x) 3 n i0 6 -2.68 -115.491 10 -1.68 -47.422 12 -0.68 -3.773 8 0.32 0.264 5 1.32 11.505 4 2.32 49.956 3 3.32 109.788 1 5.32 150.5710 1 7.32 392.2250 547.61En el ejemplo 2.9 hemos calculadox =2.68, s n =2.11, Mo =2,por tanto, el coeficiente <strong>de</strong> asimetría <strong>de</strong> Pearson es:As P = x − Mo = 2.68 − 2 =0.3223.s n 2.11A partir <strong>de</strong> la tabla anterior po<strong>de</strong>mos obtener el coeficiente <strong>de</strong> asimetría <strong>de</strong>Fisher:1∑ nn i=1As F =(x i − x) 3 n is 3 = 547.61/50n2.11 3 =1.1659.En este caso, el uso <strong>de</strong> As P no es muy recomendable, puesto que el polígono<strong>de</strong> frecuencias <strong>de</strong> esta distribución no tiene forma acampanada (véase figura1). En cambio, el coeficiente As F indica que hay una mayor asimetríapositiva.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!