28.10.2014 Views

Práctica 1 - Departamento de Estadística e Investigación Operativa ...

Práctica 1 - Departamento de Estadística e Investigación Operativa ...

Práctica 1 - Departamento de Estadística e Investigación Operativa ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Bioestadística. Curso 2012-2013<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro<br />

Índice<br />

1. Objetivos <strong>de</strong> la práctica 2<br />

2. Introducción 2<br />

3. El programa Statistix 2<br />

3.1. Introducir datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

3.2. Importar datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

4. <strong>Estadística</strong> <strong>de</strong>scriptiva con Statistix 5<br />

4.1. Tablas <strong>de</strong> frecuencias y representaciones grácas para variables cualitativas . . . . . . . . . . . 5<br />

4.2. Tablas <strong>de</strong> frecuencias y representaciones grácas para variables cuantitativas . . . . . . . . . . 6<br />

4.2.1. Variables cuantitativas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

4.2.2. Variables cuantitativas continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

4.3. Análisis <strong>de</strong>scriptivo por grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

5. Medidas características 9<br />

5.1. El diagrama <strong>de</strong> caja o Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

6. Otras opciones para el manejo <strong>de</strong> datos en Statistix 12<br />

6.1. Transformación <strong>de</strong> variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

6.1.1. Obtención <strong>de</strong> nuevas variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

6.1.2. Recodicación <strong>de</strong> variables en rangos . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

7. Ejercicios 14<br />

1


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

1 Objetivos <strong>de</strong> la práctica<br />

El objetivo <strong>de</strong> esta práctica es familiarizarse con el funcionamiento <strong>de</strong>l programa Statistix, conocer los procedimientos<br />

<strong>de</strong> estadística <strong>de</strong>scriptiva que nos ofrece y aplicarlos a conjuntos <strong>de</strong> datos. Estudiaremos:<br />

Procedimientos para crear e importar datos con Statistix.<br />

Tablas <strong>de</strong> frecuencias para variables cualitativas y cuantitativas (discretas o continuas).<br />

Representaciones grácas.<br />

Medidas características.<br />

2 Introducción<br />

Son muchos los paquetes estadísticos que po<strong>de</strong>mos encontrar en la actualidad, <strong>de</strong>s<strong>de</strong> software comercial como<br />

Statistix, SPSS, SAS, MATLAB, Statistica, Stata, hasta software libre como el Lenguaje R, <strong>de</strong> gran aplicación<br />

en investigación Biomédica. Muchas <strong>de</strong> estas propuestas son aplicaciones ecientes que se basan en el uso <strong>de</strong><br />

potentes interfaces grácas (GUI Graphical User Interface) con sistemas <strong>de</strong> menús y ventanas <strong>de</strong>splegables que<br />

facilitan al usuario el proceso <strong>de</strong> mo<strong>de</strong>lización estadística.<br />

Statistix es un programa <strong>de</strong> análisis estadístico que po<strong>de</strong>mos utilizar <strong>de</strong> forma sencilla para analizar datos. Este<br />

programa nos ofrece procedimientos estadísticos básicos y avanzados. Como veremos, el entorno <strong>de</strong> trabajo que<br />

proporciona Statistix es muy amigable y similar al <strong>de</strong> otros programas. En este sentido, aprendiendo a manejar<br />

Statistix, no <strong>de</strong>berías encontrar dicultad para adaptarte a otros paquetes estadísticos.<br />

3 El programa Statistix<br />

Para comenzar a trabajar con Statistix, pulsa en el menú <strong>de</strong> Windows Inicio I Programas I Statistix.<br />

El programa se abre como se muestra en la Figura 1. En el menú principal superior, se encuentran las siguientes<br />

opciones:<br />

File: A través <strong>de</strong> este menú podremos leer datos <strong>de</strong> un<br />

chero, guardar datos, imprimir, y acce<strong>de</strong>r a otras opciones<br />

<strong>de</strong> manejo <strong>de</strong> cheros usuales en cualquier programa.<br />

Edit: A través <strong>de</strong> este menú podremos copiar, cortar y<br />

pegar datos seleccionados con el ratón.<br />

Data: Nos permite introducir variables y datos. También<br />

están disponibles a través <strong>de</strong> este menú diversas opciones<br />

para el manejo <strong>de</strong> datos que iremos viendo en la práctica<br />

(seleccionar casos, recodicar variables, poner etiquetas,...).<br />

Statistics: A través <strong>de</strong> este menú acce<strong>de</strong>remos a los diferentes<br />

métodos estadísticos que veremos a lo largo <strong>de</strong>l<br />

curso.<br />

Figura 1: Programa Statistix<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 2 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Preferences: Nos permitirá modicar las opciones por <strong>de</strong>fecto <strong>de</strong>l tratamiento <strong>de</strong> datos y grácos.<br />

Window: A través <strong>de</strong> este menú po<strong>de</strong>mos cambiar la organización <strong>de</strong> ventanas.<br />

Help: Nos permite acce<strong>de</strong>r a la ayuda <strong>de</strong>l programa.<br />

El paquete <strong>de</strong> ayuda <strong>de</strong> Statistix: Para acce<strong>de</strong>r al paquete <strong>de</strong> ayuda <strong>de</strong> Statistix pulsa en el menú<br />

superior Help I Statistix Help... Una vez <strong>de</strong>splegada la ayuda selecciona en la pestaña <strong>de</strong> Contenidos<br />

el tema que <strong>de</strong>seas consultar.<br />

3.1 Introducir datos<br />

La ventana que encontramos al entrar en Statistix (ventana <strong>de</strong>l editor <strong>de</strong> datos) tiene una estructura similar a<br />

la <strong>de</strong> una hoja <strong>de</strong> cálculo y se utiliza para introducir los datos que se quieren analizar. Veremos como introducir<br />

datos en Statistix a través <strong>de</strong> un ejemplo práctico.<br />

Ejemplo:<br />

En la última hora han acudido al servicio <strong>de</strong> urgencias <strong>de</strong> un hospital ocho pacientes, cuyos datos<br />

<strong>de</strong> ingreso se encuentran resumidos en la siguiente tabla. Clasica las variables recogidas (sexo,<br />

peso, estatura, temperatura y número <strong>de</strong> visitas previas al servicio <strong>de</strong> urgencias) e introduce los<br />

datos en Statistix.<br />

Sexo Peso Estatura Temperatura Visitas<br />

M 63 1.74 38 0<br />

M 58 1.63 36.5 2<br />

H 84 1.86 37.2 0<br />

M 47 1.53 38.3 0<br />

M 70 1.75 37.1 1<br />

M 57 1.68 36.8 0<br />

H 87 1.82 38.4 1<br />

M 55 1.46 36.6 1<br />

Cuadro 1: Datos <strong>de</strong>l servicio <strong>de</strong> urgencias <strong>de</strong> un hospital<br />

En primer lugar, introduciremos los datos <strong>de</strong> la variable Sexo. Para introducir datos pulsa en el menú superior<br />

Data I Insert I Variables. Escribe en el cuadro <strong>de</strong> diálogo el nombre <strong>de</strong> la variable que quieres crear y pulsa<br />

Ok. Fíjate que en el editor <strong>de</strong> datos aparece una columna con el nombre <strong>de</strong> la variable que has creado.<br />

La variable Sexo es una variable cualitativa que toma dos valores (mujer y hombre). Lo más cómodo para<br />

trabajar con variables cualitativas en Statistix es codicar las variables y <strong>de</strong>spués ponerles etiquetas. En este<br />

caso utilizaremos la codicación:<br />

Mujer=1<br />

Hombre=0<br />

Una vez añadidos los datos (unos y ceros) <strong>de</strong> la variable Sexo <strong>de</strong>bemos poner etiquetas para recordar la forma<br />

en que hemos hecho la codicación. Para poner etiquetas a los valores <strong>de</strong> una variable pulsa en el menú superior<br />

Data I Labels I Value labels.... Selecciona la variable Sexo como Source Variable y en el cuadro Dene<br />

Variable escribe cada valor <strong>de</strong> la variable y su correspondiente etiqueta. Asegúrate <strong>de</strong> que las etiquetas <strong>de</strong>nidas<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 3 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Figura 2: Cuadro <strong>de</strong> diálogo para insertar etiquetas en Statistix<br />

han pasado (botón I) al cuadro <strong>de</strong> la <strong>de</strong>recha Value Labels, ver Figura 2. Para que los cambios tengan efecto<br />

no olvi<strong>de</strong>s pulsar el botón Save antes <strong>de</strong> cerrar el cuadro <strong>de</strong> diálogo.<br />

Etiquetas en Statistix: A través <strong>de</strong> su menú Data I Labels, Statistix permite poner etiquetas al<br />

conjunto <strong>de</strong> datos (Data Set Label...), a las variables (Variable Label...) y a los valores <strong>de</strong> las<br />

variables (Value Labels...). Estas etiquetas se utilizan en los informes y grácos <strong>de</strong> Statistix.<br />

Guarda los datos en Statistix: Es aconsejable guardar los datos en un chero <strong>de</strong>spués <strong>de</strong> su introducción.<br />

Para guardar los datos usa la opción File I Save. También pue<strong>de</strong>s usar File I Save as.<br />

Como en cualquier otro programa <strong>de</strong> Windows podrás elegir la carpeta en don<strong>de</strong> guardar el chero.<br />

Los datos se guardarán con la extensión .sx. Si <strong>de</strong>seas guardar los datos en otro formato (chero <strong>de</strong><br />

texto, chero Excel,...) tendrás que utilizar el menú File I Export.<br />

Ejercicio:<br />

Crea un chero <strong>de</strong> Statistix urgencias.sx con los datos <strong>de</strong> la Tabla 1. Ponle la etiqueta Servicio<br />

<strong>de</strong> urgencias <strong>de</strong> un hospital al conjunto <strong>de</strong> datos y una etiqueta a cada variable indicando lo que<br />

representa.<br />

3.2 Importar datos<br />

Des<strong>de</strong> el menú File I Open podremos abrir cheros <strong>de</strong> datos .sx creados previamente con Statistix. El cuadro<br />

<strong>de</strong> diálogo es similar al <strong>de</strong> otras aplicaciones Windows. Pue<strong>de</strong>s encontrar algunos cheros <strong>de</strong> ejemplo en la<br />

carpeta Sample Data que se crea en el directorio <strong>de</strong> instalación <strong>de</strong>l programa.<br />

Ejemplo:<br />

Abre el chero <strong>de</strong> Statistix urgenciasCompleto.sx. En este chero se encuentran todos los datos<br />

<strong>de</strong> entrada a urgencias <strong>de</strong> un día.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 4 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Abrir datos en Statistix: En Statistix no se pue<strong>de</strong>n tener abiertos simultáneamente dos archivos <strong>de</strong><br />

datos. Si se <strong>de</strong>sea crear uno nuevo, Statistix cerrará automáticamente el archivo anterior preguntando<br />

previamente si se <strong>de</strong>sea guardar los cambios.<br />

En muchas ocasiones dispondremos <strong>de</strong> datos en cheros creados por otros programas, por ejemplo, cheros <strong>de</strong><br />

texto, cheros Excel, etc. Para abrir cheros <strong>de</strong> otros formatos en Statistix usaremos el menú File I Import.<br />

Por este procedimiento añadiremos variables a un nuevo conjunto <strong>de</strong> datos <strong>de</strong> Statistix o a uno ya existente.<br />

Ejercicio:<br />

El chero urgenciasCompleto.txt contiene los datos <strong>de</strong>l ejercicio anterior en formato texto .txt.<br />

Importa los datos <strong>de</strong>s<strong>de</strong> Statistix.<br />

4 <strong>Estadística</strong> <strong>de</strong>scriptiva con Statistix<br />

Apren<strong>de</strong>remos ahora a realizar el análisis <strong>de</strong>scriptivo <strong>de</strong> un conjunto <strong>de</strong> datos con Statistix. Veremos como<br />

calcular tablas <strong>de</strong> frecuencias, realizar grácos representativos y calcular medidas características. Como ejemplo<br />

utilizaremos el conjunto <strong>de</strong> datos <strong>de</strong>l servicio <strong>de</strong> urgencias, que encontrarás en el chero urgenciasCompleto.sx.<br />

4.1 Tablas <strong>de</strong> frecuencias y representaciones grácas para variables cualitativas<br />

Veamos en primer lugar como obtener las frecuencias absolutas, relativas y acumuladas <strong>de</strong> la variable Sexo, que<br />

es una variable cualitativa.<br />

Vete al menú Statistics I Summary Statistics I Frequency Distribution... En el cuadro <strong>de</strong> diálogo selecciona<br />

la variable Sexo y pásala (botón I) al cuadro <strong>de</strong> la <strong>de</strong>recha Frequency Variables. Pulsa Ok. Se abrirá entonces<br />

una nueva ventana (ventana <strong>de</strong> resultados) con la siguiente información:<br />

Frequency Distribution of Sexo<br />

Cumulative<br />

Value Freq Percent Freq Percent<br />

Hombre 40 52,6 40 52,6<br />

Mujer 36 47,4 76 100,0<br />

Total 76 100,0<br />

Como pue<strong>de</strong>s observar, la columna Freq nos <strong>de</strong>vuelve las frecuencias absolutas (<strong>de</strong>l total <strong>de</strong> 76 pacientes que<br />

acudieron a urgencias, 40 fueron hombres y 36 fueron mujeres). La columna Percent representa las frecuencias<br />

relativas (en porcentaje). El 52.6 % <strong>de</strong> los pacientes que acudieron a urgencias fueron hombres, mientras que el<br />

47.4 % fueron mujeres. Las dos últimas columnas representan las frecuencias acumuladas (absolutas y relativas).<br />

Ventana <strong>de</strong> resultados: Cuando seleccionamos un procedimiento estadístico en Statistix, la tabla <strong>de</strong><br />

resultados o la gráca correspondiente se muestran en una nueva ventana (ventana <strong>de</strong> resultados).<br />

Como cualquier otra ventana, la ventana <strong>de</strong> resultados se pue<strong>de</strong> minimizar, maximizar, reescalar,...<br />

Cuando esté minimizada pue<strong>de</strong>s volver a acce<strong>de</strong>r a ella a través <strong>de</strong>l botón <strong>de</strong>l menú Window.<br />

Las ventana <strong>de</strong> resultados tiene sus propio menú, que podrás ver cuando esté activa (pincha sobre la<br />

ventana <strong>de</strong> resultados). El menú <strong>de</strong> la ventana <strong>de</strong> resultados tiene cinco submenús: File, Edit, Results,<br />

Window, y Help que te permitirán, entre otras opciones, guardar e imprimir los resultados y grácos.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 5 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Figura 3: Cuadro <strong>de</strong> diálogo para realizar un diagrama <strong>de</strong> barras <strong>de</strong> la variable Sexo<br />

Figura 4: Diagrama <strong>de</strong> sectores y diagrama <strong>de</strong> barras <strong>de</strong> la variable Sexo<br />

Una vez calculadas las frecuencias absolutas y relativas <strong>de</strong> la variable Sexo, po<strong>de</strong>mos empezar a hacer resúmenes<br />

grácos. Por ejemplo, para hacer un diagrama <strong>de</strong> sectores utilizaremos el menú Statistics I Summary Statistics<br />

I Pie Chart... En el cuadro <strong>de</strong> la izquierda aparece la lista <strong>de</strong> las variables que ya tenemos <strong>de</strong>nidas. Basta<br />

con seleccionar la variable que nos interesa y pasarla al cuadro Categorical Variable. En el cuadro Display<br />

Values podrás seleccionar si <strong>de</strong>seas que se muestren las frecuencias absolutas <strong>de</strong> cada categoría o el porcentaje<br />

<strong>de</strong> casos.<br />

Para representar un diagrama <strong>de</strong> barras, utilizaremos el menú Results I Summary Statistics I Histogram<br />

como se muestra en la Figura 3.<br />

Grácos en Statistix: La apariencia <strong>de</strong> los grácos se pue<strong>de</strong> cambiar fácilmente. Pincha sobre el gráco<br />

que <strong>de</strong>seas modicar para activar la ventana y selecciona el menú Results I Graph Preferences.<br />

Podrás elegir los colores <strong>de</strong> los grácos, los símbolos para representar los puntos, el tipo <strong>de</strong> fuente,<br />

etc. También podrás cambiar el título <strong>de</strong>l gráco a través <strong>de</strong>l menú Results I Titles.<br />

4.2 Tablas <strong>de</strong> frecuencias y representaciones grácas para variables cuantitativas<br />

4.2.1 Variables cuantitativas discretas<br />

Consi<strong>de</strong>remos ahora la variable Visitas, que es una variable cuantitativa discreta. Po<strong>de</strong>mos volver a utilizar el<br />

menú Statistics I Summary Statistics I Frequency Distribution... para obtener una tabla <strong>de</strong> frecuencias<br />

absolutas y porcentajes.<br />

Ahora tienen mayor interpretación las columnas <strong>de</strong> frecuencias acumuladas (tanto absolutas como relativas).<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 6 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Por ejemplo, observamos que <strong>de</strong> los pacientes registrados, 62 no habían acudido previamente al servicio <strong>de</strong><br />

urgencias más <strong>de</strong> una vez (lo que se correspon<strong>de</strong> con un 81.6 % <strong>de</strong> la muestra).<br />

Pue<strong>de</strong>s representar un diagrama <strong>de</strong> barras, utilizando el menú Statistics I Summary Statistics I Histogram.<br />

Si pones etiquetas a los valores <strong>de</strong> la variable Visitas, obtendrás un diagrama <strong>de</strong> barras como el que se muestra<br />

a continuación.<br />

Frequency Distribution of Visitas<br />

Cumulative<br />

Value Freq Percent Freq Percent<br />

0 17 22,4 17 22,4<br />

1 45 59,2 62 81,6<br />

2 11 14,5 73 96,1<br />

3 3 3,9 76 100,0<br />

Total 76 100,0<br />

4.2.2 Variables cuantitativas continuas<br />

Para trabajar con variables cuantitativas continuas tenemos que agrupar los valores <strong>de</strong> las variables en intervalos.<br />

Consi<strong>de</strong>remos como ejemplo la variable Estatura. Tenemos un total <strong>de</strong> 76 observaciones que toman valores entre<br />

1.46 y 1.88. Po<strong>de</strong>mos consi<strong>de</strong>rar intervalos <strong>de</strong> amplitud 5 cm. entre 1.45 y 1.9. De esta forma garantizamos<br />

que todas nuestras observaciones están en alguno <strong>de</strong> los intervalos <strong>de</strong>nidos.<br />

Statistics I Summary Statistics I Frequency Distribution...<br />

Elige la variable Estatura y pásala al cuadro Frequency Variables.<br />

En el cuadro Bin Size selecciona:<br />

Low: 1.45<br />

High: 1.9<br />

Step: 0.05<br />

Frequency Distribution of Estatura Estatura <strong>de</strong>l paciente (m.)<br />

Cumulative<br />

Low High Freq Percent Freq Percent<br />

1.45 1.50 1 1,3 1 1,3<br />

1.50 1.55 1 1,3 2 2,6<br />

1.55 1.60 6 7,9 8 10,5<br />

1.60 1.65 6 7,9 14 18,4<br />

1.65 1.70 8 10,5 22 28,9<br />

1.70 1.75 17 22,4 39 51,3<br />

1.75 1.80 13 17,1 52 68,4<br />

1.80 1.85 17 22,4 69 90,8<br />

1.85 1.90 7 9,2 76 100,0<br />

Total 76 100,0<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 7 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Figura 5: Histograma <strong>de</strong> la variable Estatura<br />

Obtenemos así un total <strong>de</strong> 9 intervalos (cumpliendo la recomendación <strong>de</strong> que el número <strong>de</strong> intervalos sea<br />

aproximadamente p p<br />

n =<br />

76 = 8:71). ¾Cómo interpretas los resultados <strong>de</strong> la tabla <strong>de</strong> frecuencias? Observamos,<br />

por ejemplo, que hay 8 pacientes con estatura en el intervalo [1:65; 1:70). Si nos jamos en la columna <strong>de</strong><br />

frecuencias acumuladas observamos que hay 52 pacientes que mi<strong>de</strong>n menos <strong>de</strong> 1.8 m.<br />

La representación gráca para variables continuas es el histograma. Se realiza en Statistix a través <strong>de</strong>l menú<br />

Statistics I Summary Statistics I Histogram. Como en el caso <strong>de</strong> la tabla <strong>de</strong> frecuencias tendrás que<br />

<strong>de</strong>terminar los intervalos que quieres consi<strong>de</strong>rar en el cuadro X-Axis. El resultado se muestra en la Figura 5.<br />

Ejercicio:<br />

Construye las tablas <strong>de</strong> frecuencias y grácas representativas <strong>de</strong>l resto <strong>de</strong> variables <strong>de</strong>l conjunto<br />

<strong>de</strong> datos <strong>de</strong>l servicio <strong>de</strong> urgencias.<br />

4.3 Análisis <strong>de</strong>scriptivo por grupos<br />

En muchas ocasiones, a<strong>de</strong>más <strong>de</strong> hacer el estudio <strong>de</strong> una variable <strong>de</strong> forma global como hemos hecho anteriormente<br />

con las variables Visitas y Estatura, es interesante analizar como se comportan dichas variables en<br />

diferentes subgrupos. Por ejemplo, ¾acu<strong>de</strong>n con mayor frecuencia las mujeres a los servicios <strong>de</strong> urgencia? ¾Hay<br />

diferencias signicativas entre las estaturas <strong>de</strong> hombres y mujeres?<br />

Statistix nos permitirá construir tablas <strong>de</strong> frecuencias y grácas por grupos <strong>de</strong> manera muy sencilla. Consi<strong>de</strong>remos<br />

como ejemplo la variable Visitas. Po<strong>de</strong>mos volver a utilizar el menú Statistics I Summary Statistics I<br />

Frequency Distribution... para obtener una tabla <strong>de</strong> frecuencias absolutas y porcentajes. Para que la tabla<br />

obtenida nos muestre frecuencias por sexos simplemente tendremos que seleccionar la variable Visitas como<br />

Frequency Variables y la variable Sexo como Grouping Variable.<br />

Frequency Distribution of Visitas for Sexo = Hombre<br />

Cumulative<br />

Value Freq Percent Freq Percent<br />

0 10 25,0 10 25,0<br />

1 27 67,5 37 92,5<br />

2 2 5,0 39 97,5<br />

3 1 2,5 40 100,0<br />

Total 40 100,0<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 8 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Frequency Distribution of Visitas for Sexo = Mujer<br />

Cumulative<br />

Value Freq Percent Freq Percent<br />

0 7 19,4 7 19,4<br />

1 18 50,0 25 69,4<br />

2 9 25,0 34 94,4<br />

3 2 5,6 36 100,0<br />

Igualmente podremos realizar grácas por grupos como la <strong>de</strong> la Figura 6, eligiendo la variable Visitas como<br />

Depen<strong>de</strong>nt Variable y la variable Sexo como Categorical Variable en el cuadro <strong>de</strong> diálogo Statistics I<br />

Summary Statistics I Histogram.<br />

Figura 6: Diagramas <strong>de</strong> barras <strong>de</strong> frecuencias relativas (en %) <strong>de</strong> la variable Visitas agrupada por Sexo<br />

Ejercicio:<br />

Haz un análisis <strong>de</strong>scriptivo <strong>de</strong> la variable Estatura agrupada por Sexo.<br />

5 Medidas características<br />

Statistix permite calcular directamente medidas características <strong>de</strong> posición, dispersión y forma a través <strong>de</strong>l menú<br />

Statistics I Summary Statistics I Descriptive Statistics...<br />

Figura 7: Cálculo <strong>de</strong> medidas características con Statistix.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 9 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

El procedimiento produce una tabla resumen <strong>de</strong> medidas características <strong>de</strong> una o varias variables (pue<strong>de</strong>s<br />

seleccionar varias variables al mismo tiempo). Pue<strong>de</strong>s calcular, entre otros:<br />

N: tamaño muestral n (número <strong>de</strong> observaciones).<br />

Missing: número <strong>de</strong> datos faltantes (se representan en Statistix como M).<br />

Sum: suma <strong>de</strong> valores.<br />

Mean: media muestral<br />

x = 1 n<br />

n∑<br />

i=1<br />

x i = x 1 + : : : + x n<br />

:<br />

n<br />

SD: Desviación típica<br />

s =<br />

√<br />

√ 1<br />

n 1<br />

√<br />

n∑<br />

(x i x) 2 (x1 x) 2 + : : : + (x n x) 2<br />

=<br />

n 1<br />

i=1<br />

:<br />

Variance: Varianza<br />

s 2 = 1<br />

n 1<br />

n∑<br />

(x i x) 2 = (x 1 x) 2 + : : : + (x n x) 2<br />

n 1<br />

i=1<br />

:<br />

CV: coeciente <strong>de</strong> variación<br />

CV = s x :<br />

Median: una vez or<strong>de</strong>nados los datos <strong>de</strong> menor a mayor la mediana es el valor <strong>de</strong> la variable que <strong>de</strong>ja a<br />

su izquierda el 50 % <strong>de</strong> los datos.<br />

Min/Max: valores mínimo y máximo.<br />

Quartiles: primer, segundo y tercer cuartil.<br />

Skew: coeciente <strong>de</strong> asimetría.<br />

Kurtosis: coeciente <strong>de</strong> Kurtosis.<br />

Por ejemplo, estas son algunas <strong>de</strong> las medidas características <strong>de</strong> las variables Peso y Estatura.<br />

Descriptive Statistics<br />

Peso Estatura<br />

N 76 76<br />

Mean 66.716 1.7330<br />

SD 11.389 0.0909<br />

Variance 129.71 8.269E-03<br />

Minimum 47.000 1.4600<br />

1st Quarti 58.000 1.6800<br />

Median 66.000 1.7400<br />

3rd Quarti 76.000 1.8000<br />

Maximum 92.000 1.8800<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 10 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

Percentiles: Si quieres calcular otros percentiles (no necesariamente la mediana o los cuartiles) pue<strong>de</strong>s<br />

hacerlo en Statistix a través <strong>de</strong>l menú Statistics I Summary Statistics I Percentiles. Escribe en los<br />

cuadros <strong>de</strong> texto <strong>de</strong> Percentiles hasta un máximo <strong>de</strong> cinco valores que <strong>de</strong>sees calcular. Por ejemplo,<br />

para calcular el primer cuartil escribe 25 y para la mediana 50.<br />

Ejercicio:<br />

Calcula e interpreta la media, los cuartiles y el coeciente <strong>de</strong> variación <strong>de</strong> la variable Estatura<br />

agrupada por Sexo.<br />

5.1 El diagrama <strong>de</strong> caja o Boxplot<br />

La información obtenida a partir <strong>de</strong> las medidas <strong>de</strong> centralización, dispersión y forma se pue<strong>de</strong> usar para realizar<br />

diagramas <strong>de</strong> caja (boxplots) que visualmente nos información sobre como están distribuidos los datos. El<br />

diagrama <strong>de</strong> caja consta <strong>de</strong>:<br />

una caja central que está <strong>de</strong>limitada por la posición <strong>de</strong> los cuartiles Q1 y Q3.<br />

Dentro <strong>de</strong> esa caja se dibuja la línea que representa la mediana (cuartil Q2).<br />

De los extremos <strong>de</strong> la caja salen unas líneas que se extien<strong>de</strong>n hasta LI = max fmn(x i ); Q1<br />

LS = mn fmax(x i ); Q3 + 1:5RIg.<br />

1:5RIg y<br />

Los datos que caen fuera <strong>de</strong> los bigotes se representan individualmente mediante £ (datos atípicos<br />

mo<strong>de</strong>rados) y o (datos atípicos extremos).<br />

Para representar un diagrama <strong>de</strong> cajas en Statistix selecciona Statistics I Summary Statistics I Box and<br />

Whisker Plots... La Figura 8 muestra los diagramas <strong>de</strong> caja para la variable Estatura agrupada por Sexo.<br />

Elige la variable Estatura como Depen<strong>de</strong>nt Variable y la variable Sexo como Categorical Variable. Fíjate que<br />

en ambos sexos hay datos atípicos mo<strong>de</strong>rados (personas cuyas estaturas están fuera <strong>de</strong>l rango razonable <strong>de</strong><br />

valores <strong>de</strong>terminado por el conjunto <strong>de</strong> observaciones <strong>de</strong> cada sexo).<br />

Figura 8: Diagramas <strong>de</strong> caja para la variable Estatura agrupada por Sexo.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 11 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

6 Otras opciones para el manejo <strong>de</strong> datos en Statistix<br />

En este apartado repasaremos algunas <strong>de</strong> las opciones que nos ofrece Statistix para manejar conjuntos <strong>de</strong> datos.<br />

Muchas <strong>de</strong> estas operaciones serán muy útiles a la hora <strong>de</strong> organizar la información <strong>de</strong> nuestras variables.<br />

6.1 Transformación <strong>de</strong> variables<br />

6.1.1 Obtención <strong>de</strong> nuevas variables<br />

En muchas ocasiones, necesitaremos realizar alguna transformación <strong>de</strong> nuestros datos o crear nuevas variables<br />

a partir <strong>de</strong> operaciones sobre variables ya existentes. Por ejemplo, el índice <strong>de</strong> masa corporal IMC es una medida<br />

<strong>de</strong> asociación entre el peso y la estatura <strong>de</strong> un individuo. El IMC se ha utilizado como uno <strong>de</strong> los recursos para<br />

evaluar el estado nutricional <strong>de</strong> personas adultas, <strong>de</strong> acuerdo con los valores propuestos por la Organización<br />

Mundial <strong>de</strong> la Salud. Se calcula como<br />

IMC =<br />

Peso<br />

Estatura 2<br />

y se mi<strong>de</strong> en Kg=m 2 . ¾Cómo calcularíamos esta nueva variable en Statistix para los individuos <strong>de</strong>l conjunto <strong>de</strong><br />

datos <strong>de</strong> urgencias?<br />

Selecciona el menú Data I Transformations<br />

En el cuadro Transformation Expression <strong>de</strong>bes escribir la expresión para la nueva variable. Fíjate en el<br />

ejemplo <strong>de</strong> la Figura 9. La función Power seleccionada <strong>de</strong>l listado <strong>de</strong> funciones <strong>de</strong>l cuadro Functions<br />

calcula la potencia <strong>de</strong> or<strong>de</strong>n 2 <strong>de</strong> la variable Estatura.<br />

Pulsa Go.<br />

Figura 9: Transformación <strong>de</strong> variables.<br />

Ejercicio:<br />

Realiza un análisis <strong>de</strong>scriptivo completo <strong>de</strong> la nueva variable IMC.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 12 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

6.1.2 Recodicación <strong>de</strong> variables en rangos<br />

En algunas ocasiones nos interesará agrupar en rangos los valores <strong>de</strong> una variable. Por ejemplo, la Organización<br />

Mundial <strong>de</strong> la Salud clasica el estado nutricional <strong>de</strong> los adultos <strong>de</strong> acuerdo con el IMC como se muestra a<br />

continuación<br />

Clasicación IMC (Kg=m 2 )<br />

Infrapeso < 18:5<br />

Normal [18:5; 25)<br />

Sobrepeso [25; 30)<br />

Obeso 30<br />

Cuadro 2: Clasicación <strong>de</strong>l estado nutricional <strong>de</strong> adultos <strong>de</strong> acuerdo con el IMC.<br />

Crearemos una nueva variable IMCclas a partir <strong>de</strong> IMC con la codicación:<br />

Infrapeso=0, Normal=1, Sobrepeso=2, Obeso=3.<br />

Selecciona el menú Data I Reco<strong>de</strong><br />

Elige como Source Variable la variable IMC y como<br />

Destination Variable la variable IMCclas.<br />

Introduce los antiguos y nuevos valores en los cuadros<br />

<strong>de</strong> texto. Se pue<strong>de</strong>n especicar rangos <strong>de</strong> valores utilizando<br />

un guion, como se muestra en la Figura.<br />

Ejercicio:<br />

Ponle etiquetas a los valores <strong>de</strong> la nueva variable IMCclas y representa un diagrama <strong>de</strong> tarta como<br />

el que se muestra a continuación.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 13 <strong>de</strong> 14


Bioestadística. Grado en Medicina<br />

<strong>Práctica</strong> 1: Análisis <strong>de</strong>scriptivo<br />

7 Ejercicios<br />

1. Una vez que se ha introducido un conjunto <strong>de</strong> datos, es posible añadir entre dos las <strong>de</strong> una variable<br />

uno o más datos nuevos usando la opción Data I Insert I Cases. Para ello <strong>de</strong>bes indicar el número <strong>de</strong><br />

la la que ocupará el primer dato nuevo y el número <strong>de</strong> las nuevas que quieres introducir. Comprueba<br />

el funcionamiento <strong>de</strong> esta opción modicando el conjunto <strong>de</strong> datos <strong>de</strong>l servicio <strong>de</strong> urgencias que has<br />

guardado en urgencias.sx. En la siguiente tabla se muestran los datos originales a los que se les han<br />

añadido 3 nuevos registros intermedios (las 7, 8 y 9).<br />

Sexo Peso Estatura Temperatura Visitas<br />

M 63 1.74 38 0<br />

M 58 1.63 36.5 2<br />

H 84 1.86 37.2 0<br />

M 47 1.53 38.3 0<br />

M 70 1.75 37.1 1<br />

M 57 1.68 36.8 0<br />

H 78 1.90 38.2 3<br />

H 75 1.72 36.5 2<br />

M 50 1.54 37 0<br />

H 87 1.82 38.4 1<br />

M 55 1.46 36.6 1<br />

Cuadro 3: Datos <strong>de</strong>l servicio <strong>de</strong> urgencias <strong>de</strong> un hospital con nuevos registros<br />

2. La opción Data I Delete se utiliza para borrar datos por bloques, o bien para eliminar variable. Practica<br />

con el conjunto <strong>de</strong> datos <strong>de</strong> urgencias a borrar registros o variables.<br />

3. La opción Data I Fill permite introducir repetidamente un mismo valor. Se utiliza especicando el valor<br />

que queremos introducir junto con el número <strong>de</strong> casillas que <strong>de</strong>be ocupar. Comprueba el funcionamiento<br />

<strong>de</strong> esta opción.<br />

4. Introduce el siguiente conjunto <strong>de</strong> datos en Statistix. Codica la variable Nivel <strong>de</strong> colesterol (Bajo=1,<br />

Medio=2, Alto=3). Guarda los datos en un archivo nivelcol.sx.<br />

Nivel <strong>de</strong> colesterol Edad<br />

Alto 65<br />

Alto 54<br />

Bajo 35<br />

Medio 45<br />

Alto 52<br />

5. Abre el chero <strong>de</strong> ejemplo <strong>de</strong> Statistix Alcohol.sx, que encontrarás en la carpeta Sample Data en el<br />

directorio <strong>de</strong> instalación <strong>de</strong> Statistix. ¾Qué representan las variables recogidas en dicho chero? Consulta<br />

las etiquetas para saber a qué se reere el conjunto <strong>de</strong> datos y las distintas variables.<br />

6. El chero Alcohol.txt contiene los datos <strong>de</strong> alcoholismo en formato texto. Importa los datos <strong>de</strong>s<strong>de</strong><br />

Statistix.<br />

7. El chero Alcohol.xls contiene los datos <strong>de</strong> alcoholismo en formato Excel. Importa los datos <strong>de</strong>s<strong>de</strong><br />

Statistix.<br />

Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 14 <strong>de</strong> 14

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!