Software y Manual - UCLA School of Public Health
Software y Manual - UCLA School of Public Health Software y Manual - UCLA School of Public Health
Software y Manual Versión 2.0 Cálculo de Tamaño Muestral y Selección de Conglomerados y Hogares en Encuestas Rápidas Muhammad N. Farid Ralph R. Frerichs Departamento de Epidemiología Universidad de California, Los Ángeles (UCLA) Los Ángeles, CA 90095-1772 USA
- Page 2 and 3: Junio, 2007 El programa Csurvey fue
- Page 4 and 5: - 3 -
- Page 6 and 7: Número Pueblo Tamaño Poblacional*
- Page 8 and 9: Tabla Discado Giratorio El número
- Page 10 and 11: Capítulo 2: Instalación Obtenga C
- Page 12 and 13: Csurvey 2.0 - Asistente de Instalac
- Page 14 and 15: programa ofrecerá una última opor
- Page 16 and 17: Csurvey 2.0 - Asistente de Instalac
- Page 18 and 19: Removiendo Csurvey de la Computador
- Page 20 and 21: Suponga que usted está planeando u
- Page 22 and 23: - 21 -
- Page 24 and 25: como se muestra en la Figura 3.4. P
- Page 26 and 27: Parámetro de Encuesta Datos de Con
- Page 28 and 29: Ahora, los límites de confianza an
- Page 30 and 31: Suponga que la cobertura de inmuniz
- Page 32 and 33: Preparándose para una Encuesta Rá
- Page 34 and 35: Csurvey 2.0 Selección Aleatoria de
- Page 36 and 37: Csurvey 2.0 C- Survey Versión 2.0
- Page 38 and 39: Importar desde un archivo de Micros
- Page 40 and 41: Csurvey 2.0 C- Survey Selección Al
- Page 42 and 43: En la parte inferior derecha de la
- Page 44 and 45: Tamaño Muestral: Estimación de Pa
- Page 46 and 47: Csurvey 2.0 C- Survey Selección al
- Page 48 and 49: Csurvey 2.0 C- Survey Versión 2.0
- Page 50 and 51: Parámetro de encuesta Datos de con
<strong>S<strong>of</strong>tware</strong> y <strong>Manual</strong><br />
Versión 2.0<br />
Cálculo de Tamaño Muestral y<br />
Selección de Conglomerados y Hogares<br />
en Encuestas Rápidas<br />
Muhammad N. Farid<br />
Ralph R. Frerichs<br />
Departamento de Epidemiología<br />
Universidad de California, Los Ángeles (<strong>UCLA</strong>)<br />
Los Ángeles, CA 90095-1772 USA
Junio, 2007<br />
El programa Csurvey fue inicialmente programado para DOS (para computadoras<br />
compatibles con IBM) por Iwan Ariawan, de la Universidad de Indonesia, mientras<br />
realizaba estudios de postgrado en <strong>UCLA</strong> en un programa patrocinado por el Programa<br />
de Entrenamiento en VIH/SIDA de Fogarty International. Csurvey se basó en un<br />
programa de Hoja de Cálculo creado por el Pr<strong>of</strong>esor Ralph R. Frerichs, el cual fue<br />
usado por muchos años en su curso de <strong>UCLA</strong>, EPI 418 Encuestas Epidemiológicas<br />
Rápidas en Países en Desarrollo. Después de asistir al curso EPI 418, Muhammad N.<br />
Farid, también patrocinado por el Programa de Entrenamiento en VIH/SIDA de Fogarty<br />
International, diseñó y programó la Versión 2 de Csurvey en ambiente Windows.<br />
Después de la creación de la Versión 2 del programa, el presente manual fue escrito por<br />
el Pr<strong>of</strong>esor Frerichs en conjunto con Muhammad Farid.<br />
Este manual fué traducido al Español por Danilo Rayo 1<br />
Rodriguez-Lainz 2<br />
y editado por Alfonso<br />
Este manual y el programa de s<strong>of</strong>tware son de dominio público y pueden ser<br />
copiados y distribuidos sin restricción. Ni el manual ni el programa deberían ser<br />
vendidos para obtener un beneficio financiero.<br />
1 Director, DRB Consulting , Managua, Nicaragua. www.drbcons.com<br />
2 <strong>Public</strong> <strong>Health</strong> Institute, Oakland, California http://www.phi.org/<br />
- 1 -
Tabla de contenidos<br />
Capítulo 1: Introducción<br />
¿Qué es Csurvey? ....................................................................................... ..... 4<br />
Selección de Conglomerados ............................................................... 4<br />
Tamaño muestral .................................................................................. 5<br />
Número aleatorio .................................................................................. 6<br />
¿Cómo está organizado este manual? ............................................................... 8<br />
Capítulo 2: Instalación<br />
Obtenga Csurvey del sitio web de Epidemiología de <strong>UCLA</strong> ........................... 9<br />
Instale Csurvey en la unidad C: de su computadora ........................................ 9<br />
Cómo remover CSurvey de su computadora ..................................................... 18<br />
Capítulo 3: Ejemplo General<br />
Tamaño muestral inicial .................................................................................... 19<br />
Estimación de parámetros .......................................................................19<br />
Prueba de hipótesis ................................................................................ 27<br />
Preparación para una encuesta rápida .................................................................31<br />
Parámetros de encuestas ......................................................................... 34<br />
Datos de conglomerados .........................................................................37<br />
Revisión del tamaño muestral .................................................................40<br />
Implementación de una encuesta rápida<br />
Muestreo por probabilidad proporcional al tamaño en 1 a etapa ........... 44<br />
Muestreo por probabilidad proporcional al tamaño en 1 a etapa<br />
en comunidades con múltiples conglomerados ..................................... 46<br />
Otras funciones ................................................................................................. 50<br />
Discado giratorio para seleccionar una dirección aleatoria ................... 51<br />
Números aleatorios ............................................................................... 54<br />
Capítulo 4: Explicación Detallada<br />
Tamaño muestral – estimación de parámetros ................................................. 56<br />
Tamaño muestral – prueba de hipótesis ........................................................... 60<br />
Muestreo por probabilidad proporcional al tamaño en primera etapa ............. 65<br />
- 2 -
- 3 -
Capítulo 1: Introducción<br />
¿Qué es Csurvey?<br />
Csurvey es un programa para Windows que realiza las tareas necesarias para<br />
implementar encuestas rápidas, llamadas también encuestas bietápicas (o de dos etapas)<br />
por conglomerados, con muestreo por probabilidad proporcional al tamaño (PPS por sus<br />
siglas en Inglés) en una primera etapa y un número constante de hogares o personas en<br />
una segunda etapa. Aunque los métodos de dichas encuestas pueden ser utilizados para<br />
encuestas de gran tamaño, éstas son generalmente pequeñas (i.e aplicadas a 300 hogares<br />
o individuos aproximadamente). El programa Csurvey 2.0 ha sido escrito para<br />
computadoras compatibles con Windows como una continuación al programa Csurvey<br />
1.5, escrito para DOS. El programa ayuda a seleccionar una muestra de conglomerados<br />
de una lista de los mismos, calcula el tamaño muestral para una encuesta por<br />
conglomerados y crea una tabla de números aleatorios para seleccionar hogares de<br />
inicio aleatorio o personas dentro de los hogares. Existen tres módulos principales en<br />
Csurvey, a saber, selección de conglomerados, tamaño muestral y números aleatorios.<br />
El detalle de estos módulos se presenta a continuación.<br />
Selección de conglomerados. El primer módulo selecciona una muestra de<br />
conglomerados de la lista total de los mismos utilizando el método de probabilidad<br />
proporcional al tamaño (PPS por sus siglas en inglés). Para realizar el muestreo de<br />
conglomerados, los usuarios deben crear una base de datos de origen, la cual contendrá<br />
el nombre y el tamaño de cada conglomerado en la población de la que se seleccionará<br />
la muestra. Esta base de datos puede ser creada utilizando Csurvey o puede ser<br />
importada de otros programas comunes de hoja de cálculo o administración de bases de<br />
datos. La Figura 1.1 muestra los conglomerados seleccionados en un archivo típico de<br />
bases de datos de origen.<br />
- 4 -
Número<br />
Pueblo<br />
Tamaño<br />
Poblacional*<br />
Número de<br />
Conglomerados<br />
Seleccionados<br />
Número<br />
de<br />
hogares<br />
Número<br />
de<br />
Personas<br />
Elegibles<br />
Número de<br />
Hogares Elegibles<br />
Personas<br />
Elegibles<br />
por<br />
Hogares<br />
Elegibles<br />
*Personas en la población como unidad de tamaño<br />
Figura 1.1 Módulo de selección de conglomerados de Csurvey.<br />
Tamaño muestral. El segundo módulo permite calcular el tamaño muestral requerido<br />
para una encuesta por conglomerados que satisfaga las necesidades del investigador.<br />
Los usuarios pueden evaluar un tamaño muestral propuesto o calcular el número<br />
mínimo de conglomerados o el promedio de personas por conglomerado que se<br />
necesitan para un intervalo de confianza especificado. La Figura 1.2 presenta la<br />
estimación del tamaño muestral para una muestra por conglomerados propuesta con una<br />
estimación del valor de prevalencia de 50%, un nivel de confianza del 95% y un<br />
intervalo de confianza entre 40 % y 60% (inclusive).<br />
- 5 -
Estimación de Parámetros<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
conglomerado<br />
Error estándar deseado de la proporción<br />
Error estándar observado de la proporción<br />
Efecto de diseño<br />
Proporción estimada que posee el atributo<br />
Mitad de la longitud del intervalo de confianza<br />
Nivel de confianza deseado:<br />
Parámetro de homogeneidad: Efecto de diseño<br />
Nivel de homogeneidad: Bajo<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
Número promedio de hogares seleccionados por conglomerado<br />
Tasa de homogeneidad<br />
Estimación puntual para la proporción<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta por<br />
conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para la<br />
necesidad planteada? SI<br />
IC (Intervalo de confianza)<br />
Calcular<br />
Imprimir<br />
Figura 1.2 Módulo de tamaño muestral de Csurvey<br />
Números aleatorios. El tercer módulo se utiliza para crear una tabla de números<br />
aleatorios que puede ser impresa. Esta tabla es útil para seleccionar personas u hogares<br />
en los conglomerados muestreados. La Figura 1.3 presenta una tabla típica de números<br />
aleatorios para comunidades con menos de 500 hogares.<br />
- 6 -
Tabla<br />
Discado Giratorio<br />
El número máximo Generar Imprimir<br />
Figura 1.3 Módulo de números aleatorios de Csurvey<br />
- 7 -
¿Cómo está organizado este manual?<br />
El Capítulo 2 del manual de Csurvey describe el proceso de instalación del programa<br />
en una computadora compatible con Windows con una unidad C: que utilice dicho<br />
sistema operativo. Seguidamente, el Capítulo 3 <strong>of</strong>rece un ejemplo general de una<br />
encuesta rápida que podría ser planeada para la región de Yogyakarta en Indonesia.<br />
Posiblemente, los usuarios que estén familiarizados con la versión 1.5 de Csurvey para<br />
DOS no necesitarán información adicional para usar la versión nueva. Finalmente, el<br />
Capítulo 4 contiene la explicación técnica de las diferentes funciones disponibles en el<br />
programa Csurvey, incluyendo las fórmulas matemáticas que están incorporadas dentro<br />
del mismo.<br />
- 8 -
Capítulo 2: Instalación<br />
Obtenga Csurvey del sitio web de Epidemiología de <strong>UCLA</strong><br />
Para iniciar, el programa Csurvey debe ser descargado del sitio web de Epidemiología<br />
de <strong>UCLA</strong>. Posteriormente, este debe ser copiado a la unidad C: de la computadora de<br />
destino. El programa y las instrucciones para realizar la instalación se encuentran en<br />
http://www.ph.ucla.edu/epi/rapidsurvey.html, específicamente en la sección de<br />
s<strong>of</strong>tware. Una vez que el programa ha sido descargado y copiado a la unidad C:, el<br />
archivo de instalación debería aparecer tal y como se muestra en la Figura 2.1:<br />
Dirección<br />
C:\csurvey2<br />
Nombre Tamaño Tipo<br />
CS2setup 13,479 KB Aplicación<br />
Figura 2.1 Ubicación del programa Csurvey en la unidad C:<br />
Cómo instalar el Csurvey en la unidad C: de la computadora:<br />
Con el botón izquierdo del ratón, haga doble clic en el archivo CS2setup (ver Figura<br />
2.1) . La primera pantalla del proceso de instalación debería ser igual a la mostrada en la<br />
Figura 2.2.<br />
- 9 -
Csurvey 2.0 - Asistente de Instalación<br />
Selección Aleatoria de<br />
Conglomerados<br />
Determinación del Tamaño Muestral<br />
Generador de Números Aleatorios<br />
C-Survey<br />
Versión 2.0<br />
Instalador Atrás Siguiente Cancelar<br />
Figura 2.2: Pantalla inicial del proceso de instalación<br />
Al hacer clic con el botón izquierdo del ratón en el botón Siguiente, aparecerá lo<br />
presentado en la Figura 2.3, en la cual se recuerda al usuario que el material está<br />
protegido con derechos de autor y que no está destinado para la venta. Por el contrario,<br />
el programa está disponible gratuitamente para todas aquellas personas que quieran<br />
implementar encuestas basadas en la comunidad.<br />
- 10 -
Csurvey 2.0 - Asistente de Instalación<br />
Bienvenido al Asistente de Instalación de Csurvey 2.0<br />
El Asistente instalará Csurvey 2.0 en su<br />
computadora. Para continuar, haga clic en Siguiente<br />
CS<br />
ADVERTENCIA: Este programa está protegido por leyes<br />
de derechos de autor y tratados internacionales.<br />
Atrás Siguiente Cancelar<br />
Figura 2.3 Pantalla de bienvenida del proceso de instalación<br />
Al hacer clic nuevamente en el botón Siguiente aparecerá lo presentado en la Figura<br />
2.4, mostrando la ubicación en la cual el programa será instalado en la computadora. Si<br />
desea que el programa se instale en una ubicación diferente, haga clic con el botón<br />
izquierdo del ratón en el botón Cambiar y seleccione la ruta del nuevo directorio o sub<br />
directorio.<br />
- 11 -
Csurvey 2.0 - Asistente de Instalación<br />
Carpeta de Destino<br />
Instalar Csurvey 2.0<br />
en:<br />
Haga clic en el botón Siguiente para instalar<br />
en esta carpeta o haga clic en ¨Cambiar¨<br />
para instalar en una carpeta distinta.<br />
C:\Archivos de Programa\Csurvey<br />
Cambiar<br />
Instalador Atrás Siguiente Cancelar<br />
Figura 2.4: Subdirectorio de destino para el programa Csurvey.<br />
Nota: En este caso, el programa está siendo instalado como un sub directorio en la ruta<br />
C:\Archivos de programa\Csurvey2. Los archivos de ejemplo (cuya extensión es *.csf)<br />
también serán instalados en esa carpeta a menos de que se seleccione una nueva<br />
ubicación haciendo clic en el botón ‘Cambiar’. Si la ubicación es correcta, haga clic en<br />
el botón ‘Siguiente’ para continuar. Antes de que se lleve a cabo la instalación, el<br />
- 12 -
programa <strong>of</strong>recerá una última oportunidad para visualizar el sub-directorio de destino,<br />
tal y como se muestra en la Figura 2.5.<br />
Csurvey 2.0 - Asistente de Instalación<br />
Listo para Instalar el Programa<br />
El asistente esta listo para comenzar la instalación<br />
Si desea revisar o cambiar cualquiera de los parámetros de instalación, haga<br />
clic en ¨Atrás¨. Haga clic en ¨Cancelar para salir del asistente.<br />
Parámetros actuales<br />
Tipo de Instalación<br />
Típica<br />
Carpeta de Destino<br />
C:\Archivos de Programa\Csurvey<br />
Información del Usuario<br />
Nombre:<br />
Su Nombre<br />
Compañía:<br />
Instalador Atrás Siguiente Cancelar<br />
Figura 2.5: Revisión del subdirectorio de destino<br />
- 13 -
Los archivos necesarios serán copiados por el programa de instalación a la ubicación<br />
seleccionada. Mientras este proceso se realiza, la pantalla mostrará el progreso del<br />
mismo, tal y como se muestra en la Figura 2.6.<br />
Csurvey 2.0 - Asistente de Instalación<br />
Instalando Csurvey 2.0<br />
Las funciones del programa que usted seleccionó están<br />
siendo instaladas<br />
Por favor espere mientras el Asistente instala Csurvey 2.0. Esto podría<br />
tardar varios minutos<br />
Estatus:<br />
Copiando los archivos nuevos<br />
Instalador Atrás Siguiente Cancelar<br />
Figura 2.6 Instalación de los archivos de Csurvey<br />
Una vez completado el proceso anterior, la pantalla presentada en la Figura 2.7<br />
aparecerá, indicando que el programa ha sido instalado exitosamente.<br />
- 14 -
Csurvey 2.0 - Asistente de Instalación<br />
Asistente de Instalación Completado<br />
El Asistente ha instalado Csurvey 2.0 exitosamente.<br />
Haga clic en Finalizar para salir del asistente<br />
CS<br />
Atrás Finalizar Cancelar<br />
Figura 2.7 Instalación exitosa de Csurvey<br />
Haga clic en Finalizar con el botón izquierdo del ratón.<br />
- 15 -
Ubicación de los archivos. Si abre el subdirectorio de destino en la unidad C:, los<br />
archivos mostrados en la Figura 2.8 deberían aparecer.<br />
Nombre Tamaño Tipo<br />
csurvey<br />
conglomerado<br />
Aplicación<br />
Archivo de Micros<strong>of</strong>t Excel<br />
Maestro de Presentaciones<br />
Extensión de Aplicación<br />
Figura 2.8 Archivos instalados en el subdirectorio<br />
Csurvey2.<br />
El programa Csurvey está instalado ahora.<br />
Iniciar Csurvey. Para iniciar el programa, lleve el ratón a la parte inferior izquierda<br />
del Escritorio de Windows y haga clic con el botón izquierdo en .<br />
Posteriormente seleccione , seguido de .<br />
Finalmente seleccione .<br />
- 16 -
Removiendo Csurvey de la Computadora<br />
Cómo Desinstalar Csurvey. Si desea desinstalar Csurvey, el procedimiento es el<br />
mismo que para instalarlo. Sin embargo, en el último paso se debe hacer clic en<br />
. El programa entonces preguntará si el usuario está seguro de querer<br />
desinstalar Csurvey, tal y como se muestra en la Figura 2.9<br />
Instalador de Windows<br />
Está seguro que desea desinstalar este producto?<br />
Si<br />
Figura 2.9 Pantalla de confirmación para desinstalar Csurvey<br />
No<br />
Haga clic en sí y el programa empezará el proceso de desinstalación, removiendo<br />
Csurvey de la computadora.<br />
- 17 -
Capítulo 3: Ejemplo General<br />
Posiblemente, la mejor manera de aprender a utilizar Csurvey sea mediante un ejemplo,<br />
utilizando datos de Indonesia, los cuales están incluidos en el programa. El programa<br />
está destinado a asistir al usuario en las diversas tareas requeridas para las encuestas<br />
rápidas. Para obtener mayor información sobre este tipo de encuestas visite<br />
http://www.ph.ucla.edu/epi/rapidsurvey.html.<br />
Después de iniciar el programa Csurvey (como se describió al final del Capítulo 2),<br />
aparecerá la pantalla mostrada en la Figura 3.1.<br />
Csurvey 2.0<br />
CS<br />
Archivo de<br />
trabajo:<br />
El Programa<br />
Internacional de<br />
Entrenamiento<br />
e Investigación<br />
sobre SIDA<br />
de <strong>UCLA</strong>/Fogarty<br />
Selección Aleatoria de<br />
Conglomerados<br />
Determinación del Tamaño Muestral<br />
Generador de Números Aleatorios<br />
C-Survey<br />
Versión 2.0<br />
Contáctenos<br />
Figura 3.1 Pantalla de inicio de Csurvey.<br />
- 18 -
Suponga que usted está planeando una encuesta rápida pero aún no ha realizado la<br />
estimación del tamaño muestral que es<br />
Crear un archivo .CSF<br />
Crear<br />
Archivos tipo<br />
Cancelar<br />
Figura 3.2 Creación del archivo de trabajo samplesize.csf<br />
necesario para realizar la encuesta. Para hacer esto, considere los dos íconos<br />
en la parte superior derecha de la pantalla.<br />
Tamaño muestral inicial<br />
Estimación de Parámetros. Haga clic con el botón izquierdo del ratón en<br />
para crear un archivo temporal de trabajo llamado samplesize.csf. Introduzca el texto tal<br />
y como se muestra en la Figura 3.2.<br />
Posteriormente haga clic en el botón para crear el archivo de trabajo. La<br />
pantalla mostrada en la Figura 3.3 debería aparecer.<br />
- 19 -
Csurvey 2.0<br />
Selección Aleatoria<br />
de Conglomerados<br />
CS C- Survey Determinación del<br />
Tamaño Muestral<br />
Versión 2.0<br />
Generador de<br />
Números<br />
Aleatorios<br />
Archivo de trabajo:<br />
Parámetro<br />
de encuesta<br />
Datos de Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Nombre de la encuesta<br />
Unidad primaria de muestreo<br />
Unidad de tamaño<br />
Unidad última de muestreo<br />
Unidad<br />
elegible<br />
Tamaño muestral<br />
-Conglomerados<br />
-Hogares por conglomerado<br />
Información<br />
Adicional<br />
Número promedio de personas por hogar<br />
Proporción de personas elegibles<br />
Proporción de hogares elegibles<br />
El Programa<br />
Internacional de<br />
Entrenamiento e<br />
Investigación sobre<br />
SIDA de<br />
<strong>UCLA</strong>/Fogarty<br />
Contáctenos OK Cancelar Imprimir<br />
Figura 3.3 Pantalla de inicio (no utilizada en este momento)<br />
La pantalla está dividida en cinco secciones, con pestañas en la parte superior<br />
mostrando los nombres de las mismas. Al abrir esta pantalla, la primera pestaña,<br />
Parámetros de Encuesta, aparece resaltada. El usuario utilizará esta pestaña en un<br />
momento posterior, una vez que esté disponible la información para la encuesta<br />
específica a realizar. La sección Tamaño Muestral está dividida en dos partes,<br />
Estimación de Parámetros ( la cual será presentada inicialmente) y Prueba de Hipótesis<br />
(la cual será presentada posteriormente). Por el momento, para completar el proceso de<br />
planificación haga clic con el botón izquierdo del ratón en botón<br />
pantalla mostrada en la Figura 3.4 debería aparecer.<br />
y la<br />
- 20 -
- 21 -
Csurvey 2.0<br />
C- Survey<br />
Selección Aleatoria de<br />
Conglomerados<br />
Versión 2.0<br />
Determinación del Tamaño<br />
Muestral<br />
Archivo de trabajo:<br />
Generador de Números Aleatorios<br />
Parámetro<br />
de Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Estimación de Parámetros<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
conglomerado<br />
Proporción estimada que posee el<br />
atributo<br />
Mitad de la longitud del intervalo de<br />
confianza<br />
Nivel de confianza<br />
deseado<br />
Parámetro de<br />
homogeneidad<br />
Nivel de homogeneidad<br />
Número promedio de personas elegibles por hogar<br />
Número de<br />
conglomerados<br />
Número promedio de hogares seleccionados por conglomerado<br />
Error estándar deseado de la proporción<br />
Error estándar observado de la proporción<br />
Efecto de diseño<br />
Tasa de homogeneidad<br />
Estimación puntual para la proporción<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta por<br />
conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para la<br />
necesidad planteada?<br />
IC (Intervalo de confianza)<br />
El Programa<br />
Internacional de<br />
Entrenamiento e<br />
Investigación sobre<br />
SIDA de<br />
<strong>UCLA</strong>/Fogarty<br />
Contáctenos Calcular Imprimir<br />
Figura 3.4 Pantalla de la sección ´Tamaño muestral´, utilizada para estimar una<br />
proporción.<br />
Dado que usted considerará diversas estimaciones de tamaño muestral para un<br />
parámetro de interés, seleccione la opción Probar el tamaño muestral propuesto, tal y<br />
- 22 -
como se muestra en la Figura 3.4. Para determinar el tamaño muestral para una<br />
encuesta rápida, usted necesitará cuatro valores: 1) su mejor estimación de la proporción<br />
que posee el atributo de interés en la población a ser muestreada, 2) la mitad de la<br />
longitud del intervalo de confianza máximo que sería aceptable (i.e. el nivel de<br />
precisión deseado), 3) el nivel de confianza deseado (ya sea 90%, 95% -el nivel usual- ó<br />
99%) y 4) una estimación del efecto de diseño esperado o la tasa de homogeneidad. El<br />
efecto de diseño es una medida de cuanto más grande es la varianza en una encuesta<br />
rápida (i.e. una encuesta bietápica por conglomerados) en comparación con un grupo de<br />
tamaño similar con datos recolectados mediante muestreo aleatorio simple. Para<br />
encuestas de inmunización, por ejemplo, el valor del efecto de diseño para la estimación<br />
del tamaño muestral se establece en 2.0 frecuentemente. Mientras la tasa de<br />
homogeneidad (o coeficiente de correlación intraclase) es utilizada frecuentemente por<br />
encuestadores experimentados con conocimiento del atributo de interés sobre la base de<br />
encuestas rápidas previas, el efecto de diseño es usado con mayor frecuencia por<br />
aquellos investigadores que no cuentan con dicha información.<br />
Para este ejemplo, suponga, en primer lugar, que un 20% de la población muestreada<br />
poseerá el atributo de interés. Por ende, usted deberá digitar 0.20 en el espacio ubicado a<br />
la derecha de la etiqueta Proporción estimada con atributo. En segundo lugar, suponga<br />
que el nivel de confianza deseado es del 95% y que la mitad de la longitud del intervalo<br />
de confianza es de cinco puntos porcentuales (i.e. 0.05) o que el límite inferior del<br />
intervalo de confianza es 15% y el límite superior de dicho intervalo es 25%. En tercer<br />
lugar, suponga que el efecto de diseño será bajo (i.e. 2.0), que habrá una persona<br />
elegible por hogar (un supuesto frecuente en encuestas de inmunización de niños entre<br />
los 12 y 23 meses de edad), que habrán 30 conglomerados que serán seleccionados en la<br />
primera etapa y 10 hogares con una persona elegible en cada uno que serán<br />
seleccionados en la segunda etapa. Una vez que se introduzca toda esta información,<br />
haga clic en y la Figura 3.5 aparecerá.<br />
- 23 -
- 24 -
Parámetro<br />
de Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Estimación de Parámetros<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
conglomerado<br />
Error estándar deseado de la proporción<br />
Error estándar observado de la proporción<br />
Efecto de diseño<br />
Proporción estimada que posee el atributo<br />
Mitad de la longitud del intervalo de confianza<br />
Nivel de confianza deseado<br />
Parámetro de homogeneidad: Efecto de Diseño<br />
Nivel de homogeneidad: Bajo<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
Número promedio de hogares seleccionados por conglomerado<br />
Tasa de homogeneidad<br />
Estimación puntual para la proporción<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta por<br />
conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para la<br />
necesidad planteada?<br />
IC (Intervalo de confianza)<br />
Calcular<br />
Imprimir<br />
Figura 3.5 Tamaño muestral inadecuado para los limites de confianza deseados<br />
Note que los límites de confianza inferiores y superiores correspondientes al tamaño<br />
muestral especificado serían 13.3% y 26.7%, respectivamente, un intervalo de confianza<br />
más grande que el solicitado (para el cual los límites inferiores y superiores eran 15% y<br />
25%, respectivamente). Para obtener los límites de confianza deseados, la Figura 3.5<br />
muestra que el error estándar para el parámetro estimado no debería exceder un valor de<br />
0.0244. Para el tamaño muestral seleccionado, el error estándar observado de la<br />
proporción es de 0.0327, es decir, demasiado alto para lo esperado. Por esta razón, el<br />
programa contesta con un ´No´ la pregunta ¿Es el tamaño muestral adecuado para la<br />
necesidad planteada? En este punto, usted puede incrementar los límites de confianza<br />
aceptables, incrementar el número de conglomerados, incrementar el número de hogares<br />
seleccionados por conglomerado o, con conocimiento adicional del diseño muestral,<br />
reducir el coeficiente de correlación intraclase de manera que éste se aproxime a cero (el<br />
nivel de una muestra aleatoria simple). Por ahora, suponga que el tamaño de los límites<br />
de confianza deseados permanece fijo en +/- 5 puntos porcentuales y que existen<br />
suficientes fondos y tiempo para muestrear una grupo más grande, siempre<br />
considerando 30 conglomerados y estableciendo que habrán 18 personas por<br />
conglomerado, tal y como se muestra en la Figura 3.6.<br />
- 25 -
Parámetro<br />
de Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Estimación de Parámetros<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
conglomerado<br />
Error estándar deseado de la<br />
proporción<br />
Error estándar observado de la<br />
proporción<br />
Efecto de diseño<br />
Proporción estimada que posee el atributo<br />
Mitad de la longitud del intervalo de confianza<br />
Nivel de confianza deseado<br />
Parámetro de homogeneidad: Efecto de Diseño<br />
Nivel de homogeneidad: Bajo<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
Número promedio de hogares seleccionados por conglomerado<br />
Tasa de homogeneidad<br />
Estimación puntual para la<br />
proporción<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta<br />
por conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para<br />
la necesidad planteada?<br />
IC (Intervalo de confianza)<br />
Calcular<br />
Imprimir<br />
Figura 3.6 Tamaño muestral adecuado para los límites de confianza deseados<br />
- 26 -
Ahora, los límites de confianza anticipados son 15% y 25%, es decir, el intervalo<br />
aceptable para el investigador. En lugar de una muestra de 300 personas –como se<br />
observaba en la Figura 3.5-, el tamaño de la muestra ahora ha aumentado a 540<br />
personas. Por ende, debe notarse que el incremento de la precisión tiene su precio, lo<br />
que se observará en el aumento del tiempo y trabajo utilizado para muestrear a 240<br />
personas adicionales. El pequeño gráfico presentado en la parte inferior derecha de la<br />
figura muestra los límites confianza esperados al 90%, 95% y 99%, lo cual es útil para<br />
explicar el concepto de límites de confianza a personas que no están familiarizadas con<br />
nociones estadísticas.<br />
Si las partes involucradas con la encuesta planificada consideran que estos valores son<br />
aceptables, entonces haga clic en el botón<br />
, firme y escriba la fecha sobre<br />
la página que será impresa y entréguela a la persona o agencia que está financiando la<br />
encuesta planificada.<br />
Prueba de Hipótesis: Podría ser que en lugar de determinar la prevalencia o incidencia<br />
de un atributo, usted esté interesado en comparar un cambio de un atributo en el tiempo<br />
o en comparar el nivel de un atributo en varias regiones. Generalmente, este tipo de<br />
estudios se realizan para evaluar cambios, tales como aumentos en niveles de<br />
vacunación, reducción de consumo de cigarrillos, aumentos en el uso de condón, entre<br />
otros. Para implementar una evaluación de este tipo, el programa proporciona<br />
información de dos encuestas rápidas del mismo tamaño e indica si el tamaño muestral<br />
es suficiente para detectar una diferencia en las dos proporciones de interés con un nivel<br />
aceptable de precisión, de acuerdo a las especificaciones del investigador.<br />
En la sección Tamaño Muestral, haga clic en Prueba de Hipótesis en la parte derecha<br />
del panel. Note que la parte izquierda cambiará, tal y como se muestra en la Figura 3.7.<br />
- 27 -
Parámetro<br />
de Encuesta<br />
Datos de<br />
Conglomerado<br />
Estimación de Parámetros<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de<br />
conglomerados<br />
Calcular el número promedio en la<br />
muestra por conglomerado<br />
Valor estimado de la primera proporción<br />
Valor estimado de la segunda proporción<br />
Mitad de la longitud del intervalo de confianza<br />
Nivel de confianza deseado<br />
Parámetro de homogeneidad<br />
Nivel de homogeneidad<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
Número promedio de hogares seleccionados por conglomerado<br />
Error estándar deseado de la diferencia de las<br />
proporciones<br />
Error estándar observado de la diferencia de las<br />
proporciones<br />
Efecto de diseño<br />
Tasa de homogeneidad<br />
Estimación puntual de la diferencia de proporciones<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta por<br />
conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para la necesidad<br />
planteada?<br />
IC (Intervalo de confianza)<br />
El Programa Internacional<br />
de Entrenamiento e<br />
Investigación sobre SIDA de<br />
<strong>UCLA</strong>/Fogarty<br />
Contáctenos<br />
Calcular<br />
Imprimir<br />
Figura 3.7 Pantalla de tamaño muestral para probar la diferencia entre dos proporciones<br />
(i.e. prueba de hipótesis).<br />
- 28 -
Suponga que la cobertura de inmunización en una región es 20%. Suponga también que<br />
la cobertura de inmunización es 60% en otra región en la cual trabaja un grupo de salud<br />
más activo. Por ende, se piensa que la diferencia entre las dos regiones es de 40 puntos<br />
porcentuales. Usted está interesado en implementar dos encuestas rápidas para probar la<br />
hipótesis de que las dos regiones tienen coberturas de inmunización diferentes. Si bien<br />
el investigador y la agencias financiadoras creen que la diferencia entre ambas regiones<br />
es de 40 puntos porcentuales, están dispuestos a aceptar, con un nivel de confianza del<br />
95%, que la diferencia se encuentra entre 25 puntos porcentuales y 50 puntos<br />
porcentuales. Es decir, con una diferencia de 0.40, el intervalo de confianza al 95% no<br />
debería ser mayor de ±0.15. Al igual que se planteó anteriormente, se supone que el<br />
efecto de diseño será bajo, que el número promedio de personas elegibles por hogar<br />
será 1.0, que el número de conglomerados será 30 y que el número de hogares que serán<br />
seleccionados en cada conglomerado puede tomar varios valores –en el caso de este<br />
ejemplo este valor es 12-.<br />
Los valores estimados que se ajustan a los requerimientos del investigador o la agencia<br />
financiera se muestran en la Figura 3.8. Tal y como se ha mencionado, se estima que la<br />
diferencia entre las dos proporciones es 0.40. Para dos encuestas con 360 individuos<br />
cada una, el resultado será un intervalo de confianza al 95% entre 0.3 y 0.5 para la<br />
diferencia entre dos proporciones, el cual será aceptable para los requerimientos de<br />
precisión estipulados por el investigador. Una vez que dichos valores se consideren<br />
aceptables, la página debería ser impresa, firmada, fechada y entregada a la agencia o<br />
persona que financia la encuesta planeada.<br />
- 29 -
Parámetro<br />
de Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Estimación de Parámetros<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de<br />
conglomerados<br />
Calcular el número promedio en la<br />
muestra por conglomerado<br />
Valor estimado de la primera proporción<br />
Valor estimado de la segunda proporción<br />
Mitad de la longitud del intervalo de<br />
confianza<br />
Nivel de confianza deseado<br />
Parámetro de<br />
homogeneidad: Efecto de Diseño<br />
Nivel de homogeneidad: Bajo<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
Número promedio de hogares seleccionados por<br />
conglomerado<br />
Error estándar deseado de la diferencia de las<br />
proporciones<br />
Error estándar observado de la diferencia de las<br />
proporciones<br />
Efecto de diseño<br />
Tasa de homogeneidad<br />
Estimación puntual de la diferencia de proporciones<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta por<br />
conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para la necesidad<br />
planteada? SI<br />
IC (Intervalo de confianza)<br />
El Programa Internacional de<br />
Entrenamiento e Investigación<br />
sobre SIDA de <strong>UCLA</strong>/Fogarty<br />
Contáctenos<br />
Calcular<br />
Imprimir<br />
Figura 3.8 Tamaño muestral adecuado para los límites de confianza deseados<br />
- 30 -
Preparándose para una Encuesta Rápida<br />
El programa supone que el encuestador dispone de información demográfica sobre la<br />
población estudiada y requiere que éste tome decisiones sobre los detalles del diseño<br />
muestral bietápico por conglomerados. En la parte superior derecha se observan los dos<br />
botones siguientes: El botón de la izquierda se utiliza para crear nuevos<br />
archivos de programa con datos de la población estudiada. Por<br />
otro lado, el botón de la derecha se utiliza para trabajar con archivos existentes que<br />
contienen datos de la población estudiada.<br />
Dado que esta sección del Capítulo 3 demuestra el trabajo con datos existentes, haga<br />
clic con el botón izquierdo de su ratón en el botón El Programa debería<br />
encontrar dos archivos de ejemplo, a saber, yogya.csf y vil9_yogya.csf (y<br />
posiblemente el archivo SAMPLESIZE.csf si ha seguido los pasos de la sección<br />
Tamaño Muestral Inicial de este capítulo) tal y como se muestra en la Figura 3.9.<br />
- 31 -
Abrir archivo de<br />
datos CSF<br />
Buscar en:<br />
Csurvey2<br />
Mis documentos<br />
recientes<br />
Escritorio<br />
Mis documentos<br />
Mi PC<br />
Mis sitios de red<br />
Abrir un archivo con<br />
extensión .CSF<br />
Abrir<br />
Archivos tipo *.CSF Cancelar<br />
Figura 2.9 Archivos con extensión CSF mostrados en el programa CSurvey<br />
Página de<br />
códigos<br />
Seleccione yogya.csf y haga clic con el botón izquierdo del ratón en ‘Abrir’. Esto hará<br />
que aparezca la pantalla mostrada en la Figura 3.10.<br />
- 32 -
Csurvey 2.0<br />
Selección Aleatoria de<br />
Conglomerados<br />
C- Survey Determinación del Tamaño<br />
Muestral<br />
Versión 2.0<br />
Generador de Números<br />
Aleatorios<br />
Archivo de trabajo:<br />
Parámetro de<br />
encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Nombre de la<br />
encuesta Encuesta de Salud Infantil en Yogyakarta, Indonesia, 2006<br />
Unidad primaria<br />
de muestreo<br />
Unidad de<br />
tamaño<br />
Unidad última<br />
de muestreo<br />
Pueblo/localidad<br />
Población<br />
Hogar<br />
Unidad elegible Niños entre los 12 y 23 meses de edad<br />
Tamaño<br />
muestral<br />
-<br />
Conglomerados<br />
-Hogares por<br />
conglomerado<br />
Información<br />
Adicional<br />
Número promedio de personas por hogar<br />
Proporción de personas elegibles<br />
Proporción de hogares elegibles<br />
El Programa<br />
Internacional de<br />
Entrenamiento e<br />
Investigación sobre SIDA<br />
de <strong>UCLA</strong>/Fogarty<br />
Contáctenos OK Cancelar Imprimir<br />
Figura 3.10 Abriendo la pantalla de Csurvey para el archivo yogya.csf, un archivo de<br />
ejemplo.<br />
- 33 -
Como puede observarse, la pantalla se divide en cinco secciones, con pestañas<br />
mostrando los nombres de las mismas. Al abrir esta pantalla, la primera pestaña, a<br />
saber, Parámetros de Encuesta, aparecerá seleccionada.<br />
Parámetros de Encuesta. En esta pestaña se incluyen campos que deben ser llenados<br />
por el usuario con información descriptiva sobre la encuesta propuesta y la población a<br />
estudiar. Dicha información se utiliza en la primera etapa de una encuesta rápida, es<br />
decir, durante la etapa de selección de los conglomerados a través del método de<br />
Probabilidad Proporcional al Tamaño (PPS por sus siglas en inglés). En primer lugar<br />
aparece el nombre de la encuesta y a éste le sigue la unidad primaria de muestreo(i.e.<br />
UPM). Las UPMs se identifican sobre la base del número de personas (i.e. población),<br />
hogares o alguna otra unidad de tamaño. En el caso de este ejemplo, las UPMs (o<br />
pueblos/localidades) se listan por tamaño poblacional. La unidad última de<br />
muestreo(UUM) en el ejemplo es un hogar y las unidades elegibles a ser incluidas en la<br />
encuesta son todos los niños con edades entre los 12 y 23 meses. El número de<br />
conglomerados (o grupos de individuos u hogares de tamaño constante) que serán<br />
seleccionados por el programa en la primera etapa del muestreo son 25, el número<br />
mínimo para este tipo de encuestas dado que el número usual de conglomerados<br />
seleccionados es 30. Otra información que debe ser proporcionada por el usuario<br />
incluye la población por hogar (i.e. el número promedio de personas por hogar en la<br />
población en la que se seleccionará la muestra), la proporción de personas elegibles (i.e.<br />
la proporción de la población entre los 12 y 23 meses de edad), y la proporción de<br />
hogares elegibles (i.e. la proporción de todos los hogares en la población a ser<br />
muestreada que tienen uno o más niños entre los 12 y 23 meses de edad). Generalmente,<br />
el usuario no conocerá los valores exactos de las variables de hogar. Sin embargo,<br />
debería ser capaz de proveer estimaciones razonables de dichos valores, de tal manera<br />
que éstos sean apropiados para la planificación de una encuesta. En el ejemplo mostrado<br />
en la Figura 3.10, el hogar promedio en la región de Yogyakarta tiene 4.5 personas. Por<br />
otro lado, los niños entre las edades de 12 y 23 meses conforman el 2% de la población<br />
total (i.e. 0.02) y se estima que el 9% de los hogares en la población estudiada (i.e. 0.09)<br />
tienen un niño entre las edades de12 y 23 meses.<br />
A continuación haga clic en la pestaña de datos de conglomerado para ver la<br />
información de la población estudiada (ver Figura 3.11)<br />
- 34 -
Csurvey 2.0<br />
C- Survey<br />
Versión 2.0<br />
Selección Aleatoria de<br />
Conglomerados<br />
Determinación del Tamaño<br />
Muestral<br />
Generador de Números<br />
Aleatorios<br />
Archivo de trabajo:<br />
Parámetro de<br />
encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Número Pueblo/localidad Población*<br />
El Programa<br />
Internacional de<br />
Entrenamiento e<br />
Investigación<br />
sobre SIDA de<br />
<strong>UCLA</strong>/Fogarty<br />
*Personas en la población como<br />
unidad de tamaño<br />
Contáctenos Agregar Insertar Editar Borrar Imprimir Anexar desde .CSF .XLS<br />
Figura 3.11 Datos de población por conglomerado.<br />
- 35 -
Para la realización de cualquier encuesta rápida, la información poblacional de todas las<br />
comunidades que conforman la población estudiada debe ser introducida por el<br />
investigador. Para hacer esto, la persona a cargo de la implementación de la encuesta<br />
puede crear un archivo *.csf nuevo, anexar un archivo *.csf creado previamente (ver<br />
parte inferior derecha de la Figura 3.11) o anexar un archivo *.xls usando el programa<br />
de Hoja de Cálculo Micros<strong>of</strong>t Excel (ver parte inferior derecha de la Figura 3.11). Si se<br />
selecciona la opción de anexar un archivo de Micros<strong>of</strong>t Excel (i.e. *.xls), aparecerá una<br />
pantalla que guía al investigador en el proceso de digitación de datos, tal y como se<br />
muestra en la Figura 3.12.<br />
- 36 -
Importar desde un archivo de Micros<strong>of</strong>t Excel<br />
Para importar datos de conglomerados desde MS Excel, el archivo debería<br />
ajustarse a los siguientes criterios:<br />
1. No hay encabezados de columna en la fila 1;<br />
2. El número 9 se coloca en la columna A para los conglomerados que serán<br />
importados;<br />
3. El nombre y tamaño del conglomerado (i.e. población u hogares) se colocan en<br />
las columnas C y D, respectivamente;<br />
4. Las columnas que no sean A, C y D deberán dejarse en blanco; y<br />
5. Sólo la Hoja 1 del libro de trabajo de Excel se utilizará para importar los datos.<br />
A continuación se presenta un ejemplo<br />
Continuar<br />
Cancelar<br />
Figura 3.12 Formato para importar datos desde Micros<strong>of</strong>t Excel.<br />
Datos de conglomerado. El conjunto de datos de ejemplo mostrado en la Figura 3.11<br />
contiene información para 45 pueblos, cuya población estimada se presenta en la<br />
columna D. Los datos pueden ser fácilmente editados o impresos, usando los botones<br />
ubicados en la parte inferior de la Figura 3.11.<br />
Para asegurarse que el tamaño muestral especificado en la Figura 3.10 es el adecuado<br />
para satisfacer las necesidades del investigador, haga clic en la pestaña etiquetada<br />
tamaño muestral, tal y como se muestra en la Figura 3.13.<br />
- 37 -
- 38 -
Csurvey 2.0<br />
C- Survey Selección Aleatoria de<br />
Conglomerados<br />
Versión 2.0<br />
Determinación del Tamaño<br />
Muestral<br />
Archivo de trabajo:<br />
Generador de Números<br />
Aleatorios<br />
Parámetro de<br />
Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Estimación de Parámetros<br />
Prueba de Hipótesis<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
conglomerado<br />
Error estándar deseado de la<br />
proporción<br />
Error estándar observado de la<br />
proporción<br />
Efecto de diseño<br />
Proporción estimada que posee el atributo<br />
Mitad de la longitud del intervalo de confianza<br />
Nivel de confianza deseado<br />
Parámetro de homogeneidad Efecto de Diseño<br />
Nivel de homogeneidad Bajo<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
Número promedio de hogares seleccionados por conglomerado<br />
Tasa de homogeneidad<br />
Estimación puntual para la<br />
proporción<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta<br />
por conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para<br />
la necesidad planteada?<br />
IC (Intervalo de confianza)<br />
El Programa<br />
Internacional de<br />
Entrenamiento e<br />
Investigación sobre<br />
SIDA de <strong>UCLA</strong>/Fogarty<br />
Contáctenos Calcular Imprimir<br />
Figura 3.13 Revisión del tamaño muestral especificado para una encuesta bietápica por<br />
conglomerados.<br />
- 39 -
Revisión del Tamaño Muestral. En este ejemplo, el valor de la proporción del atributo<br />
de interés es de 0.20 (ó 20%). El investigador está dispuesto a aceptar límites de<br />
confianza entre 0.12 y 0.28 (ó entre 12% y 28%) con un nivel de confianza del 95%. En<br />
otras palabras, la mitad de la longitud del intervalo de confianza es 0.08. Dado que se<br />
trata de una encuesta por conglomerados, la estimación de la varianza será<br />
probablemente mayor que la observada en una encuesta que utilice muestreo aleatorio<br />
simple. La medida en la que la varianza será mayor será estimada ya sea por el efecto de<br />
diseño o la tasa de homogeneidad. En el ejemplo, el efecto de diseño es seleccionado y<br />
se le asigna un nivel de homogeneidad bajo, lo cual equivale a un efecto de diseño de<br />
2.0. Además, se especifica que se trata de una encuesta pequeña, con 25 conglomerados<br />
y 10 niños entre las edades de 12 y 23 meses en cada uno de ellos. Para el ejemplo de<br />
Indonesia, las 10 unidades de muestreo por conglomerado son 10 hogares con uno o<br />
más niños entre las edades de 12 y 23 meses. ¿Es este tamaño muestral adecuado? Para<br />
asegurarse, haga clic en el botón (el cual importará la información apropiada de la<br />
pestaña de Parámetros de Encuesta). A continuación haga clic en el botón<br />
En el ejemplo presentado en la Figura 3.13, el tamaño muestral para la encuesta<br />
propuesta sería de 250 personas ó 25 conglomerados con 10 hogares elegibles en cada<br />
uno de éstos con 1 niño entre los 12 y 23 meses de edad en cada hogar elegible. En este<br />
ejemplo, el error estándar deseado de la proporción no debería exceder el valor de<br />
0.0363 para satisfacer los criterios introducidos por el investigador en la primera<br />
columna de la sección de Tamaño Muestral. Sobre la base del tamaño muestral<br />
estimado, el error estándar observado de la proporción es 0.0358, un valor menor que el<br />
error estándar máximo deseado, es decir, 0.0363. Por ende, el tamaño muestral<br />
propuesto es adecuado para la necesidad planteada, lo que ocasiona que el programa<br />
responda sí. Con un nivel bajo de homogeneidad (tal y como lo definió el investigador),<br />
el programa supone un efecto de diseño de 2.0 (i.e. la varianza de la encuesta por<br />
conglomerados será el doble de la varianza de una encuesta similar que utilice muestreo<br />
aleatorio simple) y una tasa de homogeneidad de 0.1111. La media y los límites de<br />
confianza al 95% son estimados como proporciones con valores de 0.2000 (0.1262,<br />
0.2738) o como porcentajes con valores de 20% (12.6%, 27.4%), respectivamente.<br />
- 40 -
En la parte inferior derecha de la pestaña Tamaño Muestral, se presenta un pequeño<br />
gráfico, tal y como se muestra en la Figura 3.14<br />
.<br />
Figura 3.14 Gráfico de los límites de confianza al 90%, 95% y 99% para los parámetros<br />
de encuesta propuestos.<br />
La información sobre el tamaño muestral debería ser compartida con la persona o<br />
agencia que financia la encuesta para determinar si la precisión de las estimaciones es<br />
aceptable. Es decir, debería buscarse una respuesta a la pregunta: ¿sería aceptable<br />
realizar una encuesta de un atributo que tiene una prevalencia del 20% (i.e. 0.20) y<br />
límites de confianza de 13% a 27% con un nivel de confianza del 95%? Es importante<br />
mencionar también que con este tamaño muestral el investigador podría aceptar, con un<br />
nivel de confianza del 90%, que el intervalo de confianza de 14% a 26% contendría al<br />
verdadero valor. A la vez, el investigador podría aceptar, con un nivel de confianza del<br />
99%, que el intervalo de confianza de 10% a 30% encerraría al verdadero valor,<br />
suponiendo, claro está, que no existe sesgo. Si el tamaño muestral se considera<br />
aceptable, el investigador debería presionar el botón para imprimir una<br />
copia de la pantalla del Tamaño Muestral y proporcionarla a la agencia financiera para<br />
mostrar los valores que deberían esperarse. La página que se imprimiría (incluyendo<br />
todo el texto pero no el gráfico) se muestra en la Figura 3.15.<br />
- 41 -
- 42 -
Tamaño Muestral: Estimación de Parámetros<br />
Propósito del cálculo:<br />
Proporción estimada que posee el atributo<br />
Mitad de la longitud del intervalo de confianza<br />
Nivel de confianza deseado<br />
Parámetro de homogeneidad<br />
Nivel de homogeneidad<br />
Número de conglomerados<br />
Número promedio de la muestra por conglomerado<br />
Probar el tamaño muestral<br />
propuesto<br />
Efecto de Diseño<br />
Bajo<br />
Error estándar deseado de la proporción<br />
Error estándar observado de la proporción<br />
Efecto de diseño<br />
Tasa de homogeneidad<br />
Estimación puntual de la proporción<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
Tamaño muestral para la encuesta por conglomerados propuesta<br />
¿Es el tamaño muestral adecuado para la necesidad planteada?<br />
SI<br />
Intervalo de confianza al 90%<br />
Intervalo de confianza al 95%<br />
Intervalo de confianza al 99%<br />
Figura 3.15 Información impresa sobre el tamaño muestral para la estimación de<br />
parámetros<br />
- 43 -
En la sección de Parámetros de Encuesta (mostrada en la Figura 3.10), se ordenó al<br />
programa que seleccionara 25 conglomerados por el método de probabilidad<br />
proporcional al tamaño (PPS por sus siglas en Inglés) de una lista poblacional de 45<br />
localidades o comunidades. Dado que el módulo de Tamaño Muestral mostró que tanto<br />
el número de conglomerados y hogares por conglomerado era aceptable, se cuenta con<br />
las condiciones necesarias para continuar con el proceso de implementación de<br />
encuestas rápidas.<br />
Implementando una Encuesta Rápida<br />
Muestreo por Probabilidad Proporcional al Tamaño en la Primera Etapa. Las<br />
encuestas rápidas se implementan mediante un proceso de dos etapas. En la primera<br />
etapa, se seleccionan conglomerados por medio del método de probabilidad<br />
proporcional al tamaño (PPS por sus siglas en inglés). En la segunda etapa se selecciona<br />
un número igual de hogares (o quizás personas) en cada uno de los conglomerados<br />
seleccionados en la primera etapa. Este método de muestreo asegura que los datos de la<br />
encuesta sean auto-ponderados y no requieran ponderaciones estadísticas especiales<br />
para su análisis. Las encuestas auto-ponderadas pueden ser analizadas con mayor<br />
facilidad que las encuestas ponderadas.<br />
Los datos poblacionales en el archivo yogya.csf fueron presentados en la sección Datos<br />
de Conglomerado (Figura 3.11). Para ver la muestra estimada mediante probabilidad<br />
proporcional al tamaño, haga clic en la pestaña Selección de Conglomerados, tal y<br />
como se muestra en la Figura 3.16.<br />
- 44 -
Csurvey 2.0<br />
C- Survey<br />
Selección aleatoria de conglomerados<br />
Archivo de trabajo:<br />
Versión 2.0<br />
Determinación del tamaño muestral<br />
Generador de números aleatorios<br />
Parámetro de<br />
encuesta<br />
Datos de<br />
conglomerado<br />
Selección de<br />
conglomerados<br />
Tamaño<br />
muestral<br />
Número<br />
aleatorio<br />
Conglomerado seleccionado por el método de<br />
Probabilidad Proporcional al Tamaño con<br />
reemplazo (PPS-WR por sus siglas en Inglés)<br />
Ultima selección:<br />
Número<br />
Pueblo/<br />
Localidad<br />
Tamaño<br />
Poblacional*<br />
Número de<br />
Conglomerados<br />
Seleccionados<br />
Número<br />
de<br />
hogares<br />
Número de<br />
Personas<br />
Elegibles<br />
Número<br />
de<br />
Hogares<br />
Elegibles<br />
Personas<br />
Elegibles<br />
por<br />
Hogares<br />
Elegibles<br />
*Personas en la población como unidad de tamaño<br />
El Programa<br />
Internacional<br />
de<br />
Entrenamiento<br />
e Investigación<br />
sobre SIDA de<br />
<strong>UCLA</strong>/Fogarty<br />
Contáctenos Ejecutar Imprimir<br />
Figura 3.16 Muestra de 25 conglomerados con probabilidad proporcional al tamaño<br />
(PPS).<br />
La mayoría de los pueblos seleccionados tienen un conglomerado de 10 hogares que<br />
será seleccionado en la segunda etapa. Sin embargo, algunos de los pueblos tienen más<br />
de un conglomerado de 10 hogares que será seleccionado en la segunda etapa. Si un<br />
pueblo es grande, el investigador puede repetir el proceso de selección. Esto puede<br />
hacerse únicamente, claro está, para el número de conglomerados que serán<br />
seleccionados en dicho pueblo.<br />
- 45 -
Muestreo por Probabilidad Proporcional al Tamaño en la Primera Etapa en<br />
Comunidades con Conglomerados Múltiples. A continuación se presenta un ejemplo<br />
para el pueblo de 9.Wirogunan (mostrado en la línea 3 de la Figura 3.16), el cual tiene<br />
tres conglomerados que serán seleccionados. Para este propósito, el pueblo de<br />
Wirogunan se ha sub-dividido para hacer más fácil el trabajo del equipo de campo. Para<br />
ver los datos del pueblo de Wirogunan, haga clic en el botón , seleccione el<br />
archivo vil9_yogya.csf y seguidamente haga clic en el botón . Hecho esto,<br />
debería aparecer lo presentado en la Figura 3.17. Note que la figura muestra que hay<br />
tres conglomerados que serán seleccionados, no 25 como antes. También debe notar<br />
que el programa aún muestra 10 hogares por conglomerado. La información adicional<br />
sobre el tamaño de los hogares y datos por el estilo es la misma que se mostró en la<br />
Figura 3.10.<br />
- 46 -
Csurvey 2.0<br />
C- Survey<br />
Versión 2.0<br />
Selección Aleatoria de<br />
Conglomerados<br />
Determinación del Tamaño<br />
Muestral<br />
Generador de Números<br />
Aleatorios<br />
Archivo de trabajo:<br />
Parámetro de<br />
encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Nombre de la<br />
encuesta<br />
Unidad primaria de<br />
muestreo<br />
Unidad de tamaño<br />
Unidad última de<br />
muestreo<br />
Unidad elegible<br />
Encuesta de Salud Infantil en Yogyakarta, Indonesia, 2006<br />
Pueblo: Wirogunan<br />
Población<br />
Hogar<br />
Niños entre los 12 y 23 meses de edad<br />
Tamaño muestral<br />
-Conglomerados<br />
-Hogares por<br />
conglomerado<br />
Información<br />
Adicional<br />
Número promedio de personas por hogar<br />
Proporción de personas elegibles<br />
Proporción de hogares elegibles<br />
El Programa Internacional de<br />
Entrenamiento e<br />
Investigación sobre SIDA de<br />
<strong>UCLA</strong>/Fogarty<br />
Contáctenos OK Cancelar Imprimir<br />
Figura 3.17 Muestra de 3 conglomerados en el pueblo de Wirogunan.<br />
Para ver los datos del pueblo de Wirogunan, haga clic en la pestaña Datos de<br />
Conglomerado en la parte superior del panel. La Figura 3.18 debería aparecer.<br />
- 47 -
Parámetro de<br />
encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Número<br />
Región 1<br />
Región 2<br />
Región 3<br />
Región 4<br />
Región 5<br />
Pueblo:<br />
Wirogunan<br />
Población*<br />
*Personas en la población como<br />
unidad de tamaño<br />
Agregar Insertar Editar Borrar Imprimir Anexar desde .CSF .XLS<br />
Figura 3.18 Sub-regiones en el pueblo de Wirogunan<br />
La suma de las poblaciones de las cinco subregiones es 18,049, lo que equivale al total<br />
de la población de Wirogunan, tal y como se mostró en la Figura 3.16. Para seleccionar<br />
los tres conglomerados de Wirogunan que fueron originalmente indicados en la Figura<br />
3.16, haga clic en la pestaña Selección de Conglomerados. Tal y como se observa en la<br />
Figura 3.19, tres de las cinco sub-regiones ahora tienen un conglomerado seleccionado<br />
en cada una de ellas.<br />
- 48 -
Parámetro<br />
de<br />
encuesta<br />
Datos de<br />
conglomerado<br />
Selección de<br />
conglomerados<br />
Tamaño<br />
muestral<br />
Número<br />
aleatorio<br />
Conglomerado seleccionado por el método de Probabilidad<br />
Proporcional al Tamaño con reemplazo<br />
(PPS-WR por sus siglas en Inglés)<br />
Ultima selección:<br />
Número<br />
Pueblo:<br />
Wirogunan<br />
Tamaño<br />
Poblacional*<br />
Número de<br />
Conglomerados<br />
Seleccionados<br />
Número<br />
de<br />
hogares<br />
Número<br />
de<br />
Personas<br />
Elegibles<br />
Número de<br />
Hogares Elegibles<br />
Personas<br />
Elegibles<br />
por<br />
Hogares<br />
Elegibles<br />
Región 1<br />
Región 2<br />
Región 4<br />
*Personas en la población como unidad de<br />
tamaño<br />
Ejecutar<br />
Imprimir<br />
Figura 3.19 Muestreo por probabilidad proporcional al tamaño (PPS) de tres<br />
conglomerados en las sub-regiones de Wirogunan.<br />
- 49 -
El mismo procedimiento puede ser repetido para otros pueblos en los cuales se<br />
seleccionó más de un conglomerado. De manera alternativa, los pueblos podría haberse<br />
dividido previamente en unidades más pequeñas de tal manera que un conglomerado<br />
tenga probabilidad de ser seleccionado en cada una de éstas. Sin embargo, esto podría<br />
implicar demasiado tiempo en lo que respecta a recolección, digitación, recuento y<br />
procesamiento de datos.<br />
Otras Funciones<br />
Existen dos funciones adicionales en el programa Csurvey, las cuales son útiles para la<br />
implementación de encuestas rápidas. Estas corresponden a la función de discado<br />
giratorio en una dirección aleatoria y la generación de una tabla de números aleatorios.<br />
En muchas regiones del mundo los hogares no están identificados o numerados<br />
claramente. Cuando se está ante ese tipo de situaciones, el procedimiento más frecuente<br />
para seleccionar un número constante de hogares (o individuos elegibles), en la segunda<br />
etapa, corresponde a la selección aleatoria del hogar con el cual se iniciará, para,<br />
posteriormente, continuar con el hogar vecino más cercano hasta que la cuota constante<br />
se complete. El objetivo de esto es lograr que cada hogar en el conglomerado tenga una<br />
probabilidad igual de ser seleccionado aleatoriamente como el hogar en el que se<br />
iniciará el proceso. El procedimiento se describe a continuación. Primero, el<br />
investigador se ubica en el centro del pueblo o sub-región. En segundo lugar, el<br />
investigador utiliza la herramienta de discado giratorio disponible en Csurvey para<br />
seleccionar una dirección aleatoria que le permitirá caminar hasta la periferia del pueblo<br />
o sub-región (i.e. un vector seleccionado aleatoriamente). En su trayecto por dicho<br />
vector, el investigador contará todos los hogares por los que pase (ver Figura 3.20).<br />
Estos se marcarán y se numerarán en un mapa dibujado a mano en el campo.<br />
Figura 3.20 Conteo de hogares a lo largo de un vector aleatorio camino a la periferia de<br />
un pueblo.<br />
- 50 -
Una vez que todos los hogares a lo largo del vector seleccionado sean contados y<br />
marcados en un mapa, uno de ellos se seleccionará por muestreo de una lista de<br />
números aleatorios. Dicha selección será un número entre 1 y el número del último<br />
hogar contado (i.e. el #10 en el ejemplo). El hogar seleccionado se considerará como el<br />
hogar de inicio aleatorio y será el punto inicial para obtener el número constante de<br />
hogares elegibles (o personas, si se cuenta con una persona elegible por hogar) para el<br />
conglomerado en cuestión.<br />
Discado Giratorio. Haga clic en la pestaña de Número Aleatorio en la parte superior<br />
del panel. Seguidamente, haga clic en Discado Giratorio (la sección ubicada a la<br />
derecha), tal y como se presenta en la Figura 3.20. Note que el disco giratorio está<br />
dividido en 8 secciones numeradas de un pastel circular.<br />
- 51 -
Parámetro de<br />
Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Tabla<br />
Discado Giratorio<br />
Girar<br />
Imprimir<br />
El número de dirección<br />
Figura 3.21 Discado giratorio para determinación de dirección aleatoria con el fin de<br />
seleccionar el hogar de inicio aleatorio<br />
Haga clic en<br />
y el disco empezará a girar y se detendrá en una dirección<br />
aleatoria. El número de esta dirección será señalado por la flecha y se mostrará en el<br />
espacio ubicado en la parte inferior derecha de la figura. Una vez que el proceso de<br />
discado se haya completado para el conglomerado especificado (este proceso sólo<br />
debería realizarse una vez para ajustarse a la teoría estadística), la página deberá<br />
imprimirse. Para hacer esto, haga clic en<br />
y una imagen de la dirección<br />
aleatoria determinada por el discado<br />
giratorio será impresa como se<br />
muestra en la Figura 3.22.<br />
- 52 -
Csurvey 2.0<br />
Dirección Determinada por Discado Giratorio<br />
El número de dirección: 3<br />
Figura 3.22 Formato impreso de discado giratorio para un conglomerado específico<br />
El proceso deberá repetirse para todos los conglomerados seleccionados, usualmente un<br />
total de 30. El número específico de conglomerado deberá anotarse en la parte superior<br />
del formato impreso, el cual deberá entregarse a cada encuestador correspondiente. Una<br />
vez que se cuenta con esta página, el personal de campo solamente necesitará una<br />
brújula pequeña y módica para determinar la dirección del vector aleatorio. Utilizando<br />
la brújula, el entrevistador deberá determinar la dirección Norte y luego caminar a lo<br />
largo de la línea imaginaria mostrada en el formato impreso del discado giratorio (i.e. #3<br />
en el ejemplo) hasta llegar a la periferia del pueblo o sub-región. Todos los hogares por<br />
- 53 -
los que el entrevistador pase en su trayecto deberán ser contados y listados en forma de<br />
mapa, como se mostró previamente en la Figura 3.20.<br />
Número aleatorio. Con el fin de seleccionar el hogar de inicio aleatorio, Csurvey<br />
generará una tabla de números aleatorios para cada equipo de campo. Si los pueblos o<br />
sub-regiones son pequeños, solamente se necesitarán números aleatorios de dos dígitos.<br />
De manera contrastante, si los pueblos o sub-regiones son medianos o grandes, una lista<br />
de números aleatorios de tres dígitos seria útil. Para generar una tabla de números<br />
aleatorios haga clic en la pestaña Número Aleatorio. A continuación, haga clic en Tabla.<br />
Dado que el ejemplo mostrado en la Figura 3.20 es muy pequeño, una lista de números<br />
aleatorios entre 1 y 50 es suficiente. Para crear dicha lista, introduzca el número 50 en el<br />
espacio al lado de la etiqueta Número Máximo –ubicada en la parte inferior izquierda de<br />
la pantalla- y haga clic en el botón<br />
para crear la tabla de números<br />
aleatorios. Un ejemplo de esta lista se muestra en la Figura 3.23.<br />
Parámetro de<br />
Encuesta<br />
Datos de<br />
Conglomerado<br />
Selección de<br />
Conglomerados<br />
Tamaño<br />
Muestral<br />
Número<br />
Aleatorio<br />
Tabla<br />
Discado Giratorio<br />
El número máximo Generar Imprimir<br />
Figura 3.23 Lista de números aleatorios de 1 a 50.<br />
- 54 -
La lista puede ser impresa haciendo clic en el botón<br />
Iniciando en un<br />
punto aleatorio en la lista, el encuestador lee hacia abajo la columna de números y hace<br />
lo mismo en las siguientes columnas hasta que un número aleatorio entre 1 y el número<br />
del último hogar ubicado en el vector de interés sea ubicado. Para el ejemplo de la<br />
Figura 3.20, se buscaría un número entre 1 y 10. Si ese número fuera 8, por ejemplo, el<br />
hogar con el número 8 en el mapa se identificaría como el hogar de inicio aleatorio. El<br />
equipo de campo retornaría al hogar número 8 y empezaría a buscar individuos<br />
elegibles, yendo de un hogar a su vecino más cercano, hasta que la cuota constante se<br />
complete.<br />
Para mayores detalles sobre encuestas rápidas, visite por favor<br />
http://www.ph.ucla.edu/epi/rapidsurvey.html. Con esto concluye la presentación de las<br />
funciones del programa Csurvey.<br />
- 55 -
Capítulo 4: Explicación Detallada<br />
Este capítulo proporciona una explicación breve pero detallada de cada procedimiento<br />
presentado en Csurvey. Para mayor información sobre encuestas rápidas, visite por<br />
favor http://www.ph.ucla.edu/epi/rapidsurvey.html.<br />
Tamaño Muestral - Estimación de Parámetros<br />
La pantalla de tamaño muestral para la estimación de parámetros fue descrita en el<br />
Capítulo 3 y presentada en la Figura 3.6. Las siguientes descripciones utilizan los<br />
valores presentados en la Figura 3.6.<br />
Valores que Deben ser Digitados por el Investigador<br />
Propósito del cálculo<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
conglomerado<br />
El investigador debe estimar el valor de la proporción<br />
que posee el atributo en la población muestreada. Este<br />
valor debe ser digitado en el espacio correspondiente.<br />
Proporción estimada que posee el atributo<br />
Mitad de la longitud del intervalo de confianza<br />
El investigador digita la precisión deseada de la<br />
proporción estimada que posee el atributo (d).La<br />
precisión es la mitad de la longitud del intervalo de<br />
confianza. Es igual a<br />
donde t es la t de<br />
Student que<br />
corresponde al<br />
nivel de confianza deseado y donde se(p) es el error<br />
estándar de la proporción (conocido también como la<br />
desviación estándar de la media muestral)<br />
Nivel de confianza deseado<br />
El investigador selecciona un nivel de confianza, de tres<br />
opciones posibles, a saber, 90%, 95%, 99%.<br />
Parámetro de Homogeneidad: Efecto de Diseño<br />
El investigador define parámetro de homogeneidad que<br />
pretende usar. La primera opción de parámetro es el<br />
efecto de diseño (el cual compara la varianza de la<br />
encuesta por conglomerados con la varianza de una<br />
encuesta de tamaño similar que utilice muestreo<br />
aleatorio simple). La segunda opción es la tasa de<br />
homogeneidad (la cual es una medida del coeficiente de<br />
correlación intraclase)<br />
- 56 -
Nivel de Homogeneidad: Bajo<br />
Número promedio de personas elegibles por hogar<br />
Número de conglomerados<br />
El investigador define el nivel anticipado del parámetro de<br />
homogeneidad. Las opciones son: igual que en una muestra<br />
aleatoria simple (i.e. ya sea un efecto de diseño con un<br />
valor de 1.0 o la tasa de homogeneidad equivalente), bajo<br />
(i.e. ya sea un efecto de diseño de 2.0 o la tasa de<br />
homogeneidad equivalente), medio (i.e. ya sea un efecto de<br />
diseño de 4.0 o la tasa de homogeneidad equivalente), alto<br />
(i.e. ya sea un efecto de diseño de 7.0 o la tasa de<br />
homogeneidad equivalente), o manual (i.e. definida por el<br />
investigador).<br />
El investigador tiene dos opciones. La primera permite<br />
al investigador digitar una estimación del número<br />
promedio de personas elegibles que residen en un<br />
hogar. La segunda opción es que el investigador deje<br />
que el programa proporcione este valor sobre la base de<br />
la información digitada en la pantalla Parámetros de<br />
Encuesta (Ver Figura 3.10).<br />
El investigador digita el número de conglomerados que<br />
serán muestreados en la primera etapa por medio de<br />
probabilidad proporcional al tamaño (PPS) –en el<br />
ejemplo se muestra el valor típico 30-. Este número<br />
debería ser mayor o igual a 25 para ajustarse a la teoría<br />
estadística correspondiente a una estimación de<br />
parámetros no sesgada.<br />
Número promedio de hogares seleccionados por<br />
conglomerado<br />
El investigador digita el número constante de hogares (o<br />
personas, si se cuenta con una persona por hogar<br />
elegible) que serán seleccionadas en cada conglomerado<br />
escogido.<br />
Una vez que el investigador ha introducido los diferentes valores, el programa calculará<br />
los valores muestrales que correspondan con los datos digitados. Como se ha<br />
mencionado anteriormente, la presentación se basa en los valores mostrados<br />
previamente en la Figura 3.6.<br />
- 57 -
Valores Calculados por el Programa<br />
Error estándar deseado de la proporción<br />
El programa determinará, sobre la base de los valores<br />
digitados por el investigador, el error estándar máximo<br />
que satisfará los deseos del este. El valor es el nivel de<br />
precisión deseado (d), dividido por el valor de la t de<br />
Student, el cual corresponde a 1 menos el número de<br />
conglomerados, de tal manera que<br />
El programa determinará, sobre la base de los valores<br />
digitados por el investigador, el error estándar cuya<br />
formula es:<br />
Error estándar observado de la proporción<br />
donde p es la proporción que posee el atributo de interés,<br />
q es igual a 1-p, roh es la tasa de homogeneidad (o<br />
coeficiente de correlación intraclase),<br />
es el número promedio de personas por<br />
conglomerado y n es el número de conglomerados.<br />
Efecto de diseño (deff)<br />
El programa determinará el efecto de diseño sobre la base<br />
de los valores digitados por el investigador. Si la tasa de<br />
homogeneidad (roh) fue digitada en lugar del efecto de<br />
diseño, el programa calculara el valor de este mediante la<br />
siguiente fórmula.<br />
donde<br />
arriba.<br />
tiene el mismo significado mencionado<br />
- 58 -
La tasa de homogeneidad (roh) puede ser un valor<br />
digitado por el investigador como una medida del<br />
coeficiente de correlación intraclase o puede ser<br />
calculada mediante la siguiente formula<br />
Tasa de homogeneidad (roh)<br />
donde<br />
y deff tienen el mismo significado<br />
mencionado arriba.<br />
Estimación puntual para la proporción<br />
La estimación puntual (p) fue previamente<br />
digitada por el investigador y se muestra<br />
nuevamente aquí.<br />
Los límites de confianza superior e inferior para el<br />
intervalo de confianza (IC) deseado se calculan por<br />
medio de la fórmula:<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
donde p es la estimación puntual, t es la t de<br />
Student – igual a 1 menos el número de<br />
conglomerados- (i.e. los grados de libertad para el<br />
análisis de un estimador de razones o<br />
proporciones ) y se(p) es el error estándar de la<br />
proporción.<br />
El tamaño muestral propuesto por el investigador<br />
es igual a:<br />
Tamaño muestral para la encuesta de conglomerados<br />
propuesta<br />
donde n es el número de conglomerados y<br />
es el número promedio de personas por<br />
conglomerado.<br />
El programa compara el error estándar se(p)<br />
calculado con el error estándar esperado sobre la<br />
base de los deseos del investigador y digita “Sí” si<br />
Es el tamaño muestral adecuado para la necesidad planteada?<br />
o “No” si<br />
donde se(p) es el error<br />
estándar de la proporción, d es la mitad de la<br />
longitud del intervalo de confianza y t es el valor<br />
de la t de Student –igual a 1 menos el número de<br />
conglomerados-.<br />
- 59 -
Finalmente, el programa calcula los intervalos de<br />
confianza al 90%, 95% y 99%, para la muestra<br />
propuesta. La fórmula para el intervalo de<br />
confianza es:<br />
Para el ejemplo de los 30 conglomerados (i.e. 29<br />
grados de libertad calculados en el análisis<br />
estadístico) los valores de t son 1.699, 2.045 y<br />
2.756 para los intervalos de confianza al 90%, 95%<br />
y 99%, respectivamente. Los valores de t usados<br />
por el programa dependen del número de<br />
conglomerados digitado por el investigador. Si el<br />
límite inferior de confianza es menor que cero o si<br />
el límite superior de confianza es mayor que 1, los<br />
valores serán truncados a 0 y 1, respectivamente.<br />
El programa calcula también el número mínimo de conglomerados que serían necesarios<br />
para satisfacer los deseos del investigador (suponiendo que el número promedio de<br />
personas elegibles por hogar y el número promedio de hogares por conglomerado hayan<br />
sido incluidos) o el número promedio en la muestra por conglomerados (suponiendo<br />
que el número promedio de personas elegibles por hogar y el número de conglomerados<br />
hayan sido incluidos).<br />
Tamaño Muestral – Prueba de Hipótesis<br />
La pantalla de tamaño muestral y su sección de prueba de hipótesis fue previamente<br />
descrita en el Capítulo 3 y mostrada en la Figura 3.8. Las siguientes descripciones<br />
utilizan los valores presentados en dicha figura.<br />
Valores que Deben ser Digitados por el Investigador<br />
Propósito del calculo:<br />
Probar el tamaño muestral propuesto<br />
Calcular el número mínimo de conglomerados<br />
Calcular el número promedio en la muestra por<br />
Conglomerados<br />
Valor estimado de la primera proporción<br />
Valor estimado de la segunda proporción<br />
El investigador debe estimar las proporciones que<br />
poseen el atributo de interés en las dos muestras que<br />
serán comparadas. El programa considerará la<br />
diferencia absoluta entre las dos proporciones<br />
(i.e. |p 2 -p 1 |). Por ende, el orden no es importante.<br />
- 60 -
Mitad de la longitud del intervalo de confianza<br />
El investigador debe digitar la precisión deseada de la<br />
diferencia absoluta estimada entre las dos<br />
proporciones. La precisión equivale a la mitad de la<br />
longitud del intervalo de confianza, la cual se<br />
representa por la letra d y se calcula por medio de la<br />
siguiente fórmula:<br />
donde t es la t de Student que corresponde al nivel de<br />
confianza deseado y<br />
es el error estándar<br />
de la diferencia entre las dos proporciones.<br />
Nivel de confianza deseado<br />
El investigador debe seleccionar uno de los tres niveles<br />
de confianza disponibles, a saber, 90%, 95% y 99%.<br />
Parámetro de homogeneidad: Efecto de Diseño<br />
El investigador debe establecer el parámetro de<br />
homogeneidad que pretende usar. La primera opción<br />
es el efecto de diseño –el cual compara la varianza de la<br />
diferencia entre las dos proporciones para una<br />
encuesta por conglomerados con la varianza de una<br />
encuesta de tamaño similar que utilice muestreo<br />
aleatorio simple. La segunda opción posible es la tasa<br />
de homogeneidad, la cual es una medida del<br />
coeficiente de correlación intraclase.<br />
Nivel de homogeneidad: Bajo<br />
El investigador debe establecer el nivel anticipado del<br />
parámetro de homogeneidad para la diferencia entre<br />
las dos proporciones. Las opciones son: igual que en<br />
una muestra aleatoria simple (i.e. ya sea un efecto de<br />
diseño con un valor de 1.0 o la tasa de homogeneidad<br />
equivalente), bajo (i.e. ya sea un efecto de diseño de<br />
2.0 o la tasa de homogeneidad equivalente), medio (i.e.<br />
ya sea un efecto de diseño de 4.0 o la tasa de<br />
homogeneidad equivalente), alto (i.e. ya sea un efecto<br />
de diseño de 7.0 o la tasa de homogeneidad<br />
equivalente), o manual (i.e. definida por el<br />
investigador).<br />
Número promedio de personas elegibles por hogar<br />
El investigador debe digitar una estimación del número<br />
promedio de personas que residen en un hogar o dejar<br />
que el programa calcule este valor sobre la base de la<br />
información digitada en la pantalla de Parámetros de<br />
Encuesta (Ver Figura 3.10).<br />
- 61 -
Número de conglomerados<br />
El investigador debe digitar el número de<br />
conglomerados a ser muestreados en la primera etapa<br />
utilizando el método de probabilidad proporcional al<br />
tamaño (PPS por sus siglas en inglés) para las dos<br />
encuestas. En el ejemplo, cada encuesta selecciona 30<br />
conglomerados, para un total de 60.<br />
Número promedio<br />
de hogares seleccionados<br />
por conglomerado<br />
El investigador debe digitar el número constante de<br />
hogares ( o personas si se cuenta con una persona por<br />
hogar elegible) que serán seleccionados en cada<br />
conglomerado escogido en las dos encuestas.<br />
Una vez que el investigador digita los diversos valores, el programa calculará los<br />
valores muestrales que correspondan con los datos digitados.<br />
- 62 -
Valores Calculados por el Programa<br />
Error estándar deseado de la diferencia<br />
de proporciones<br />
El programa determinará, sobre la base de los valores<br />
digitados por el investigador y para satisfacer los deseos<br />
de este, el error estándar máximo de la diferencia entre<br />
dos proporciones. El valor es el nivel de precisión deseado<br />
(d), dividido por el valor de la t de Student, el cual<br />
corresponde a 1 menos el número de conglomerados en<br />
cada encuesta, de tal forma que<br />
El programa determinará el error estándar -sobre la base<br />
de los valores digitados- por medio de la siguiente<br />
fórmula:<br />
Error estándar observado de la diferencia<br />
de proporciones<br />
donde p 1 y p 2 son las dos proporciones que poseen el<br />
atributo de interés y q 1 y q 2 equivalen a 1-p 1 y 1-p 2 ,<br />
respectivamente. Deff es el efecto de diseño, n es el<br />
número de conglomerados en cada una de las dos<br />
encuestas y es el número promedio de personas<br />
por conglomerado en cada una de las encuestas.<br />
El programa determinará el efecto de diseño sobre la base<br />
de los valores digitados. Si la tasa de homogeneidad (roh)<br />
fue digitada en lugar del efecto de diseño (deff), el<br />
programa calculará este último utilizando la siguiente<br />
fórmula:<br />
Efecto de Diseño(deff)<br />
donde tiene el mismo significado mencionado<br />
anteriormente.<br />
La tasa de homogeneidad (roh) puede ser digitada por el<br />
investigador como una medida del coeficiente de<br />
correlación intraclase o puede ser calculada por medio de<br />
la fórmula:<br />
Tasa de homogeneidad(roh)<br />
donde deff y tienen el mismo significado<br />
mencionado anteriormente.<br />
- 63 -
Estimación puntual para la diferencia de proporciones<br />
Las dos estimaciones puntuales (i.e. p 1 y p 2 ) fueron<br />
previamente digitadas por el investigador y son mostradas<br />
aquí como | p 2 - p 1 | ó | 0.60 - 0.20|.<br />
Los límites superiores e inferiores para el intervalo de<br />
confianza (IC) deseado se calculan por medio de la fórmula<br />
siguiente:<br />
Límite inferior de confianza<br />
Límite superior de confianza<br />
donde p 1 y p 2 son las dos estimaciones puntuales, t es el<br />
valor de la t de Student –igual a 1 menos el número de<br />
conglomerados- y<br />
es el error estándar de la<br />
diferencia entre las dos proporciones.<br />
El tamaño muestral propuesto por el investigador para<br />
cada una de las dos encuestas por conglomerados es igual<br />
a:<br />
Tamaño muestral para la encuesta<br />
por conglomerados propuesta<br />
Donde n es el número de conglomerados y es el<br />
número promedio de personas por conglomerado. El total<br />
es 720 en el ejemplo para las dos encuestas.<br />
El programa comparara el error estándar observado de las<br />
dos proporciones con el error estándar<br />
deseado<br />
por el investigador y digita “Si” si<br />
Es el tamaño muestral adecuado para la necesidad<br />
planteada?<br />
o “No” si<br />
donde se(p 2 -p 1 ) es el error estándar de la diferencia entre<br />
las dos proporciones, d es la mitad de la longitud del<br />
intervalo de confianza y t es el valor de la t de Student –<br />
igual a 1 menos el número de conglomerados-.<br />
Finalmente, el programa calcula los intervalos de confianza<br />
al 90%, 95% y 99% para la muestra propuesta. La fórmula<br />
del intervalo de confianza es:<br />
Para el ejemplo de 30 conglomerados (i.e. 29 grados de<br />
libertad calculados en el análisis estadístico) los valores de<br />
t son 1.699, 2.045 y 2.756 para los intervalos de confianza<br />
(IC) al 90%, 95% y 99%, respectivamente. Los valores de t<br />
usados por el programa dependen del número total de<br />
conglomerados digitados por el investigador.<br />
- 64 -
El programa calcula también el número mínimo de conglomerados que son necesarios<br />
para satisfacer los deseos del investigador (suponiendo que el número promedio de<br />
personas elegibles por hogar y el número promedio de hogares por conglomerado están<br />
incluidos) o el número promedio en la muestra por conglomerado (suponiendo que el<br />
número promedio de personas elegibles por hogar y el número de conglomerados están<br />
incluidos).<br />
Muestra por Probabilidad Proporcional al Tamaño en la Primera Etapa<br />
Para encuestas rápidas (i.e. encuestas bietápicas (o de dos etapas) por conglomerados),<br />
los conglomerados (pueblos, comunidades, cuadras, etc.) son seleccionados en una<br />
primera etapa por medio del método de probabilidad proporcional al tamaño. Una vez<br />
que los datos poblacionales son digitados para cada conglomerado, el programa crea<br />
una lista acumulada de la población muestreada y almacena información de la ubicación<br />
de cada conglomerado en dicha lista. Posteriormente, se selecciona un número aleatorio<br />
entre 1 y un número que equivale al total de la población muestreada. Seguidamente,<br />
este número es asignado al conglomerado correspondiente en la lista acumulada. El<br />
proceso se repite para cada uno de los conglomerados, usualmente 30 de ellos. Por lo<br />
anterior, los conglomerados son seleccionados aleatoriamente por medio del método de<br />
probabilidad proporcional al tamaño (PPS pos sus siglas en inglés) con reemplazo.<br />
- 65 -