02.07.2013 Views

Volumen 8 Número 2 Octubre 2010 - Blog de ESPOL - Escuela ...

Volumen 8 Número 2 Octubre 2010 - Blog de ESPOL - Escuela ...

Volumen 8 Número 2 Octubre 2010 - Blog de ESPOL - Escuela ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1001000101001010010101011000111010 ISSN Nº 1390 - 3802<br />

1010011001000101010100010100100010101001010110100101<br />

0010100100010010010111100101010010010100100100100101<br />

1010010001111001010100100101010010001001001001001010<br />

0100100100100100010010010010010100010100100101001001<br />

matemática<br />

0101000100100100100100100101001001001001001010010010<br />

0100100100010010010001001010010010010001001010010010<br />

0010100100100100100101001010010100101001010100100101<br />

UNA PUBLICACIÓN DEL ICM - <strong>ESPOL</strong><br />

1010110101001001001010010101010101010010011001010010<br />

0101010010010100101010010100100100101001001001010010<br />

<strong>Volumen</strong> 8 <strong>Número</strong> 2 <strong>Octubre</strong> <strong>2010</strong><br />

0100101001010101001001001010101100101010010010010010<br />

1001011001010101100100101010110101010100100110010100<br />

1100100101001010010001010100100100101001001010101010<br />

Z<br />

0110010100110010101010100010010100101010001010010100<br />

1001010011010010100100101001010010100101010010100100<br />

0101000100100100010100100100101010100100100101001011<br />

0100110101101010010010010100101001001001010010011110<br />

1001001001010010010010010010110110010100101010010100<br />

1010010101010101010010101001001100101001010110101011<br />

1100100101010010100101010111010010101001110010101010<br />

0101001010010100101100101001010101001111001010010101<br />

0010101001010010100101010011010101010110100101010100<br />

Y<br />

1010101001001010010111010100101011100101000101010000<br />

1111010101001011001011110101001001101000010010101111<br />

0100111010101010100011010101001011101010110101010110<br />

0101010110100100100111100110110101011101010010010111<br />

1110101001000100100100100100100100100001001001001000<br />

X<br />

1010100010100111001011101010101011101101101001011100<br />

1001111100101001010011001010010010110101000101001101<br />

0010100100101001010010100101010010100100100010100101<br />

0010101011000111010100010100101001100100010101010001<br />

0100100010101001010110100101001010010001001001011110<br />

0101010010010100100100100101101001000111100101010010<br />

<strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral - <strong>ESPOL</strong><br />

Instituto <strong>de</strong> Ciencias Matemáticas - ICM<br />

0101010010001001001001001010010010010010010001001001<br />

0010010100010100100101001001010100010010010010010010<br />

0101001000101001010010100101010010100100100010100101<br />

0010101011001000101001010010101011000111010100010100<br />

1010011001000101010100010100100010101001010110100101


INSTITUTO DE CIENCIAS MATEMÁTICAS<br />

El Instituto <strong>de</strong> Ciencias Matemáticas (ICM) es una unidad académica <strong>de</strong> la <strong>ESPOL</strong>.<br />

Des<strong>de</strong> el inicio la función <strong>de</strong>l ICM ha sido la docencia en Matemáticas, Ciencias<br />

Gráficas e Informática, para la formación <strong>de</strong> profesionales en ingeniería, tecnología<br />

y ciencias, habiendo tenido a su cargo en los albores <strong>de</strong> la <strong>ESPOL</strong>, el dictado <strong>de</strong> 10<br />

materias. Con el transcurso <strong>de</strong>l tiempo y acor<strong>de</strong> con la era <strong>de</strong> la información, el ICM<br />

creó en mayo <strong>de</strong> 1995 la carrera <strong>de</strong> “Ingeniería en Estadística Informática”, como<br />

alternativa en ingeniería en información y servicios. Posteriormente, con el fin <strong>de</strong><br />

garantizar la eficiencia en el control y gestión empresarial con profesionales<br />

capacitados y <strong>de</strong> excelencia se creó la carrera <strong>de</strong> “Auditoría y Control <strong>de</strong> Gestión”<br />

en mayo <strong>de</strong> 2000. También el Instituto ha incursionado en una <strong>de</strong> las más<br />

importantes ramas <strong>de</strong> la matemática aplicada que tiene gran<strong>de</strong>s aplicaciones en el<br />

mundo mo<strong>de</strong>rno, esto es la Investigación <strong>de</strong> Operaciones, la Teoría <strong>de</strong> Optimización,<br />

y particularmente las aplicaciones logísticas, a través <strong>de</strong>l ofrecimiento <strong>de</strong> programas<br />

<strong>de</strong> pre-grado y post-grado en estas áreas. Así es como <strong>de</strong>s<strong>de</strong> el año 2005 se<br />

viene ofreciendo la maestría en Control <strong>de</strong> Operaciones y Gestión Logística y <strong>de</strong>s<strong>de</strong><br />

el año 2006 la carrera <strong>de</strong> Ingeniería en Logística y Transporte.<br />

El ICM también cuenta con el CENTRO DE INVESTIGACIONES ESTADÍSTICAS, a<br />

través <strong>de</strong>l cual, se realizan: estudios <strong>de</strong> predicción, estudios actuariales, estudios <strong>de</strong><br />

mercado, diseños <strong>de</strong> experimentos, planificación y dirección <strong>de</strong> censos, análisis<br />

financieros, bases <strong>de</strong> datos estadísticos, formulación <strong>de</strong> proyectos, ingeniería <strong>de</strong> la<br />

calidad, etc.<br />

Entre otras activida<strong>de</strong>s que <strong>de</strong>sarrolla el ICM anualmente están: las JORNADAS EN<br />

ESTADÍSTICA E INFORMÁTICA que actualmente está en su décimoquinta versión, el<br />

CONCURSO INTERCOLEGIAL DE MATEMÁTICAS que se viene realizando en forma<br />

continúa <strong>de</strong>s<strong>de</strong> 1988.<br />

.<br />

Más información: www.icm.espol.edu.ec o escribirnos al e-mail: icm@espol.edu.ec, warmas@espol.edu.ec,<br />

eriva<strong>de</strong>n@espol.edu.ec, 30 ½ vía Perimetral: Edificios 25 – B Planta alta (Área <strong>de</strong> Institutos) Telfs.: (593-4)<br />

2269525 – 2269526, fax: (593–4) 853138.<br />

Guayaquil – Ecuador


matemática<br />

UNA PUBLICACIÓN DEL ICM – <strong>ESPOL</strong><br />

<strong>Volumen</strong> 8 <strong>Número</strong> 2 <strong>Octubre</strong> <strong>2010</strong><br />

Rector <strong>ESPOL</strong>: Ph.D. Moisés Tacle Galárraga<br />

Vicerrector General <strong>ESPOL</strong>: M.Sc. Armando Altamirano Chávez<br />

Director ICM: M.Sc. Washington Armas<br />

Subdirector ICM: M.Sc. Luis Rodríguez Ojeda<br />

Editor <strong>de</strong> publicaciones <strong>de</strong>l ICM: M.Sc. Eduardo Riva<strong>de</strong>neira<br />

Consejo Editorial ICM: M.Sc. Efrén Jaramillo Carrión<br />

M.Sc. Jorge Fernán<strong>de</strong>z Ronquillo<br />

M.Sc. Luis Rodríguez Ojeda<br />

Redacción y estilo: M.Sc. Janet Valdiviezo<br />

M.Sc. Gau<strong>de</strong>ncio Zurita Herrera<br />

Edición: Ing. Eva María Mera Intriago<br />

Srta. Carolina Carrasco Salas


matemática es una publicación <strong>de</strong>l Instituto <strong>de</strong> Ciencias Matemáticas <strong>de</strong><br />

la <strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral, y preten<strong>de</strong> constituirse en un órgano<br />

<strong>de</strong> difusión científico – tecnológico, con el fin <strong>de</strong> incentivar y motivar el<br />

<strong>de</strong>sarrollo y avance <strong>de</strong> la matemática y sus aplicaciones.<br />

matemática publica artículos teóricos y <strong>de</strong> tipo experimental tales como<br />

ensayos, resúmenes <strong>de</strong> tesis <strong>de</strong> grado y trabajos <strong>de</strong> investigación<br />

relacionados con la aplicación <strong>de</strong> la matemática en los diferentes ámbitos <strong>de</strong><br />

la realidad.


EDITORIAL<br />

La Universidad Ecuatoriana se encuentra ante el reto que le ha planteado la<br />

nueva ley <strong>de</strong> Educación Superior. La exigencia <strong>de</strong> que los académicos<br />

posean la más alta calificación y que sus investigaciones sean publicadas<br />

más allá <strong>de</strong> las fronteras <strong>de</strong> nuestro país, ha dado el golpe inicial para una<br />

avalancha <strong>de</strong> reformas que no siempre son bien acogidas.<br />

Nosotros, <strong>de</strong>s<strong>de</strong> aquí, confiamos en que todos estos requerimientos serán<br />

cumplidos y así nuestra universidad irá por camino seguro al nivel <strong>de</strong><br />

excelencia que todos aspiramos.<br />

Los que hacemos Revista Matemática estamos siempre dispuestos a<br />

fortalecer este proceso <strong>de</strong> superación, con nuestro humil<strong>de</strong> trabajo.


CONTENIDO<br />

EDITORIAL..................................................................................................... 5<br />

PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES<br />

SOCIOECONÓMICOS EN EL ECUADOR A PARTIR DE LA ENEMDU 2009<br />

Choez Geovanny…………………..........…………….................. 7<br />

APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL ESTUDIO DE<br />

REGISTROS ELECTROENCEFALOGRÁFICOS<br />

González Javier, Granados Carlos, López Hernán, Torres Iván…. 16<br />

ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ<br />

DE VARIANZAS Y COVARIANZAS DE VECTORES ALEATORIOS<br />

MULTIVARIADOS<br />

Montaño Néstor, Zurita Gau<strong>de</strong>ncio....………………….................... 22<br />

DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />

Páez Joseph………………………………….…………………… 33<br />

RESOLUCIÓN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA<br />

EL PROBLEMA DE LA DISPERSIÓN MÁXIMA<br />

Sandoya Fernando....................................................................……….. 41


matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />

<strong>2010</strong>, Vol. 8, No. 2<br />

PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS<br />

NIVELES SOCIOECONÓMICOS EN EL ECUADOR A PARTIR DE<br />

LA ENEMDU 2009<br />

1 Choez Geovanny<br />

Resumen. Se realizó este trabajo con el propósito <strong>de</strong> presentar una metodología preliminar para el cálculo <strong>de</strong> los niveles<br />

socioeconómicos en el Ecuador reflexionando en metodologías implementadas en países europeos y también en Chile. Se i<strong>de</strong>ntificaron<br />

8 niveles socioeconómicos a partir <strong>de</strong> la tenencia acumulada <strong>de</strong> bienes, cada uno <strong>de</strong> los bienes multiplicado por un factor obtenido a<br />

través <strong>de</strong>l análisis <strong>de</strong> componentes principales categórico. A<strong>de</strong>más se logró clasificar los bienes en primarios, secundarios y extras.<br />

Posteriormente se evalúo la relación estadística entre los niveles socioeconómicos obtenidos y variables que conceptualmente están<br />

vinculadas a estos. Los resultados son congruentes respecto a las metodologías implementadas en otros países.<br />

Palabras Clave: INEC, ENEMDU, Niveles socioeconómicos, componentes principales.<br />

Abstract. Introduction: This work presents a new methodology to calculate the social gra<strong>de</strong>s or social class in the Ecuador, taking into<br />

consi<strong>de</strong>ration implemented methodologies in countries in Europe and Chile. Objective: I<strong>de</strong>ntify the social level or social class in the<br />

Ecuadorian population using multivariate statistical methods. Methods: The statistical technique used is categorical principal<br />

components which provi<strong>de</strong> a factor based off the assets of the investigated people. Results: The analysis provi<strong>de</strong>s eight social levels<br />

where 1 is the lowest level and 8 is the highest level. Conclusions: These social gra<strong>de</strong>s obtained with this methodology are congruent<br />

between others revised methodologies.<br />

Key words. INEC, ENEMDU, Social gra<strong>de</strong>s, categorical componentes principales.<br />

Recibido: Agosto, <strong>2010</strong><br />

Aceptado: Septiembre, <strong>2010</strong><br />

1. INTRODUCCIÓN<br />

El Instituto Nacional <strong>de</strong> Estadística y Censos<br />

(INEC) consi<strong>de</strong>ra <strong>de</strong> suma importancia la<br />

estratificación socioeconómica en el país, por esto<br />

el área <strong>de</strong> análisis <strong>de</strong> la regional <strong>de</strong>l litoral <strong>de</strong>cidió<br />

explorar las bases teóricas y métodos estadísticos<br />

multivariados utilizados para la clasificación <strong>de</strong><br />

datos que permita establecer un marco <strong>de</strong><br />

referencia metodológico como guía en la<br />

clasificación <strong>de</strong> los hogares según los niveles<br />

socioeconómicos.<br />

Un primer trabajo referente a la temática se<br />

realizó utilizando la información <strong>de</strong> la Encuesta<br />

<strong>de</strong> Empleo, Desempleo y Subempleo (ENEMDU<br />

2008) y su modulo <strong>de</strong> opinión (auto percepción)<br />

en el que se construyó un mo<strong>de</strong>lo estadístico para<br />

<strong>de</strong>terminar las características o grupo <strong>de</strong><br />

características que mayor relación tienen con el<br />

bienestar <strong>de</strong>l hogar (según la percepción <strong>de</strong>l/la<br />

jefe/a <strong>de</strong>l hogar).<br />

Consecuentemente se <strong>de</strong>cidió realizar éste<br />

trabajo cuyo propósito es proponer una<br />

metodología preliminar para la estructuración <strong>de</strong><br />

los niveles socioeconómicos (NSE) <strong>de</strong> los hogares<br />

ecuatorianos, a través <strong>de</strong> la aplicación <strong>de</strong> métodos<br />

multivariados con los datos <strong>de</strong> la ENEMDU 2009.<br />

________________________<br />

1 Choez Geovanny, Ingeniero en Estadística e Informática,<br />

<strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>);<br />

Departamento <strong>de</strong> Análisis Socioeconómico, INEC.<br />

(e_mail: geovanny_choez@inec.gob.ec)<br />

Para el <strong>de</strong>sarrollo <strong>de</strong> la propuesta el primer<br />

objetivo es analizar los métodos estadísticos<br />

multivariados utilizados para la clasificación <strong>de</strong><br />

datos. Luego combinar los métodos para la<br />

estructuración <strong>de</strong> los niveles socioeconómicos <strong>de</strong><br />

los hogares ecuatorianos. Finalmente se quiere<br />

comparar los resultados <strong>de</strong> la metodología<br />

obtenida frente a otros métodos <strong>de</strong> estratificación<br />

<strong>de</strong> estudios similares.<br />

2. MARCO TEÓRICO<br />

NSE ESOMAR 2<br />

En 1997, y en respuesta a las necesida<strong>de</strong>s <strong>de</strong> la<br />

creciente investigación paneuropea en el mercado<br />

único, European Society for Opinion and<br />

Marketing Research 3 (ESOMAR) propuso un<br />

nuevo método <strong>de</strong> clasificación. Su objetivo era<br />

incrementar la convergencia <strong>de</strong> los criterios<br />

socioeconómicos y <strong>de</strong>mográficos utilizados en<br />

cada país para tabular los estudios <strong>de</strong> marketing y<br />

<strong>de</strong> opinión. La clasificación propuesta (Social<br />

Gra<strong>de</strong> Matrix) se investigó en los doce países que<br />

en 1997 formaban la Unión Europea sobre la base<br />

<strong>de</strong> las cerca <strong>de</strong> 90.000 entrevistas <strong>de</strong>l<br />

Eurobarómetro. Consiste en la utilización <strong>de</strong> los<br />

procedimientos que se aplican alternativamente<br />

según que el principal sustentador <strong>de</strong>l hogar sea<br />

2<br />

Transcrito <strong>de</strong>s<strong>de</strong> “Investigación Comercial 22 casos<br />

prácticos y un apéndice teórico”, Pg. 49, 50<br />

3<br />

Sociedad Europea para investigaciones <strong>de</strong> opinión y<br />

marketing.


laboralmente activo o inactivo. En el primer caso,<br />

la clase socioeconómica a la que pertenece el<br />

hogar se <strong>de</strong>fine según la posición profesional <strong>de</strong><br />

dicho sustentador y la edad a la que terminó sus<br />

estudios. Esta edad se ha ajustado para incluir<br />

cualquier período <strong>de</strong> educación o <strong>de</strong> formación<br />

profesional llevado a cabo <strong>de</strong>spués <strong>de</strong> la entrada<br />

G. CHOEZ<br />

8<br />

<strong>de</strong>l individuo en el mercado laboral. Por ejemplo,<br />

la persona que <strong>de</strong>jó la escuela a los 16 años pero<br />

recibió enseñanza especializada durante 20 meses<br />

mientras realizaba un trabajo remunerado, será<br />

catalogada como habiendo terminado los estudios<br />

a los 18 años.<br />

TABLA I<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Cuadro <strong>de</strong> resumen ESOMAR 1997<br />

Matriz <strong>de</strong> posición social (Activos)<br />

Edad a la que terminó los estudios (años)<br />

Ocupación 13 o menos 14 15-16 17-20 21 o más<br />

Director general con 6+ empleados<br />

Profesional autónomo<br />

D C1 B A A<br />

Empleado profesional<br />

Directivo con 6+ empleados<br />

Director general con 5- empleados<br />

D D C1 B A<br />

Mandos intermedios con 5- empleados<br />

Dueño o socio <strong>de</strong> empresa con 6+ empleados<br />

D D C2 C1 B<br />

Agricultura, gana<strong>de</strong>ría, pesca E3 E1 D C1 B<br />

Empleado<br />

Dueño o socio <strong>de</strong> empresa con -5 empleados<br />

E2 E1 D C2 C1<br />

Viajante o representante<br />

Obrero manual especializado<br />

E2 E1 D C2 C1<br />

Obrero manual no especializado E3 E3 E1 D D<br />

Se aplica una matriz alternativa cuando el<br />

principal sustentador <strong>de</strong>l hogar es inactivo,<br />

concepto que incluye los casos siguientes:<br />

jubilado, incapacitado físicamente, parado,<br />

temporalmente inactivo, estudiante y ama <strong>de</strong> casa.<br />

En estos casos, la posición social <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la<br />

situación económica <strong>de</strong>l hogar y <strong>de</strong> la edad a la<br />

que el sustentador principal terminó los estudios.<br />

El status económico es un índice que se calcula<br />

teniendo en cuenta el número <strong>de</strong> ítems poseídos<br />

<strong>de</strong>ntro <strong>de</strong> la siguiente lista: televisión en color,<br />

vi<strong>de</strong>o, vi<strong>de</strong>ocámara, dos o más coches, proyector<br />

<strong>de</strong> diapositivas, or<strong>de</strong>nador personal, taladro<br />

eléctrico, freidora eléctrica, reloj <strong>de</strong> radio y<br />

segunda vivienda. Esta lista se revisará en el<br />

futuro <strong>de</strong>pendiendo <strong>de</strong> si alguno <strong>de</strong> los ítems se ha<br />

generalizado y ha <strong>de</strong>jado <strong>de</strong> ser discriminante en<br />

los hogares europeos.<br />

TABLA II<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Cuadro <strong>de</strong> resumen ESOMAR 1997<br />

Status<br />

Matriz <strong>de</strong> posición social (Inactivos)<br />

Edad a la que terminó los estudios<br />

<strong>Número</strong> <strong>de</strong> ítems poseídos 13 o menos 14 15-16 17-20 21 o más<br />

5 o más D C1 B A A<br />

4 D C2 C1 B A<br />

3 D C2 C1 B B<br />

2 E1 E1 E1 C2 C1<br />

1 E3 E2 E1 C2 C1<br />

0/NC E3 E3 E2 D D


PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />

PARTIR DE LA ENEMDU 2009<br />

3. MARCO CONCEPTUAL<br />

ENEMDU.-<br />

Encuesta <strong>de</strong> Empleo, Desempleo y Subempleo.<br />

ESOMAR 43 . –<br />

European Society for Opinion and Marketing<br />

Research<br />

Métodos estadísticos multivariados.-<br />

Según Daniel Peña (2002) los métodos<br />

estadísticos multivariados para el análisis <strong>de</strong> datos<br />

compren<strong>de</strong> el estudio estadístico <strong>de</strong> varias<br />

variables medidas en elementos <strong>de</strong> una población<br />

con los siguientes objetivos:<br />

• Resumir los datos mediante un pequeño<br />

conjunto <strong>de</strong> nuevas variables.<br />

• Encontrar grupos en los datos, si existen.<br />

• Clasificar nuevas observaciones en grupos<br />

<strong>de</strong>finidos.<br />

• Relacionar dos conjuntos <strong>de</strong> variables.<br />

INEC.-<br />

Instituto Nacional <strong>de</strong> Estadística y Censos.<br />

Niveles Socioeconómicos.-<br />

Los NSE son un conjunto <strong>de</strong> estratos a capas en<br />

los que se divi<strong>de</strong> una sociedad según el estilo <strong>de</strong><br />

vida o grupo <strong>de</strong> características, dichas<br />

características son homogéneas <strong>de</strong>ntro <strong>de</strong> cada<br />

capa y heterogéneas entre capas. Las<br />

características pue<strong>de</strong>n ser sociales, económicas,<br />

<strong>de</strong>mográficas, etc.<br />

4. METODOLOGÍA<br />

ANÁLISIS DE COMPONENTES<br />

PRINCIPALES CATEGÓRICO<br />

El análisis estándar <strong>de</strong> componentes<br />

principales asume que todas las variables <strong>de</strong>l<br />

análisis se mi<strong>de</strong>n a escala numérica, y que las<br />

relaciones entre los pares <strong>de</strong> variables son<br />

lineales (Pérez, 2006).<br />

Varela (2005) menciona sobre éste análisis<br />

que “la primera componente principal es la<br />

combinación lineal <strong>de</strong> las variables originales<br />

<strong>de</strong> varianza máxima”, es <strong>de</strong>cir, que la ecuación<br />

<strong>de</strong> la primera componente (Y1) es:<br />

Y = α X + α X + + α X<br />

1 11 1 12 2 ... 1p<br />

p<br />

Don<strong>de</strong> p es el número <strong>de</strong> variables originales.<br />

La segunda componente principal (Y2) se<br />

construye análogamente:<br />

Y2 = α 21 X 1 + α 22 X 2 + ... + α 2 p X p<br />

El análisis <strong>de</strong> componentes principales<br />

categóricas extien<strong>de</strong> ésta metodología para<br />

permitir la ejecución <strong>de</strong>l análisis <strong>de</strong><br />

4<br />

Tomado <strong>de</strong> “Investigación Comercial 22 casos prácticos y<br />

un apéndice teórico”, Pg.37<br />

9<br />

componentes principales en cualquier mezcla<br />

<strong>de</strong> variables nominales, ordinales y numéricas.<br />

El análisis <strong>de</strong> componentes principales<br />

categórico se conoce también por el acrónimo<br />

CATPCA, <strong>de</strong>l inglés CATegorical Principal<br />

Components Analysis. El objetivo <strong>de</strong> los<br />

análisis <strong>de</strong> componentes principales es la<br />

reducción <strong>de</strong> un conjunto original <strong>de</strong> variables<br />

en un conjunto más pequeño <strong>de</strong> componentes<br />

no correlacionados que representen la mayor<br />

parte <strong>de</strong> la información encontrada en las<br />

variables originales. Para las variables<br />

nominales y ordinales <strong>de</strong>l análisis, se calcula<br />

puntuaciones óptimas para las categorías<br />

(Pérez, 2006).<br />

5. ANÁLISIS DE<br />

CORRESPONDENCIAS<br />

Uno <strong>de</strong> los objetivos <strong>de</strong>l análisis <strong>de</strong><br />

correspon<strong>de</strong>ncias es <strong>de</strong>scribir las relaciones<br />

existentes entre dos variables nominales,<br />

recogidas en una tabla <strong>de</strong> correspon<strong>de</strong>ncias, sobre<br />

un espacio <strong>de</strong> pocas dimensiones, mientras que al<br />

mismo tiempo se <strong>de</strong>scriben las relaciones entre las<br />

categorías <strong>de</strong> cada variable. Para cada variable,<br />

las distancias sobre un gráfico entre los puntos <strong>de</strong><br />

categorías reflejan las relaciones entre las<br />

categorías, con las categorías similares<br />

representadas próximas unas a otras. El análisis<br />

factorial es una técnica típica para <strong>de</strong>scribir las<br />

relaciones existentes entre variables en un espacio<br />

<strong>de</strong> pocas dimensiones. Sin embargo, el análisis<br />

factorial requiere datos <strong>de</strong> intervalo y el número<br />

<strong>de</strong> observaciones <strong>de</strong>be ser cinco veces el número<br />

<strong>de</strong> variables. Por su parte, el análisis <strong>de</strong><br />

correspon<strong>de</strong>ncias asume que las variables son<br />

nominales y permite <strong>de</strong>scribir las relaciones entre<br />

las categorías <strong>de</strong> cada variable, así como la<br />

relación entre las variables. A<strong>de</strong>más, el análisis <strong>de</strong><br />

correspon<strong>de</strong>ncias se pue<strong>de</strong> utilizar para analizar<br />

cualquier tabla <strong>de</strong> medidas <strong>de</strong> correspon<strong>de</strong>ncia<br />

que sean positivas.<br />

6. PROPUESTA<br />

Paso 1<br />

El primer paso es establecer un conjunto <strong>de</strong><br />

variables que permitan encontrar agrupaciones en<br />

los datos. Peña Daniel (2002) en su texto<br />

consi<strong>de</strong>ra que el análisis <strong>de</strong> componentes<br />

principales es muy útil como herramienta<br />

exploratoria, por esto se utilizó esta técnica para<br />

i<strong>de</strong>ntificar agrupaciones según los bienes que<br />

permitan alguna clasificación <strong>de</strong> los hogares<br />

ecuatorianos. El conjunto <strong>de</strong> bienes consi<strong>de</strong>rados<br />

para el análisis y que forman parte <strong>de</strong>l<br />

equipamiento <strong>de</strong>l hogar son: Refrigerador,<br />

televisor, licuadora, computador, equipo <strong>de</strong><br />

sonido, micro-ondas, cocina con horno, cocina sin


horno, radio, lavadora, DVD, bicicleta, moto,<br />

auto, línea telefónica e internet. Se omitió algunos<br />

bienes poco frecuentes para maximizar la<br />

Dimensión 2<br />

G. CHOEZ<br />

10<br />

explicación <strong>de</strong> los datos y se obtuvo los siguientes<br />

grupos:<br />

FIGURA 1<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Componentes Principales - Equipamiento <strong>de</strong> bienes en el hogar<br />

,6<br />

,4<br />

,2<br />

-,0<br />

-,2<br />

-,4<br />

-,6<br />

0,0<br />

,1<br />

Dimensión 1<br />

,2<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

,3<br />

,4<br />

Los grupos <strong>de</strong> bienes con sus respectivos nombres son:<br />

,5<br />

Microhondas<br />

Pc<br />

Auto<br />

Lavadora<br />

,6<br />

Tel.<br />

Equipo<br />

Dvd<br />

Cocina H.<br />

Licuadora<br />

Refrigerador<br />

TABLA IV<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Clasificación <strong>de</strong> bienes <strong>de</strong>l hogar<br />

TV<br />

Clasificación <strong>de</strong> bienes <strong>de</strong>l hogar<br />

Bienes primarios Bienes secundarios Bienes extras Bienes poco frecuentes (omitidos)<br />

Licuadora Equipo <strong>de</strong> sonido Computador (PC) Internet<br />

Refrigerador DVD Auto Bicicleta<br />

Televisor Cocina con horno Microhondas Moto<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

,7<br />

,8<br />

Lavadora Radio<br />

,9<br />

Línea telefónica Cocina sin horno<br />

1,0


PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />

PARTIR DE LA ENEMDU 2009<br />

Paso 2<br />

El siguiente paso consiste en asignar una<br />

pon<strong>de</strong>ración a la tenencia <strong>de</strong> cada bien, la tabla <strong>de</strong><br />

11<br />

bienes con los respectivos pesos se presenta a<br />

continuación:<br />

TABLA V<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Pon<strong>de</strong>raciones para bienes <strong>de</strong>l hogar<br />

Pon<strong>de</strong>raciones para bienes <strong>de</strong>l hogar<br />

Bienes Pon<strong>de</strong>ración<br />

Refrigeradora 2<br />

Televisor 1<br />

Licuadora 2<br />

Computador (PC) 10<br />

Equipo <strong>de</strong> sonido 6<br />

Microhondas 10<br />

Cocina con horno 5<br />

Cocina sin horno 1<br />

Radio 1<br />

Lavadora 10<br />

DVD 5<br />

Bicicleta 1<br />

Moto 1<br />

Auto 9<br />

Línea telefónica 8<br />

Internet 1<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

Las pon<strong>de</strong>raciones se obtuvieron <strong>de</strong> los<br />

coeficientes <strong>de</strong> las ecuaciones <strong>de</strong> las dos primeras<br />

componentes principales 54 que explican un 52%<br />

<strong>de</strong> la varianza total <strong>de</strong> los datos. Para obtener la<br />

pon<strong>de</strong>ración se sumo el coeficiente <strong>de</strong> la variable<br />

<strong>de</strong>l bien X en la primera componente y el<br />

coeficiente en la segunda componente <strong>de</strong>l mismo<br />

bien X y se lo multiplicó por factor 10. Así se<br />

calculó la pon<strong>de</strong>ración en cada bien excepto los<br />

bienes pocos frecuentes que se les dio la<br />

pon<strong>de</strong>ración <strong>de</strong> 1.<br />

5<br />

Revisar teoría <strong>de</strong> las componentes principales en<br />

metodología<br />

Paso 3<br />

Luego se procedió a construir una variable que<br />

sume la cantidad <strong>de</strong> bienes que posee el hogar<br />

multiplicado por la pon<strong>de</strong>ración respectiva, es<br />

<strong>de</strong>cir, la variable (puntaje total) recopila la<br />

tenencia <strong>de</strong>l bien y su respectivo peso. Los niveles<br />

socioeconómicos se construyen a partir <strong>de</strong>l<br />

puntaje total según la concentración <strong>de</strong> casos<br />

como se muestra a continuación:


Puntaje total<br />

0<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

25<br />

26<br />

27<br />

28<br />

29<br />

30<br />

31<br />

32<br />

33<br />

34<br />

35<br />

36<br />

37<br />

38<br />

39<br />

40<br />

41<br />

0<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

2<br />

2<br />

1<br />

1<br />

2<br />

2<br />

2<br />

2<br />

2<br />

G. CHOEZ<br />

FIGURA 2<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Construcción <strong>de</strong> niveles socioeconómicos<br />

2<br />

3<br />

3<br />

3<br />

3<br />

4<br />

4<br />

4<br />

4<br />

Porcentaje<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

3<br />

5<br />

5<br />

5<br />

5<br />

6<br />

Los rangos <strong>de</strong> puntajes para la construcción <strong>de</strong> los niveles se presentan a continuación:<br />

6<br />

7<br />

7<br />

12<br />

Niveles socioeconómicos<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

0<br />

4<br />

5<br />

7<br />

10<br />

10<br />

20<br />

20<br />

Porcentaje<br />

TABLA VI<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Rangos <strong>de</strong> puntaje según bienes<br />

Rangos <strong>de</strong> puntaje según bienes<br />

Puntaje según bienes Nivel socioeconómico %<br />

0 a 1 bien 1 8.7<br />

2 a 8 bines 2 40.3<br />

9 a 14 bienes 3 20.4<br />

15 a 19 bienes 4 10.0<br />

20 a 24 bienes 5 6.8<br />

25 a 29 bienes 6 5.3<br />

30 a 34 bienes 7 4.4<br />

35 o más bienes 8 4.0<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

Paso 4<br />

La validación <strong>de</strong> los niveles socioeconómicos<br />

obtenidos se realizó a través <strong>de</strong>l análisis <strong>de</strong><br />

correspon<strong>de</strong>ncia. La primera validación consiste<br />

9<br />

en graficar las categorías <strong>de</strong> las variables (nivel <strong>de</strong><br />

instrucción y nivel socioeconómico). El gráfico<br />

respectivo se presenta a continuación:<br />

30<br />

40<br />

40


PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />

PARTIR DE LA ENEMDU 2009<br />

Dimensión 2<br />

2,0<br />

1,5<br />

1,0<br />

,5<br />

0,0<br />

-,5<br />

-1,0<br />

-1,5<br />

-2,0<br />

-2,0<br />

FIGURA 3<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Nivel <strong>de</strong> instrcción vs nivel socioeconómico<br />

-1,5<br />

Dimensión 1<br />

1<br />

ninguno<br />

-1,0<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

2<br />

primaria<br />

El gráfico <strong>de</strong> correspon<strong>de</strong>ncia indica que existe<br />

relación directamente proporcional entre el nivel<br />

socioeconómico y el nivel <strong>de</strong> instrucción, es <strong>de</strong>cir,<br />

a mayor nivel <strong>de</strong> instrucción <strong>de</strong>l jefe <strong>de</strong> hogar<br />

mayor nivel socioeconómico <strong>de</strong>l hogar.<br />

Dimensión 2<br />

1,0<br />

,8<br />

,6<br />

,4<br />

,2<br />

,0<br />

-,2<br />

-,4<br />

-,6<br />

-,8<br />

-1,0<br />

-1,5<br />

8<br />

Dimensión 1<br />

-,5<br />

3<br />

0,0<br />

4<br />

,5<br />

13<br />

5<br />

secundaria<br />

6<br />

1,0<br />

superior<br />

7<br />

1,5<br />

8<br />

2,0<br />

2,5<br />

Estratos<br />

Nivel <strong>de</strong> instrucción<br />

La segunda validación consiste en graficar las<br />

categorías <strong>de</strong> las variables (condición <strong>de</strong> actividad<br />

y nivel socioeconómico) en un gráfico <strong>de</strong><br />

correspon<strong>de</strong>ncias que es presentado a<br />

continuación:<br />

FIGURA 4<br />

Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />

Condición <strong>de</strong> actividad vs nivel socioeconómico<br />

Ocupados plenos<br />

7<br />

-1,0<br />

Fuente: ENEMDU 2009<br />

Elaborado por: Autor<br />

6<br />

5<br />

-,5<br />

Desempleo Abierto<br />

4<br />

Desempleo Oculto<br />

3<br />

0,0<br />

Inactivo<br />

Subempleo Visible<br />

2<br />

Otras formas <strong>de</strong> sube<br />

,5<br />

1<br />

1,0<br />

Nivel socioeconómico<br />

Condición <strong>de</strong><br />

actividad


En el gráfico <strong>de</strong> correspon<strong>de</strong>ncia se i<strong>de</strong>ntificaron<br />

dos grupos conceptualmente relacionados.<br />

7. CONCLUSIONES<br />

La estructuración <strong>de</strong> los niveles<br />

socioeconómicos a través <strong>de</strong> los bienes que<br />

conforman el equipamiento <strong>de</strong>l hogar<br />

conceptualmente es congruente.<br />

La metodología implementada para la<br />

estructuración <strong>de</strong> los niveles socioeconómicos a<br />

través <strong>de</strong> los bienes que conforman el<br />

equipamiento concuerda con metodologías<br />

G. CHOEZ<br />

14<br />

similares utilizadas en Chile y en países <strong>de</strong><br />

Europa.<br />

8. RECOMENDACIONES<br />

Revisar ésta primera propuesta y contribuir en<br />

la modificación o perfeccionamiento <strong>de</strong> la<br />

misma.<br />

Continuar con la revisión <strong>de</strong> métodos<br />

estadísticos multivariados consi<strong>de</strong>rando otras<br />

variables que conceptualmente estén relacionadas<br />

al nivel socioeconómico.


PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />

PARTIR DE LA ENEMDU 2009<br />

REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />

[1]. MEULMAN, J. (2005). SPSS Categories ®<br />

14.0. SPSS Inc. EE.UU.<br />

[2]. NORMAS INTERNACIONALES APA,<br />

“Revista Universitaria Límite”. Facultad <strong>de</strong><br />

Ciencias Sociales. Departamento <strong>de</strong> Filosofía y<br />

Psicología. Universidad <strong>de</strong> Tarapacá.<br />

Arica – Chile.<br />

15<br />

[3]. PEÑA, D. (2002). “Análisis <strong>de</strong> Datos<br />

Multivariantes”. McGraw-Hill. España.<br />

[4]. PÉREZ, C. (2006). “Técnicas <strong>de</strong> Análisis<br />

Multivariante <strong>de</strong> Datos”. Pearson Educación.<br />

España.<br />

[5]. VARELA, L. (2005). “Análisis Multivariante<br />

para las Ciencias Sociales”. Pearson<br />

Educación. España.


matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />

<strong>2010</strong>, Vol. 8, No. 2<br />

APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL<br />

ESTUDIO DE REGISTROS ELECTROENCEFALOGRÁFICOS<br />

1 González Javier, 2 Granados Carlos, 3 López Hernán, 4 Torres Iván<br />

Resumen Los registros electroencefalográficos (EEG) son señales <strong>de</strong> tipo electrofisiológicas caracterizadas por su alto grado <strong>de</strong><br />

aleatoriedad y bajos niveles <strong>de</strong> amplitud. Por su gran complejidad necesitan ser analizadas mediante la utilización <strong>de</strong> técnicas no<br />

lineales, como es el caso <strong>de</strong>l cálculo <strong>de</strong> la entropía. La importancia <strong>de</strong>l tratamiento <strong>de</strong> este tipo <strong>de</strong> señales, radica en que <strong>de</strong>bido a sus<br />

características, son susceptibles a las interferencias producidas por agentes externos como otros equipos alre<strong>de</strong>dor e internos como los<br />

movimientos musculares. Esta propuesta <strong>de</strong> trabajo se enfoca en el uso <strong>de</strong>l cálculo <strong>de</strong> la entropía aproximada, para caracterizar<br />

regularidad <strong>de</strong> registros EEG. Los algoritmos implementados están basados en el planteamiento matemático realizado por Steven<br />

Pincus (Pincus, 1991) referentes a la entropía aproximada, Joshua S. Richman and J. Randall Moorman (Moorman, 2000) referentes a<br />

entropía muestral y en los algoritmos <strong>de</strong>sarrollados por George B. Moody (Moody, 2001).<br />

Palabras Claves. Señales EEG, entropía, patologías.<br />

Abstrat. The electroencephalographic records (EEG) are electrophysiological signal with high randomness properties and low<br />

amplitu<strong>de</strong>. The EEG needs nonlinear techniques for its analys because it is a complex time series. In this paper the calculation of the<br />

entropy is very important to characterize the EEG.<br />

Key words. EEG signals, Entropy, pathologies.<br />

Recibido: Junio, <strong>2010</strong><br />

Aceptado: Agosto, <strong>2010</strong><br />

1. INTRODUCCIÓN<br />

Dentro <strong>de</strong>l gran grupo <strong>de</strong> las señales<br />

electrofisiológicas, existen los registros<br />

electroencefalográficos (EEG), que ha exigido<br />

múltiples estrategias matemáticas para extraer<br />

información con un alto grado <strong>de</strong> utilidad e<br />

importancia en el campo médico [1]. El EEG es un<br />

examen que registra la actividad eléctrica <strong>de</strong>l<br />

cerebro y proporciona una aproximación <strong>de</strong> la<br />

actividad <strong>de</strong> las ondas emitidas por las células<br />

nerviosas en la corteza <strong>de</strong>l cerebro. El EEG se<br />

compone principalmente <strong>de</strong> un grupo <strong>de</strong> ondas<br />

clasificadas por su rango en el dominio <strong>de</strong> la<br />

frecuencia, empezando por las ondas tipo Delta que<br />

compren<strong>de</strong>n el rango entre 0 y 4 Hz, seguidamente<br />

se tienen las ondas tipo Theta (4 – 8 Hz), las ondas<br />

tipo Alpha (8 – 12 Hz), ondas Beta (14 – 30 Hz) y<br />

las ondas Gamma (3 – 8 HZ). La adquisición <strong>de</strong>l<br />

EEG consta <strong>de</strong> 4 etapas principales, la primera <strong>de</strong><br />

ellas es la adquisición <strong>de</strong> la señal mediante el<br />

posicionamiento <strong>de</strong> electrodos según el estándar<br />

internacional 10-20 y se clasifican <strong>de</strong> acuerdo<br />

a la tarea o condiciones experimentales para<br />

las que se emplearan, por ejemplo pue<strong>de</strong>n ser<br />

__________________________<br />

1<br />

González Barajas Javier, Docente Facultad <strong>de</strong> Ing.<br />

Electrónica. Universidad Santo Tomás. Cra 9 N° 51-15.<br />

Bogotá – Colombia.<br />

(e-mail: javiere_gonzalez@yahoo.com.mx).<br />

2<br />

Granados Guevara Carlos A., Ingeniero Electrónico.<br />

Universidad Santo Tomás. Cra 9 N° 51-15. Bogotá. Colombia.<br />

(e-mail: andres102@hotmail.com).<br />

3<br />

Lopez Católico Hernan Camilo. Médico Cirujano.<br />

Coordinador Médico Serivico <strong>de</strong> Neurofisiologia. Liga Central<br />

Contra la Epilepsia.<br />

(e-mail: hernancamilolopez@hotmail.com)<br />

4<br />

Torres Rincón Iván. Ingeniero Electrónico. Universidad Santo<br />

Tomás. Cra 9 N° 51-15. Bogotá. Colombia.<br />

(e-mail: ibamsho@msn.com).<br />

electrodos <strong>de</strong> superficie, <strong>de</strong> aguja o <strong>de</strong> profundidad.<br />

Por lo general esos registros poseen una amplitud<br />

en el rango 10 - 45µv. Para obtener una serie <strong>de</strong><br />

tiempo <strong>de</strong> los registros EEG, se realiza un proceso<br />

<strong>de</strong> discretización con frecuencias <strong>de</strong> muestreo <strong>de</strong><br />

200Hz y 250 muestras por segundo. Como<br />

estrategia utilizada en los trabajos más actuales<br />

sobre el análisis <strong>de</strong>l EEG, se cuenta con los<br />

métodos <strong>de</strong> análisis no lineal <strong>de</strong> series <strong>de</strong> tiempo<br />

[2]. También se ha citado en la literatura la<br />

Trasformada <strong>de</strong> Fourier, mediante la cual se estudia<br />

la distribución <strong>de</strong> frecuencias en la señal EEG [3].<br />

La Transformada Wavelet, empleada para la<br />

clasificación automática <strong>de</strong> patrones y análisis <strong>de</strong><br />

energía en las diferentes bandas <strong>de</strong> frecuencia <strong>de</strong>l<br />

EEG [4]. El Filtro Kalman, para la eliminación <strong>de</strong><br />

señales <strong>de</strong> artefactos [5]. El análisis <strong>de</strong><br />

componentes in<strong>de</strong>pendientes, para la separación <strong>de</strong><br />

señales estadísticamente in<strong>de</strong>pendientes y el<br />

filtrado <strong>de</strong> artefactos [6].<br />

Para fines <strong>de</strong>l <strong>de</strong>sarrollo <strong>de</strong> este trabajo se ha<br />

utilizado el cálculo <strong>de</strong> la entropía aproximada, que<br />

refleja la probabilidad <strong>de</strong> la existencia <strong>de</strong> patrones<br />

no precedidos por otros similares <strong>de</strong>ntro <strong>de</strong> una<br />

serie analizada y asigna valores mayores a<br />

secuencias más irregulares [7]. En el caso <strong>de</strong>l EEG<br />

se cuantifica la predicción <strong>de</strong> valores <strong>de</strong> amplitud<br />

sucesivos basándose en el conocimiento <strong>de</strong> algunos<br />

valores <strong>de</strong> amplitud previos. Por lo tanto una<br />

secuencia <strong>de</strong> datos que contenga gran cantidad <strong>de</strong><br />

patrones repetitivos, tendrá una entropía<br />

aproximada pequeña, mientras que una secuencia<br />

<strong>de</strong> datos más irregular tendrá una entropía<br />

aproximada mayor. Pincus la <strong>de</strong>finió como la<br />

correlación entera en cada punto <strong>de</strong>ntro <strong>de</strong> la<br />

muestra [8]. El valor <strong>de</strong> la entropía (ApEn)


aproximada <strong>de</strong>pen<strong>de</strong> <strong>de</strong> tres parámetros la longitud<br />

<strong>de</strong>l patrón (observaciones sucesivas) m, el criterio<br />

<strong>de</strong> similitud r y el número <strong>de</strong> puntos <strong>de</strong> la serie N.<br />

Matemáticamente <strong>de</strong>finida en (1) y (2).<br />

m m+<br />

1<br />

( ) ( ) ( )<br />

ApEn m, r, N =Φ r −Φ r conr≥1 (1)<br />

m 1<br />

m<br />

φ ( r)<br />

=<br />

logCi<br />

( r)<br />

(2)<br />

N − m + 1<br />

∑ + − N m 1<br />

i=<br />

1<br />

Debido a que la entropía aproximada es una<br />

medida susceptible a la cantidad <strong>de</strong> datos que<br />

componen la señal analizada y que adicionalmente<br />

durante la comparación tiene en cuenta el mismo<br />

patrón que se está buscando, se ha optado por<br />

trabajar también con la entropía muestral. Ésta es<br />

una modificación al planteamiento <strong>de</strong> Pincus [8]<br />

hecha por Richman – Moorman [9].<br />

Matemáticamente <strong>de</strong>finida en (3) y (4).<br />

m<br />

⎛ A ( r)<br />

⎞<br />

SampEn( m, r, N ) =−ln⎜ m ⎟ (3)<br />

⎝ B ( r)<br />

⎠<br />

N−m m( ) 1<br />

m<br />

B r =<br />

Bi() r<br />

N −m−1∑ (4)<br />

N−m i=<br />

1<br />

i=<br />

1<br />

m ( ) 1<br />

m<br />

A r = Ai() r<br />

N − m∑<br />

(5)<br />

m<br />

Don<strong>de</strong> B correspon<strong>de</strong> a la cantidad <strong>de</strong><br />

coinci<strong>de</strong>ncias por patrón y m A correspon<strong>de</strong> a la<br />

cantidad <strong>de</strong> patrones coinci<strong>de</strong>ntes.<br />

2. MATERIALES Y MÉTODOS<br />

Para el <strong>de</strong>sarrollo <strong>de</strong> este proyecto fueron<br />

utilizados registros EEG tomados <strong>de</strong> la base <strong>de</strong><br />

datos <strong>de</strong> la Fundación Liga Central Contra la<br />

Epilepsia (LICCE), correspondientes a pacientes<br />

con anomalías primarias generalizadas. Registros<br />

que fueron analizados <strong>de</strong> acuerdo a las <strong>de</strong>scargas<br />

presentes. Los algoritmos fueron <strong>de</strong>sarrollaron en<br />

Matlab. El algoritmo implementado carga en la<br />

memoria la señal EEG, que se encuentra en un<br />

archivo <strong>de</strong> cabecera dispuesto como un vector (Sn),<br />

el cual se segmenta en series <strong>de</strong> tiempo <strong>de</strong> longitud<br />

m y se genera la matriz (Pm). Cada serie será un<br />

patrón que se <strong>de</strong>sea hallar a lo largo <strong>de</strong> la señal. A<br />

continuación en (6) se muestra la manera como se<br />

realiza la segmentación <strong>de</strong> Sn.<br />

J. GONZALEZ, C. GRANADOS, H. LÓPEZ & I. TORRES<br />

17<br />

Sn={1,2,3,4,5,…,N}<br />

⎡ 1 2 … m ⎤<br />

Pm = ⎢ 2 3 m + 1⎥<br />

⎢ ⎥<br />

⎣ N − m+ 1 … N ⎦<br />

(6)<br />

Luego cada una <strong>de</strong> estas series <strong>de</strong> tiempo es<br />

comparada con las <strong>de</strong>más y si la diferencia entre<br />

cada uno <strong>de</strong> sus respectivos elementos es menor<br />

que r se cuenta como una coinci<strong>de</strong>ncia,<br />

almacenando el total <strong>de</strong> coinci<strong>de</strong>ncias en una<br />

variable. Este proceso se repite para m+1, es <strong>de</strong>cir,<br />

aumentando el número <strong>de</strong> elementos <strong>de</strong> las series<br />

<strong>de</strong> tiempo a m+1. En seguida se promedian la<br />

cantidad <strong>de</strong> coinci<strong>de</strong>ncias por patrón para m y m+1<br />

y la cantidad <strong>de</strong> patrones coinci<strong>de</strong>ntes por señal.<br />

Finalmente se obtiene el valor <strong>de</strong> entropía como el<br />

logaritmo <strong>de</strong>l cociente entre ambos valores.<br />

3. RESULTADOS<br />

Los algoritmos <strong>de</strong> entropía muestral y aproximada<br />

que fueron <strong>de</strong>sarrollados, se implementaron en<br />

MATLAB para realizar pruebas con diferentes<br />

tipos <strong>de</strong> señales; esto con el fin <strong>de</strong> evi<strong>de</strong>nciar las<br />

variaciones <strong>de</strong> los valores <strong>de</strong> entropía en señales<br />

con topologías diferentes. En primer lugar se tomó<br />

una función seno a la que se le calculó la entropía<br />

aproximada para tener un valor base sobre el cual<br />

haríamos las observaciones. En seguida, a esta<br />

señal se le sumó una señal <strong>de</strong> ruido <strong>de</strong>terminístico<br />

y luego otra <strong>de</strong> ruido aleatorio y se les calculó la<br />

entropía aproximada. En la figura 1 se presentan<br />

las señales utilizadas y en tabla I, se muestran los<br />

valores <strong>de</strong> entropía obtenidos <strong>de</strong> las tres señales.<br />

FIGURA 1<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Señales <strong>de</strong> Prueba


APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL ESTUDIO DE REGISTROS ELECTROENCEFALOGRÁFICOS<br />

TABLA I<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Valores <strong>de</strong> entropía para las señales <strong>de</strong> prueba<br />

Tipo <strong>de</strong> señal<br />

Valor <strong>de</strong> entropía<br />

aproximada<br />

Función seno 0.0428<br />

Función seno con ruido<br />

0.0611<br />

<strong>de</strong>terminístico<br />

Función seno con ruido<br />

aleatorio<br />

1.0970<br />

La señal con ruido <strong>de</strong>terminístico, muestra una<br />

elevación en su valor <strong>de</strong> entropía respecto a la<br />

señal original <strong>de</strong>bido a que aumenta su<br />

complejidad, sin embargo este valor no aumenta<br />

consi<strong>de</strong>rablemente como en la tercera señal, <strong>de</strong>bido<br />

a que mantiene cierta periodicidad en sus valores.<br />

El valor <strong>de</strong> entropía <strong>de</strong> la señal con ruido aleatorio<br />

aumenta ampliamente <strong>de</strong>bido a que se pier<strong>de</strong> la<br />

periodicidad <strong>de</strong> la señal y por tanto aumenta su<br />

complejidad, es <strong>de</strong>cir que tien<strong>de</strong> a ser una señal<br />

caótica. Una <strong>de</strong> las características <strong>de</strong> la entropía<br />

aproximada, es ser altamente <strong>de</strong>pendiente <strong>de</strong> la<br />

cantidad <strong>de</strong> datos analizados, por lo que se<br />

convierte en una medida poco precisa, haciendo<br />

necesario una estimación <strong>de</strong> la cantidad <strong>de</strong> datos<br />

que se <strong>de</strong>ben tener en cuenta al momento <strong>de</strong><br />

calcular la entropía. Para mostrar esto, se compara<br />

el valor <strong>de</strong> entropía aproximada obtenido para la<br />

función seno formada por una cantidad N <strong>de</strong> datos<br />

y la misma función formada por 2N datos; esto<br />

equivale a una misma función muestreada con dos<br />

frecuencias diferentes. La figura 2 muestra las<br />

funciones utilizadas y la tabla II muestra los<br />

valores <strong>de</strong> entropía obtenidos.<br />

FIGURA 2<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Función <strong>de</strong> seno muestreada con dos frecuencias diferentes,<br />

la inferior con el doble <strong>de</strong> frecuencia que la superior<br />

18<br />

TABLA II<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Valor <strong>de</strong> entropía aproximada una señal muestreada con<br />

dos frecuencias diferentes, f1 y 2f1 respectivamente<br />

<strong>Número</strong> <strong>de</strong> datos<br />

Valor entropía<br />

aproximada<br />

400 0,0207<br />

800 0,0102<br />

Las dos señales tienen la misma forma, pero el<br />

número <strong>de</strong> datos varió en la segunda dos veces más<br />

que en la primera. Los valores <strong>de</strong> entropía variaron<br />

igualmente, pero <strong>de</strong> manera inversa, es <strong>de</strong>cir, con<br />

el doble <strong>de</strong> datos tomados, la entropía disminuye a<br />

la mitad. Para evitar el inconveniente <strong>de</strong> tener<br />

<strong>de</strong>ntro <strong>de</strong> los parámetros <strong>de</strong> entropía el número <strong>de</strong><br />

datos, se ha utilizado la entropía muestral; en la<br />

que su valor es menos sensible a la longitud <strong>de</strong> la<br />

señal analizada, pues la manera como se hace la<br />

comparación <strong>de</strong> los patrones en el algoritmo<br />

cambia al no tener en cuenta <strong>de</strong>ntro <strong>de</strong> las<br />

coinci<strong>de</strong>ncias el mismo valor que se está<br />

evaluando. Esto a su vez implica que el valor <strong>de</strong><br />

entropía aumenta respecto al valor obtenido con la<br />

entropía aproximada. En la tabla III, se presentan<br />

los valores <strong>de</strong> entropía aproximada y muestral,<br />

junto con la variación entre ellos, obtenidos para<br />

las señales <strong>de</strong> la figura 1.<br />

TABLA III<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Valores <strong>de</strong> entropía muestral y aproximada y variación<br />

entre los dos tipos <strong>de</strong> entropía<br />

Tipo <strong>de</strong> señal<br />

Valor <strong>de</strong><br />

entropía<br />

aproximada<br />

Valor <strong>de</strong><br />

entropía<br />

muestral<br />

Variación<br />

valor<br />

entropía<br />

Función seno 0.0428 0.0436 0.0008<br />

Función seno<br />

con ruido<br />

<strong>de</strong>terminístico<br />

Función seno<br />

con ruido<br />

aleatorio<br />

0.6111 0.7086 0.0975<br />

1.0970 2.4345 1.3375<br />

El aumento en el valor <strong>de</strong> entropía <strong>de</strong> las señales,<br />

se <strong>de</strong>be a que el número <strong>de</strong> patrones coinci<strong>de</strong>ntes<br />

en las señales es mucho menor y por tanto se<br />

entien<strong>de</strong> que las señales tien<strong>de</strong>n a ser más caóticas,<br />

perdiendo la periodicidad que tenían <strong>de</strong>bido a la<br />

señal original (función seno). Luego <strong>de</strong> mostrar la<br />

inci<strong>de</strong>ncia que tiene el tipo <strong>de</strong> señal y su frecuencia<br />

<strong>de</strong> muestreo en el valor <strong>de</strong> entropía, se calcula el<br />

valor <strong>de</strong> entropía para una señal EEG bipolar. Los<br />

EEG utilizados tienen una duración <strong>de</strong> 30 minutos


y 30 segundos y fueron muestreados con una<br />

frecuencia <strong>de</strong> 200Hz, por lo tanto son registros<br />

muy largos que <strong>de</strong>ben ser tomados en segmentos<br />

más cortos <strong>de</strong> tiempo llamados ventanas; en este<br />

caso cada ventana contiene 5 segundos <strong>de</strong> señal, lo<br />

que equivale a 366 ventanas en total. Cada EEG<br />

está conformado por 19 canales, <strong>de</strong> los cuales se<br />

tomaron únicamente dos, seleccionados por la<br />

mayor inci<strong>de</strong>ncia <strong>de</strong> las <strong>de</strong>scargas en su<br />

comportamiento. A continuación se presentan tres<br />

periodos <strong>de</strong> tiempo <strong>de</strong> un registro EEG en tres<br />

momentos diferentes; La figura 3 muestra un<br />

intervalo normal <strong>de</strong> la señal EEG don<strong>de</strong> no se<br />

evi<strong>de</strong>ncian <strong>de</strong>scargas.<br />

FIGURA 3<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Intervalo <strong>de</strong> señal normal<br />

la figura 4 muestra una alteración en la actividad<br />

cerebral <strong>de</strong>bido a fotoestimulación. En este caso el<br />

paciente recibe estimulación provocada por<br />

diversas fuentes <strong>de</strong> luz<br />

FIGURA 4<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Intervalo <strong>de</strong> señal con <strong>de</strong>scarga <strong>de</strong>bida o fotoestimulación en<br />

canal<br />

La figura 5 muestra una alteración <strong>de</strong>bida a<br />

somnolencia, ya que en muchos casos los registros<br />

se toman en periodos <strong>de</strong> 24 horas consecutivas y se<br />

evalúa el comportamiento <strong>de</strong>l paciente durante el<br />

ciclo Mañana - noche.<br />

J. GONZALEZ, C. GRANADOS, H. LÓPEZ & I. TORRES<br />

19<br />

FIGURA 5<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Intervalo <strong>de</strong> señal con <strong>de</strong>scarga <strong>de</strong>bida a somnolencia en<br />

canal Fp1-F3<br />

La figura 6 muestra un intervalo normal <strong>de</strong>l<br />

registro, la figura 7 muestra la <strong>de</strong>scarga por<br />

fotoestimulación y la figura 8 muestra la <strong>de</strong>scarga<br />

<strong>de</strong>bido a somnolencia.<br />

FIGURA 6<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Intervalo <strong>de</strong> señal normal en canal F3-C3<br />

FIGURA 7<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Intervalo <strong>de</strong> señal normal con <strong>de</strong>scarga <strong>de</strong>bida a<br />

fotoestimulación en canal F3-C3


APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL ESTUDIO DE REGISTROS ELECTROENCEFALOGRÁFICOS<br />

FIGURA 8<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Intervalo <strong>de</strong> señal con <strong>de</strong>scarga <strong>de</strong>bida a somnolencia en<br />

canal F3-C3<br />

Se calculó el valor <strong>de</strong> entropía para las ventanas <strong>de</strong><br />

tiempo mostradas arriba. La tabla IV contiene los<br />

valores <strong>de</strong> entropía para cada intervalo <strong>de</strong> señal por<br />

canal, la ventana <strong>de</strong> tiempo que correspon<strong>de</strong> a la<br />

señal analizada y el tipo <strong>de</strong> activación que produjo<br />

la <strong>de</strong>scarga.<br />

TABLA IV<br />

Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />

electroencefalográficos<br />

Valores <strong>de</strong> entropía aproximada y muestral en dos canales<br />

<strong>de</strong> una señal EEG bipolar <strong>de</strong> acuerdo a eventos presentes<br />

Activación<br />

Entropía<br />

Aproximada<br />

Entropía<br />

Muestral<br />

Normal 1,0232 1,1290<br />

Fotoestimulación 0,8756 0,9243<br />

Somnolencia 0,9069 0,9684<br />

Normal 1,0985 1,4294<br />

Fotoestimulación 0,7146 0,7340<br />

Somnolencia 0,7124 0,7318<br />

Al revisar los valores <strong>de</strong> entropía se aprecia que<br />

estos disminuyen cuando se presentan anomalías<br />

20<br />

en la actividad cerebral, esto se <strong>de</strong>be a que la señal<br />

tien<strong>de</strong> a or<strong>de</strong>narse durante este tipo <strong>de</strong><br />

comportamiento anormal.<br />

4. CONCLUSIONES<br />

A través <strong>de</strong>l <strong>de</strong>sarrollo <strong>de</strong> este trabajo se ha<br />

contado en primera instancia con el estudio e<br />

implementación <strong>de</strong> las técnicas para el calculo <strong>de</strong> la<br />

entropía aproximada y la entropía muestral. Por<br />

medio <strong>de</strong> las simulaciones previas realizadas con<br />

señales sinusoidales puras se ha podido evi<strong>de</strong>nciar<br />

la sensibilidad <strong>de</strong> esta medida ante el aumento <strong>de</strong> la<br />

complejidad <strong>de</strong> series <strong>de</strong> tiempo. Al po<strong>de</strong>r contar<br />

con el dominio <strong>de</strong> los algoritmos se ha tenido la<br />

oportunidad <strong>de</strong> po<strong>de</strong>rlos implementar en una<br />

plataforma basada en un procesador digital <strong>de</strong><br />

señales DSP <strong>de</strong>l fabricante Texas Instrumentes, con<br />

lo cual se obtiene el valor agregado <strong>de</strong> tener una<br />

herramienta con capacidad <strong>de</strong> procesamiento que<br />

permite tener gran portabilidad y la posibilidad <strong>de</strong><br />

realizar análisis no lineales en tiempo real <strong>de</strong><br />

registros EEG. Los algoritmos implementados en la<br />

plataformas para DSP han sido ensayados con<br />

registros EEG en diferentes estados: normal, bajo<br />

estímulos y con presencia <strong>de</strong> anomalías y se ha<br />

podido evi<strong>de</strong>nciar que la medida <strong>de</strong> entropía es<br />

sensible para los las disminuciones <strong>de</strong> complejidad<br />

que sufre el EEG.<br />

5. AGRADECIMIENTOS<br />

Los resultados logrados en este trabajo han sido<br />

logrados gracias a la colaboración <strong>de</strong>l cuerpo<br />

medico <strong>de</strong> la Liga Central Contra la Epilepsia <strong>de</strong> la<br />

ciudad <strong>de</strong> Bogota, DC. Colombia y especialmente a<br />

la <strong>de</strong>dicación <strong>de</strong>l Medico cirujano Hernán Camilo<br />

López que coordino el manejo <strong>de</strong> las bases <strong>de</strong> datos<br />

<strong>de</strong> EEG.


ECTRÓNICAS<br />

J. GONZALEZ, C. GRANADOS, H. LÓPEZ & I. TORRES<br />

REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />

[1]. THAKOR, N. V.; TONG, S. (2004)<br />

“Advances in quantitative<br />

electroencephalogram analysis methods”,<br />

Annu. Rev. Biomed. Eng., 6:453-495.<br />

[2]. H. KANTZ AND T. SCHREIBER. (2005).<br />

“Nonlinear Time Series Analysis”,<br />

Cambridge: Cambridge.<br />

[3]. BRISMAR T. (2007). “The human EEG -<br />

Physiological and clinical studies”. Physiol<br />

Behav, doi: 10.1016/j. physbeh.<br />

2007.05.047.<br />

[4]. O. A. ROSSO ET AL. (2001). “Wavelet<br />

entropy: a new tool for analysis of short<br />

duration brain electrical signals”. Journal of<br />

Neuroscience Methods (105), pp 65-75.<br />

[5]. JOSÉ L. GUTIERREZ, GUSTAVO F.<br />

NEER Y LAURA R. DE VIÑAS. (2005).<br />

“Diagnóstico <strong>de</strong> Epilepsia a Distancia: una<br />

aplicación <strong>de</strong> la telemedicina”. Buenos<br />

Aires: s.n.<br />

21<br />

[6]. A. DELORME, T. SEJNOWSKI AND S.<br />

MAKEIG. (2007). “Enhanced <strong>de</strong>tection of<br />

artifacts in EEG data using higher-or<strong>de</strong>r<br />

statistics and in<strong>de</strong>pen<strong>de</strong>nt component<br />

analysis”, Neuroimage 34, pp 1443-1449.<br />

[7]. DANIEL ABÁSOLO BAZ ET AL. (2006).<br />

“Análisis no lineal <strong>de</strong> la señal<br />

electroencefalográfica (EEG) para la ayuda<br />

en el diagnóstico <strong>de</strong> la enfermedad <strong>de</strong><br />

Alzheimer”, Madrid: s.n.<br />

[8]. S. M. PINCUS AND A. L.<br />

GOLDBERGER. (1994). “Physiological<br />

time series analysis: what does regularity<br />

quantify?”, Amer. J. Physiol., vol. 66, pp.<br />

H1643–Hl656.<br />

[9]. JOSHUA S. RICHMAN AND J.<br />

RANDALL MOORMAN. (2000).<br />

“Physiological time-series analysis using<br />

approximate entropy and sample entropy,<br />

Am J Physiol Heart Circ Physiol”,vol 278,<br />

pp H2039–H2049.


matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />

<strong>2010</strong>, Vol. 8, No. 2<br />

ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA<br />

MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />

ALEATORIOS MULTIVARIADOS<br />

1 Montaño Néstor, 2 Zurita Gau<strong>de</strong>ncio<br />

Resumen. La Estimación Robusta nace <strong>de</strong> la necesidad <strong>de</strong> estimadores que se comporten “bien” aún cuando existan variaciones en los<br />

supuestos iniciales o cuando es posible que la muestra esté “contaminada” por valores aberrantes que producen influencias en los<br />

resultados y por lo tanto conducen a estimaciones errónea; siendo este un campo en constante <strong>de</strong>sarrollo se han propuesto diversos métodos<br />

<strong>de</strong> Estimación. Este artículo presenta los resultados <strong>de</strong> un estudio tipo Monte Carlo realizado para comparar algunos Métodos <strong>de</strong><br />

Estimación Robusta para el Vector <strong>de</strong> Medias y Matriz <strong>de</strong> Varianzas y Covarianzas <strong>de</strong> un vector aleatorio <strong>de</strong> seis variables. El propósito es<br />

evaluar el comportamiento <strong>de</strong> los estimadores bajo diversas condiciones como Contaminación total o Contaminación por Variable; a<strong>de</strong>más<br />

se trata <strong>de</strong> establecer una “regla empírica” don<strong>de</strong> se utilice al tamaño <strong>de</strong> la Muestra, al Sesgo y la Curtosis Muestral como elementos <strong>de</strong><br />

<strong>de</strong>cisión sobre el estimador a utilizar. Los estimadores M <strong>de</strong> Huber y Bicuadrático o Bipon<strong>de</strong>rado son los que mejor rendimiento presentan,<br />

aunque cuando la curtosis es “alta” el Estimador MCD es el mejor.<br />

Palabras claves: Estimación Multivariada, Robustez, Monte Carlo<br />

Abstract. The Robust Estimation born from the need of estimators to behave "well" even when there are variations in the initial assumptions<br />

or when it is possible that the mo<strong>de</strong>l is "contaminated" by outliers that producing influences the results and thus lead to estimates wrong,<br />

because of this is a field in constant <strong>de</strong>velopment have been proposed various methods of estimation. This article presents the results of a<br />

Monte Carlo study realized for to compare some Robust Estimation Methods for Vector averages and Matrix of Variance and Covariance of<br />

a random vector of six variables. The purpose is to evaluate the behavior of the estimators un<strong>de</strong>r various conditions such as total<br />

contamination or contamination for variable, also I seek to establish a “empirical rule" that it use the size of the Sample, the Sample Bias and<br />

the Sample Kurtosis as elements of <strong>de</strong>cision on the estimator one to using. The M estimator of Huber and Bisquared are those who present<br />

better performance, though when the kurtosis is "high" the Estimator MCD is the best.<br />

Key words: Multivariate Estimation, Robustness, Monte Carlo<br />

RECIBIDO: Agosto, <strong>2010</strong><br />

Aceptado: Septiembre, <strong>2010</strong><br />

1. INTRODUCCIÓN<br />

Para estimar parámetros poblacionales se utiliza<br />

información obtenida a partir <strong>de</strong> los datos que<br />

proporciona una Muestra; en la práctica se verifica<br />

que un alto porcentaje <strong>de</strong> las mediciones que se<br />

efectúan, por diferentes razones, contienen errores<br />

<strong>de</strong> medición u observaciones atípicas llamadas<br />

“valores aberrantes” o “extremos” pues se alejan<br />

acentuadamente <strong>de</strong>l comportamiento general <strong>de</strong> las<br />

<strong>de</strong>más observaciones; bajo este escenario, ¿el<br />

estimador seguirá siendo una “buena”<br />

aproximación, o se verá afectado por este<br />

particular?.<br />

Esta situación origina la búsqueda <strong>de</strong> estimadores<br />

robustos, es <strong>de</strong>cir, estimadores “poco” sensibles a<br />

errores <strong>de</strong> medición o a valores aberrantes.<br />

________________________<br />

1 Montaño Nestor, Ingeniero en Estadística e Informática,<br />

<strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>);<br />

(e_mail: rmontano@espol.edu.ec).<br />

2 Zurita Gau<strong>de</strong>ncio, M.Sc., Profesor <strong>de</strong> la <strong>Escuela</strong> Superior<br />

Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>); Director <strong>de</strong>l Centro <strong>de</strong><br />

Estudios e Investigaciones Estadísticas ICM – <strong>ESPOL</strong>.<br />

(e_mail: gzurita@espol.edu.ec).<br />

2. ESTIMACIÓN ROBUSTA<br />

Para mo<strong>de</strong>lar la situación en que la mayoría <strong>de</strong> las<br />

observaciones provienen <strong>de</strong> una distribución Fθ ,<br />

pero una pequeña fracción ε <strong>de</strong> las observaciones<br />

son valores atípicos generados por otra distribución<br />

H, Tukey en [15] plantea la Familia <strong>de</strong><br />

Contaminación F ε <strong>de</strong>finida por:<br />

F ε = { ( 1 − ε) Fθ+ εH; θ∈Θ}<br />

(2.1)<br />

don<strong>de</strong> ε representa la proporción <strong>de</strong><br />

contaminación.<br />

Se espera que los Estimadores Robustos cumplan<br />

con dos requerimientos: Eficiencia y Estabilidad.<br />

Se dice que un estimador es Eficiente si sus<br />

estimaciones son “buenas” aunque no exista<br />

contaminación, es <strong>de</strong>cir que por ejemplo, el<br />

Estimador Robusto <strong>de</strong>be ser comparable con el<br />

Estimador <strong>de</strong> Máxima Verosimilitud (al que <strong>de</strong> aquí<br />

en a<strong>de</strong>lante llamado Estimador Clásico). Para el<br />

caso multivariado este requerimiento implica lo<br />

siguiente:<br />

i) Sea ∑<br />

( μ n , n ) los estimadores <strong>de</strong> localización y<br />

dispersión para una muestra <strong>de</strong> tamaño n y sean


ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />

ALEATORIOS MULTIVARIADOS<br />

∑<br />

( μ ∞ , ∞ ) sus valores asintóticos. Si<br />

∑<br />

∑ ∑<br />

i ( p ) N ∼ X μ , entonces ∞ = μ μ y ∞ = c<br />

don<strong>de</strong> c es una constante; y,<br />

ii) ∑<br />

( μ n , n ) <strong>de</strong>ben ser asintóticamente normales,<br />

esto es,<br />

n μ <br />

n − μ ∞<br />

L<br />

⎯→N0, Vμ<br />

( ) ( p )<br />

∑ ( ∑<br />

− )<br />

L<br />

⎯→N q<br />

0,<br />

( n ) ( V )<br />

n vech ∞ ∑<br />

p( p + 1)<br />

= y ( )<br />

don<strong>de</strong> q<br />

vech ∑ es el vector que<br />

2<br />

contiene los q elementos <strong>de</strong> la triangular inferior <strong>de</strong><br />

∑ .<br />

Un estimador se lo consi<strong>de</strong>ra estable si su “buen”<br />

comportamiento se preserva incluso ante la<br />

presencia <strong>de</strong> contaminación, esto es cuando F varía<br />

sobre F ε . Para evaluar la estabilidad se han<br />

propuesto varias medidas, como Sesgo Asintótico<br />

Máximo y la Varianza asintótica Máxima las cuales<br />

mi<strong>de</strong>n el “peor” comportamiento <strong>de</strong>l estimador para<br />

todo ε < ε*<br />

; también se tiene el Punto <strong>de</strong> Ruptura<br />

Asintótico don<strong>de</strong> la i<strong>de</strong>a es representar la mayor<br />

fracción <strong>de</strong> contaminación que el estimador pue<strong>de</strong><br />

tolerar.<br />

Por otro lado, en varios <strong>de</strong> los métodos <strong>de</strong> análisis<br />

multivariados se trabaja con transformaciones<br />

lineales <strong>de</strong> las variables, entonces todos los<br />

estimadores tratados cumplen la propiedad <strong>de</strong><br />

equivarianza, esto es:<br />

Si y=Ax+b entonces<br />

μ( y) = A<br />

μ ( x) + b<br />

∑<br />

( ) ∑ T<br />

y = A ( x)<br />

A<br />

Se han propuesto diversos Estimadores Robustos,<br />

sin embargo para este estudio se ha escogido a<br />

consi<strong>de</strong>rados “más populares”, a continuación<br />

<strong>de</strong>finirá a cada uno <strong>de</strong> ellos.<br />

En lo siguiente, la distancia <strong>de</strong> Mahalanobis<br />

representada por:<br />

T<br />

( x , μ, ∑) = ( x μ) ∑−1(<br />

x μ )<br />

di = di<br />

i i − i −<br />

2.1 ESTIMADOR M MULTIVARIADO<br />

Maronna en [9] extien<strong>de</strong> los estimadores M<br />

propuestos por Huber en [5] a espacios<br />

p-dimensionales; así, <strong>de</strong>fine al estimador M como la<br />

solución <strong>de</strong><br />

23<br />

i ( − ) = 0<br />

( x − μ) ( x<br />

T<br />

− μ<br />

) = <br />

( ) x μ<br />

n<br />

∑ ⎡⎣W1d ⎤⎦<br />

i<br />

i=<br />

1<br />

2 ( ) <br />

1<br />

2<br />

1<br />

n<br />

∑ ⎡W d ⎤<br />

n i i<br />

i=<br />

⎣ i ⎦<br />

don<strong>de</strong> W1 y W2 no son necesariamente iguales.<br />

Nótese que el Estimador M se pue<strong>de</strong> interpretar<br />

como un Vector <strong>de</strong> Medias pon<strong>de</strong>rado y una Matriz<br />

<strong>de</strong> Covarianza pon<strong>de</strong>rada, don<strong>de</strong> las pon<strong>de</strong>raciones<br />

<strong>de</strong>pen<strong>de</strong>n <strong>de</strong> la Distancia <strong>de</strong> Mahalanobis.<br />

Se utilizan funciones W1 y W2 <strong>de</strong> tipo Huber, esto<br />

es:<br />

⎧<br />

⎪<br />

⎪1<br />

W1( di) = ⎨<br />

⎪ k<br />

⎪⎩ di di≤k di> k<br />

y W<br />

2<br />

2(<br />

d<br />

i ) =<br />

W1di β<br />

∑<br />

( ( ) ) 2<br />

2.2 ESTIMADOR S BICUADRÁTICO<br />

MULTIVARIADO<br />

Se <strong>de</strong>fine al Estimador S Bicuadrático o<br />

p<br />

Bipon<strong>de</strong>rado multivariado como ˆ μ ∈ R y ˆ ∑∈ S<br />

p<br />

que minimiza ∑<br />

ˆ σ ˆ<br />

( di ( x, μ , ) ) con ∑ = 1,<br />

don<strong>de</strong> ˆ σ<br />

es un Estimador M univariado <strong>de</strong> Escala que<br />

satisface<br />

n<br />

1 ⎛di⎞ ∑ ρ δ<br />

n<br />

⎜ =<br />

ˆ<br />

⎟<br />

⎝σ⎠ i=<br />

1<br />

{ } 3<br />

siendo () t min 1,1-( 1-t )<br />

ρ = .<br />

Se pue<strong>de</strong> <strong>de</strong>mostrar que, bajo ciertas condiciones,<br />

los estimadores S son una particularización <strong>de</strong> los<br />

Estimadores M cuya función <strong>de</strong> pon<strong>de</strong>ración tien<strong>de</strong><br />

a cero para distancias “gran<strong>de</strong>s”.<br />

2.3 ESTIMADOR S T-BICUADRÁTICO<br />

Mientras mayor sea el número <strong>de</strong> variables, los<br />

estimadores S con función <strong>de</strong> pon<strong>de</strong>raciones<br />

continua se aproximan al vector <strong>de</strong> medias muestral<br />

y la matriz <strong>de</strong> varianzas y covarianzas muestral, esto<br />

implica una pérdida <strong>de</strong> robustez; Rocke en [12]<br />

consi<strong>de</strong>ra este problema y propone un tipo <strong>de</strong><br />

estimador con función <strong>de</strong>pendiente <strong>de</strong>l número <strong>de</strong><br />

variables, en particular propuso una familia <strong>de</strong><br />

estimadores cuya función ρ cumple que<br />

lim p→∞ ρ ( d) = I ( d><br />

1)<br />

, don<strong>de</strong> I ( d> 1)<br />

es la<br />

función “indicador”. El estimador T-Bicuadrático es<br />

un estimador que cumple las mismas condiciones<br />

<strong>de</strong>l Estimador Bicuadrático con


⎧ 0 para 0≤≤− t 1 γ<br />

⎪<br />

⎪<br />

⎪⎛<br />

2<br />

() t t 1⎞ ⎡<br />

⎛<br />

3 t 1⎞ ⎤<br />

ρ = ⎨⎜<br />

− 1 para 1 γ t 1 γ<br />

4γ ⎟⎢ − −<br />

⎜ ⎥<br />

γ ⎟ + − < < +<br />

⎪⎝ ⎠⎢ ⎝ ⎠ ⎥ 2<br />

⎣ ⎦<br />

⎪<br />

⎪<br />

⎩ 1 para t≥+<br />

1 γ<br />

2.4 ESTIMADOR COVARIANZA DE MÍNIMO<br />

DETERMINANTE MCD<br />

Zuo en [18] indica que los estimadores MCD<br />

propuestos por Rousseeuw escogen h observaciones<br />

las cuales minimizan el <strong>de</strong>terminante <strong>de</strong> la Matriz<br />

<strong>de</strong> Covarianzas Clásica, así, el estimador MCD <strong>de</strong><br />

localización es el promedio <strong>de</strong> las h observaciones y<br />

el estimador MCD <strong>de</strong> escala es un múltiplo escalar<br />

<strong>de</strong> la Matriz <strong>de</strong> Covarianzas correspondiente a las h<br />

observaciones.<br />

Este estimador es probablemente el más popular<br />

<strong>de</strong>bido (en parte) al “rápido” cálculo <strong>de</strong> los<br />

estimadores por parte <strong>de</strong> varios algoritmos<br />

<strong>de</strong>sarrollados.<br />

2.5 ESTIMADOR STAHEL-DONOHO (DS)<br />

Maronna en [8] indica que la i<strong>de</strong>a <strong>de</strong>l estimador<br />

Stahel-Donoho, propuesto por Stahel (1981) y<br />

Donoho (1982) es que un “valor aberrante”<br />

multivariado <strong>de</strong>be serlo también en alguna<br />

proyección univariada. Entonces el estimador DS,<br />

es un vector <strong>de</strong> Media y Matriz <strong>de</strong> Covarianzas<br />

ambos pon<strong>de</strong>rados <strong>de</strong> tal manera que la pon<strong>de</strong>ración<br />

<strong>de</strong> xi es una función <strong>de</strong> la “lejanía” <strong>de</strong> xi, <strong>de</strong>notada<br />

por t( x i ) .<br />

Es <strong>de</strong>cir, siendo W1 y W2 dos funciones <strong>de</strong><br />

pon<strong>de</strong>ración, se <strong>de</strong>fine<br />

<br />

μ =<br />

∑<br />

1<br />

w<br />

n<br />

i= 1 i1<br />

i=<br />

1<br />

n<br />

∑ wi1xi ( )<br />

∑ n<br />

T<br />

1<br />

= ∑ w ( ) <br />

n i2xi−μxi− μ<br />

∑ w i 1<br />

i= 1 i2<br />

=<br />

wij = wj( t i ), j = 1,2<br />

Con ( x )<br />

3. DETALLES DE LA SIMULACIÓN<br />

Las medidas planteadas para evaluar la Robustez<br />

son <strong>de</strong>finidas asintóticamente, quedando sin<br />

explicar el comportamiento <strong>de</strong> dichos Estimadores<br />

en muestras finitas, esto es lo que se explora en el<br />

presente estudio utilizando Simulación Matemática.<br />

N. MONTAÑO & G. ZURITA<br />

24<br />

3.1 DISEÑO DEL ESTUDIO<br />

En este trabajo se generan muestras aleatorias a<br />

partir <strong>de</strong> distribuciones a las que se les manipula<br />

algunos parámetros con el objetivo <strong>de</strong> simular<br />

varias condiciones y así estudiar el comportamiento<br />

<strong>de</strong> los Estimadores Robustos bajo estas condiciones;<br />

uno <strong>de</strong> los estudios seminales en cuanto a comparar<br />

Estimadores Robustos fue el realizado por Andrews<br />

et al.[1]; en dicho estudio se dio a lugar a la noción<br />

<strong>de</strong> la tres "esquinas" para representar las posibles<br />

situaciones que se pue<strong>de</strong>n encontrar en la práctica;<br />

se propuso probar los Estimadores Robustos bajo un<br />

enfoque muy optimista (Generando una<br />

Distribución Normal), muy pesimista (a través <strong>de</strong><br />

una Cauchy) y la última prueba consistía en 20<br />

datos, 19 <strong>de</strong> los cuales eran generados a partir <strong>de</strong><br />

una Normal Estándar y el último generado a partir<br />

<strong>de</strong> una N(0,100). Los dos primeros argumentos son<br />

el punto <strong>de</strong> partida <strong>de</strong>l presente estudio, es <strong>de</strong>cir, se<br />

consi<strong>de</strong>raran muestras generadas a partir <strong>de</strong> la<br />

Distribución Normal Multivariada N(0,Σ) y la<br />

Distribución Cauchy CAU(0,Σ), consi<strong>de</strong>rando la<br />

diferencia entre ambas en el “peso” <strong>de</strong> sus colas.<br />

Las muestras generadas son contaminadas, para ello<br />

se consi<strong>de</strong>ra la Familia <strong>de</strong> Contaminación (2.1)<br />

don<strong>de</strong> ε = 0; 0.05; 0.1 y 0.3 <strong>de</strong> tal manera que se<br />

observa el comportamiento <strong>de</strong> los estimadores<br />

analizados bajo condiciones <strong>de</strong>:<br />

• No Contaminación, ε = 0 , caso que permitirá<br />

compararlos con los Estimadores <strong>de</strong> Máxima<br />

Verosimilitud,<br />

• Contaminación Mo<strong>de</strong>rada, ε = 0.5 y ε = 0.1 , que<br />

parece ser lo más cercano a la realidad, y<br />

• Contaminación Extrema, ε = 0.3 , cuyos resultados<br />

se pue<strong>de</strong>n utilizar para verificar si el Punto <strong>de</strong><br />

Ruptura <strong>de</strong> los Estimadores es mayor a 0.3.<br />

A<strong>de</strong>más, para la Distribución H que genera la<br />

contaminación en el mo<strong>de</strong>lo (2.1) se ha escogido<br />

tres Distribuciones:<br />

• Distribución Normal Multivariada N (0,9Σ), para<br />

seguir con la i<strong>de</strong>a propuesta por Tukey en [15] y<br />

que a<strong>de</strong>más es la Distribución utilizada con más<br />

frecuencia en este tipo <strong>de</strong> estudios.<br />

• Distribución Normal Multivariada<br />

N 0.537 α , 9 ∑ , es <strong>de</strong>cir una Contaminación<br />

( )<br />

6<br />

Asimétrica don<strong>de</strong> α6 representa el vector propio<br />

correspondiente al menor valor propio asociado a la<br />

Matriz <strong>de</strong> Varianzas y Covarianzas; este tipo <strong>de</strong><br />

contaminación es utilizada por Devlin en [2]; y<br />

• Distribución Uniforme Esférica U esf(d), don<strong>de</strong> d<br />

representa la distancia hacia el origen; esta<br />

distribución se utiliza bajo el supuesto que una<br />

observación errónea pue<strong>de</strong> producirse en cualquier<br />

punto con igual probabilidad.


ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />

ALEATORIOS MULTIVARIADOS<br />

Por otro lado, como se menciona en la segunda<br />

sección, el Entorno <strong>de</strong> Contaminación (2.1) indica<br />

que una proporción <strong>de</strong> vectores no siguen la<br />

distribución original, para el caso multivariado esto<br />

implica que existen dos escenarios posibles: ó todas<br />

las componentes <strong>de</strong> la observación están<br />

contaminadas ó ninguna está contaminada; esto sin<br />

embargo no es necesariamente lo que ocurre en la<br />

realidad, pues se pue<strong>de</strong> pensar que los errores se<br />

dan en una o varias componentes <strong>de</strong> la observación,<br />

difícilmente en todas; en base a esto se consi<strong>de</strong>ra<br />

otro tipo <strong>de</strong> contaminación, la misma que consi<strong>de</strong>ra<br />

cada variable in<strong>de</strong>pendientemente, es <strong>de</strong>cir,<br />

mientras en el mo<strong>de</strong>lo (2.1) una observación tiene<br />

probabilidad ε <strong>de</strong> estar contaminada, el segundo<br />

mo<strong>de</strong>lo consi<strong>de</strong>rado indica que cada componente <strong>de</strong><br />

la observación tiene probabilidad ε <strong>de</strong> estar<br />

contaminada. Las distribuciones utilizadas para<br />

generar la contaminación por variable son:<br />

Distribución Normal N ( 0, 9σ i ) y la Distribución<br />

Uniforme U ( −5 ,5).<br />

3.2 PARÁMETROS DE LA SIMULACIÓN<br />

A<strong>de</strong>más <strong>de</strong> lo explicado en la sección 3.1, para el<br />

presente estudio se trabaja con p=6, don<strong>de</strong> p<br />

representa el número <strong>de</strong> variables y el tamaño<br />

muestral será n=kp don<strong>de</strong> k=5 ,10 y 20.<br />

A continuación se presentan las dos Matrices <strong>de</strong><br />

Varianzas y Convarianzas utilizadas para generar<br />

las muestras aleatorias,<br />

⎛ ⎞<br />

1<br />

⎜.950 1<br />

⎟<br />

.300 .100 1<br />

∑<br />

1<br />

= ⎜ ⎟<br />

0 0 0 1<br />

⎜ ⎟<br />

0 0 0 −.499<br />

1<br />

⎜ ⎟<br />

⎝ 0 0 0 −.499 −.499<br />

1 ⎠<br />

a la misma que le correspon<strong>de</strong> los valores propios<br />

λ1=2.029, λ2= λ3=1.499, λ4=0.943, λ5=0.028 y<br />

λ6=0.002.<br />

La segunda matriz consi<strong>de</strong>rada es<br />

∑<br />

2<br />

⎛ ⎞<br />

⎜ ⎟<br />

⎜ ⎟<br />

⎜ ⎟<br />

⎜ ⎟<br />

⎝ ⎠<br />

=<br />

1<br />

.08<br />

.10<br />

.12<br />

1<br />

.12<br />

−.10 1<br />

−.081<br />

−.10 −.08<br />

.08 .10 1<br />

−.08 .10 −.01<br />

.08 .12 1<br />

cuyos valores propios son λ1=1.282, λ2=1.253,<br />

λ3=1.120, λ4=1.056, λ5=0.719 y λ6=0.697.<br />

La matriz Σ1 fue utilizada por Devlin en [2], la<br />

misma tiene correlaciones que varían, es términos<br />

absolutos, entre 0 y 0.95, <strong>de</strong> tal manera que se<br />

25<br />

prueba la habilidad <strong>de</strong>l estimador para <strong>de</strong>tectar esta<br />

variedad <strong>de</strong> correlaciones, a<strong>de</strong>más, λ6 es muy<br />

cercano a cero lo que indica que la matriz es “casi”<br />

singular, esto permite medir el comportamiento <strong>de</strong><br />

los estimadores en condiciones <strong>de</strong> “casi”<br />

singularidad, finalmente, al igual que las<br />

correlaciones, los valores propios asociados a Σ1<br />

también varían ampliamente.<br />

La matriz Σ2 en cambio, presenta correlaciones y<br />

valores propios con poca diferencia, así se mi<strong>de</strong> la<br />

capacidad <strong>de</strong>l estimador ante matrices con poca<br />

variabilidad en sus elementos y los valores propios<br />

asociados a la misma.<br />

Por otro lado, para la simulación <strong>de</strong> Monte Carlo<br />

cada escenario se repite N=500 veces y el software<br />

utilizado para el efecto es R versión 2.8.0 [11].<br />

3.3 CRITERIOS DE EVALUACIÓN<br />

Con el propósito <strong>de</strong> evaluar la Eficiencia y<br />

Estabilidad <strong>de</strong> los Estimadores estudiados; se <strong>de</strong>fine<br />

( ) 1 ( )<br />

1<br />

N<br />

e e<br />

x = ∑ x<br />

N i=<br />

que es el Promedio <strong>de</strong> las estimaciones<br />

correspondientes a “e” para el Vector <strong>de</strong> Medias,<br />

don<strong>de</strong> e ={Clásico, M Huber, T-Bicuadrático,<br />

Bicuadrático, MCD, DS};<br />

( e) { ( e)<br />

max =<br />

}<br />

max<br />

x x<br />

que representa a la estimación “más alejada” <strong>de</strong>l<br />

verda<strong>de</strong>ro valor <strong>de</strong>l parámetro, en términos <strong>de</strong> la<br />

distancia Euclidiana, <strong>de</strong> entre los Vectores <strong>de</strong><br />

Medias correspondientes al estimador e en las N<br />

repeticiones.<br />

Con estos dos vectores se obtiene el Sesgo<br />

Promedio Total y Sesgo Máximo Total, haciendo<br />

T<br />

( e)<br />

( )<br />

Sesgo Promedio Total = Prom ( x ) = x x<br />

T<br />

( e) ( e) ( e)<br />

Sesgo Máximo T = Max ( x ) = ( x max ) x max<br />

es <strong>de</strong>cir, calculando Distancia Euclidiana entre el<br />

verda<strong>de</strong>ro valor <strong>de</strong>l Vector <strong>de</strong> Medias “0” con<br />

( e)<br />

y con x respectivamente.<br />

Se <strong>de</strong>fine también<br />

6<br />

( e) ( e)<br />

sdtotal ( x ) sd ( x )<br />

= ∑<br />

i=<br />

1<br />

i<br />

e ( e)<br />

( ) ( )<br />

( )<br />

( e)<br />

x<br />

que es la suma <strong>de</strong> las Desviaciones Estándar <strong>de</strong> cada<br />

componente <strong>de</strong>l Vector <strong>de</strong> Medias correspondiente<br />

( e)<br />

al estimador e, <strong>de</strong> tal manera que sdtotal ( x )<br />

representa la Desviación Total <strong>de</strong>l estimador e.


Por último, bajo el supuesto que el mejor estimador<br />

es el que presente un mejor balance entre: su<br />

comportamiento promedio, su “peor”<br />

comportamiento y la dispersión <strong>de</strong> sus estimaciones,<br />

se ha elaborado un índice que es:<br />

( e) ( e) ( e)<br />

( Prom ( x ) + Max ( x ) + sdtotal<br />

( x ) )<br />

Indice =<br />

3<br />

(3.1)<br />

la media aritmética entre el Sesgo Promedio Total,<br />

Sesgo Máximo Total y la Desviación Total; <strong>de</strong> tal<br />

manera que el estimador que presente menor índice<br />

será el más Eficiente y Estable en cada escenario<br />

estudiado, nótese que se da la misma importancia a<br />

las tres medidas.<br />

Por otro lado, en la práctica no se conoce cuan<br />

contaminada está la muestra, ni que Distribución<br />

genera la contaminación, etc. solo se tiene la matriz<br />

<strong>de</strong> observaciones y el tamaño muestral, por lo que<br />

en el presente estudio también se explora el<br />

comportamiento <strong>de</strong> los estimadores en función <strong>de</strong>l<br />

Sesgo y Curtosis Muestral, con el propósito <strong>de</strong> que<br />

dichas medidas junto con el tamaño <strong>de</strong> la muestra<br />

sirvan como criterios para <strong>de</strong>cidir que estimador<br />

utilizar.<br />

4. RESUMEN DE RESULTADOS<br />

Se simula en total 184 escenarios, el análisis<br />

<strong>de</strong>tallado <strong>de</strong> los mismos es presentado en [10], en<br />

esta sección se presenta algunos <strong>de</strong> los resultados<br />

obtenidos dando un breve resumen <strong>de</strong> los más<br />

relevantes.<br />

4.1 ANÁLISIS POR ESCENARIO SIMULADO<br />

Las tablas <strong>de</strong> resultado se encuentran divididas en<br />

tres secciones verticales, presentando los resultados<br />

para la estimación <strong>de</strong>l vector <strong>de</strong> medias, los valores<br />

propios y la matriz <strong>de</strong> varianzas y covarianzas, y en<br />

tres secciones horizontales, correspondientes a cada<br />

tamaño muestral k=5 ,10 y 20 . En cada sección se<br />

muestra en la columna <strong>de</strong>nominada “Prom” el<br />

Sesgo Promedio Total, el Sesgo Máximo Total es<br />

presentado en la columna “Max”, mientras que la<br />

Desviación Total se presenta en la columna “Desv”<br />

y en la última columna se muestra el Índice (3.1).<br />

La Tabla I presenta los resultados obtenidos para<br />

el escenario <strong>de</strong> muestras generadas a partir <strong>de</strong> una<br />

Distribución Normal N(0,Σ), Σ=Σ1 sin contaminar;<br />

N. MONTAÑO & G. ZURITA<br />

26<br />

se pue<strong>de</strong> ver que los Estimadores Robustos son<br />

comparables al Estimadores <strong>de</strong> Máxima<br />

Verosimilitud, pues en todos los casos sus<br />

resultados no difieren consi<strong>de</strong>rablemente <strong>de</strong> los<br />

resultados <strong>de</strong>l estimador <strong>de</strong> máxima verosimilitud.<br />

En la simulación realizada en [10], para muestras<br />

generadas a partir <strong>de</strong> una Distribución Normal<br />

N(0,Σ), Σ=Σ2 se notó un comportamiento parecido,<br />

es <strong>de</strong>cir, se verifica que los estimadores Robustos<br />

Estudiados son Eficientes. Consi<strong>de</strong>rando el Sesgo<br />

Promedio Total como medida <strong>de</strong> la “bondad” <strong>de</strong>l<br />

Estimador, en los escenarios simulados, el<br />

Estimador Clásico presenta su “peor” rendimiento<br />

al tratar <strong>de</strong> estimar la Matriz <strong>de</strong> Covarianzas y los<br />

Valores Propios asociados a la misma.<br />

La Tabla II presenta los resultados obtenidos para<br />

muestras generadas a partir <strong>de</strong> una Distribución<br />

Normal N(0,Σ), Σ=Σ1 contaminada con ε =0.10 y<br />

H=N(0,9Σ1), se pue<strong>de</strong> ver como el Estimador<br />

Clásico estima incorrectamente a los Valores<br />

Propios y Matriz <strong>de</strong> Covarianzas, teniendo un índice<br />

más <strong>de</strong> dos veces mayor al índice alcanzado por el<br />

“peor” estimador robusto cuando k =10 y 20. En<br />

general, cuando la muestra es generada a partir <strong>de</strong><br />

una Población Normal N(0,Σ), Σ=Σ1 contaminada<br />

con H=N(0,9Σ1), o H = U esf (d=5) los estimadores<br />

sobreestiman el primer y segundo valor propio para<br />

luego estimar con error “pequeño” los valores<br />

propios restantes; en este caso, los Estimadores<br />

Clásico y MCD son los que sobreestiman con<br />

mayor error el primer valor propio, sin embrago, el<br />

Estimador MCD reduce consi<strong>de</strong>rablemente su error<br />

mientras aumenta el tamaño muestral. Mientras que,<br />

cuando Σ=Σ2 los Estimadores sobreestiman el<br />

primer y segundo valor propio, sin embargo, al final<br />

generalmente subestiman el menor valor propio. De<br />

acuerdo a los resultados obtenidos, el tamaño<br />

muestral influye en la estimación, pues en todos los<br />

estimadores se cumple que al aumentar el mismo, se<br />

disminuye el Sesgo Promedio Total y la Desviación<br />

Total. El estimador T-Bicuadrático es casi siempre<br />

superado por los <strong>de</strong>más Estimadores Robustos,<br />

situación que era previsible pues este estimador fue<br />

construido para mejorar el comportamiento <strong>de</strong> los<br />

estimadores S para p “gran<strong>de</strong>” y en el presente<br />

estudio se consi<strong>de</strong>ra p =6. La Tabla III muestra que<br />

a pesar <strong>de</strong> que la mayoría <strong>de</strong> los Estimadores<br />

Robustos consi<strong>de</strong>rados han sido construidos bajo el<br />

supuesto <strong>de</strong> contaminación simétrica, al ser<br />

sometidos a contaminación asimétrica se comportan<br />

<strong>de</strong> manera similar a cuando la misma es simétrica.


ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />

ALEATORIOS MULTIVARIADOS<br />

TABLA I<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados para Población Normal N (0,Σ), Σ=Σ1 sin Contaminar<br />

TABLA II<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados para Población Normal N(0,Σ1) Contaminada con ε =0.10 y H=N (0,9 Σ1)<br />

27


N. MONTAÑO & G. ZURITA<br />

TABLA III<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados para Población Normal N(0,Σ1) Contaminada con ε =0.10 y H=N (0.537α6,9 Σ1)<br />

TABLA IV<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados para Población Normal N(0,Σ1) Contaminada por variable con ε =0.10 y H=U (-5,5)<br />

28


ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />

ALEATORIOS MULTIVARIADOS<br />

TABLA V<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados para Población Cauchi CAU(0,Σ), Σ=Σ1 sin Contaminar<br />

Así también, los estimadores han sido construidos<br />

siguiendo el entorno <strong>de</strong> contaminación (2.1), sin<br />

embargo, al contaminar por variable, según lo<br />

explicado en la sección 3.1, los Estimadores brindan<br />

“buenas” estimaciones, véase la Tabla IV; no<br />

obstante, en el presente estudio no se analiza las<br />

consecuencias que pue<strong>de</strong> tener la contaminación por<br />

variable en las Técnicas <strong>de</strong> Análisis Multivariado.<br />

Cuando las Muestras son generadas a partir <strong>de</strong> la<br />

Distribución Cauchy, el Estimador Clásico en todos<br />

los casos brinda las estimaciones más distantes <strong>de</strong><br />

cada parámetro poblacional, la Tabla V presenta el<br />

caso cuando se generan muestras a partir <strong>de</strong> una<br />

Cauchy sin contaminar. A<strong>de</strong>más, en estos casos, el<br />

algoritmo utilizado para el Estimador M <strong>de</strong> Huber<br />

no siempre converge a una solución. Los valores<br />

propios son siempre sobreestimados; en la parte<br />

<strong>de</strong>recha <strong>de</strong> la Tabla V se muestra los errores<br />

absolutos y relativos <strong>de</strong> la estimación <strong>de</strong> los valores<br />

propios para k=20.<br />

A las estimaciones brindadas por el estimador DS<br />

en varias ocasiones les correspon<strong>de</strong> un Sesgo<br />

Promedio Total menor al Sesgo presentado por los<br />

<strong>de</strong>más estimadores, sin embargo su “peor”<br />

estimación pue<strong>de</strong> incluso encontrarse más alejada<br />

que la “peor” estimación utilizando el método<br />

Clásico; esto implica que no presente un Balance<br />

a<strong>de</strong>cuado y no sea consi<strong>de</strong>rado el mejor estimador<br />

(<strong>de</strong> acuerdo al índice planteado) en los escenarios<br />

simulados.<br />

29<br />

4.2 ANÁLISIS POR TAMAÑO MUESTRAL,<br />

SESGO Y CURTOSIS<br />

En esta parte <strong>de</strong>l estudio se trata <strong>de</strong> establecer una<br />

“regla empírica” en la cual se utilice el tamaño <strong>de</strong> la<br />

Muestra, el Sesgo y la Curtosis Muestral como<br />

elementos <strong>de</strong> <strong>de</strong>cisión sobre que estimador utilizar<br />

en ese caso.<br />

A cada muestra generada se le ha calculado Sesgo<br />

y Curtosis, a<strong>de</strong>más se <strong>de</strong>terminan la distancia<br />

Euclidiana entre el verda<strong>de</strong>ro valor <strong>de</strong>l Vector <strong>de</strong><br />

Medias, la Matriz <strong>de</strong> Covarianzas y los Valores<br />

Propios asociados a la misma con la estimación<br />

obtenida por cada Método; a partir <strong>de</strong> esto se<br />

establece el estimador “más cercano” en cada<br />

muestra.<br />

En las Tablas VI y VII se presenta un resumen <strong>de</strong><br />

los resultados obtenidos para muestra tamaño 30 y<br />

60 respectivamente; en las mencionadas tablas se<br />

pue<strong>de</strong> observar los tres estimadores que con mayor<br />

frecuencia presentan la menor distancia entre el<br />

valor <strong>de</strong>l parámetro y la estimación; para cada<br />

estimador se presenta la distancia Promedio y su<br />

Desviación Estándar, a<strong>de</strong>más <strong>de</strong> la Frecuencia<br />

Relativa <strong>de</strong> ser el estimador “más cercano” al valor<br />

real.<br />

Así, por ejemplo, con tamaño <strong>de</strong> muestra igual a<br />

30, cuando el Sesgo es menor a 45 y la Curtosis se<br />

encuentra en el intervalo [20, 65) el 25,3% <strong>de</strong> las


ocasiones el estimador Clásico es el que presenta la<br />

menor distancia para la estimación <strong>de</strong>l Vector <strong>de</strong><br />

Medias, siendo su distancia Promedio igual a<br />

0.503±0.174. Mientras que para los Valores Propios<br />

y la Matriz <strong>de</strong> Varianzas y Covarianzas el<br />

Estimador M <strong>de</strong> Huber en más <strong>de</strong>l 50% <strong>de</strong> los casos<br />

brinda la estimación “más cercana”.<br />

A<strong>de</strong>más, para valores <strong>de</strong> Sesgo Muestral superiores<br />

a 45 pero inferiores a 90, el Estimador DS es con<br />

mayor frecuencia el “mejor” estimador, sin embrago<br />

su Promedio y Desviación Estándar <strong>de</strong> la distancia<br />

para el caso <strong>de</strong> los Valores Propios y Matriz <strong>de</strong><br />

Covarianzas es mayor a la presentada por los otros<br />

dos estimadores, por ejemplo, cuando la Curtosis se<br />

encuentra en el intervalo [110, 155) la distancia<br />

promedio correspondiente al Estimador DS al<br />

estimar la Matriz <strong>de</strong> Varianzas y Covarianzas es<br />

11.075 mientras que para el Estimador Bicuadrático<br />

es 8.397, situación que pue<strong>de</strong> ser causada por la alta<br />

dispersión observada en el Estimador DS.<br />

N. MONTAÑO & G. ZURITA<br />

30<br />

De acuerdo a la Tabla VII, cuando el Sesgo<br />

Muestral es mayor a 90 y menor a 180 y la Curtosis<br />

Muestral se encuentra en el intervalo [130, 220) el<br />

estimador MCD alcanza la proporción 0.688 <strong>de</strong> ser<br />

el estimador “más cercano” a los Valores Propios;<br />

es seguido por el estimador DS y Bicuadrático.<br />

Nótese que el estimador que con mayor frecuencia<br />

es el mejor estimador <strong>de</strong> la Matriz <strong>de</strong> Covarianzas y<br />

los Valores Propios asociados a la misma es, para<br />

sesgos mayores a 90, el Estimador MCD.<br />

De acuerdo a los resultados obtenidos, para n =120,<br />

cuando la Curtosis es menor a 230 el Estimador M<br />

<strong>de</strong> Huber o el Estimador Bicuadrático son los que<br />

con mayor frecuencia se constituyen en los<br />

“mejores” estimadores, mientras que para Curtosis<br />

mayor a 230 el mejor estimador es con mayor<br />

frecuencia el MCD.<br />

TABLA VI<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados en función <strong>de</strong>l Sesgo y la Curtosis para tamaño muestral 30


ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />

ALEATORIOS MULTIVARIADOS<br />

TABLA VII<br />

Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />

Resultados en función <strong>de</strong>l Sesgo y la Curtosis para tamaño muestral 60<br />

5. CONCLUSIONES<br />

Se confirma la sensibilidad <strong>de</strong> los Estimadores <strong>de</strong><br />

Máxima Verosimilitud para el Vector <strong>de</strong> Medias y<br />

Matriz <strong>de</strong> Varianzas y Covarianzas ante<br />

<strong>de</strong>sviaciones <strong>de</strong> la Distribución Normal<br />

Multivariada. Cuando la muestra es generada a<br />

partir <strong>de</strong> la Distribución Normal Multivariada, para<br />

cualquier tamaño muestral los Estimadores M <strong>de</strong><br />

Huber y Bicuadrático son generalmente los que<br />

alcanzan el menor índice al estimar el Vector <strong>de</strong><br />

Medias, Matriz <strong>de</strong> Covarianzas y Valores Propios.<br />

Cuando se consi<strong>de</strong>ra muestras generadas a partir <strong>de</strong><br />

una Distribución Cauchy, el Estimador Bicuadrático<br />

31<br />

presenta el mejor comportamiento para k =5,<br />

mientras que para k =10 y k =20 el Estimador MCD<br />

es el que “mejor” estima la Matriz <strong>de</strong> Covarianzas y<br />

los Valores propios, todo ello en base al índice<br />

planteado en 3.2.<br />

Para ε =0.30 los estimadores Robustos estudiados,<br />

se comportan <strong>de</strong> forma parecida a cuando ε =0.05 y<br />

ε =0.10, se concluye entonces que el Punto <strong>de</strong><br />

Ruptura, para p =6 variables, es mayor a 0.3<br />

Finalmente, se recomienda la realización <strong>de</strong><br />

próximos estudios que complementen el presente<br />

trabajo.


N. MONTAÑO & G. ZURITA<br />

REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />

[1]. ANDREWS, D. et al. (1972). Robust<br />

Estimates of Location: Survey and Advances.<br />

Princeton Univ. Press.<br />

[2]. DEVLIN, S., GNANADESIKAN, R., Y<br />

KETTENRING J. (1981). “Robust<br />

estimation of dispersion matrices and<br />

Principal Components”, Journal of the<br />

American Statistical Association; 76, 354-<br />

362.<br />

[3]. HAMPEL, F. (1971). “A general<br />

qualitative <strong>de</strong>finition of robustness”, The<br />

Annals of Mathematical Statistics; 42, 1887–<br />

1896.<br />

[4]. HAMPEL, F. (1974). “The influence curve<br />

and its role in robust estimation”, Journal of<br />

the American Statistical Association; 69,<br />

383–393.<br />

[5]. HUBER, P. (1964). “Robust estimation of a<br />

location parameter”, The Annals of<br />

Mathematical Statistics; 35, 73–101.<br />

[6]. HUBER, P. (1972). “The 1972 wald lecture.<br />

Robust Statistics: A Review”, The Annals of<br />

Mathematical Statistics; 43, 1041–1067.<br />

[7]. HUBER, P. (1979). “Robust Statistical<br />

Procedures”, Society for industrial and<br />

Applied Mathematics.<br />

[8]. MARONNA, R., MARTIN, D. Y YOHAI,<br />

V. (2006). “Robust Statistics: Theory and<br />

Methods”, John Willey & Sons, New York–<br />

USA.<br />

[9]. MARONNA, R. (1976). “Robust M-<br />

Estimators of Multivariate Location and<br />

Scatter”, The Annals of Statistics; 4, 51–67.<br />

[10]. MONTAÑO, N. (2009) “Estimadores<br />

Robustos para el Vector <strong>de</strong> Medias y la<br />

Matriz <strong>de</strong> Varianzas y Covarianzas <strong>de</strong><br />

Vectores Aleatorios Multivariados”, Tesis <strong>de</strong><br />

Grado.<br />

32<br />

[11]. R DEVELOPMENT CORE TEAM<br />

(2008). “R: A language and environment for<br />

statistical computing. R Foundation for<br />

Statistical Computing”, Vienna, Austria.<br />

[12]. ROCKE D. (1996) “Robustness<br />

properties of multivariate location and shape<br />

in high dimension”, The Annals of Statistics;<br />

24, 1327–1345.<br />

[13]. RENCHER, A. (1998). “Multivariate<br />

Statistical Inference and Applications”, John<br />

Willey & Sons, New York–USA.<br />

[14]. SEBER, G. (1984). “Multivariate<br />

observation”, John Willey & Sons, New<br />

York–USA.<br />

[15]. TUKEY, J. (1960). “A survey of<br />

sampling from contaminated distributions”,<br />

Contributions to Probability and Statistics:<br />

Essays in Honor of Harold Hotelling”, Olkin<br />

Ediciones Stanford University Press,<br />

Stanford. CA.<br />

[16]. YOHAI, V. (2004). “Notas <strong>de</strong><br />

probabilidad y estadística”, [en línea]<br />

Universidad <strong>de</strong> Buenos Aires, Buenos Aires<br />

– Argentina.<br />

[17]. ZAMAR, R. (1994) “Estimación<br />

Robusta” , Estadística Española; 36, 327–<br />

387.<br />

[18]. ZUO, Y. (2006). “Robust location and<br />

scatter estimators in multivariate análisis”<br />

(invited book chapter to honor Peter Bickel<br />

on his 65th Birthday), The Frontiers in<br />

Statistics, Imperial College Press.


matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />

<strong>2010</strong>, Vol. 8, No. 2<br />

DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />

Páez Chávez Joseph 1<br />

Abstract. In this manuscript we introduce some important concepts concerning dynamical systems theory. We <strong>de</strong>vote special attention to<br />

studying differential equations from a dynamical systems viewpoint. The introduced concepts are illustrated by examples.<br />

Keywords: Dynamical Systems, discrete-time systems, continuous-time systems, differential equations, vector fields.<br />

Resumen. En este manuscrito presentamos algunos conceptos importantes concernientes a la teoría <strong>de</strong> los sistemas dinámicos. Se presta<br />

especial atención al estudio <strong>de</strong> ecuaciones diferenciales <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> sistemas dinámicos. Los conceptos presentados son<br />

ilustrados mediante ejemplos.<br />

Keywords: Sistemas dinámicos, sistemas <strong>de</strong> tiempo discreto, sistema <strong>de</strong> tiempo contínuo, mo<strong>de</strong>laje matemático.<br />

RECIBIDO: Agosto, <strong>2010</strong><br />

ACEPTADO: Septiembre, <strong>2010</strong><br />

1. INTRODUCTION<br />

Nowadays dynamical systems phenomena appear<br />

in almost every area of science, from the oscillating<br />

Belousov-Zhabotinsky reaction in chemistry to the<br />

chaotic Lorenz system in meteorology, from<br />

complicated behavior in celestial mechanics to the<br />

bifurcations arising in ecological mo<strong>de</strong>ls. It turns<br />

out that many of the phenomena mentioned above<br />

can be <strong>de</strong>scribed by means of differential equations.<br />

For this reason, it is an important task to un<strong>de</strong>rstand<br />

the connections between differential equations and<br />

dynamical systems. By doing this, we obtain a<br />

powerful tool which allows us to study the<br />

qualitative behavior of differential equations<br />

without having to solve them analytically. This is<br />

specially useful when a general solution is not<br />

available or the numerical simulations are too<br />

expensive.<br />

In this article, we continue the study started in [7].<br />

We recall some basic Concepts introduced in that<br />

manuscript and bring some new ones. We also<br />

present a theorem concerning existence and<br />

uniqueness of the solution of initial value problems<br />

and show the connection between these problems<br />

and dynamical systems. Most of the material<br />

presented in this manuscript can be found in the<br />

lectures notes of Prof. Beyn, [4, 5]. There is<br />

nevertheless plenty of literature on this subject, e.g.,<br />

see [1, 2, 3, 6, 8].<br />

______________________________<br />

1 Joseph Páez Chávez, Ph.D, Profesor <strong>de</strong>l Instituto <strong>de</strong> Ciencias<br />

Matemáticas, <strong>ESPOL</strong>. (e_mail: jpaez@espol.edu.ec)<br />

2. BASIC CONCEPTS AND THEOREMS<br />

To begin with, we recall the <strong>de</strong>finition of<br />

dynamical system (cf. [7]):<br />

Definition 2.1. A dynamical system is a triple<br />

{ T , X , { ϕ<br />

t}<br />

} , where T is a time set, X is a state<br />

t∈T<br />

space and t<br />

ϕ : X → X is a family of operators<br />

parametrized by t ∈ T , such that:<br />

0 0<br />

DS1 ∀u∈ X : ϕ ( u) = u, ie . ., ϕ = Idx,<br />

DS2 ∀u ∈ X, ∀s, t ∈T :<br />

( u) ( ( u) ) ,.., ie o<br />

t+ s t s t s t+ s<br />

ϕ = ϕ ϕ ϕ ϕ = ϕ<br />

Here, the set X stands for a metric space. The<br />

t<br />

function ϕ is known as evolution operator. This<br />

operator can be thought of as a “law” that governs<br />

the behavior of the system. Furthermore, the time<br />

set T has the following properties:<br />

• ∃0 ∈ T, ∀t ∈ T : t + 0 = t ,<br />

• ∀ts , ∈ T: s+ t∈T,<br />

• ∀ts , ∈ T : s+ t= t+ s.<br />

This means that T equipped with the operation + is<br />

a commutative semigroup. In [7, Example 2.1], the<br />

author explains the fact that a discrete-time system<br />

is completely <strong>de</strong>fined by knowing the function<br />

1<br />

g:= ϕ . Hence the evolution operator can be<br />

constructed as follows<br />

0<br />

k<br />

ϕ = Idx<br />

, andϕ = g o g o ... o g , (2.1)<br />

<br />

k times<br />

k ∈ . Further, if g is invertible, the system admits<br />

negative values of k. For this reason, the function g<br />

is said to be the generator of the dynamical system.<br />

Now the natural question that arises from this fact is


whether continuous-time systems also have, in some<br />

sense, generators. Note that in this case we <strong>de</strong>al<br />

with values of time on the real line, so the function<br />

1<br />

ϕ does not allow us to construct the evolution<br />

operator, at least not on the whole real line. These<br />

consi<strong>de</strong>rations lead us to the following <strong>de</strong>finition:<br />

Definition 2.2. Let { T , X ,<br />

t { ϕ } } , where<br />

∈T<br />

+<br />

T = or ∪ {} 0 , be a dynamical system such<br />

that ϕ ( x)<br />

•<br />

is differentiable for all x ∈ X . Then<br />

the function f: X → X given by<br />

h 0<br />

d<br />

ϕ ( x) − ϕ ( x<br />

t<br />

)<br />

f ( x) : = ( ϕ ( x)<br />

) = lim<br />

dt t=<br />

0 h→0<br />

h<br />

h∈T<br />

is referred to as infinitesimal generator of the<br />

dynamical system 2 .1Of course, the spirit of a<br />

generator is that we can in some way construct the<br />

evolution operator from the generator. In (2.1) we<br />

explained how the evolution operator of a discretetime<br />

system can be obtained from its generator.<br />

Now we will show that this is possible for<br />

continuous-time systems, too:<br />

N N<br />

Theorem 2.3. Let f : → be the<br />

infinitesimal generator of a dynamical system<br />

N<br />

T , <br />

t<br />

, . Then the function<br />

{ { ϕ } } t∈T<br />

1 ( , ) N<br />

u∈C <br />

T<br />

t<br />

<strong>de</strong>fined as u() t = ϕ ( u0)<br />

is a<br />

solution of the initial value problem<br />

y t = f y t , y(0) = u .<br />

() ( () ) 0<br />

Proof. By DS1 we have that ( 0)<br />

0<br />

ϕ ( )<br />

u = u0 = u0,<br />

so the initial condition is satisfied. According to the<br />

<strong>de</strong>finition of infinitesimal generator we have that<br />

ϕ<br />

∀t ∈ T:<br />

f ( u() t ) = lim<br />

h→0<br />

h∈T<br />

= lim<br />

h→∈<br />

0<br />

h T<br />

h<br />

( u() t ) − u( t)<br />

t<br />

( ( u0) ) − u() t<br />

h t<br />

ϕ ϕ<br />

( ) − ( )<br />

DS2 h t<br />

ϕ u0u t<br />

lim<br />

h 0 h<br />

h<br />

+<br />

=<br />

→<br />

∈T<br />

______________________________<br />

2 Also called vector field of the dynamical system.<br />

h<br />

h<br />

J. PÁEZ<br />

34<br />

()<br />

( + ) − ( )<br />

u t h u t<br />

= lim<br />

h→0<br />

h<br />

h∈T<br />

= u t<br />

This theorem asserts that every dynamical system<br />

(of the type introduced in Definition 2.2) is<br />

completely <strong>de</strong>fined by its infinitesimal generator,<br />

or, more precisely, by the initial value problem<br />

presented above. Now the natural question is<br />

whether every inicial value problem represents a<br />

dynamical system. For this issue to be <strong>de</strong>alt with,<br />

we first present a standard result about the existence<br />

and uniqueness of the solution of inicial value<br />

problems:<br />

N<br />

Theorem 2.4. Let Ω⊂ be open and<br />

1<br />

( ,<br />

N )<br />

y ( t) = f ( y( t) ) , y(0) = u0<br />

f ∈C Ω . Then the initial value problem<br />

(2.2)<br />

has for each u0 ∈ Ω exactly one nonextendible<br />

solution ( , 0 )<br />

t T( u ) t ( u ) t ( u )<br />

u t u ∈Ω, where<br />

( )<br />

∈ 0 =<br />

−<br />

the function u<br />

0 ,<br />

+ 0 ∋ 0.<br />

The domain of<br />

D = t, u ∈ ×Ω: t ∈ J u<br />

{ ( 0) ( 0)<br />

}<br />

is open and u<br />

1<br />

C ( D,<br />

N )<br />

k N<br />

f ∈C ( Ω, ) , then u<br />

k<br />

C ( D<br />

N)<br />

k<br />

∈ . Furthermore, if<br />

∈ , , ≥1.<br />

FIGURE 1<br />

Dynamical systems and differential equations<br />

Domain of <strong>de</strong>finition of the solution of (2.2)<br />

Proof. This is a classical result and its proof can be<br />

found in any book on Differential Equations, e.g.,<br />

see [1, Chapter II].<br />

Besi<strong>de</strong>s guaranteeing existence and uniqueness, this<br />

theorem also gives valuable information about the<br />

domain D of <strong>de</strong>finition of the solution. This domain<br />

turns out to be open and furthermore the solution of


the initial value problem (2.2) does not exist outsi<strong>de</strong><br />

D. For this reason, the interval J(u0) is referred to as<br />

the maximal interval of existence. Here, it is<br />

important to point out that this interval varies with<br />

the initial value u0, see Figure 1. With this few<br />

remarks we can turn back to the question we<br />

outlined before, that is, whether an initial value<br />

problem <strong>de</strong>fines a dynamical system. We will see<br />

that this is true, but in a local sense:<br />

Theorem 2.5. Let the assumptions of Theorem 2.4<br />

N<br />

hold. Then the operador ϕ<br />

i (): i D → , given<br />

t<br />

by ϕ ( u0) = u( t, u0)<br />

, <strong>de</strong>fines a local dynamical<br />

system.<br />

Proof. Let us first show DS1. By the initial value<br />

condition in (2.2), we have that<br />

0<br />

∀u0 ∈Ω : ϕ ( u0) = u( 0, u0) = u0<br />

Now let us work with DS2. Let u0 ∈ Ω and<br />

s ∈ J u be arbitrary, but fixed. Then the<br />

( )<br />

0<br />

t s s<br />

function v() t : ϕ ( ϕ ( u ) ) , t J( ϕ ( u0)<br />

)<br />

=<br />

0<br />

∈ , is<br />

a solution of<br />

y t = f y t ,<br />

s<br />

y(0) = ϕ u (2.3)<br />

() ( () ) ( 0 )<br />

Now consi<strong>de</strong>r the function w() t :<br />

t s<br />

ϕ ( u)<br />

+<br />

If follows that<br />

(2.2)<br />

DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />

= .<br />

d () = ( ( + , 0) ) = ( ( + , 0)<br />

) = ( () )<br />

wt <br />

dt<br />

ut su f ut su f wt<br />

0+<br />

s s<br />

and w( 0)<br />

= ϕ ( u0) = ϕ ( u0)<br />

.<br />

Therefore, w is another solution of (2.3) and by<br />

uniqueness (cf. Theorem 2.4), v = w,i.e.<br />

( ( u0) ) ( u0)<br />

t s t s<br />

ϕ ϕ ϕ +<br />

= .<br />

FIGURE 2<br />

Dynamical systems and differential equations<br />

Forced pendulum<br />

0<br />

35<br />

According to this theorem, the initial value<br />

problem (2.2) always represents an autonomous<br />

dynamical system. Thus, by combining this result<br />

with Theorem 2.3, we can realize that the concept of<br />

dynamical system is closely related to initial value<br />

problems, and, more generally, to differential<br />

equations (see [7, Example 3.2]). In many cases,<br />

physical phenomena inclu<strong>de</strong>s the action of an<br />

external time-<strong>de</strong>pen<strong>de</strong>nt “force”, which leads us to<br />

mo<strong>de</strong>ling the un<strong>de</strong>rlying phenomena by means of<br />

non-autonomous differential equations of the form<br />

y ( t) = f ( t, y( t) ) , y( t0) = u0, t ∈[<br />

t0, tE]<br />

(2.4)<br />

1<br />

N<br />

Where f ∈ C ( ×Ω, ) . Studying in <strong>de</strong>tail<br />

non-autonomous dynamical systems is beyond the<br />

scope of this article, however, we do want to point<br />

out that such systems can be written in an<br />

autonomous way as the following example shows.<br />

Example 2.6. Consi<strong>de</strong>r a pendulum of mass m<br />

attached to a string of length L, which is displaced<br />

by an angle from the vertical rest position, see<br />

Figure 2. Suppose that there exists an external<br />

sinusoidal force F(t) acting on the system. The<br />

dynamics of the pendulum can then be <strong>de</strong>scribed by<br />

the ODE<br />

<br />

g<br />

θ() t + sin ( θ() t ) = Asin ( βt) + Bcos ( βt)<br />

, t ∈<br />

L<br />

(2.5)<br />

where ABβ , , ∈ , β > 0 are fixed and g stands for<br />

the gravity constant. The case where there is no<br />

external force (i.e. A = B = 0) was studied in [7,<br />

Example 2.3]. There, it is proved that the pendulum<br />

can be seen as an autonomous dynamical system.<br />

Now we will show how to <strong>de</strong>al with the external<br />

force in or<strong>de</strong>r to preserve the autonomous carácter<br />

of the system. One way to achieve this is adding a<br />

nonlinear oscillator to the system. An example of<br />

such an oscillator is given by<br />

2 2<br />

⎧x()<br />

t = x() t + β y() t − x() t( x() t + y() t ) ,<br />

⎪<br />

⎨<br />

2 2<br />

⎪y()<br />

t = y() t − β x() t − y() t ( x() t + y() t ) ,<br />

⎩<br />

which has the solution<br />

x( t) = sin ( βt) , y( t) = cos(<br />

βt)<br />

. Now consi<strong>de</strong>r<br />

the functions u( t) = θ( t) , v( t) = θ(<br />

t) , t ∈<br />

, and<br />

<strong>de</strong>fine


⎛ ⎞<br />

v<br />

⎜ g<br />

⎟<br />

− sin + +<br />

G( u, v, x, y)<br />

: = ⎜ L<br />

⎟,<br />

⎜x + β y − x x + y ⎟<br />

⎜<br />

⎟<br />

y − β x − y x + y ⎟<br />

Where ( ) 4<br />

( u) Ax By<br />

2 (<br />

2 (<br />

2)<br />

2)<br />

⎝ ⎠<br />

z : = u, v, x, y ∈ . Thus, it is easy to see<br />

that the non-autonomous system (2.5) can be<br />

written as<br />

z () t = G( z() t ) ,<br />

which is an autonomous differential equation of the<br />

type of (2.2). This discussion provi<strong>de</strong>s us with a<br />

way of applying the theory <strong>de</strong>veloped for<br />

autonomous dynamical systems to the present nonautonomous<br />

case. In many cases it may happen that<br />

the external force is not periodic, or difficult to<br />

mo<strong>de</strong>l by an autonomous oscillator. If this is so, we<br />

can resort to writing system (2.4) in autonomous<br />

form as follows:<br />

⎧y()<br />

t = f ( h() t , y() t ) , t ∈[<br />

t0, tE]<br />

,<br />

⎪<br />

⎪h()<br />

t = 1,<br />

⎪<br />

⎨<br />

⎪y(<br />

t0) = u0,<br />

⎪<br />

⎪h(<br />

t0) = t0.<br />

⎩<br />

This is an autonomous system of N + 1 ODEs with<br />

N + 1 initial conditions.<br />

3. EQUILIBRIA, ORBITS, AND PHASE<br />

DIAGRAMS<br />

A common approach for starting the study of<br />

dynamical systems consists in introducing<br />

geometrical objects that allow us to visualize<br />

dynamical properties, thereby making their analysis<br />

easier. To achieve this, we will begin with the<br />

concept of orbit. Then we will realize that a<br />

dynamical system can be qualitatively <strong>de</strong>scribed by<br />

drawing some “typical” orbits. This process leads us<br />

to the so-called phase diagram. To begin with, let us<br />

first introduce the notion of equilibrium, which is<br />

the simplest object of study in dynamical systems.<br />

To this end, we consi<strong>de</strong>r the Example 2.6 without<br />

forcing, see Figure 2. In [7, Example 3.1], the<br />

(approximate) evolution operator<br />

( ) 2 2<br />

ϕ () :<br />

⋅<br />

i × → is found to be<br />

J. PÁEZ<br />

36<br />

t θ<br />

θ ′<br />

⎛ ⎞ ⎛θ⎞ ω θ ω g<br />

ϕ ⎜ = = , ω =<br />

θ ⎟<br />

⎝ ⎠ t L<br />

where<br />

⎛ 0<br />

⎞<br />

0 () t ⎜ sin( t) + 0 cos( t)<br />

⎟<br />

ω<br />

′ ⎜<br />

0 θ ′ () ⎟ ⎜ ⎟<br />

⎝ ⎠ ⎜θ0cos( ωt) θ0ωsin( ωt)<br />

⎟<br />

⎝ ′ − ⎠<br />

θ and<br />

0<br />

(3.1)<br />

θ ′ represent the angle and angular<br />

0<br />

velocity of the pendulum, respectively, at t = 0.<br />

Now suppose that we let the pendulum run with the<br />

initial conditions θ = θ′<br />

= 0 . How does the<br />

0 0<br />

system evolve in time? From the formula for the<br />

evolution operador presented above, it is easy to see<br />

t<br />

that ϕ ( θ , θ′<br />

0 0)<br />

= 0,<br />

for all t. We can also arrive at<br />

this conclusion from a physical point of view.<br />

Initializing the system with θ = θ′<br />

= 0 amounts<br />

0 0<br />

to placing the pendulum at the vertical position with<br />

initial angular velocity equal to zero. It is then clear<br />

that the pendulum will remain at the vertical<br />

position θ = 0 forever. This illustrates the simplest<br />

behavior that a dynamical system may present.<br />

However, this simple behavior can be seen in more<br />

complicated/abstract systems, too. Consi<strong>de</strong>r for<br />

example the PDE<br />

⎧∂u<br />

∂u<br />

( xt , ) + x ( xt , ) = 0<br />

⎪ ∂t ∂x<br />

⎨<br />

,<br />

⎪<br />

u( x,0) = f ( x)<br />

⎪⎩<br />

( , ) , ( )<br />

1 2 1<br />

u ∈C f ∈C<br />

with evolution operator<br />

() 1 1<br />

ϕ (): C ( ) C ( )<br />

⋅<br />

⋅ × → given by<br />

t −t<br />

( ϕ ( f ) )( x) = f ( xe ) (cf. [7, Example 3.2]).<br />

Choose the initial condition f ( x) = K for all<br />

x ∈ being a real constant. Then it follows that<br />

t −t<br />

t<br />

( ϕ ( ) )( ) ( ) ( ) ϕ ( )<br />

∀t∈ :<br />

f x = f xe = K= f x ⇒ f = f<br />

This means that if we initialize the system at a<br />

constant function, the system will remain at that<br />

function forever. These two examples illustrate the<br />

concept of equilibrium of a dynamical system,<br />

which is formally <strong>de</strong>fined as follows:<br />

Definition 3.1. Let { T, X , { ϕ<br />

t}<br />

} be a dynamical<br />

t∈T<br />

system. A point x0 ∈ X is referred to as<br />

equilibrium point if<br />

t ∀t∈ T : ϕ ( x0) = x0<br />

In other words, we can say that if a dynamical<br />

system is placed at an equilibrium point, it will


emain there forever. This fact was already seen in<br />

the examples above. In the literature, equilibrium<br />

points are also called “steady states”, “equilibrium<br />

solutions”, “stationary points”, “rest points”, and<br />

“fixed points”, among others. Some authors reserve<br />

the name “equilibrium” for continuous-time<br />

systems, while the term “fixed point” is used when<br />

<strong>de</strong>aling with discrete-time systems. However, the<br />

rea<strong>de</strong>r should have in mind that both terms stand for<br />

the same dynamical object. Now that we have<br />

introduced our first (and the simplest) dynamical<br />

object of study, our next task will be to investigate<br />

how to <strong>de</strong>tect such objects, provi<strong>de</strong>d the<br />

(infinitesimal) generator of the system is known.<br />

This task is accomplished in the following:<br />

1 N N<br />

Theorem 3.2. Let f, g C ( , )<br />

the Systems<br />

() ( () ) , ( 0)<br />

DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />

∈ . Consi<strong>de</strong>r<br />

x t = f x t x = ξ , (3.2)<br />

( )<br />

x = g x , x = ξ , n∈<br />

(3.3)<br />

n n−1<br />

0<br />

N<br />

Then z0 ∈ is an equilibrium (resp. fixed point)<br />

f z 0 = 0<br />

(resp. g(z0) = z0).<br />

Proof. Let us first work with system (3.2). Assume<br />

that z0 is an equilibrium of (3.2). This means that<br />

t ϕ ( z0) = z0<br />

for all t. Thus, according to<br />

Definition 2.2, we have that<br />

d t<br />

d<br />

f ( z0) = ( ϕ ( z ) ) = ( z0)<br />

= 0<br />

dt 0<br />

t= 0 dt t=<br />

0<br />

f z = 0 . Define the constant<br />

of (3.2) (resp. (3.3)), if and only if ( )<br />

Now suppose that ( )<br />

0<br />

function () 0 , xt = z t∈<br />

. It is then easy to check<br />

that x is a solution of (3.2), and by uniqueness (cf.<br />

t<br />

Theorem 2.4), we can conclu<strong>de</strong> that ( )<br />

ϕ z = z<br />

0 0<br />

for all t ∈ . Hence z 0 is an equilibrium of (3.2).<br />

Now let us turn to the discrete-time case. Assume z0<br />

n<br />

to be a fixed point of (3.3), i.e., ϕ ( z0) = z0<br />

for all<br />

n ∈ ∪ { 0}<br />

. By (2.1), it is readily seen that<br />

( 0) 1<br />

ϕ ( 0) 0<br />

( ) = , and that<br />

n ( )<br />

g z = z = z . Now suppose that<br />

g z z<br />

0 0<br />

ϕ z = z for some fixed<br />

0 0<br />

n ∈ holds. It follows by induction that<br />

DS 2<br />

n+ 1 n 1<br />

n<br />

z = z0 = z0 = z0<br />

( 0 ) ( ( ) ) ( )<br />

ϕ ϕ ϕ ϕ<br />

<br />

= z<br />

0<br />

37<br />

n<br />

Hence ϕ ( z ) = z for all { 0}<br />

0 0<br />

n ∈ ∪ , i.e., z0 is<br />

a fixed point of (3.3).<br />

The principal significance of the theorem is that it<br />

provi<strong>de</strong>s us with a way of finding and<br />

characterizing equilibrium points of dynamical<br />

systems. In other words, if we are interested in<br />

equilibrium points (resp. fixed points) of system<br />

(2.2) (resp. (3.3)), we should look for the solutions<br />

of the equation f ( x ) = 0 (resp. g ( x) = x.<br />

Now<br />

that we have un<strong>de</strong>rstood the meaning of equilibrium<br />

point, we can proceed with the concept of a<br />

somewhat more elaborated dynamical object, the<br />

so-called orbit.<br />

{ }<br />

Definition 3.3. Let , ,<br />

t { }<br />

T X ϕ<br />

t∈T<br />

be a<br />

dynamical system and x0 ∈ X . The set<br />

r<br />

t<br />

( 0) = { ∈ : = ϕ ( 0)<br />

, ∈T }<br />

O x x X x x t<br />

is referred to as orbit of x0.<br />

Before showing some examples, it is worth<br />

presenting a few remarks:<br />

• ∀x0 ∈ X : Or( x0) ⊂ X ,<br />

• If x 0 is an equilibrium point, then<br />

( ) { }<br />

Orx0 = x0<br />

, i.e., an equilibrium point is<br />

•<br />

the simplest orbit,<br />

in continuous-time dynamical systems, the<br />

orbits are curves parametrized by the time t,<br />

• in discrete-time dynamical systems, the orbits<br />

are sequences in X, i.e., OΓ( x0) ∈ X<br />

T for all<br />

x0 ∈ X .<br />

Let us illustrate the concept of orbit by some<br />

examples.<br />

FIGURE 3<br />

Dynamical systems and differential equations<br />

Orbit of the pendulum system


Example 3.4. Consi<strong>de</strong>r again the pendulum system<br />

of Example 2.6, without external forcing. The<br />

evolution operator can be written as (cf. (3.1))<br />

⎛ R<br />

0 ⎛ ⎞⎞<br />

t ⎛R0⎞ sin ⎜ωt φ ⎟<br />

ϕ = ⎜ +<br />

ω ⎝ 0 ⎠⎟<br />

⎜φ⎟ , where<br />

⎝ 0 ⎠ ⎜ ⎛ ⎞ ⎟<br />

R COS ⎜ωt+ φ ⎟ ⎟<br />

⎝ 0 ⎝ 0 ⎠ ⎠<br />

R = θ ′<br />

2<br />

+<br />

2<br />

ωθ0<br />

θω and sin ( φ ) =<br />

( ) ( )<br />

0 0 0<br />

∞<br />

⎜ ⎟<br />

⎝ ⎠n=<br />

0<br />

R0<br />

Here, we must choose small (why?). Thus, an<br />

ω<br />

orbit of the pendulum system is <strong>de</strong>scribed by the<br />

parametric curve<br />

⎧⎛ R ⎞ ⎫<br />

⎪ 0 ⎛ ⎞<br />

sin ⎜ωt+ φ ⎟ ⎪<br />

Or( θ , θ′ 0 ) = 0 : t<br />

0 ⎨<br />

⎜<br />

ω ⎝ ⎠⎟<br />

∈<br />

⎬.<br />

⎛ ⎞<br />

⎪<br />

⎜ R COS ⎜ωt+ φ ⎟ ⎟<br />

⎩⎝ ⎪<br />

0 ⎝ 0 ⎠ ⎠ ⎭<br />

A typical example of an orbit of this system is<br />

<strong>de</strong>picted in Figure 3. Note that, in this case, the<br />

orbits are always closed curves, which reveals the<br />

periodic nature of the system (in the absence of<br />

friction!). In the figure, the arrow stands for the<br />

direction of the evolution as the time increases.<br />

How does the orbit Or ( 0,0)<br />

look like?<br />

Example 3.5. Let g : → be <strong>de</strong>fined by<br />

2<br />

g ( x) = x . Consi<strong>de</strong>r the system<br />

( 1 ) ,<br />

xn = g xn−n∈ .<br />

Choose x 0 = 2 as initial point. Then we have that<br />

( ) n<br />

Or2 = { x∈ : x= ϕ ( 2 ) , n=<br />

0,1,... } = { 2,4,16,... }<br />

⎛ n<br />

2 ⎞ {} 0<br />

= 2 ∈ ∪<br />

<br />

.<br />

<br />

Clearly, x = 1 and x = 0 are fixed points of the<br />

system, and so it follows that O r ( 1) = { 1}<br />

and<br />

O r ( 0) = { 0}<br />

. In the examples above we have<br />

illustrated the concept of orbit for both continuous<br />

and discrete-time dynamical systems. As we pointed<br />

out before, an orbit is a subset of the state space,<br />

and so we can ask ourselves whether the state space<br />

could be, in some sense, <strong>de</strong>composed into a<br />

collection of orbits of a dynamical system. To this<br />

end, the following theorem gives us important<br />

information:<br />

t<br />

Theorem 3.6. Let { T , X , { ϕ } } be an invertible<br />

t∈T<br />

(cf. [7, Section 3]) dynamical system.<br />

0<br />

R<br />

0<br />

J. PÁEZ<br />

38<br />

Let u0, v0 ∈ X . Then r ( 0) r ( 0)<br />

Or ( u0) ∩ Or ( v0)<br />

.<br />

Proof. Suppose that ( ) ( ) ≠<br />

means that<br />

O u ∩ O v = φ or<br />

O u ∩ O v φ . This<br />

r 0 r 0<br />

( 0) ( 0)<br />

t s<br />

ϕ ( ) ϕ ( )<br />

∃y∈ X : y∈Or u<br />

: y =<br />

∧ y∈Or u0 =<br />

v<br />

v0<br />

⇔ ∃s, t ∈T<br />

Therefore, we have that<br />

Γ<br />

DS2 Γ−t Γ−t s<br />

DS 2<br />

Γ−+ t s<br />

0 0 0 0<br />

( )<br />

: ( ) t(<br />

)<br />

<br />

= ϕs(<br />

v0<br />

)<br />

( )<br />

This implies that Or ( u0) Or ( v0)<br />

analogously that Or ( v0) Or ( u0)<br />

O ( u ) = O ( v ) .<br />

( ) ( ) Γ ( )<br />

∀Γ ∈ ϕ u = ϕ ϕ u = ϕ ϕ v = ϕ v ∈O<br />

v<br />

0<br />

r 0 r 0<br />

⊆ . We can prove<br />

⊆ and hence<br />

From this Theorem, we can conclu<strong>de</strong> the following:<br />

• Two orbits satisfying the conditions of the<br />

theorem above are either disjoint or i<strong>de</strong>ntical,<br />

• through every point in the state space passes only<br />

one orbit. Consequently, it follows that<br />

.<br />

X = ∪ Or( x0)<br />

x0∈X This means that the state space can be represented<br />

as the disjoint union of orbits of un<strong>de</strong>rlying<br />

dynamical system. This motivates the <strong>de</strong>finition of<br />

phase diagram (see below).<br />

t<br />

Definition 3.7. Let { T, X , { ϕ } } be a dynamical<br />

t∈T<br />

system. The partitioning of the state space into<br />

orbits is referred to as phase diagram 2 of the<br />

dynamical system. Let us restrict our attention to<br />

initial value problems (cf. (2.2)). In this case, the<br />

phase diagram consists of a family of solution<br />

curves of the system (2.2) obtained by varying the<br />

initial condition u 0 . It is clear that if x is any point<br />

in OΓ ( u0)<br />

, then f ( x ) represents tangent vector of<br />

the solution curve at x. For this reason, the ODE<br />

(2.2) is also referred to as vector field.<br />

Let us consi<strong>de</strong>r again the pendulum system of<br />

Example 3.4. How does its phase diagram look<br />

like? We have seen that any orbit of that system is<br />

given by<br />

r<br />

⎧⎛ R ⎞ ⎫<br />

θ θ = ω<br />

∈<br />

.<br />

( , ′ 0 )<br />

0<br />

⎪ 0 ⎛ ⎞<br />

sin ⎜ωt+ φ ⎟ ⎪<br />

⎨<br />

⎜ ⎝ 0 ⎠⎟:<br />

⎬<br />

⎛ ⎞<br />

⎪<br />

⎜ R COS ⎜ωt+ φ ⎟ ⎟ ⎪<br />

0 ⎝ 0 ⎠<br />

O t<br />

⎩⎝ ⎠ ⎭


FIGURE 4<br />

Dynamical systems and differential equations<br />

Phase diagram of the pendulum system<br />

If we vary the initial conditions<br />

0 0 , θ θ ′ , we will then<br />

obtain several closed curves centered at the origin,<br />

see Figure 4. The phase diagram provi<strong>de</strong>s us with<br />

an easy way of visualizing the behavior of a<br />

dynamical system. Useful information can be<br />

obtained from the phase plot, even if we do not<br />

know the evolution operator. For instance, suppose<br />

that a pendulum system presents the phase plot as<br />

shown in Figure 5. From this picture, we can see<br />

that the orbits are no longer periodic, but they spiral<br />

into the origin, which is an equilibrium point. Hence<br />

this point is called a spiral sink. What does this<br />

mean from a physical point of view? Note that the<br />

phase diagram tells us that any initial point will,<br />

after a long time, end at the equilibrium point. This<br />

fact reveals the presence of friction, which prevents<br />

the system from oscillating forever as it happens in<br />

the pendulum system <strong>de</strong>scribed in Figure 4.<br />

DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />

39<br />

4. CONCLUSIONS<br />

In this manuscript we have seen that dynamical<br />

systems and autonomous differential equations are<br />

intimately related objects. In particular, Theorems<br />

2.3 and 2.5 reflect this fact. We have also learned<br />

how to <strong>de</strong>al with non-autonomous differential<br />

equations, which appear when an external forcing is<br />

present. More importantly, we have introduced<br />

several geometrical objects such as equilibrium<br />

points, orbits and phase diagrams. With these<br />

concepts, our goal was to provi<strong>de</strong> the rea<strong>de</strong>r with<br />

tools for facilitating the study of the qualitative<br />

behavior of dynamical systems. In forthcoming<br />

articles we will explain in more <strong>de</strong>tail how the<br />

objects mentioned above can be used for the<br />

analysis of dynamical systems.<br />

FIGURE 5<br />

Dynamical systems and differential equations<br />

Phase diagram of a damped pendulum system


[1]. AMANN, H. (1995). “Gewöhnliche<br />

Differentialgleichungen”, second ed. Walter <strong>de</strong><br />

Gruyter, Berlin.<br />

[2]. ARROWSMITH, D., AND PLACE, C. M.<br />

(1990). “An Introduction to Dynamical<br />

Systems”. Cambridge University Press.<br />

[3]. ARROWSMITH, D., AND PLACE, C. M.<br />

“Dynamical Systems: Differential Equations,<br />

Maps, and Chaotic Behaviour”. Chapman &<br />

Hall, 1992.<br />

[4]. BEYN, W.-J. (1991). “Dynamische Systeme.<br />

Vorlesungsskriptum”, Bielefeld University.<br />

[5]. BEYN, W.-J. (2009). “Numerik dynamischer<br />

Systeme”. Vorlesungsskriptum, Bielefeld<br />

University.<br />

J. PÁEZ<br />

REFERENCES AND ELECTRONIC<br />

40<br />

[6]. GUCKENHEIMER, J., AND HOLMES, P.<br />

(1993). “Nonlinear Oscillations, Dynamical<br />

Systems, and Bifurcations of Vector Fields”,<br />

vol. 42 of Applied Mathematical Sciences.<br />

Springer-Verlag, New York. Fourth printing.<br />

[7]. PÁEZ CHÁVEZ, J. (<strong>2010</strong>). “A short<br />

Introduction to Dynamical Systems”.<br />

Matemática: Una Publicación <strong>de</strong>l ICM -<br />

<strong>ESPOL</strong> 8, 1, 28–33.<br />

[8]. WIGGINS, S. (2003). “Introduction to<br />

Applied Nonlinear Dynamical Systems and<br />

Chaos”, second ed., vol. 2 of Texts in Applied<br />

Mathematics. Springer-Verlag, New York.


matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />

<strong>2010</strong>, Vol. 8, No. 2<br />

RESOLUCIÓN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO<br />

PARA EL PROBLEMA DE LA DISPERSIÓN MÁXIMA<br />

1 Sandoya Fernando<br />

Resumen. El problema <strong>de</strong> la dispersión equitativa, o <strong>de</strong> la dispersión máxima consiste en que dado un conjunto <strong>de</strong> nodos y una función<br />

<strong>de</strong> “distancias” entre estos nodos, se trata <strong>de</strong> escoger un subconjunto <strong>de</strong> ellos <strong>de</strong> tal manera que este sea lo más “diverso” posible, en<br />

términos <strong>de</strong> alguna métrica consi<strong>de</strong>rada, aquí se resuelve un problema <strong>de</strong>nominado <strong>de</strong>l MAXIMO PROMEDIO en el cual el número <strong>de</strong><br />

elementos a seleccionarse también es una variable <strong>de</strong> <strong>de</strong>cisión. Otros mo<strong>de</strong>los han sido extensamente estudiados por otros autores<br />

Martí y Duarte [1], Glover [2], Prokopyev [3] y Resen<strong>de</strong> y Martí [4]. En este artículo se estudia el mo<strong>de</strong>lo <strong>de</strong>l MAXIMO PROMEDIO<br />

(MAXMEAN), que en general es un problema difícil <strong>de</strong> optimización combinatorio, <strong>de</strong>l tipo Strongly NP-hard. También se estudia la<br />

utilización <strong>de</strong>l mo<strong>de</strong>lo MAXSUM para la resolución <strong>de</strong>l MAXMEAN, y se <strong>de</strong>termina un procedimiento exacto más eficiente para<br />

resolverlo. Para comprobar los mo<strong>de</strong>los se <strong>de</strong>sarrollaron instancias <strong>de</strong> prueba aleatorias para diferentes tamaños <strong>de</strong>l problema. Todos<br />

los problemas en su formulación como mo<strong>de</strong>lo <strong>de</strong> programación matemática MIP o MIQCP fueron implementados en GAMS y<br />

resueltos con CPLEX 12.0 y con CONOPT3.<br />

Palabras Claves. Diversidad máxima, Optimización combinatoria, Programación cuadrática.<br />

Abstrat. The equitable dispersion problem, or the maximum dispersion problem is that given a set of no<strong>de</strong>s and a function of "distance"<br />

between these no<strong>de</strong>s, it comes to choosing a subset of them so this is as "different" possible in terms of some metric consi<strong>de</strong>red. Here we<br />

solve a problem called the maximum average in which the number of elements to be selected is also a <strong>de</strong>cision variable. Other mo<strong>de</strong>ls<br />

have been extensively studied by other authors: Marti and Duarte [1], Glover [2], Prokopyev [3] and Resen<strong>de</strong> and Marti [4]. In this<br />

paper we study the mo<strong>de</strong>l MAXIMUM AVERAGE (MAXMEAN), which in general is a difficult combinatorial optimization, type Strongly<br />

NP-hard. To test the mo<strong>de</strong>ls <strong>de</strong>veloped random test instances for different sizes of the problem. All the problems in its formulation as a<br />

mathematical programming mo<strong>de</strong>l or MIQCP MIP were implemented in GAMS and solved with CPLEX 12.0 and CONOPT3.<br />

Key words. Combinatorial Optimization, Maximum Diversity, Quadratic Programming.<br />

Recibido: Agosto, <strong>2010</strong><br />

Aceptado: Septiembre, <strong>2010</strong><br />

1. INTRODUCCIÓN<br />

El problema <strong>de</strong> la dispersión equitativa, o <strong>de</strong> la<br />

dispersión máxima consiste en que dado un<br />

conjunto N = {1,2,…,n} <strong>de</strong> nodos y una función<br />

<strong>de</strong> “distancias” dij entre estos nodos, se trata <strong>de</strong><br />

escoger un subconjunto M <strong>de</strong> cardinalidad m (m ≤<br />

n) <strong>de</strong> tal manera que M sea lo más “diverso”<br />

posible, don<strong>de</strong> el término “diverso” se explica en<br />

términos <strong>de</strong> una métrica consi<strong>de</strong>rada; es <strong>de</strong>cir, la<br />

dispersión <strong>de</strong>be relacionarse con algún tipo <strong>de</strong><br />

medida, en la literatura se han planteado 3<br />

mo<strong>de</strong>los distintos, <strong>de</strong>notados como: MAXMIN,<br />

MAXSUM, y MAXMINSUM, últimamente<br />

Prokopyev [3] ha planteado dos problemas<br />

adicionales: <strong>de</strong>nominados <strong>de</strong>l MAXIMO<br />

PROMEDIO y MINDIFF, <strong>de</strong> los cuales en uno <strong>de</strong><br />

ellos, el <strong>de</strong>l MAXIMO PROMEDIO, el número<br />

<strong>de</strong> elementos a seleccionarse también es una<br />

variable <strong>de</strong> <strong>de</strong>cisión, y en los restantes cuatro<br />

mo<strong>de</strong>los este es un valor pre<strong>de</strong>terminado, estos<br />

autores enuncian los problemas pero no plantean<br />

sus soluciones.<br />

Los mo<strong>de</strong>los MAXMIN y MAXSUM han sido<br />

extensamente estudiados por Martí y Duarte [1],<br />

________________________<br />

1 Sandoya Fernando, M.Sc., Profesor <strong>de</strong> la <strong>Escuela</strong> Superior<br />

Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>); Coordinador <strong>de</strong> la carrera<br />

Ingeniería en Logística y Transporte ICM – <strong>ESPOL</strong>.<br />

(e_mail: fsandoya@espol.edu.ec)<br />

Glover [2], Prokopyev [3] y Resen<strong>de</strong> y Martí [4].<br />

En este artículo se estudia el mo<strong>de</strong>lo <strong>de</strong>l<br />

MAXIMO PROMEDIO (MAXMEAN), que en<br />

general es un problema difícil <strong>de</strong> optimización<br />

combinatorio, <strong>de</strong>l tipo Strongly NP-hard.<br />

También se estudia la utilización <strong>de</strong>l mo<strong>de</strong>lo<br />

MAXSUM para la resolución <strong>de</strong>l MAXMEAN, y<br />

se <strong>de</strong>termina un procedimiento exacto más<br />

eficiente para resolverlo.<br />

Para comprobar los mo<strong>de</strong>los se <strong>de</strong>sarrollaron<br />

instancias <strong>de</strong> prueba para diferentes valores <strong>de</strong> n y<br />

m, en estos problemas <strong>de</strong> prueba se generaron los<br />

valores <strong>de</strong> dij, usando primero una distribución<br />

uniforme (0,20). En vista <strong>de</strong> las soluciones que se<br />

observaron en el mo<strong>de</strong>lo MAXMEAN para estos<br />

valores <strong>de</strong> dij, se consi<strong>de</strong>ró luego instancias en las<br />

cuales los valores <strong>de</strong> dij son positivos y negativos,<br />

generándolos por medio <strong>de</strong> una distribución<br />

uniforme (-10,10)<br />

Todos los problemas en su formulación como<br />

mo<strong>de</strong>lo <strong>de</strong> programación matemática MIP (Mixed<br />

integer Programming) con variables binarias<br />

fueron implementados en GAMS y resueltos con<br />

CPLEX 12.0, y a<strong>de</strong>más se trató el problema<br />

MAXSUM en su formulación <strong>de</strong> programación<br />

matemática MIQCP (Mixed Integer Quadratically<br />

Constrained Programming) con variables binarias<br />

usando el solver en período <strong>de</strong> prueba CONOPT3.


2. FORMULACIONES<br />

Los mo<strong>de</strong>los consi<strong>de</strong>rados son: MAXSUM<br />

IQCP, MAXSUM IP, MAX-MEAN, MAX-MIN<br />

SUM y MIN-DIFF. La formulación <strong>de</strong> estos<br />

mo<strong>de</strong>los es la siguiente:<br />

2.1 MAXSUM IQCP<br />

El problema <strong>de</strong> la máxima diversidad<br />

originalmente fue planteado en términos <strong>de</strong><br />

seleccionar el conjunto <strong>de</strong> elementos que<br />

maximice la suma <strong>de</strong> las distancias entre los<br />

nodos seleccionados, esta pue<strong>de</strong> ser la forma más<br />

“obvia” <strong>de</strong> plantear el problema, esta línea <strong>de</strong><br />

pensamiento dio origen al mo<strong>de</strong>lo <strong>de</strong> la Máxima<br />

Suma o MAXSUM, que se formula como un<br />

problema <strong>de</strong> programación cuadrática binaria <strong>de</strong><br />

la siguiente manera:<br />

Para i = 1, 2,..., n,<br />

la variable x i toma el valor 1<br />

si el elemento i-ésimo es seleccionado y 0 sino; el<br />

mo<strong>de</strong>lo MAXSUM IQCP es entonces formulado<br />

como un problema <strong>de</strong> programación cuadrática<br />

binaria:<br />

( )<br />

n= 1 n<br />

MaxSum IQCP Max∑∑<br />

dxx ij i j (1)<br />

n<br />

i=<br />

1<br />

i= 1 j= i+<br />

1<br />

s.. t∑ xi= m<br />

(2)<br />

x = 0,1 i = 1, 2,..., n (3)<br />

2.2 MAXSUM IP<br />

i<br />

El mo<strong>de</strong>lo MAXSUM IQCP pue<strong>de</strong> ser<br />

fácilmente linealizado introduciendo nuevas<br />

variables variables zij <strong>de</strong> la siguiente manera:<br />

n= 1 n<br />

MaxSum IP Max ∑ ∑ dij zij<br />

(4)<br />

i= 1 j= i+<br />

1<br />

( )<br />

s.t. (2), (3) y:<br />

zij ≥ xi+ xj−1, zij ≤ xi, (5)<br />

zij ≤ xj, 1 ≤ i ≤ j ≤ n;<br />

2.3 MAX MIN<br />

{ }<br />

z ∈ 0,1 , 1 ≤ i ≤ j ≤ n (6)<br />

ij<br />

Seleccionar un subconjunto <strong>de</strong> dispersión<br />

máxima <strong>de</strong> cardinalidad m también pue<strong>de</strong> ser<br />

entendido como la selección <strong>de</strong> los m elementos<br />

F. SANDOYA<br />

42<br />

para los cuales se maximiza la menor <strong>de</strong> las<br />

distancias dij entre los elementos seleccionados:<br />

( MaxMin) max { min dxx ij i j<br />

i,j M }<br />

M: M = m ∈<br />

{ }<br />

xi ∈ 0,1 ; 1 ≤ i ≤ n (8)<br />

(7)<br />

El mo<strong>de</strong>lo MAXMIN pue<strong>de</strong> ser linealizado y<br />

planteado como un problema <strong>de</strong> programación<br />

entera con variables binarias, como se <strong>de</strong>muestra<br />

en [8].<br />

2.4 MIN DIFF<br />

Para formular el problema Min-Diff<br />

introducimos<br />

dicomo: ()<br />

el concepto <strong>de</strong>l diferencial<br />

di () = ∑ dij<br />

j∈M, j≠i (9)<br />

Así el problema MIN DIFF pue<strong>de</strong> ser formulado<br />

como:<br />

( MinDiff ) Min { maxi M di () −mini<br />

M di () }<br />

n<br />

s.. t∑ xi= m (11)<br />

i=<br />

1<br />

x = 0,1 i = 1, 2,..., n (12)<br />

i<br />

∈ ∈ (10)<br />

Y que pue<strong>de</strong> ser reformulado como un problema<br />

MIP con variables binarias <strong>de</strong> la siguiente<br />

manera:<br />

mintrsxt (13)<br />

, , ,<br />

s. t. t ≥ r − s, i = 1,..., n;<br />

(14)<br />

−<br />

( ) ( ) ( )<br />

r ≥ ∑ d i<br />

i∈M −Ui 1− x<br />

i<br />

+ M<br />

(15)<br />

1 − xi , i = 1,..., n;<br />

+<br />

( ) ( ) ( )<br />

s ≤ ∑ d i<br />

i∈M − Li 1− xi + M<br />

(16)<br />

1 − xi , i = 1,..., n;<br />

n<br />

n<br />

∑ xi = m, xi ∈ { 0,1} i = 1,..., n;<br />

(17)<br />

i=<br />

1<br />

Don<strong>de</strong> i U y L i cotas superior e inferior<br />

convenientemente escogidas para d() i , y


RESOLUCIÒN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPERSIÒN MÁXIMA<br />

− +<br />

M , M son constantes gran<strong>de</strong>s, estos valores<br />

pue<strong>de</strong>n ser <strong>de</strong>terminados y ajustados<br />

a<strong>de</strong>cuadamente, como se observa en [5].<br />

2.5 MAXMEAN<br />

El mo<strong>de</strong>lo MAXMEAN, o <strong>de</strong>l máximo<br />

promedio, implica seleccionar cierto número <strong>de</strong><br />

elementos <strong>de</strong>l conjunto original, <strong>de</strong> tal manera<br />

que este represente la máxima diferencia<br />

promedio. De esta manera también es variable <strong>de</strong><br />

<strong>de</strong>cisión la cantidad <strong>de</strong> elementos a seleccionarse.<br />

El mo<strong>de</strong>lo pue<strong>de</strong> representarse como:<br />

∑ ∑<br />

MaxMean Max<br />

( )<br />

i=<br />

1<br />

n= 1 n<br />

i= 1 j=+ i 1<br />

dijxixj n<br />

∑ i= 1 xi<br />

n<br />

st .. ∑ xi<br />

≥ 2 (19)<br />

x = 0,1 i = 1, 2,..., n (20)<br />

i<br />

(18)<br />

Tal como se lo presenta este es un problema <strong>de</strong><br />

optimización binaria fraccional, pero pue<strong>de</strong> ser<br />

linealizado utilizando ciertas transformaciones,<br />

así en su formulación linealizada el problema<br />

MAXMEAN se presenta como:<br />

n−1n Max ∑ ∑ dij zij<br />

(21)<br />

i= 1 j= i+<br />

1<br />

st .. y − z<br />

i<br />

≤1 − x<br />

i<br />

, z<br />

i<br />

≤ y, z<br />

i<br />

≤ x<br />

i<br />

,<br />

z<br />

i<br />

≥ 0, i = 1,..., n<br />

(22)<br />

y − z<br />

ij<br />

≤ 2 − x<br />

i<br />

− x<br />

j<br />

, z<br />

ij<br />

≤ y, z<br />

ij<br />

≤ x<br />

i<br />

,<br />

(23)<br />

z<br />

ij<br />

≥ 0,1 ≤ i < j ≤ n<br />

n n<br />

n<br />

∑xi ≥ 1∑ zi = 1, xi<br />

∈{<br />

0,1}<br />

(24)<br />

i= 1 i=<br />

1<br />

43<br />

3. RESOLUCION EXACTA DEL<br />

PROBLEMA MAXMEAN<br />

La siguiente propiedad indica que si d es una<br />

distancia, la solución al problema MAXMEAN es<br />

que todos los puntos <strong>de</strong>ben ser seleccionados, con<br />

lo cual la solución <strong>de</strong>l problema en este caso se<br />

vuelve trivial.<br />

PROPIEDAD: En el problema MAXMEAN si dij<br />

satisfacen la <strong>de</strong>sigualdad triangular, son<br />

simétricas y no negativas, es <strong>de</strong>cir d es una<br />

distancia, entonces m = n.<br />

Demostración:<br />

n−1 ∑ n<br />

i= 1 ∑ j=+ i 1<br />

dij<br />

Se <strong>de</strong>mostrará que<br />

es una<br />

n<br />

estrictamente creciente en función <strong>de</strong> n<br />

(1) Como ejemplo observemos el caso n = 3<br />

Por <strong>de</strong>mostrar:<br />

d + d + d d<br />

><br />

3 2<br />

12 13 23 12<br />

1<br />

d < d ≤ d + d<br />

2<br />

Como: 12 12 13 23<br />

3<br />

d < d + d + d<br />

2<br />

12 12 13 23<br />

d + d + d d<br />

><br />

3 2<br />

12 13 23 12<br />

Lo mismo para<br />

d + d + d d<br />

><br />

3 2<br />

12 13 23 23<br />

(2) Para n = k+1<br />

Por <strong>de</strong>mostrar:<br />

d + d + d d<br />

3 2<br />

> y<br />

12 13 23 12<br />

k k 1<br />

1 1<br />

d<br />

k−<br />

∑ k<br />

i= ∑ j=+ i ij ∑i=<br />

1 ∑ j=+ i 1<br />

dij<br />

><br />

k + 1<br />

k<br />

Es <strong>de</strong>cir por <strong>de</strong>mostrar:<br />

k−1 k k<br />

k 1 k<br />

i 1 j i 1<br />

dij i 1 d<br />

−<br />

= ∑ =+ + = ik , + 1 i=<br />

1 ∑ j=+ i 1<br />

dij<br />

∑ ∑ ∑<br />

><br />

k +<br />

1<br />

k


Es <strong>de</strong>cir:<br />

k−1 k k k−1 k k−1 k<br />

1<br />

∑∑dij + ∑di, k + 1 > ∑∑dij + ∑∑dij<br />

i= 1 j= i+ 1 i= 1 i= 1 j= i+ 1 k i= 1 j= i+<br />

1<br />

Luego hay que <strong>de</strong>mostrar:<br />

k k−1k 1<br />

∑dik , + 1 > ∑ ∑ dij<br />

i= 1 k i= 1 j= i+<br />

1<br />

d ≤ d + d<br />

Como: 12 1, k+ 1 2, k+<br />

1<br />

Como:<br />

está!!<br />

d ≤ d + d<br />

13 1, k+ 1 3, k+<br />

1<br />

d ≤ d + d<br />

1k 1, k+ 1 k, k+<br />

1<br />

<br />

d ≤ d + d<br />

k−1, k k− 1, k+ 1 k, k+<br />

1<br />

k−1k k<br />

∑∑dij < ( k −1)<br />

∑ di,<br />

k + 1<br />

i= 1 j= i+ 1 i=<br />

1<br />

k−1 ∑ k<br />

i= 1 ∑ j=+ i 1<br />

dij<br />

k −1<br />

<<br />

k<br />

∑<br />

i=<br />

1<br />

d<br />

ik , + 1<br />

k−1 k k 1<br />

1 1<br />

d<br />

−<br />

∑ k<br />

i= ∑ j=+ i ij ∑i=<br />

1 ∑ j=+ i 1<br />

dij<br />

<<br />

k k −1<br />

OBSERVACION: La propiedad anterior no es<br />

cierta si dij son positivas y simétricas pero no<br />

satisfacen la <strong>de</strong>sigualdad triangular, es <strong>de</strong>cir se<br />

pue<strong>de</strong>n encontrar contrajemplos en los cuales para<br />

los cuales dij ≥0 y simétrica y sin embargo m < n.<br />

Aunque estos ejemplos serían la excepción, pues<br />

al <strong>de</strong>sarrollar simulaciones con los dij generados<br />

aleatoriamente en todas las simulaciones m<br />

resultó ser igual a n, tal como se observa en la<br />

tabla 2, en la cual se presentan los resultados para<br />

valores <strong>de</strong> n = 10, 15, 20, 25 y 30, para cada uno<br />

<strong>de</strong> los cuales se generaron 10 instancias<br />

aleatoriamente.<br />

Ejemplo: Sea n = 4 y las distancias dij dadas en la<br />

tabla 1:<br />

F. SANDOYA<br />

ya<br />

44<br />

TABLA I<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />

<strong>de</strong> la dispersión máxima<br />

Ejemplo con dij ≥ 0 y simétricas con el cual la solución <strong>de</strong>l<br />

MAXMEAN es m < n<br />

1<br />

2<br />

3<br />

4<br />

1 2 3 4<br />

0 20 18 1<br />

20 0 20 2<br />

18 20 0 1<br />

1 2 1 0<br />

En este caso m = 3, y se seleccionan los puntos 1,<br />

2 y 3<br />

El mejor promedio es 19.33, consi<strong>de</strong>rando X1 = X2<br />

= X3 = 1, X4 = 0.<br />

En cambio seleccionando todos los puntos; es<br />

<strong>de</strong>cir, X1 = X2 = X3 = X4 = 1 el promedio es 15.5.<br />

TABLA II<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />

<strong>de</strong> la dispersión máxima<br />

Resultados <strong>de</strong>l mo<strong>de</strong>lo MAXMEAN con dij seleccionados<br />

aleatoriamente U[0,20]<br />

n m<br />

Mínimo 10<br />

10 Máximo 10<br />

Mínimo 15<br />

15 Máximo 15<br />

Mínimo 20<br />

20 Máximo 20<br />

Mínimo 25<br />

25 Máximo 25<br />

Mínimo 30<br />

30 Máximo 30<br />

SOLUCION DEL PROBLEMA MAXMEAN<br />

EN EL CASO NO TRIVIAL<br />

Se consi<strong>de</strong>ra ahora la generación <strong>de</strong> instancias<br />

con dij seleccionadas aleatoriamente con una<br />

distribución U[-10,10], y se resuelve el mo<strong>de</strong>lo<br />

MAXMEAN según la formulación (21) – (24),<br />

usando C-PLEX 12 con los parámetros por<br />

<strong>de</strong>fecto. Los experimentos fueron <strong>de</strong>sarrollados<br />

en una Laptop Intel Core Solo 1.40 GHz, 3 Gb<br />

RAM. Los resultados son mostrados en la tabla 3.


RESOLUCIÒN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPERSIÒN MÁXIMA<br />

TAMAÑO<br />

PARAMETR<br />

O<br />

TABLA III<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema <strong>de</strong> la dispersión máxima<br />

Soluciones exactas para el mo<strong>de</strong>lo MaxMean para tamaños variando entre n = 10 a n = 30 nodos<br />

TIEMPO CPU (SEGUNDOS) VALOR OBJETIVO M<br />

MAXIMUM MEDIAN MINIMUM<br />

MAXIMU<br />

M<br />

45<br />

MEDIAN<br />

MINIMU<br />

M<br />

MAXIMU<br />

M<br />

MEDIA<br />

N<br />

n = 10 0.330 0.264 0.172 11.75 7.206 6.258 6 4 3<br />

n = 15 3.002 1.5715 0.905 14.63 11.942 7.707 9 7 3<br />

n = 20 72.009 49.1605 25.532 18.505 14.091<br />

5<br />

11.034 11 7.5 5<br />

n = 25 2087.09 1191.71<br />

1<br />

658.721 19.215 16.923 14.503 15 9 5<br />

n = 30<br />

> 5<br />

hours<br />

> 5<br />

hours<br />

> 5<br />

hours<br />

- - - - - -<br />

4. RELACION ENTRE EL PROBLEMA<br />

MAXSUM Y EL PROBLEMA<br />

MAXMEAN<br />

Nótese que se podría resolver alternativamente<br />

el problema MAXMEAN a través <strong>de</strong> la resolución<br />

<strong>de</strong>l problema MAXSUM <strong>de</strong> la siguiente manera:<br />

Si resolvemos óptimamente el problema<br />

MAXSUM para todos los valores <strong>de</strong> m posibles;<br />

es <strong>de</strong>cir, para m = 2, 3, …, n, y dividimos estos<br />

valores óptimos para su respectivo valor <strong>de</strong> m,<br />

tendríamos todos los valores <strong>de</strong> los mejores<br />

promedios, <strong>de</strong> ahí al seleccionar el máximo valor<br />

<strong>de</strong> ellos se tendrá el óptimo <strong>de</strong>l problema<br />

MAXMEAN. Curiosamente en los resultados<br />

computacionales, esta estrategia <strong>de</strong> resolver m<br />

problemas MAXSUM resultó más eficiente que<br />

resolver el problema MAXMEAN formulado en<br />

(21)-(24), tal como se observa en la tabla 4.<br />

SOLUCION DEL PROBLEMA MAXMEAN<br />

UTILIZANDO EL MODELO MAXSUM<br />

Se consi<strong>de</strong>ra ahora la generación <strong>de</strong> instancias<br />

con dij seleccionadas aleatoriamente con una<br />

distribución U[-10,10], y se resuelve el mo<strong>de</strong>lo<br />

MAXMEAN siguiendo la estrategia <strong>de</strong> resolver m<br />

problemas MAXSUM en su formulación<br />

MAXSUM IQCP (1) –(3) usando el solver <strong>de</strong><br />

prueba CONOPT3 y MAXSUM IP (4) – (6)<br />

usando C-PLEX 12 con los parámetros por<br />

<strong>de</strong>fecto. Los experimentos fueron <strong>de</strong>sarrollados<br />

en una Laptop Intel Core Solo 1.40 GHz, 3 Gb<br />

RAM.<br />

MINIMU<br />

M<br />

En los experimentos computacionales, al resolver<br />

los m problemas MAXSUM, y dividiendo su<br />

óptimo para m, se observó en todas las instancias<br />

generadas que estos problemas tienen sólo un<br />

óptimo local, tal como se observa en las figuras 1,<br />

2 y 3.<br />

Tomando en cuenta la forma que toma el máximo<br />

promedio para distintos valores <strong>de</strong> m, con un solo<br />

máximo local, se pue<strong>de</strong> explotar esta<br />

característica para generar una estrategia <strong>de</strong><br />

resolver los problemas MAXSUM para valores<br />

crecientes <strong>de</strong> m, dividir su valor para m y parar el<br />

momento en que para el siguiente valor <strong>de</strong> m este<br />

valor <strong>de</strong>l promedio <strong>de</strong>crece, con lo cual se<br />

reduciría aún más el tiempo <strong>de</strong> ejecución<br />

utilizando este procedimiento.<br />

En cambio en la tabla 4 se observan los tiempos<br />

en los cuales se obtuvieron los resultados, cuando<br />

se utilizó este procedimiento resolviendo los<br />

problemas MAXSUM con la formulación MIP y<br />

utilizando C-PLEX12, y resolviendo los<br />

problemas MAXSUM con su formulación IQCP<br />

utilizando CONOPT3. También se reporta el GAP<br />

para el cual el solver CONOPT3 dio el resultado<br />

como óptimo, nótese que en este caso también se<br />

resolvieron m problemas pero <strong>de</strong>l tipo MAXSUM.<br />

Hay que <strong>de</strong>stacar el hecho <strong>de</strong> que a pesar que con<br />

CONOPT3 no se garantiza que se obtenga la<br />

solución óptima exacta, en el 40% <strong>de</strong> los<br />

experimentos si se alcanzó el óptimo.


FIGURA 1<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />

<strong>de</strong> la dispersión máxima<br />

Valores óptimos <strong>de</strong>l problema MAXSUM divididos para m<br />

para una instancia con n=30<br />

FIGURA 2<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />

<strong>de</strong> la dispersión máxima<br />

Valores óptimos <strong>de</strong>l problema MAXSUM divididos para m<br />

para una instancia con n=40<br />

FIGURA 3<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />

<strong>de</strong> la dispersión máxima<br />

Valores óptimos <strong>de</strong>l problema MAXSUM divididos para m<br />

para una instancia con n=50<br />

F. SANDOYA<br />

46<br />

TABLA IV<br />

Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />

<strong>de</strong> la dispersión máxima<br />

Tiempos para el problema MAXMEAN al resolverlo con<br />

los tres métodos planteados<br />

n método tiempo CPU m GAP<br />

MAXMEAN 17.74 7 -<br />

20<br />

MAXSUM IP<br />

MAXSUM<br />

IQCP<br />

8.506<br />

0.675<br />

7<br />

8<br />

-<br />

1.19%<br />

MAXMEAN 788.448 7 -<br />

25<br />

MAXSUM IP<br />

MAXSUM<br />

IQCP<br />

41.884<br />

0.783<br />

7<br />

7<br />

-<br />

1.93%<br />

MAXMEAN 57723.918 7 -<br />

30<br />

MAXSUM IP<br />

MAXSUM<br />

IQCP<br />

99.408<br />

0.757<br />

7<br />

7<br />

-<br />

5.72%<br />

MAXMEAN ∞ 12 -<br />

40<br />

MAXSUM IP<br />

MAXSUM<br />

IQCP<br />

745.025<br />

1.611<br />

12<br />

10<br />

-<br />

0.95%<br />

MAXMEAN ∞ 14 -<br />

50<br />

MAXSUM IP 122576.938 14 -<br />

MAXSUM<br />

IQCP<br />

5. CONCLUSIONES Y<br />

RECOMENDACIONES<br />

3.66 13 1.86%<br />

En esta investigación se pudo <strong>de</strong>terminar que el<br />

problema MAXMEAN sólo tiene sentido<br />

estudiarlo para distancias inter elemento dij<br />

negativas y positivas, pues si las dij son todas<br />

negativas las solución es siempre m =1, mientras<br />

que si todas las dij son positivas es casi seguro que<br />

m = n.<br />

Por otro lado resulta curioso el hecho que el<br />

mo<strong>de</strong>lo MIP planteado requiere un tiempo<br />

excesivo <strong>de</strong> ejecución incluso para tamaños <strong>de</strong>l<br />

problema pequeños, y sólo pue<strong>de</strong> ser resuelto en<br />

un tiempo pru<strong>de</strong>ncial para valores <strong>de</strong> n inferiores<br />

a 25. Sin embargo se pue<strong>de</strong> resolver <strong>de</strong> manera<br />

exacta el mismo problema resolviendo m<br />

problemas <strong>de</strong>l tipo MAXSUM en un tiempo<br />

mucho menor. Incluso, tomando en cuenta la<br />

forma que toma el máximo promedio para<br />

distintos valores <strong>de</strong> m, con un solo máximo local,<br />

podría utilizarse la estrategia <strong>de</strong> parar el momento<br />

en que para un m mayor el valor <strong>de</strong>l promedio<br />

<strong>de</strong>crece, con lo cual se reduciría aún más el<br />

tiempo <strong>de</strong> ejecución utilizando este<br />

procedimiento.


RESOLUCIÒN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPERSIÒN MÁXIMA<br />

La utilización <strong>de</strong> otro tipo <strong>de</strong> solvers que están en<br />

etapa <strong>de</strong> prueba, tales como CONOPT3 que<br />

utiliza procedimientos <strong>de</strong> optimización numérica<br />

no lineal, reduce drásticamente los tiempos <strong>de</strong><br />

ejecución, en base a los tiempos alcanzados para<br />

el tamaño máximo consi<strong>de</strong>rado en la versión<br />

<strong>de</strong>mo disponible, n = 50. Se especula que se<br />

47<br />

podrían resolver con la versión profesional<br />

problemas <strong>de</strong> tamaño muy gran<strong>de</strong>, la <strong>de</strong>sventaja<br />

es que no está garantizado que este solver alcance<br />

la solución óptima, a pesar que el programa<br />

reporta GAP cero, sin embargo si lo hizo el 40%<br />

<strong>de</strong> las veces en los experimentos<br />

computacionales.


F. SANDOYA<br />

REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />

[1]. DUARTE A, MARTÍ R. (2007). “Tabu<br />

Search and GRASP for the Maximum<br />

Diversity Problem”, European Journal of<br />

Operational Research; 178, 71-84.<br />

[2]. GLOVER F, KUO CC, DHIR KS. (1998),<br />

“Heuristic Algorithms for the Maximum<br />

Diversity Problem”, Journal of Information<br />

and Optimization Sciences 1998; vol. 19, no.<br />

1, 109-132.<br />

[3]. PROKOPYEV OA, KONG N,<br />

MARTINEZ-TORRES DL. (2009).<br />

48<br />

“The equitable dispersion problem”.<br />

European Journal of Operational Research;<br />

197: 59-67.<br />

[4]. RESENDE MGC, MARTÍ R, GALLEGO<br />

M, DUARTE A. (<strong>2010</strong>). GRASP with path<br />

relinking for the max-min diversity problema.<br />

Computers and Operations Research; 37:<br />

498-508.<br />

[5]. C-PLEX 12.0 User’s Manual (2009), GAMS<br />

documents.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!