Volumen 8 Número 2 Octubre 2010 - Blog de ESPOL - Escuela ...
Volumen 8 Número 2 Octubre 2010 - Blog de ESPOL - Escuela ...
Volumen 8 Número 2 Octubre 2010 - Blog de ESPOL - Escuela ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
1001000101001010010101011000111010 ISSN Nº 1390 - 3802<br />
1010011001000101010100010100100010101001010110100101<br />
0010100100010010010111100101010010010100100100100101<br />
1010010001111001010100100101010010001001001001001010<br />
0100100100100100010010010010010100010100100101001001<br />
matemática<br />
0101000100100100100100100101001001001001001010010010<br />
0100100100010010010001001010010010010001001010010010<br />
0010100100100100100101001010010100101001010100100101<br />
UNA PUBLICACIÓN DEL ICM - <strong>ESPOL</strong><br />
1010110101001001001010010101010101010010011001010010<br />
0101010010010100101010010100100100101001001001010010<br />
<strong>Volumen</strong> 8 <strong>Número</strong> 2 <strong>Octubre</strong> <strong>2010</strong><br />
0100101001010101001001001010101100101010010010010010<br />
1001011001010101100100101010110101010100100110010100<br />
1100100101001010010001010100100100101001001010101010<br />
Z<br />
0110010100110010101010100010010100101010001010010100<br />
1001010011010010100100101001010010100101010010100100<br />
0101000100100100010100100100101010100100100101001011<br />
0100110101101010010010010100101001001001010010011110<br />
1001001001010010010010010010110110010100101010010100<br />
1010010101010101010010101001001100101001010110101011<br />
1100100101010010100101010111010010101001110010101010<br />
0101001010010100101100101001010101001111001010010101<br />
0010101001010010100101010011010101010110100101010100<br />
Y<br />
1010101001001010010111010100101011100101000101010000<br />
1111010101001011001011110101001001101000010010101111<br />
0100111010101010100011010101001011101010110101010110<br />
0101010110100100100111100110110101011101010010010111<br />
1110101001000100100100100100100100100001001001001000<br />
X<br />
1010100010100111001011101010101011101101101001011100<br />
1001111100101001010011001010010010110101000101001101<br />
0010100100101001010010100101010010100100100010100101<br />
0010101011000111010100010100101001100100010101010001<br />
0100100010101001010110100101001010010001001001011110<br />
0101010010010100100100100101101001000111100101010010<br />
<strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral - <strong>ESPOL</strong><br />
Instituto <strong>de</strong> Ciencias Matemáticas - ICM<br />
0101010010001001001001001010010010010010010001001001<br />
0010010100010100100101001001010100010010010010010010<br />
0101001000101001010010100101010010100100100010100101<br />
0010101011001000101001010010101011000111010100010100<br />
1010011001000101010100010100100010101001010110100101
INSTITUTO DE CIENCIAS MATEMÁTICAS<br />
El Instituto <strong>de</strong> Ciencias Matemáticas (ICM) es una unidad académica <strong>de</strong> la <strong>ESPOL</strong>.<br />
Des<strong>de</strong> el inicio la función <strong>de</strong>l ICM ha sido la docencia en Matemáticas, Ciencias<br />
Gráficas e Informática, para la formación <strong>de</strong> profesionales en ingeniería, tecnología<br />
y ciencias, habiendo tenido a su cargo en los albores <strong>de</strong> la <strong>ESPOL</strong>, el dictado <strong>de</strong> 10<br />
materias. Con el transcurso <strong>de</strong>l tiempo y acor<strong>de</strong> con la era <strong>de</strong> la información, el ICM<br />
creó en mayo <strong>de</strong> 1995 la carrera <strong>de</strong> “Ingeniería en Estadística Informática”, como<br />
alternativa en ingeniería en información y servicios. Posteriormente, con el fin <strong>de</strong><br />
garantizar la eficiencia en el control y gestión empresarial con profesionales<br />
capacitados y <strong>de</strong> excelencia se creó la carrera <strong>de</strong> “Auditoría y Control <strong>de</strong> Gestión”<br />
en mayo <strong>de</strong> 2000. También el Instituto ha incursionado en una <strong>de</strong> las más<br />
importantes ramas <strong>de</strong> la matemática aplicada que tiene gran<strong>de</strong>s aplicaciones en el<br />
mundo mo<strong>de</strong>rno, esto es la Investigación <strong>de</strong> Operaciones, la Teoría <strong>de</strong> Optimización,<br />
y particularmente las aplicaciones logísticas, a través <strong>de</strong>l ofrecimiento <strong>de</strong> programas<br />
<strong>de</strong> pre-grado y post-grado en estas áreas. Así es como <strong>de</strong>s<strong>de</strong> el año 2005 se<br />
viene ofreciendo la maestría en Control <strong>de</strong> Operaciones y Gestión Logística y <strong>de</strong>s<strong>de</strong><br />
el año 2006 la carrera <strong>de</strong> Ingeniería en Logística y Transporte.<br />
El ICM también cuenta con el CENTRO DE INVESTIGACIONES ESTADÍSTICAS, a<br />
través <strong>de</strong>l cual, se realizan: estudios <strong>de</strong> predicción, estudios actuariales, estudios <strong>de</strong><br />
mercado, diseños <strong>de</strong> experimentos, planificación y dirección <strong>de</strong> censos, análisis<br />
financieros, bases <strong>de</strong> datos estadísticos, formulación <strong>de</strong> proyectos, ingeniería <strong>de</strong> la<br />
calidad, etc.<br />
Entre otras activida<strong>de</strong>s que <strong>de</strong>sarrolla el ICM anualmente están: las JORNADAS EN<br />
ESTADÍSTICA E INFORMÁTICA que actualmente está en su décimoquinta versión, el<br />
CONCURSO INTERCOLEGIAL DE MATEMÁTICAS que se viene realizando en forma<br />
continúa <strong>de</strong>s<strong>de</strong> 1988.<br />
.<br />
Más información: www.icm.espol.edu.ec o escribirnos al e-mail: icm@espol.edu.ec, warmas@espol.edu.ec,<br />
eriva<strong>de</strong>n@espol.edu.ec, 30 ½ vía Perimetral: Edificios 25 – B Planta alta (Área <strong>de</strong> Institutos) Telfs.: (593-4)<br />
2269525 – 2269526, fax: (593–4) 853138.<br />
Guayaquil – Ecuador
matemática<br />
UNA PUBLICACIÓN DEL ICM – <strong>ESPOL</strong><br />
<strong>Volumen</strong> 8 <strong>Número</strong> 2 <strong>Octubre</strong> <strong>2010</strong><br />
Rector <strong>ESPOL</strong>: Ph.D. Moisés Tacle Galárraga<br />
Vicerrector General <strong>ESPOL</strong>: M.Sc. Armando Altamirano Chávez<br />
Director ICM: M.Sc. Washington Armas<br />
Subdirector ICM: M.Sc. Luis Rodríguez Ojeda<br />
Editor <strong>de</strong> publicaciones <strong>de</strong>l ICM: M.Sc. Eduardo Riva<strong>de</strong>neira<br />
Consejo Editorial ICM: M.Sc. Efrén Jaramillo Carrión<br />
M.Sc. Jorge Fernán<strong>de</strong>z Ronquillo<br />
M.Sc. Luis Rodríguez Ojeda<br />
Redacción y estilo: M.Sc. Janet Valdiviezo<br />
M.Sc. Gau<strong>de</strong>ncio Zurita Herrera<br />
Edición: Ing. Eva María Mera Intriago<br />
Srta. Carolina Carrasco Salas
matemática es una publicación <strong>de</strong>l Instituto <strong>de</strong> Ciencias Matemáticas <strong>de</strong><br />
la <strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral, y preten<strong>de</strong> constituirse en un órgano<br />
<strong>de</strong> difusión científico – tecnológico, con el fin <strong>de</strong> incentivar y motivar el<br />
<strong>de</strong>sarrollo y avance <strong>de</strong> la matemática y sus aplicaciones.<br />
matemática publica artículos teóricos y <strong>de</strong> tipo experimental tales como<br />
ensayos, resúmenes <strong>de</strong> tesis <strong>de</strong> grado y trabajos <strong>de</strong> investigación<br />
relacionados con la aplicación <strong>de</strong> la matemática en los diferentes ámbitos <strong>de</strong><br />
la realidad.
EDITORIAL<br />
La Universidad Ecuatoriana se encuentra ante el reto que le ha planteado la<br />
nueva ley <strong>de</strong> Educación Superior. La exigencia <strong>de</strong> que los académicos<br />
posean la más alta calificación y que sus investigaciones sean publicadas<br />
más allá <strong>de</strong> las fronteras <strong>de</strong> nuestro país, ha dado el golpe inicial para una<br />
avalancha <strong>de</strong> reformas que no siempre son bien acogidas.<br />
Nosotros, <strong>de</strong>s<strong>de</strong> aquí, confiamos en que todos estos requerimientos serán<br />
cumplidos y así nuestra universidad irá por camino seguro al nivel <strong>de</strong><br />
excelencia que todos aspiramos.<br />
Los que hacemos Revista Matemática estamos siempre dispuestos a<br />
fortalecer este proceso <strong>de</strong> superación, con nuestro humil<strong>de</strong> trabajo.
CONTENIDO<br />
EDITORIAL..................................................................................................... 5<br />
PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES<br />
SOCIOECONÓMICOS EN EL ECUADOR A PARTIR DE LA ENEMDU 2009<br />
Choez Geovanny…………………..........…………….................. 7<br />
APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL ESTUDIO DE<br />
REGISTROS ELECTROENCEFALOGRÁFICOS<br />
González Javier, Granados Carlos, López Hernán, Torres Iván…. 16<br />
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ<br />
DE VARIANZAS Y COVARIANZAS DE VECTORES ALEATORIOS<br />
MULTIVARIADOS<br />
Montaño Néstor, Zurita Gau<strong>de</strong>ncio....………………….................... 22<br />
DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />
Páez Joseph………………………………….…………………… 33<br />
RESOLUCIÓN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA<br />
EL PROBLEMA DE LA DISPERSIÓN MÁXIMA<br />
Sandoya Fernando....................................................................……….. 41
matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />
<strong>2010</strong>, Vol. 8, No. 2<br />
PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS<br />
NIVELES SOCIOECONÓMICOS EN EL ECUADOR A PARTIR DE<br />
LA ENEMDU 2009<br />
1 Choez Geovanny<br />
Resumen. Se realizó este trabajo con el propósito <strong>de</strong> presentar una metodología preliminar para el cálculo <strong>de</strong> los niveles<br />
socioeconómicos en el Ecuador reflexionando en metodologías implementadas en países europeos y también en Chile. Se i<strong>de</strong>ntificaron<br />
8 niveles socioeconómicos a partir <strong>de</strong> la tenencia acumulada <strong>de</strong> bienes, cada uno <strong>de</strong> los bienes multiplicado por un factor obtenido a<br />
través <strong>de</strong>l análisis <strong>de</strong> componentes principales categórico. A<strong>de</strong>más se logró clasificar los bienes en primarios, secundarios y extras.<br />
Posteriormente se evalúo la relación estadística entre los niveles socioeconómicos obtenidos y variables que conceptualmente están<br />
vinculadas a estos. Los resultados son congruentes respecto a las metodologías implementadas en otros países.<br />
Palabras Clave: INEC, ENEMDU, Niveles socioeconómicos, componentes principales.<br />
Abstract. Introduction: This work presents a new methodology to calculate the social gra<strong>de</strong>s or social class in the Ecuador, taking into<br />
consi<strong>de</strong>ration implemented methodologies in countries in Europe and Chile. Objective: I<strong>de</strong>ntify the social level or social class in the<br />
Ecuadorian population using multivariate statistical methods. Methods: The statistical technique used is categorical principal<br />
components which provi<strong>de</strong> a factor based off the assets of the investigated people. Results: The analysis provi<strong>de</strong>s eight social levels<br />
where 1 is the lowest level and 8 is the highest level. Conclusions: These social gra<strong>de</strong>s obtained with this methodology are congruent<br />
between others revised methodologies.<br />
Key words. INEC, ENEMDU, Social gra<strong>de</strong>s, categorical componentes principales.<br />
Recibido: Agosto, <strong>2010</strong><br />
Aceptado: Septiembre, <strong>2010</strong><br />
1. INTRODUCCIÓN<br />
El Instituto Nacional <strong>de</strong> Estadística y Censos<br />
(INEC) consi<strong>de</strong>ra <strong>de</strong> suma importancia la<br />
estratificación socioeconómica en el país, por esto<br />
el área <strong>de</strong> análisis <strong>de</strong> la regional <strong>de</strong>l litoral <strong>de</strong>cidió<br />
explorar las bases teóricas y métodos estadísticos<br />
multivariados utilizados para la clasificación <strong>de</strong><br />
datos que permita establecer un marco <strong>de</strong><br />
referencia metodológico como guía en la<br />
clasificación <strong>de</strong> los hogares según los niveles<br />
socioeconómicos.<br />
Un primer trabajo referente a la temática se<br />
realizó utilizando la información <strong>de</strong> la Encuesta<br />
<strong>de</strong> Empleo, Desempleo y Subempleo (ENEMDU<br />
2008) y su modulo <strong>de</strong> opinión (auto percepción)<br />
en el que se construyó un mo<strong>de</strong>lo estadístico para<br />
<strong>de</strong>terminar las características o grupo <strong>de</strong><br />
características que mayor relación tienen con el<br />
bienestar <strong>de</strong>l hogar (según la percepción <strong>de</strong>l/la<br />
jefe/a <strong>de</strong>l hogar).<br />
Consecuentemente se <strong>de</strong>cidió realizar éste<br />
trabajo cuyo propósito es proponer una<br />
metodología preliminar para la estructuración <strong>de</strong><br />
los niveles socioeconómicos (NSE) <strong>de</strong> los hogares<br />
ecuatorianos, a través <strong>de</strong> la aplicación <strong>de</strong> métodos<br />
multivariados con los datos <strong>de</strong> la ENEMDU 2009.<br />
________________________<br />
1 Choez Geovanny, Ingeniero en Estadística e Informática,<br />
<strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>);<br />
Departamento <strong>de</strong> Análisis Socioeconómico, INEC.<br />
(e_mail: geovanny_choez@inec.gob.ec)<br />
Para el <strong>de</strong>sarrollo <strong>de</strong> la propuesta el primer<br />
objetivo es analizar los métodos estadísticos<br />
multivariados utilizados para la clasificación <strong>de</strong><br />
datos. Luego combinar los métodos para la<br />
estructuración <strong>de</strong> los niveles socioeconómicos <strong>de</strong><br />
los hogares ecuatorianos. Finalmente se quiere<br />
comparar los resultados <strong>de</strong> la metodología<br />
obtenida frente a otros métodos <strong>de</strong> estratificación<br />
<strong>de</strong> estudios similares.<br />
2. MARCO TEÓRICO<br />
NSE ESOMAR 2<br />
En 1997, y en respuesta a las necesida<strong>de</strong>s <strong>de</strong> la<br />
creciente investigación paneuropea en el mercado<br />
único, European Society for Opinion and<br />
Marketing Research 3 (ESOMAR) propuso un<br />
nuevo método <strong>de</strong> clasificación. Su objetivo era<br />
incrementar la convergencia <strong>de</strong> los criterios<br />
socioeconómicos y <strong>de</strong>mográficos utilizados en<br />
cada país para tabular los estudios <strong>de</strong> marketing y<br />
<strong>de</strong> opinión. La clasificación propuesta (Social<br />
Gra<strong>de</strong> Matrix) se investigó en los doce países que<br />
en 1997 formaban la Unión Europea sobre la base<br />
<strong>de</strong> las cerca <strong>de</strong> 90.000 entrevistas <strong>de</strong>l<br />
Eurobarómetro. Consiste en la utilización <strong>de</strong> los<br />
procedimientos que se aplican alternativamente<br />
según que el principal sustentador <strong>de</strong>l hogar sea<br />
2<br />
Transcrito <strong>de</strong>s<strong>de</strong> “Investigación Comercial 22 casos<br />
prácticos y un apéndice teórico”, Pg. 49, 50<br />
3<br />
Sociedad Europea para investigaciones <strong>de</strong> opinión y<br />
marketing.
laboralmente activo o inactivo. En el primer caso,<br />
la clase socioeconómica a la que pertenece el<br />
hogar se <strong>de</strong>fine según la posición profesional <strong>de</strong><br />
dicho sustentador y la edad a la que terminó sus<br />
estudios. Esta edad se ha ajustado para incluir<br />
cualquier período <strong>de</strong> educación o <strong>de</strong> formación<br />
profesional llevado a cabo <strong>de</strong>spués <strong>de</strong> la entrada<br />
G. CHOEZ<br />
8<br />
<strong>de</strong>l individuo en el mercado laboral. Por ejemplo,<br />
la persona que <strong>de</strong>jó la escuela a los 16 años pero<br />
recibió enseñanza especializada durante 20 meses<br />
mientras realizaba un trabajo remunerado, será<br />
catalogada como habiendo terminado los estudios<br />
a los 18 años.<br />
TABLA I<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Cuadro <strong>de</strong> resumen ESOMAR 1997<br />
Matriz <strong>de</strong> posición social (Activos)<br />
Edad a la que terminó los estudios (años)<br />
Ocupación 13 o menos 14 15-16 17-20 21 o más<br />
Director general con 6+ empleados<br />
Profesional autónomo<br />
D C1 B A A<br />
Empleado profesional<br />
Directivo con 6+ empleados<br />
Director general con 5- empleados<br />
D D C1 B A<br />
Mandos intermedios con 5- empleados<br />
Dueño o socio <strong>de</strong> empresa con 6+ empleados<br />
D D C2 C1 B<br />
Agricultura, gana<strong>de</strong>ría, pesca E3 E1 D C1 B<br />
Empleado<br />
Dueño o socio <strong>de</strong> empresa con -5 empleados<br />
E2 E1 D C2 C1<br />
Viajante o representante<br />
Obrero manual especializado<br />
E2 E1 D C2 C1<br />
Obrero manual no especializado E3 E3 E1 D D<br />
Se aplica una matriz alternativa cuando el<br />
principal sustentador <strong>de</strong>l hogar es inactivo,<br />
concepto que incluye los casos siguientes:<br />
jubilado, incapacitado físicamente, parado,<br />
temporalmente inactivo, estudiante y ama <strong>de</strong> casa.<br />
En estos casos, la posición social <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la<br />
situación económica <strong>de</strong>l hogar y <strong>de</strong> la edad a la<br />
que el sustentador principal terminó los estudios.<br />
El status económico es un índice que se calcula<br />
teniendo en cuenta el número <strong>de</strong> ítems poseídos<br />
<strong>de</strong>ntro <strong>de</strong> la siguiente lista: televisión en color,<br />
vi<strong>de</strong>o, vi<strong>de</strong>ocámara, dos o más coches, proyector<br />
<strong>de</strong> diapositivas, or<strong>de</strong>nador personal, taladro<br />
eléctrico, freidora eléctrica, reloj <strong>de</strong> radio y<br />
segunda vivienda. Esta lista se revisará en el<br />
futuro <strong>de</strong>pendiendo <strong>de</strong> si alguno <strong>de</strong> los ítems se ha<br />
generalizado y ha <strong>de</strong>jado <strong>de</strong> ser discriminante en<br />
los hogares europeos.<br />
TABLA II<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Cuadro <strong>de</strong> resumen ESOMAR 1997<br />
Status<br />
Matriz <strong>de</strong> posición social (Inactivos)<br />
Edad a la que terminó los estudios<br />
<strong>Número</strong> <strong>de</strong> ítems poseídos 13 o menos 14 15-16 17-20 21 o más<br />
5 o más D C1 B A A<br />
4 D C2 C1 B A<br />
3 D C2 C1 B B<br />
2 E1 E1 E1 C2 C1<br />
1 E3 E2 E1 C2 C1<br />
0/NC E3 E3 E2 D D
PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />
PARTIR DE LA ENEMDU 2009<br />
3. MARCO CONCEPTUAL<br />
ENEMDU.-<br />
Encuesta <strong>de</strong> Empleo, Desempleo y Subempleo.<br />
ESOMAR 43 . –<br />
European Society for Opinion and Marketing<br />
Research<br />
Métodos estadísticos multivariados.-<br />
Según Daniel Peña (2002) los métodos<br />
estadísticos multivariados para el análisis <strong>de</strong> datos<br />
compren<strong>de</strong> el estudio estadístico <strong>de</strong> varias<br />
variables medidas en elementos <strong>de</strong> una población<br />
con los siguientes objetivos:<br />
• Resumir los datos mediante un pequeño<br />
conjunto <strong>de</strong> nuevas variables.<br />
• Encontrar grupos en los datos, si existen.<br />
• Clasificar nuevas observaciones en grupos<br />
<strong>de</strong>finidos.<br />
• Relacionar dos conjuntos <strong>de</strong> variables.<br />
INEC.-<br />
Instituto Nacional <strong>de</strong> Estadística y Censos.<br />
Niveles Socioeconómicos.-<br />
Los NSE son un conjunto <strong>de</strong> estratos a capas en<br />
los que se divi<strong>de</strong> una sociedad según el estilo <strong>de</strong><br />
vida o grupo <strong>de</strong> características, dichas<br />
características son homogéneas <strong>de</strong>ntro <strong>de</strong> cada<br />
capa y heterogéneas entre capas. Las<br />
características pue<strong>de</strong>n ser sociales, económicas,<br />
<strong>de</strong>mográficas, etc.<br />
4. METODOLOGÍA<br />
ANÁLISIS DE COMPONENTES<br />
PRINCIPALES CATEGÓRICO<br />
El análisis estándar <strong>de</strong> componentes<br />
principales asume que todas las variables <strong>de</strong>l<br />
análisis se mi<strong>de</strong>n a escala numérica, y que las<br />
relaciones entre los pares <strong>de</strong> variables son<br />
lineales (Pérez, 2006).<br />
Varela (2005) menciona sobre éste análisis<br />
que “la primera componente principal es la<br />
combinación lineal <strong>de</strong> las variables originales<br />
<strong>de</strong> varianza máxima”, es <strong>de</strong>cir, que la ecuación<br />
<strong>de</strong> la primera componente (Y1) es:<br />
Y = α X + α X + + α X<br />
1 11 1 12 2 ... 1p<br />
p<br />
Don<strong>de</strong> p es el número <strong>de</strong> variables originales.<br />
La segunda componente principal (Y2) se<br />
construye análogamente:<br />
Y2 = α 21 X 1 + α 22 X 2 + ... + α 2 p X p<br />
El análisis <strong>de</strong> componentes principales<br />
categóricas extien<strong>de</strong> ésta metodología para<br />
permitir la ejecución <strong>de</strong>l análisis <strong>de</strong><br />
4<br />
Tomado <strong>de</strong> “Investigación Comercial 22 casos prácticos y<br />
un apéndice teórico”, Pg.37<br />
9<br />
componentes principales en cualquier mezcla<br />
<strong>de</strong> variables nominales, ordinales y numéricas.<br />
El análisis <strong>de</strong> componentes principales<br />
categórico se conoce también por el acrónimo<br />
CATPCA, <strong>de</strong>l inglés CATegorical Principal<br />
Components Analysis. El objetivo <strong>de</strong> los<br />
análisis <strong>de</strong> componentes principales es la<br />
reducción <strong>de</strong> un conjunto original <strong>de</strong> variables<br />
en un conjunto más pequeño <strong>de</strong> componentes<br />
no correlacionados que representen la mayor<br />
parte <strong>de</strong> la información encontrada en las<br />
variables originales. Para las variables<br />
nominales y ordinales <strong>de</strong>l análisis, se calcula<br />
puntuaciones óptimas para las categorías<br />
(Pérez, 2006).<br />
5. ANÁLISIS DE<br />
CORRESPONDENCIAS<br />
Uno <strong>de</strong> los objetivos <strong>de</strong>l análisis <strong>de</strong><br />
correspon<strong>de</strong>ncias es <strong>de</strong>scribir las relaciones<br />
existentes entre dos variables nominales,<br />
recogidas en una tabla <strong>de</strong> correspon<strong>de</strong>ncias, sobre<br />
un espacio <strong>de</strong> pocas dimensiones, mientras que al<br />
mismo tiempo se <strong>de</strong>scriben las relaciones entre las<br />
categorías <strong>de</strong> cada variable. Para cada variable,<br />
las distancias sobre un gráfico entre los puntos <strong>de</strong><br />
categorías reflejan las relaciones entre las<br />
categorías, con las categorías similares<br />
representadas próximas unas a otras. El análisis<br />
factorial es una técnica típica para <strong>de</strong>scribir las<br />
relaciones existentes entre variables en un espacio<br />
<strong>de</strong> pocas dimensiones. Sin embargo, el análisis<br />
factorial requiere datos <strong>de</strong> intervalo y el número<br />
<strong>de</strong> observaciones <strong>de</strong>be ser cinco veces el número<br />
<strong>de</strong> variables. Por su parte, el análisis <strong>de</strong><br />
correspon<strong>de</strong>ncias asume que las variables son<br />
nominales y permite <strong>de</strong>scribir las relaciones entre<br />
las categorías <strong>de</strong> cada variable, así como la<br />
relación entre las variables. A<strong>de</strong>más, el análisis <strong>de</strong><br />
correspon<strong>de</strong>ncias se pue<strong>de</strong> utilizar para analizar<br />
cualquier tabla <strong>de</strong> medidas <strong>de</strong> correspon<strong>de</strong>ncia<br />
que sean positivas.<br />
6. PROPUESTA<br />
Paso 1<br />
El primer paso es establecer un conjunto <strong>de</strong><br />
variables que permitan encontrar agrupaciones en<br />
los datos. Peña Daniel (2002) en su texto<br />
consi<strong>de</strong>ra que el análisis <strong>de</strong> componentes<br />
principales es muy útil como herramienta<br />
exploratoria, por esto se utilizó esta técnica para<br />
i<strong>de</strong>ntificar agrupaciones según los bienes que<br />
permitan alguna clasificación <strong>de</strong> los hogares<br />
ecuatorianos. El conjunto <strong>de</strong> bienes consi<strong>de</strong>rados<br />
para el análisis y que forman parte <strong>de</strong>l<br />
equipamiento <strong>de</strong>l hogar son: Refrigerador,<br />
televisor, licuadora, computador, equipo <strong>de</strong><br />
sonido, micro-ondas, cocina con horno, cocina sin
horno, radio, lavadora, DVD, bicicleta, moto,<br />
auto, línea telefónica e internet. Se omitió algunos<br />
bienes poco frecuentes para maximizar la<br />
Dimensión 2<br />
G. CHOEZ<br />
10<br />
explicación <strong>de</strong> los datos y se obtuvo los siguientes<br />
grupos:<br />
FIGURA 1<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Componentes Principales - Equipamiento <strong>de</strong> bienes en el hogar<br />
,6<br />
,4<br />
,2<br />
-,0<br />
-,2<br />
-,4<br />
-,6<br />
0,0<br />
,1<br />
Dimensión 1<br />
,2<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
,3<br />
,4<br />
Los grupos <strong>de</strong> bienes con sus respectivos nombres son:<br />
,5<br />
Microhondas<br />
Pc<br />
Auto<br />
Lavadora<br />
,6<br />
Tel.<br />
Equipo<br />
Dvd<br />
Cocina H.<br />
Licuadora<br />
Refrigerador<br />
TABLA IV<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Clasificación <strong>de</strong> bienes <strong>de</strong>l hogar<br />
TV<br />
Clasificación <strong>de</strong> bienes <strong>de</strong>l hogar<br />
Bienes primarios Bienes secundarios Bienes extras Bienes poco frecuentes (omitidos)<br />
Licuadora Equipo <strong>de</strong> sonido Computador (PC) Internet<br />
Refrigerador DVD Auto Bicicleta<br />
Televisor Cocina con horno Microhondas Moto<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
,7<br />
,8<br />
Lavadora Radio<br />
,9<br />
Línea telefónica Cocina sin horno<br />
1,0
PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />
PARTIR DE LA ENEMDU 2009<br />
Paso 2<br />
El siguiente paso consiste en asignar una<br />
pon<strong>de</strong>ración a la tenencia <strong>de</strong> cada bien, la tabla <strong>de</strong><br />
11<br />
bienes con los respectivos pesos se presenta a<br />
continuación:<br />
TABLA V<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Pon<strong>de</strong>raciones para bienes <strong>de</strong>l hogar<br />
Pon<strong>de</strong>raciones para bienes <strong>de</strong>l hogar<br />
Bienes Pon<strong>de</strong>ración<br />
Refrigeradora 2<br />
Televisor 1<br />
Licuadora 2<br />
Computador (PC) 10<br />
Equipo <strong>de</strong> sonido 6<br />
Microhondas 10<br />
Cocina con horno 5<br />
Cocina sin horno 1<br />
Radio 1<br />
Lavadora 10<br />
DVD 5<br />
Bicicleta 1<br />
Moto 1<br />
Auto 9<br />
Línea telefónica 8<br />
Internet 1<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
Las pon<strong>de</strong>raciones se obtuvieron <strong>de</strong> los<br />
coeficientes <strong>de</strong> las ecuaciones <strong>de</strong> las dos primeras<br />
componentes principales 54 que explican un 52%<br />
<strong>de</strong> la varianza total <strong>de</strong> los datos. Para obtener la<br />
pon<strong>de</strong>ración se sumo el coeficiente <strong>de</strong> la variable<br />
<strong>de</strong>l bien X en la primera componente y el<br />
coeficiente en la segunda componente <strong>de</strong>l mismo<br />
bien X y se lo multiplicó por factor 10. Así se<br />
calculó la pon<strong>de</strong>ración en cada bien excepto los<br />
bienes pocos frecuentes que se les dio la<br />
pon<strong>de</strong>ración <strong>de</strong> 1.<br />
5<br />
Revisar teoría <strong>de</strong> las componentes principales en<br />
metodología<br />
Paso 3<br />
Luego se procedió a construir una variable que<br />
sume la cantidad <strong>de</strong> bienes que posee el hogar<br />
multiplicado por la pon<strong>de</strong>ración respectiva, es<br />
<strong>de</strong>cir, la variable (puntaje total) recopila la<br />
tenencia <strong>de</strong>l bien y su respectivo peso. Los niveles<br />
socioeconómicos se construyen a partir <strong>de</strong>l<br />
puntaje total según la concentración <strong>de</strong> casos<br />
como se muestra a continuación:
Puntaje total<br />
0<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
13<br />
14<br />
15<br />
16<br />
17<br />
18<br />
19<br />
20<br />
21<br />
22<br />
23<br />
24<br />
25<br />
26<br />
27<br />
28<br />
29<br />
30<br />
31<br />
32<br />
33<br />
34<br />
35<br />
36<br />
37<br />
38<br />
39<br />
40<br />
41<br />
0<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
1<br />
2<br />
2<br />
1<br />
1<br />
2<br />
2<br />
2<br />
2<br />
2<br />
G. CHOEZ<br />
FIGURA 2<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Construcción <strong>de</strong> niveles socioeconómicos<br />
2<br />
3<br />
3<br />
3<br />
3<br />
4<br />
4<br />
4<br />
4<br />
Porcentaje<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
3<br />
5<br />
5<br />
5<br />
5<br />
6<br />
Los rangos <strong>de</strong> puntajes para la construcción <strong>de</strong> los niveles se presentan a continuación:<br />
6<br />
7<br />
7<br />
12<br />
Niveles socioeconómicos<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
0<br />
4<br />
5<br />
7<br />
10<br />
10<br />
20<br />
20<br />
Porcentaje<br />
TABLA VI<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Rangos <strong>de</strong> puntaje según bienes<br />
Rangos <strong>de</strong> puntaje según bienes<br />
Puntaje según bienes Nivel socioeconómico %<br />
0 a 1 bien 1 8.7<br />
2 a 8 bines 2 40.3<br />
9 a 14 bienes 3 20.4<br />
15 a 19 bienes 4 10.0<br />
20 a 24 bienes 5 6.8<br />
25 a 29 bienes 6 5.3<br />
30 a 34 bienes 7 4.4<br />
35 o más bienes 8 4.0<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
Paso 4<br />
La validación <strong>de</strong> los niveles socioeconómicos<br />
obtenidos se realizó a través <strong>de</strong>l análisis <strong>de</strong><br />
correspon<strong>de</strong>ncia. La primera validación consiste<br />
9<br />
en graficar las categorías <strong>de</strong> las variables (nivel <strong>de</strong><br />
instrucción y nivel socioeconómico). El gráfico<br />
respectivo se presenta a continuación:<br />
30<br />
40<br />
40
PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />
PARTIR DE LA ENEMDU 2009<br />
Dimensión 2<br />
2,0<br />
1,5<br />
1,0<br />
,5<br />
0,0<br />
-,5<br />
-1,0<br />
-1,5<br />
-2,0<br />
-2,0<br />
FIGURA 3<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Nivel <strong>de</strong> instrcción vs nivel socioeconómico<br />
-1,5<br />
Dimensión 1<br />
1<br />
ninguno<br />
-1,0<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
2<br />
primaria<br />
El gráfico <strong>de</strong> correspon<strong>de</strong>ncia indica que existe<br />
relación directamente proporcional entre el nivel<br />
socioeconómico y el nivel <strong>de</strong> instrucción, es <strong>de</strong>cir,<br />
a mayor nivel <strong>de</strong> instrucción <strong>de</strong>l jefe <strong>de</strong> hogar<br />
mayor nivel socioeconómico <strong>de</strong>l hogar.<br />
Dimensión 2<br />
1,0<br />
,8<br />
,6<br />
,4<br />
,2<br />
,0<br />
-,2<br />
-,4<br />
-,6<br />
-,8<br />
-1,0<br />
-1,5<br />
8<br />
Dimensión 1<br />
-,5<br />
3<br />
0,0<br />
4<br />
,5<br />
13<br />
5<br />
secundaria<br />
6<br />
1,0<br />
superior<br />
7<br />
1,5<br />
8<br />
2,0<br />
2,5<br />
Estratos<br />
Nivel <strong>de</strong> instrucción<br />
La segunda validación consiste en graficar las<br />
categorías <strong>de</strong> las variables (condición <strong>de</strong> actividad<br />
y nivel socioeconómico) en un gráfico <strong>de</strong><br />
correspon<strong>de</strong>ncias que es presentado a<br />
continuación:<br />
FIGURA 4<br />
Propuesta metodológica para el cálculo <strong>de</strong> los niveles socioeconómicos en el ecuador a partir <strong>de</strong> la enemdu 2009<br />
Condición <strong>de</strong> actividad vs nivel socioeconómico<br />
Ocupados plenos<br />
7<br />
-1,0<br />
Fuente: ENEMDU 2009<br />
Elaborado por: Autor<br />
6<br />
5<br />
-,5<br />
Desempleo Abierto<br />
4<br />
Desempleo Oculto<br />
3<br />
0,0<br />
Inactivo<br />
Subempleo Visible<br />
2<br />
Otras formas <strong>de</strong> sube<br />
,5<br />
1<br />
1,0<br />
Nivel socioeconómico<br />
Condición <strong>de</strong><br />
actividad
En el gráfico <strong>de</strong> correspon<strong>de</strong>ncia se i<strong>de</strong>ntificaron<br />
dos grupos conceptualmente relacionados.<br />
7. CONCLUSIONES<br />
La estructuración <strong>de</strong> los niveles<br />
socioeconómicos a través <strong>de</strong> los bienes que<br />
conforman el equipamiento <strong>de</strong>l hogar<br />
conceptualmente es congruente.<br />
La metodología implementada para la<br />
estructuración <strong>de</strong> los niveles socioeconómicos a<br />
través <strong>de</strong> los bienes que conforman el<br />
equipamiento concuerda con metodologías<br />
G. CHOEZ<br />
14<br />
similares utilizadas en Chile y en países <strong>de</strong><br />
Europa.<br />
8. RECOMENDACIONES<br />
Revisar ésta primera propuesta y contribuir en<br />
la modificación o perfeccionamiento <strong>de</strong> la<br />
misma.<br />
Continuar con la revisión <strong>de</strong> métodos<br />
estadísticos multivariados consi<strong>de</strong>rando otras<br />
variables que conceptualmente estén relacionadas<br />
al nivel socioeconómico.
PROPUESTA METODOLÓGICA PARA EL CÁLCULO DE LOS NIVELES SOCIOECONÓMICOS EN EL ECUADOR A<br />
PARTIR DE LA ENEMDU 2009<br />
REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />
[1]. MEULMAN, J. (2005). SPSS Categories ®<br />
14.0. SPSS Inc. EE.UU.<br />
[2]. NORMAS INTERNACIONALES APA,<br />
“Revista Universitaria Límite”. Facultad <strong>de</strong><br />
Ciencias Sociales. Departamento <strong>de</strong> Filosofía y<br />
Psicología. Universidad <strong>de</strong> Tarapacá.<br />
Arica – Chile.<br />
15<br />
[3]. PEÑA, D. (2002). “Análisis <strong>de</strong> Datos<br />
Multivariantes”. McGraw-Hill. España.<br />
[4]. PÉREZ, C. (2006). “Técnicas <strong>de</strong> Análisis<br />
Multivariante <strong>de</strong> Datos”. Pearson Educación.<br />
España.<br />
[5]. VARELA, L. (2005). “Análisis Multivariante<br />
para las Ciencias Sociales”. Pearson<br />
Educación. España.
matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />
<strong>2010</strong>, Vol. 8, No. 2<br />
APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL<br />
ESTUDIO DE REGISTROS ELECTROENCEFALOGRÁFICOS<br />
1 González Javier, 2 Granados Carlos, 3 López Hernán, 4 Torres Iván<br />
Resumen Los registros electroencefalográficos (EEG) son señales <strong>de</strong> tipo electrofisiológicas caracterizadas por su alto grado <strong>de</strong><br />
aleatoriedad y bajos niveles <strong>de</strong> amplitud. Por su gran complejidad necesitan ser analizadas mediante la utilización <strong>de</strong> técnicas no<br />
lineales, como es el caso <strong>de</strong>l cálculo <strong>de</strong> la entropía. La importancia <strong>de</strong>l tratamiento <strong>de</strong> este tipo <strong>de</strong> señales, radica en que <strong>de</strong>bido a sus<br />
características, son susceptibles a las interferencias producidas por agentes externos como otros equipos alre<strong>de</strong>dor e internos como los<br />
movimientos musculares. Esta propuesta <strong>de</strong> trabajo se enfoca en el uso <strong>de</strong>l cálculo <strong>de</strong> la entropía aproximada, para caracterizar<br />
regularidad <strong>de</strong> registros EEG. Los algoritmos implementados están basados en el planteamiento matemático realizado por Steven<br />
Pincus (Pincus, 1991) referentes a la entropía aproximada, Joshua S. Richman and J. Randall Moorman (Moorman, 2000) referentes a<br />
entropía muestral y en los algoritmos <strong>de</strong>sarrollados por George B. Moody (Moody, 2001).<br />
Palabras Claves. Señales EEG, entropía, patologías.<br />
Abstrat. The electroencephalographic records (EEG) are electrophysiological signal with high randomness properties and low<br />
amplitu<strong>de</strong>. The EEG needs nonlinear techniques for its analys because it is a complex time series. In this paper the calculation of the<br />
entropy is very important to characterize the EEG.<br />
Key words. EEG signals, Entropy, pathologies.<br />
Recibido: Junio, <strong>2010</strong><br />
Aceptado: Agosto, <strong>2010</strong><br />
1. INTRODUCCIÓN<br />
Dentro <strong>de</strong>l gran grupo <strong>de</strong> las señales<br />
electrofisiológicas, existen los registros<br />
electroencefalográficos (EEG), que ha exigido<br />
múltiples estrategias matemáticas para extraer<br />
información con un alto grado <strong>de</strong> utilidad e<br />
importancia en el campo médico [1]. El EEG es un<br />
examen que registra la actividad eléctrica <strong>de</strong>l<br />
cerebro y proporciona una aproximación <strong>de</strong> la<br />
actividad <strong>de</strong> las ondas emitidas por las células<br />
nerviosas en la corteza <strong>de</strong>l cerebro. El EEG se<br />
compone principalmente <strong>de</strong> un grupo <strong>de</strong> ondas<br />
clasificadas por su rango en el dominio <strong>de</strong> la<br />
frecuencia, empezando por las ondas tipo Delta que<br />
compren<strong>de</strong>n el rango entre 0 y 4 Hz, seguidamente<br />
se tienen las ondas tipo Theta (4 – 8 Hz), las ondas<br />
tipo Alpha (8 – 12 Hz), ondas Beta (14 – 30 Hz) y<br />
las ondas Gamma (3 – 8 HZ). La adquisición <strong>de</strong>l<br />
EEG consta <strong>de</strong> 4 etapas principales, la primera <strong>de</strong><br />
ellas es la adquisición <strong>de</strong> la señal mediante el<br />
posicionamiento <strong>de</strong> electrodos según el estándar<br />
internacional 10-20 y se clasifican <strong>de</strong> acuerdo<br />
a la tarea o condiciones experimentales para<br />
las que se emplearan, por ejemplo pue<strong>de</strong>n ser<br />
__________________________<br />
1<br />
González Barajas Javier, Docente Facultad <strong>de</strong> Ing.<br />
Electrónica. Universidad Santo Tomás. Cra 9 N° 51-15.<br />
Bogotá – Colombia.<br />
(e-mail: javiere_gonzalez@yahoo.com.mx).<br />
2<br />
Granados Guevara Carlos A., Ingeniero Electrónico.<br />
Universidad Santo Tomás. Cra 9 N° 51-15. Bogotá. Colombia.<br />
(e-mail: andres102@hotmail.com).<br />
3<br />
Lopez Católico Hernan Camilo. Médico Cirujano.<br />
Coordinador Médico Serivico <strong>de</strong> Neurofisiologia. Liga Central<br />
Contra la Epilepsia.<br />
(e-mail: hernancamilolopez@hotmail.com)<br />
4<br />
Torres Rincón Iván. Ingeniero Electrónico. Universidad Santo<br />
Tomás. Cra 9 N° 51-15. Bogotá. Colombia.<br />
(e-mail: ibamsho@msn.com).<br />
electrodos <strong>de</strong> superficie, <strong>de</strong> aguja o <strong>de</strong> profundidad.<br />
Por lo general esos registros poseen una amplitud<br />
en el rango 10 - 45µv. Para obtener una serie <strong>de</strong><br />
tiempo <strong>de</strong> los registros EEG, se realiza un proceso<br />
<strong>de</strong> discretización con frecuencias <strong>de</strong> muestreo <strong>de</strong><br />
200Hz y 250 muestras por segundo. Como<br />
estrategia utilizada en los trabajos más actuales<br />
sobre el análisis <strong>de</strong>l EEG, se cuenta con los<br />
métodos <strong>de</strong> análisis no lineal <strong>de</strong> series <strong>de</strong> tiempo<br />
[2]. También se ha citado en la literatura la<br />
Trasformada <strong>de</strong> Fourier, mediante la cual se estudia<br />
la distribución <strong>de</strong> frecuencias en la señal EEG [3].<br />
La Transformada Wavelet, empleada para la<br />
clasificación automática <strong>de</strong> patrones y análisis <strong>de</strong><br />
energía en las diferentes bandas <strong>de</strong> frecuencia <strong>de</strong>l<br />
EEG [4]. El Filtro Kalman, para la eliminación <strong>de</strong><br />
señales <strong>de</strong> artefactos [5]. El análisis <strong>de</strong><br />
componentes in<strong>de</strong>pendientes, para la separación <strong>de</strong><br />
señales estadísticamente in<strong>de</strong>pendientes y el<br />
filtrado <strong>de</strong> artefactos [6].<br />
Para fines <strong>de</strong>l <strong>de</strong>sarrollo <strong>de</strong> este trabajo se ha<br />
utilizado el cálculo <strong>de</strong> la entropía aproximada, que<br />
refleja la probabilidad <strong>de</strong> la existencia <strong>de</strong> patrones<br />
no precedidos por otros similares <strong>de</strong>ntro <strong>de</strong> una<br />
serie analizada y asigna valores mayores a<br />
secuencias más irregulares [7]. En el caso <strong>de</strong>l EEG<br />
se cuantifica la predicción <strong>de</strong> valores <strong>de</strong> amplitud<br />
sucesivos basándose en el conocimiento <strong>de</strong> algunos<br />
valores <strong>de</strong> amplitud previos. Por lo tanto una<br />
secuencia <strong>de</strong> datos que contenga gran cantidad <strong>de</strong><br />
patrones repetitivos, tendrá una entropía<br />
aproximada pequeña, mientras que una secuencia<br />
<strong>de</strong> datos más irregular tendrá una entropía<br />
aproximada mayor. Pincus la <strong>de</strong>finió como la<br />
correlación entera en cada punto <strong>de</strong>ntro <strong>de</strong> la<br />
muestra [8]. El valor <strong>de</strong> la entropía (ApEn)
aproximada <strong>de</strong>pen<strong>de</strong> <strong>de</strong> tres parámetros la longitud<br />
<strong>de</strong>l patrón (observaciones sucesivas) m, el criterio<br />
<strong>de</strong> similitud r y el número <strong>de</strong> puntos <strong>de</strong> la serie N.<br />
Matemáticamente <strong>de</strong>finida en (1) y (2).<br />
m m+<br />
1<br />
( ) ( ) ( )<br />
ApEn m, r, N =Φ r −Φ r conr≥1 (1)<br />
m 1<br />
m<br />
φ ( r)<br />
=<br />
logCi<br />
( r)<br />
(2)<br />
N − m + 1<br />
∑ + − N m 1<br />
i=<br />
1<br />
Debido a que la entropía aproximada es una<br />
medida susceptible a la cantidad <strong>de</strong> datos que<br />
componen la señal analizada y que adicionalmente<br />
durante la comparación tiene en cuenta el mismo<br />
patrón que se está buscando, se ha optado por<br />
trabajar también con la entropía muestral. Ésta es<br />
una modificación al planteamiento <strong>de</strong> Pincus [8]<br />
hecha por Richman – Moorman [9].<br />
Matemáticamente <strong>de</strong>finida en (3) y (4).<br />
m<br />
⎛ A ( r)<br />
⎞<br />
SampEn( m, r, N ) =−ln⎜ m ⎟ (3)<br />
⎝ B ( r)<br />
⎠<br />
N−m m( ) 1<br />
m<br />
B r =<br />
Bi() r<br />
N −m−1∑ (4)<br />
N−m i=<br />
1<br />
i=<br />
1<br />
m ( ) 1<br />
m<br />
A r = Ai() r<br />
N − m∑<br />
(5)<br />
m<br />
Don<strong>de</strong> B correspon<strong>de</strong> a la cantidad <strong>de</strong><br />
coinci<strong>de</strong>ncias por patrón y m A correspon<strong>de</strong> a la<br />
cantidad <strong>de</strong> patrones coinci<strong>de</strong>ntes.<br />
2. MATERIALES Y MÉTODOS<br />
Para el <strong>de</strong>sarrollo <strong>de</strong> este proyecto fueron<br />
utilizados registros EEG tomados <strong>de</strong> la base <strong>de</strong><br />
datos <strong>de</strong> la Fundación Liga Central Contra la<br />
Epilepsia (LICCE), correspondientes a pacientes<br />
con anomalías primarias generalizadas. Registros<br />
que fueron analizados <strong>de</strong> acuerdo a las <strong>de</strong>scargas<br />
presentes. Los algoritmos fueron <strong>de</strong>sarrollaron en<br />
Matlab. El algoritmo implementado carga en la<br />
memoria la señal EEG, que se encuentra en un<br />
archivo <strong>de</strong> cabecera dispuesto como un vector (Sn),<br />
el cual se segmenta en series <strong>de</strong> tiempo <strong>de</strong> longitud<br />
m y se genera la matriz (Pm). Cada serie será un<br />
patrón que se <strong>de</strong>sea hallar a lo largo <strong>de</strong> la señal. A<br />
continuación en (6) se muestra la manera como se<br />
realiza la segmentación <strong>de</strong> Sn.<br />
J. GONZALEZ, C. GRANADOS, H. LÓPEZ & I. TORRES<br />
17<br />
Sn={1,2,3,4,5,…,N}<br />
⎡ 1 2 … m ⎤<br />
Pm = ⎢ 2 3 m + 1⎥<br />
⎢ ⎥<br />
⎣ N − m+ 1 … N ⎦<br />
(6)<br />
Luego cada una <strong>de</strong> estas series <strong>de</strong> tiempo es<br />
comparada con las <strong>de</strong>más y si la diferencia entre<br />
cada uno <strong>de</strong> sus respectivos elementos es menor<br />
que r se cuenta como una coinci<strong>de</strong>ncia,<br />
almacenando el total <strong>de</strong> coinci<strong>de</strong>ncias en una<br />
variable. Este proceso se repite para m+1, es <strong>de</strong>cir,<br />
aumentando el número <strong>de</strong> elementos <strong>de</strong> las series<br />
<strong>de</strong> tiempo a m+1. En seguida se promedian la<br />
cantidad <strong>de</strong> coinci<strong>de</strong>ncias por patrón para m y m+1<br />
y la cantidad <strong>de</strong> patrones coinci<strong>de</strong>ntes por señal.<br />
Finalmente se obtiene el valor <strong>de</strong> entropía como el<br />
logaritmo <strong>de</strong>l cociente entre ambos valores.<br />
3. RESULTADOS<br />
Los algoritmos <strong>de</strong> entropía muestral y aproximada<br />
que fueron <strong>de</strong>sarrollados, se implementaron en<br />
MATLAB para realizar pruebas con diferentes<br />
tipos <strong>de</strong> señales; esto con el fin <strong>de</strong> evi<strong>de</strong>nciar las<br />
variaciones <strong>de</strong> los valores <strong>de</strong> entropía en señales<br />
con topologías diferentes. En primer lugar se tomó<br />
una función seno a la que se le calculó la entropía<br />
aproximada para tener un valor base sobre el cual<br />
haríamos las observaciones. En seguida, a esta<br />
señal se le sumó una señal <strong>de</strong> ruido <strong>de</strong>terminístico<br />
y luego otra <strong>de</strong> ruido aleatorio y se les calculó la<br />
entropía aproximada. En la figura 1 se presentan<br />
las señales utilizadas y en tabla I, se muestran los<br />
valores <strong>de</strong> entropía obtenidos <strong>de</strong> las tres señales.<br />
FIGURA 1<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Señales <strong>de</strong> Prueba
APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL ESTUDIO DE REGISTROS ELECTROENCEFALOGRÁFICOS<br />
TABLA I<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Valores <strong>de</strong> entropía para las señales <strong>de</strong> prueba<br />
Tipo <strong>de</strong> señal<br />
Valor <strong>de</strong> entropía<br />
aproximada<br />
Función seno 0.0428<br />
Función seno con ruido<br />
0.0611<br />
<strong>de</strong>terminístico<br />
Función seno con ruido<br />
aleatorio<br />
1.0970<br />
La señal con ruido <strong>de</strong>terminístico, muestra una<br />
elevación en su valor <strong>de</strong> entropía respecto a la<br />
señal original <strong>de</strong>bido a que aumenta su<br />
complejidad, sin embargo este valor no aumenta<br />
consi<strong>de</strong>rablemente como en la tercera señal, <strong>de</strong>bido<br />
a que mantiene cierta periodicidad en sus valores.<br />
El valor <strong>de</strong> entropía <strong>de</strong> la señal con ruido aleatorio<br />
aumenta ampliamente <strong>de</strong>bido a que se pier<strong>de</strong> la<br />
periodicidad <strong>de</strong> la señal y por tanto aumenta su<br />
complejidad, es <strong>de</strong>cir que tien<strong>de</strong> a ser una señal<br />
caótica. Una <strong>de</strong> las características <strong>de</strong> la entropía<br />
aproximada, es ser altamente <strong>de</strong>pendiente <strong>de</strong> la<br />
cantidad <strong>de</strong> datos analizados, por lo que se<br />
convierte en una medida poco precisa, haciendo<br />
necesario una estimación <strong>de</strong> la cantidad <strong>de</strong> datos<br />
que se <strong>de</strong>ben tener en cuenta al momento <strong>de</strong><br />
calcular la entropía. Para mostrar esto, se compara<br />
el valor <strong>de</strong> entropía aproximada obtenido para la<br />
función seno formada por una cantidad N <strong>de</strong> datos<br />
y la misma función formada por 2N datos; esto<br />
equivale a una misma función muestreada con dos<br />
frecuencias diferentes. La figura 2 muestra las<br />
funciones utilizadas y la tabla II muestra los<br />
valores <strong>de</strong> entropía obtenidos.<br />
FIGURA 2<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Función <strong>de</strong> seno muestreada con dos frecuencias diferentes,<br />
la inferior con el doble <strong>de</strong> frecuencia que la superior<br />
18<br />
TABLA II<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Valor <strong>de</strong> entropía aproximada una señal muestreada con<br />
dos frecuencias diferentes, f1 y 2f1 respectivamente<br />
<strong>Número</strong> <strong>de</strong> datos<br />
Valor entropía<br />
aproximada<br />
400 0,0207<br />
800 0,0102<br />
Las dos señales tienen la misma forma, pero el<br />
número <strong>de</strong> datos varió en la segunda dos veces más<br />
que en la primera. Los valores <strong>de</strong> entropía variaron<br />
igualmente, pero <strong>de</strong> manera inversa, es <strong>de</strong>cir, con<br />
el doble <strong>de</strong> datos tomados, la entropía disminuye a<br />
la mitad. Para evitar el inconveniente <strong>de</strong> tener<br />
<strong>de</strong>ntro <strong>de</strong> los parámetros <strong>de</strong> entropía el número <strong>de</strong><br />
datos, se ha utilizado la entropía muestral; en la<br />
que su valor es menos sensible a la longitud <strong>de</strong> la<br />
señal analizada, pues la manera como se hace la<br />
comparación <strong>de</strong> los patrones en el algoritmo<br />
cambia al no tener en cuenta <strong>de</strong>ntro <strong>de</strong> las<br />
coinci<strong>de</strong>ncias el mismo valor que se está<br />
evaluando. Esto a su vez implica que el valor <strong>de</strong><br />
entropía aumenta respecto al valor obtenido con la<br />
entropía aproximada. En la tabla III, se presentan<br />
los valores <strong>de</strong> entropía aproximada y muestral,<br />
junto con la variación entre ellos, obtenidos para<br />
las señales <strong>de</strong> la figura 1.<br />
TABLA III<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Valores <strong>de</strong> entropía muestral y aproximada y variación<br />
entre los dos tipos <strong>de</strong> entropía<br />
Tipo <strong>de</strong> señal<br />
Valor <strong>de</strong><br />
entropía<br />
aproximada<br />
Valor <strong>de</strong><br />
entropía<br />
muestral<br />
Variación<br />
valor<br />
entropía<br />
Función seno 0.0428 0.0436 0.0008<br />
Función seno<br />
con ruido<br />
<strong>de</strong>terminístico<br />
Función seno<br />
con ruido<br />
aleatorio<br />
0.6111 0.7086 0.0975<br />
1.0970 2.4345 1.3375<br />
El aumento en el valor <strong>de</strong> entropía <strong>de</strong> las señales,<br />
se <strong>de</strong>be a que el número <strong>de</strong> patrones coinci<strong>de</strong>ntes<br />
en las señales es mucho menor y por tanto se<br />
entien<strong>de</strong> que las señales tien<strong>de</strong>n a ser más caóticas,<br />
perdiendo la periodicidad que tenían <strong>de</strong>bido a la<br />
señal original (función seno). Luego <strong>de</strong> mostrar la<br />
inci<strong>de</strong>ncia que tiene el tipo <strong>de</strong> señal y su frecuencia<br />
<strong>de</strong> muestreo en el valor <strong>de</strong> entropía, se calcula el<br />
valor <strong>de</strong> entropía para una señal EEG bipolar. Los<br />
EEG utilizados tienen una duración <strong>de</strong> 30 minutos
y 30 segundos y fueron muestreados con una<br />
frecuencia <strong>de</strong> 200Hz, por lo tanto son registros<br />
muy largos que <strong>de</strong>ben ser tomados en segmentos<br />
más cortos <strong>de</strong> tiempo llamados ventanas; en este<br />
caso cada ventana contiene 5 segundos <strong>de</strong> señal, lo<br />
que equivale a 366 ventanas en total. Cada EEG<br />
está conformado por 19 canales, <strong>de</strong> los cuales se<br />
tomaron únicamente dos, seleccionados por la<br />
mayor inci<strong>de</strong>ncia <strong>de</strong> las <strong>de</strong>scargas en su<br />
comportamiento. A continuación se presentan tres<br />
periodos <strong>de</strong> tiempo <strong>de</strong> un registro EEG en tres<br />
momentos diferentes; La figura 3 muestra un<br />
intervalo normal <strong>de</strong> la señal EEG don<strong>de</strong> no se<br />
evi<strong>de</strong>ncian <strong>de</strong>scargas.<br />
FIGURA 3<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Intervalo <strong>de</strong> señal normal<br />
la figura 4 muestra una alteración en la actividad<br />
cerebral <strong>de</strong>bido a fotoestimulación. En este caso el<br />
paciente recibe estimulación provocada por<br />
diversas fuentes <strong>de</strong> luz<br />
FIGURA 4<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Intervalo <strong>de</strong> señal con <strong>de</strong>scarga <strong>de</strong>bida o fotoestimulación en<br />
canal<br />
La figura 5 muestra una alteración <strong>de</strong>bida a<br />
somnolencia, ya que en muchos casos los registros<br />
se toman en periodos <strong>de</strong> 24 horas consecutivas y se<br />
evalúa el comportamiento <strong>de</strong>l paciente durante el<br />
ciclo Mañana - noche.<br />
J. GONZALEZ, C. GRANADOS, H. LÓPEZ & I. TORRES<br />
19<br />
FIGURA 5<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Intervalo <strong>de</strong> señal con <strong>de</strong>scarga <strong>de</strong>bida a somnolencia en<br />
canal Fp1-F3<br />
La figura 6 muestra un intervalo normal <strong>de</strong>l<br />
registro, la figura 7 muestra la <strong>de</strong>scarga por<br />
fotoestimulación y la figura 8 muestra la <strong>de</strong>scarga<br />
<strong>de</strong>bido a somnolencia.<br />
FIGURA 6<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Intervalo <strong>de</strong> señal normal en canal F3-C3<br />
FIGURA 7<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Intervalo <strong>de</strong> señal normal con <strong>de</strong>scarga <strong>de</strong>bida a<br />
fotoestimulación en canal F3-C3
APLICACIÓN DEL CÁLCULO DE LA ENTROPÍA PARA EL ESTUDIO DE REGISTROS ELECTROENCEFALOGRÁFICOS<br />
FIGURA 8<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Intervalo <strong>de</strong> señal con <strong>de</strong>scarga <strong>de</strong>bida a somnolencia en<br />
canal F3-C3<br />
Se calculó el valor <strong>de</strong> entropía para las ventanas <strong>de</strong><br />
tiempo mostradas arriba. La tabla IV contiene los<br />
valores <strong>de</strong> entropía para cada intervalo <strong>de</strong> señal por<br />
canal, la ventana <strong>de</strong> tiempo que correspon<strong>de</strong> a la<br />
señal analizada y el tipo <strong>de</strong> activación que produjo<br />
la <strong>de</strong>scarga.<br />
TABLA IV<br />
Aplicación <strong>de</strong>l cálculo <strong>de</strong> la entropía para el estudio <strong>de</strong> registros<br />
electroencefalográficos<br />
Valores <strong>de</strong> entropía aproximada y muestral en dos canales<br />
<strong>de</strong> una señal EEG bipolar <strong>de</strong> acuerdo a eventos presentes<br />
Activación<br />
Entropía<br />
Aproximada<br />
Entropía<br />
Muestral<br />
Normal 1,0232 1,1290<br />
Fotoestimulación 0,8756 0,9243<br />
Somnolencia 0,9069 0,9684<br />
Normal 1,0985 1,4294<br />
Fotoestimulación 0,7146 0,7340<br />
Somnolencia 0,7124 0,7318<br />
Al revisar los valores <strong>de</strong> entropía se aprecia que<br />
estos disminuyen cuando se presentan anomalías<br />
20<br />
en la actividad cerebral, esto se <strong>de</strong>be a que la señal<br />
tien<strong>de</strong> a or<strong>de</strong>narse durante este tipo <strong>de</strong><br />
comportamiento anormal.<br />
4. CONCLUSIONES<br />
A través <strong>de</strong>l <strong>de</strong>sarrollo <strong>de</strong> este trabajo se ha<br />
contado en primera instancia con el estudio e<br />
implementación <strong>de</strong> las técnicas para el calculo <strong>de</strong> la<br />
entropía aproximada y la entropía muestral. Por<br />
medio <strong>de</strong> las simulaciones previas realizadas con<br />
señales sinusoidales puras se ha podido evi<strong>de</strong>nciar<br />
la sensibilidad <strong>de</strong> esta medida ante el aumento <strong>de</strong> la<br />
complejidad <strong>de</strong> series <strong>de</strong> tiempo. Al po<strong>de</strong>r contar<br />
con el dominio <strong>de</strong> los algoritmos se ha tenido la<br />
oportunidad <strong>de</strong> po<strong>de</strong>rlos implementar en una<br />
plataforma basada en un procesador digital <strong>de</strong><br />
señales DSP <strong>de</strong>l fabricante Texas Instrumentes, con<br />
lo cual se obtiene el valor agregado <strong>de</strong> tener una<br />
herramienta con capacidad <strong>de</strong> procesamiento que<br />
permite tener gran portabilidad y la posibilidad <strong>de</strong><br />
realizar análisis no lineales en tiempo real <strong>de</strong><br />
registros EEG. Los algoritmos implementados en la<br />
plataformas para DSP han sido ensayados con<br />
registros EEG en diferentes estados: normal, bajo<br />
estímulos y con presencia <strong>de</strong> anomalías y se ha<br />
podido evi<strong>de</strong>nciar que la medida <strong>de</strong> entropía es<br />
sensible para los las disminuciones <strong>de</strong> complejidad<br />
que sufre el EEG.<br />
5. AGRADECIMIENTOS<br />
Los resultados logrados en este trabajo han sido<br />
logrados gracias a la colaboración <strong>de</strong>l cuerpo<br />
medico <strong>de</strong> la Liga Central Contra la Epilepsia <strong>de</strong> la<br />
ciudad <strong>de</strong> Bogota, DC. Colombia y especialmente a<br />
la <strong>de</strong>dicación <strong>de</strong>l Medico cirujano Hernán Camilo<br />
López que coordino el manejo <strong>de</strong> las bases <strong>de</strong> datos<br />
<strong>de</strong> EEG.
ECTRÓNICAS<br />
J. GONZALEZ, C. GRANADOS, H. LÓPEZ & I. TORRES<br />
REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />
[1]. THAKOR, N. V.; TONG, S. (2004)<br />
“Advances in quantitative<br />
electroencephalogram analysis methods”,<br />
Annu. Rev. Biomed. Eng., 6:453-495.<br />
[2]. H. KANTZ AND T. SCHREIBER. (2005).<br />
“Nonlinear Time Series Analysis”,<br />
Cambridge: Cambridge.<br />
[3]. BRISMAR T. (2007). “The human EEG -<br />
Physiological and clinical studies”. Physiol<br />
Behav, doi: 10.1016/j. physbeh.<br />
2007.05.047.<br />
[4]. O. A. ROSSO ET AL. (2001). “Wavelet<br />
entropy: a new tool for analysis of short<br />
duration brain electrical signals”. Journal of<br />
Neuroscience Methods (105), pp 65-75.<br />
[5]. JOSÉ L. GUTIERREZ, GUSTAVO F.<br />
NEER Y LAURA R. DE VIÑAS. (2005).<br />
“Diagnóstico <strong>de</strong> Epilepsia a Distancia: una<br />
aplicación <strong>de</strong> la telemedicina”. Buenos<br />
Aires: s.n.<br />
21<br />
[6]. A. DELORME, T. SEJNOWSKI AND S.<br />
MAKEIG. (2007). “Enhanced <strong>de</strong>tection of<br />
artifacts in EEG data using higher-or<strong>de</strong>r<br />
statistics and in<strong>de</strong>pen<strong>de</strong>nt component<br />
analysis”, Neuroimage 34, pp 1443-1449.<br />
[7]. DANIEL ABÁSOLO BAZ ET AL. (2006).<br />
“Análisis no lineal <strong>de</strong> la señal<br />
electroencefalográfica (EEG) para la ayuda<br />
en el diagnóstico <strong>de</strong> la enfermedad <strong>de</strong><br />
Alzheimer”, Madrid: s.n.<br />
[8]. S. M. PINCUS AND A. L.<br />
GOLDBERGER. (1994). “Physiological<br />
time series analysis: what does regularity<br />
quantify?”, Amer. J. Physiol., vol. 66, pp.<br />
H1643–Hl656.<br />
[9]. JOSHUA S. RICHMAN AND J.<br />
RANDALL MOORMAN. (2000).<br />
“Physiological time-series analysis using<br />
approximate entropy and sample entropy,<br />
Am J Physiol Heart Circ Physiol”,vol 278,<br />
pp H2039–H2049.
matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />
<strong>2010</strong>, Vol. 8, No. 2<br />
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA<br />
MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />
ALEATORIOS MULTIVARIADOS<br />
1 Montaño Néstor, 2 Zurita Gau<strong>de</strong>ncio<br />
Resumen. La Estimación Robusta nace <strong>de</strong> la necesidad <strong>de</strong> estimadores que se comporten “bien” aún cuando existan variaciones en los<br />
supuestos iniciales o cuando es posible que la muestra esté “contaminada” por valores aberrantes que producen influencias en los<br />
resultados y por lo tanto conducen a estimaciones errónea; siendo este un campo en constante <strong>de</strong>sarrollo se han propuesto diversos métodos<br />
<strong>de</strong> Estimación. Este artículo presenta los resultados <strong>de</strong> un estudio tipo Monte Carlo realizado para comparar algunos Métodos <strong>de</strong><br />
Estimación Robusta para el Vector <strong>de</strong> Medias y Matriz <strong>de</strong> Varianzas y Covarianzas <strong>de</strong> un vector aleatorio <strong>de</strong> seis variables. El propósito es<br />
evaluar el comportamiento <strong>de</strong> los estimadores bajo diversas condiciones como Contaminación total o Contaminación por Variable; a<strong>de</strong>más<br />
se trata <strong>de</strong> establecer una “regla empírica” don<strong>de</strong> se utilice al tamaño <strong>de</strong> la Muestra, al Sesgo y la Curtosis Muestral como elementos <strong>de</strong><br />
<strong>de</strong>cisión sobre el estimador a utilizar. Los estimadores M <strong>de</strong> Huber y Bicuadrático o Bipon<strong>de</strong>rado son los que mejor rendimiento presentan,<br />
aunque cuando la curtosis es “alta” el Estimador MCD es el mejor.<br />
Palabras claves: Estimación Multivariada, Robustez, Monte Carlo<br />
Abstract. The Robust Estimation born from the need of estimators to behave "well" even when there are variations in the initial assumptions<br />
or when it is possible that the mo<strong>de</strong>l is "contaminated" by outliers that producing influences the results and thus lead to estimates wrong,<br />
because of this is a field in constant <strong>de</strong>velopment have been proposed various methods of estimation. This article presents the results of a<br />
Monte Carlo study realized for to compare some Robust Estimation Methods for Vector averages and Matrix of Variance and Covariance of<br />
a random vector of six variables. The purpose is to evaluate the behavior of the estimators un<strong>de</strong>r various conditions such as total<br />
contamination or contamination for variable, also I seek to establish a “empirical rule" that it use the size of the Sample, the Sample Bias and<br />
the Sample Kurtosis as elements of <strong>de</strong>cision on the estimator one to using. The M estimator of Huber and Bisquared are those who present<br />
better performance, though when the kurtosis is "high" the Estimator MCD is the best.<br />
Key words: Multivariate Estimation, Robustness, Monte Carlo<br />
RECIBIDO: Agosto, <strong>2010</strong><br />
Aceptado: Septiembre, <strong>2010</strong><br />
1. INTRODUCCIÓN<br />
Para estimar parámetros poblacionales se utiliza<br />
información obtenida a partir <strong>de</strong> los datos que<br />
proporciona una Muestra; en la práctica se verifica<br />
que un alto porcentaje <strong>de</strong> las mediciones que se<br />
efectúan, por diferentes razones, contienen errores<br />
<strong>de</strong> medición u observaciones atípicas llamadas<br />
“valores aberrantes” o “extremos” pues se alejan<br />
acentuadamente <strong>de</strong>l comportamiento general <strong>de</strong> las<br />
<strong>de</strong>más observaciones; bajo este escenario, ¿el<br />
estimador seguirá siendo una “buena”<br />
aproximación, o se verá afectado por este<br />
particular?.<br />
Esta situación origina la búsqueda <strong>de</strong> estimadores<br />
robustos, es <strong>de</strong>cir, estimadores “poco” sensibles a<br />
errores <strong>de</strong> medición o a valores aberrantes.<br />
________________________<br />
1 Montaño Nestor, Ingeniero en Estadística e Informática,<br />
<strong>Escuela</strong> Superior Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>);<br />
(e_mail: rmontano@espol.edu.ec).<br />
2 Zurita Gau<strong>de</strong>ncio, M.Sc., Profesor <strong>de</strong> la <strong>Escuela</strong> Superior<br />
Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>); Director <strong>de</strong>l Centro <strong>de</strong><br />
Estudios e Investigaciones Estadísticas ICM – <strong>ESPOL</strong>.<br />
(e_mail: gzurita@espol.edu.ec).<br />
2. ESTIMACIÓN ROBUSTA<br />
Para mo<strong>de</strong>lar la situación en que la mayoría <strong>de</strong> las<br />
observaciones provienen <strong>de</strong> una distribución Fθ ,<br />
pero una pequeña fracción ε <strong>de</strong> las observaciones<br />
son valores atípicos generados por otra distribución<br />
H, Tukey en [15] plantea la Familia <strong>de</strong><br />
Contaminación F ε <strong>de</strong>finida por:<br />
F ε = { ( 1 − ε) Fθ+ εH; θ∈Θ}<br />
(2.1)<br />
don<strong>de</strong> ε representa la proporción <strong>de</strong><br />
contaminación.<br />
Se espera que los Estimadores Robustos cumplan<br />
con dos requerimientos: Eficiencia y Estabilidad.<br />
Se dice que un estimador es Eficiente si sus<br />
estimaciones son “buenas” aunque no exista<br />
contaminación, es <strong>de</strong>cir que por ejemplo, el<br />
Estimador Robusto <strong>de</strong>be ser comparable con el<br />
Estimador <strong>de</strong> Máxima Verosimilitud (al que <strong>de</strong> aquí<br />
en a<strong>de</strong>lante llamado Estimador Clásico). Para el<br />
caso multivariado este requerimiento implica lo<br />
siguiente:<br />
i) Sea ∑<br />
( μ n , n ) los estimadores <strong>de</strong> localización y<br />
dispersión para una muestra <strong>de</strong> tamaño n y sean
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />
ALEATORIOS MULTIVARIADOS<br />
∑<br />
( μ ∞ , ∞ ) sus valores asintóticos. Si<br />
∑<br />
∑ ∑<br />
i ( p ) N ∼ X μ , entonces ∞ = μ μ y ∞ = c<br />
don<strong>de</strong> c es una constante; y,<br />
ii) ∑<br />
( μ n , n ) <strong>de</strong>ben ser asintóticamente normales,<br />
esto es,<br />
n μ <br />
n − μ ∞<br />
L<br />
⎯→N0, Vμ<br />
( ) ( p )<br />
∑ ( ∑<br />
− )<br />
L<br />
⎯→N q<br />
0,<br />
( n ) ( V )<br />
n vech ∞ ∑<br />
p( p + 1)<br />
= y ( )<br />
don<strong>de</strong> q<br />
vech ∑ es el vector que<br />
2<br />
contiene los q elementos <strong>de</strong> la triangular inferior <strong>de</strong><br />
∑ .<br />
Un estimador se lo consi<strong>de</strong>ra estable si su “buen”<br />
comportamiento se preserva incluso ante la<br />
presencia <strong>de</strong> contaminación, esto es cuando F varía<br />
sobre F ε . Para evaluar la estabilidad se han<br />
propuesto varias medidas, como Sesgo Asintótico<br />
Máximo y la Varianza asintótica Máxima las cuales<br />
mi<strong>de</strong>n el “peor” comportamiento <strong>de</strong>l estimador para<br />
todo ε < ε*<br />
; también se tiene el Punto <strong>de</strong> Ruptura<br />
Asintótico don<strong>de</strong> la i<strong>de</strong>a es representar la mayor<br />
fracción <strong>de</strong> contaminación que el estimador pue<strong>de</strong><br />
tolerar.<br />
Por otro lado, en varios <strong>de</strong> los métodos <strong>de</strong> análisis<br />
multivariados se trabaja con transformaciones<br />
lineales <strong>de</strong> las variables, entonces todos los<br />
estimadores tratados cumplen la propiedad <strong>de</strong><br />
equivarianza, esto es:<br />
Si y=Ax+b entonces<br />
μ( y) = A<br />
μ ( x) + b<br />
∑<br />
( ) ∑ T<br />
y = A ( x)<br />
A<br />
Se han propuesto diversos Estimadores Robustos,<br />
sin embargo para este estudio se ha escogido a<br />
consi<strong>de</strong>rados “más populares”, a continuación<br />
<strong>de</strong>finirá a cada uno <strong>de</strong> ellos.<br />
En lo siguiente, la distancia <strong>de</strong> Mahalanobis<br />
representada por:<br />
T<br />
( x , μ, ∑) = ( x μ) ∑−1(<br />
x μ )<br />
di = di<br />
i i − i −<br />
2.1 ESTIMADOR M MULTIVARIADO<br />
Maronna en [9] extien<strong>de</strong> los estimadores M<br />
propuestos por Huber en [5] a espacios<br />
p-dimensionales; así, <strong>de</strong>fine al estimador M como la<br />
solución <strong>de</strong><br />
23<br />
i ( − ) = 0<br />
( x − μ) ( x<br />
T<br />
− μ<br />
) = <br />
( ) x μ<br />
n<br />
∑ ⎡⎣W1d ⎤⎦<br />
i<br />
i=<br />
1<br />
2 ( ) <br />
1<br />
2<br />
1<br />
n<br />
∑ ⎡W d ⎤<br />
n i i<br />
i=<br />
⎣ i ⎦<br />
don<strong>de</strong> W1 y W2 no son necesariamente iguales.<br />
Nótese que el Estimador M se pue<strong>de</strong> interpretar<br />
como un Vector <strong>de</strong> Medias pon<strong>de</strong>rado y una Matriz<br />
<strong>de</strong> Covarianza pon<strong>de</strong>rada, don<strong>de</strong> las pon<strong>de</strong>raciones<br />
<strong>de</strong>pen<strong>de</strong>n <strong>de</strong> la Distancia <strong>de</strong> Mahalanobis.<br />
Se utilizan funciones W1 y W2 <strong>de</strong> tipo Huber, esto<br />
es:<br />
⎧<br />
⎪<br />
⎪1<br />
W1( di) = ⎨<br />
⎪ k<br />
⎪⎩ di di≤k di> k<br />
y W<br />
2<br />
2(<br />
d<br />
i ) =<br />
W1di β<br />
∑<br />
( ( ) ) 2<br />
2.2 ESTIMADOR S BICUADRÁTICO<br />
MULTIVARIADO<br />
Se <strong>de</strong>fine al Estimador S Bicuadrático o<br />
p<br />
Bipon<strong>de</strong>rado multivariado como ˆ μ ∈ R y ˆ ∑∈ S<br />
p<br />
que minimiza ∑<br />
ˆ σ ˆ<br />
( di ( x, μ , ) ) con ∑ = 1,<br />
don<strong>de</strong> ˆ σ<br />
es un Estimador M univariado <strong>de</strong> Escala que<br />
satisface<br />
n<br />
1 ⎛di⎞ ∑ ρ δ<br />
n<br />
⎜ =<br />
ˆ<br />
⎟<br />
⎝σ⎠ i=<br />
1<br />
{ } 3<br />
siendo () t min 1,1-( 1-t )<br />
ρ = .<br />
Se pue<strong>de</strong> <strong>de</strong>mostrar que, bajo ciertas condiciones,<br />
los estimadores S son una particularización <strong>de</strong> los<br />
Estimadores M cuya función <strong>de</strong> pon<strong>de</strong>ración tien<strong>de</strong><br />
a cero para distancias “gran<strong>de</strong>s”.<br />
2.3 ESTIMADOR S T-BICUADRÁTICO<br />
Mientras mayor sea el número <strong>de</strong> variables, los<br />
estimadores S con función <strong>de</strong> pon<strong>de</strong>raciones<br />
continua se aproximan al vector <strong>de</strong> medias muestral<br />
y la matriz <strong>de</strong> varianzas y covarianzas muestral, esto<br />
implica una pérdida <strong>de</strong> robustez; Rocke en [12]<br />
consi<strong>de</strong>ra este problema y propone un tipo <strong>de</strong><br />
estimador con función <strong>de</strong>pendiente <strong>de</strong>l número <strong>de</strong><br />
variables, en particular propuso una familia <strong>de</strong><br />
estimadores cuya función ρ cumple que<br />
lim p→∞ ρ ( d) = I ( d><br />
1)<br />
, don<strong>de</strong> I ( d> 1)<br />
es la<br />
función “indicador”. El estimador T-Bicuadrático es<br />
un estimador que cumple las mismas condiciones<br />
<strong>de</strong>l Estimador Bicuadrático con
⎧ 0 para 0≤≤− t 1 γ<br />
⎪<br />
⎪<br />
⎪⎛<br />
2<br />
() t t 1⎞ ⎡<br />
⎛<br />
3 t 1⎞ ⎤<br />
ρ = ⎨⎜<br />
− 1 para 1 γ t 1 γ<br />
4γ ⎟⎢ − −<br />
⎜ ⎥<br />
γ ⎟ + − < < +<br />
⎪⎝ ⎠⎢ ⎝ ⎠ ⎥ 2<br />
⎣ ⎦<br />
⎪<br />
⎪<br />
⎩ 1 para t≥+<br />
1 γ<br />
2.4 ESTIMADOR COVARIANZA DE MÍNIMO<br />
DETERMINANTE MCD<br />
Zuo en [18] indica que los estimadores MCD<br />
propuestos por Rousseeuw escogen h observaciones<br />
las cuales minimizan el <strong>de</strong>terminante <strong>de</strong> la Matriz<br />
<strong>de</strong> Covarianzas Clásica, así, el estimador MCD <strong>de</strong><br />
localización es el promedio <strong>de</strong> las h observaciones y<br />
el estimador MCD <strong>de</strong> escala es un múltiplo escalar<br />
<strong>de</strong> la Matriz <strong>de</strong> Covarianzas correspondiente a las h<br />
observaciones.<br />
Este estimador es probablemente el más popular<br />
<strong>de</strong>bido (en parte) al “rápido” cálculo <strong>de</strong> los<br />
estimadores por parte <strong>de</strong> varios algoritmos<br />
<strong>de</strong>sarrollados.<br />
2.5 ESTIMADOR STAHEL-DONOHO (DS)<br />
Maronna en [8] indica que la i<strong>de</strong>a <strong>de</strong>l estimador<br />
Stahel-Donoho, propuesto por Stahel (1981) y<br />
Donoho (1982) es que un “valor aberrante”<br />
multivariado <strong>de</strong>be serlo también en alguna<br />
proyección univariada. Entonces el estimador DS,<br />
es un vector <strong>de</strong> Media y Matriz <strong>de</strong> Covarianzas<br />
ambos pon<strong>de</strong>rados <strong>de</strong> tal manera que la pon<strong>de</strong>ración<br />
<strong>de</strong> xi es una función <strong>de</strong> la “lejanía” <strong>de</strong> xi, <strong>de</strong>notada<br />
por t( x i ) .<br />
Es <strong>de</strong>cir, siendo W1 y W2 dos funciones <strong>de</strong><br />
pon<strong>de</strong>ración, se <strong>de</strong>fine<br />
<br />
μ =<br />
∑<br />
1<br />
w<br />
n<br />
i= 1 i1<br />
i=<br />
1<br />
n<br />
∑ wi1xi ( )<br />
∑ n<br />
T<br />
1<br />
= ∑ w ( ) <br />
n i2xi−μxi− μ<br />
∑ w i 1<br />
i= 1 i2<br />
=<br />
wij = wj( t i ), j = 1,2<br />
Con ( x )<br />
3. DETALLES DE LA SIMULACIÓN<br />
Las medidas planteadas para evaluar la Robustez<br />
son <strong>de</strong>finidas asintóticamente, quedando sin<br />
explicar el comportamiento <strong>de</strong> dichos Estimadores<br />
en muestras finitas, esto es lo que se explora en el<br />
presente estudio utilizando Simulación Matemática.<br />
N. MONTAÑO & G. ZURITA<br />
24<br />
3.1 DISEÑO DEL ESTUDIO<br />
En este trabajo se generan muestras aleatorias a<br />
partir <strong>de</strong> distribuciones a las que se les manipula<br />
algunos parámetros con el objetivo <strong>de</strong> simular<br />
varias condiciones y así estudiar el comportamiento<br />
<strong>de</strong> los Estimadores Robustos bajo estas condiciones;<br />
uno <strong>de</strong> los estudios seminales en cuanto a comparar<br />
Estimadores Robustos fue el realizado por Andrews<br />
et al.[1]; en dicho estudio se dio a lugar a la noción<br />
<strong>de</strong> la tres "esquinas" para representar las posibles<br />
situaciones que se pue<strong>de</strong>n encontrar en la práctica;<br />
se propuso probar los Estimadores Robustos bajo un<br />
enfoque muy optimista (Generando una<br />
Distribución Normal), muy pesimista (a través <strong>de</strong><br />
una Cauchy) y la última prueba consistía en 20<br />
datos, 19 <strong>de</strong> los cuales eran generados a partir <strong>de</strong><br />
una Normal Estándar y el último generado a partir<br />
<strong>de</strong> una N(0,100). Los dos primeros argumentos son<br />
el punto <strong>de</strong> partida <strong>de</strong>l presente estudio, es <strong>de</strong>cir, se<br />
consi<strong>de</strong>raran muestras generadas a partir <strong>de</strong> la<br />
Distribución Normal Multivariada N(0,Σ) y la<br />
Distribución Cauchy CAU(0,Σ), consi<strong>de</strong>rando la<br />
diferencia entre ambas en el “peso” <strong>de</strong> sus colas.<br />
Las muestras generadas son contaminadas, para ello<br />
se consi<strong>de</strong>ra la Familia <strong>de</strong> Contaminación (2.1)<br />
don<strong>de</strong> ε = 0; 0.05; 0.1 y 0.3 <strong>de</strong> tal manera que se<br />
observa el comportamiento <strong>de</strong> los estimadores<br />
analizados bajo condiciones <strong>de</strong>:<br />
• No Contaminación, ε = 0 , caso que permitirá<br />
compararlos con los Estimadores <strong>de</strong> Máxima<br />
Verosimilitud,<br />
• Contaminación Mo<strong>de</strong>rada, ε = 0.5 y ε = 0.1 , que<br />
parece ser lo más cercano a la realidad, y<br />
• Contaminación Extrema, ε = 0.3 , cuyos resultados<br />
se pue<strong>de</strong>n utilizar para verificar si el Punto <strong>de</strong><br />
Ruptura <strong>de</strong> los Estimadores es mayor a 0.3.<br />
A<strong>de</strong>más, para la Distribución H que genera la<br />
contaminación en el mo<strong>de</strong>lo (2.1) se ha escogido<br />
tres Distribuciones:<br />
• Distribución Normal Multivariada N (0,9Σ), para<br />
seguir con la i<strong>de</strong>a propuesta por Tukey en [15] y<br />
que a<strong>de</strong>más es la Distribución utilizada con más<br />
frecuencia en este tipo <strong>de</strong> estudios.<br />
• Distribución Normal Multivariada<br />
N 0.537 α , 9 ∑ , es <strong>de</strong>cir una Contaminación<br />
( )<br />
6<br />
Asimétrica don<strong>de</strong> α6 representa el vector propio<br />
correspondiente al menor valor propio asociado a la<br />
Matriz <strong>de</strong> Varianzas y Covarianzas; este tipo <strong>de</strong><br />
contaminación es utilizada por Devlin en [2]; y<br />
• Distribución Uniforme Esférica U esf(d), don<strong>de</strong> d<br />
representa la distancia hacia el origen; esta<br />
distribución se utiliza bajo el supuesto que una<br />
observación errónea pue<strong>de</strong> producirse en cualquier<br />
punto con igual probabilidad.
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />
ALEATORIOS MULTIVARIADOS<br />
Por otro lado, como se menciona en la segunda<br />
sección, el Entorno <strong>de</strong> Contaminación (2.1) indica<br />
que una proporción <strong>de</strong> vectores no siguen la<br />
distribución original, para el caso multivariado esto<br />
implica que existen dos escenarios posibles: ó todas<br />
las componentes <strong>de</strong> la observación están<br />
contaminadas ó ninguna está contaminada; esto sin<br />
embargo no es necesariamente lo que ocurre en la<br />
realidad, pues se pue<strong>de</strong> pensar que los errores se<br />
dan en una o varias componentes <strong>de</strong> la observación,<br />
difícilmente en todas; en base a esto se consi<strong>de</strong>ra<br />
otro tipo <strong>de</strong> contaminación, la misma que consi<strong>de</strong>ra<br />
cada variable in<strong>de</strong>pendientemente, es <strong>de</strong>cir,<br />
mientras en el mo<strong>de</strong>lo (2.1) una observación tiene<br />
probabilidad ε <strong>de</strong> estar contaminada, el segundo<br />
mo<strong>de</strong>lo consi<strong>de</strong>rado indica que cada componente <strong>de</strong><br />
la observación tiene probabilidad ε <strong>de</strong> estar<br />
contaminada. Las distribuciones utilizadas para<br />
generar la contaminación por variable son:<br />
Distribución Normal N ( 0, 9σ i ) y la Distribución<br />
Uniforme U ( −5 ,5).<br />
3.2 PARÁMETROS DE LA SIMULACIÓN<br />
A<strong>de</strong>más <strong>de</strong> lo explicado en la sección 3.1, para el<br />
presente estudio se trabaja con p=6, don<strong>de</strong> p<br />
representa el número <strong>de</strong> variables y el tamaño<br />
muestral será n=kp don<strong>de</strong> k=5 ,10 y 20.<br />
A continuación se presentan las dos Matrices <strong>de</strong><br />
Varianzas y Convarianzas utilizadas para generar<br />
las muestras aleatorias,<br />
⎛ ⎞<br />
1<br />
⎜.950 1<br />
⎟<br />
.300 .100 1<br />
∑<br />
1<br />
= ⎜ ⎟<br />
0 0 0 1<br />
⎜ ⎟<br />
0 0 0 −.499<br />
1<br />
⎜ ⎟<br />
⎝ 0 0 0 −.499 −.499<br />
1 ⎠<br />
a la misma que le correspon<strong>de</strong> los valores propios<br />
λ1=2.029, λ2= λ3=1.499, λ4=0.943, λ5=0.028 y<br />
λ6=0.002.<br />
La segunda matriz consi<strong>de</strong>rada es<br />
∑<br />
2<br />
⎛ ⎞<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝ ⎠<br />
=<br />
1<br />
.08<br />
.10<br />
.12<br />
1<br />
.12<br />
−.10 1<br />
−.081<br />
−.10 −.08<br />
.08 .10 1<br />
−.08 .10 −.01<br />
.08 .12 1<br />
cuyos valores propios son λ1=1.282, λ2=1.253,<br />
λ3=1.120, λ4=1.056, λ5=0.719 y λ6=0.697.<br />
La matriz Σ1 fue utilizada por Devlin en [2], la<br />
misma tiene correlaciones que varían, es términos<br />
absolutos, entre 0 y 0.95, <strong>de</strong> tal manera que se<br />
25<br />
prueba la habilidad <strong>de</strong>l estimador para <strong>de</strong>tectar esta<br />
variedad <strong>de</strong> correlaciones, a<strong>de</strong>más, λ6 es muy<br />
cercano a cero lo que indica que la matriz es “casi”<br />
singular, esto permite medir el comportamiento <strong>de</strong><br />
los estimadores en condiciones <strong>de</strong> “casi”<br />
singularidad, finalmente, al igual que las<br />
correlaciones, los valores propios asociados a Σ1<br />
también varían ampliamente.<br />
La matriz Σ2 en cambio, presenta correlaciones y<br />
valores propios con poca diferencia, así se mi<strong>de</strong> la<br />
capacidad <strong>de</strong>l estimador ante matrices con poca<br />
variabilidad en sus elementos y los valores propios<br />
asociados a la misma.<br />
Por otro lado, para la simulación <strong>de</strong> Monte Carlo<br />
cada escenario se repite N=500 veces y el software<br />
utilizado para el efecto es R versión 2.8.0 [11].<br />
3.3 CRITERIOS DE EVALUACIÓN<br />
Con el propósito <strong>de</strong> evaluar la Eficiencia y<br />
Estabilidad <strong>de</strong> los Estimadores estudiados; se <strong>de</strong>fine<br />
( ) 1 ( )<br />
1<br />
N<br />
e e<br />
x = ∑ x<br />
N i=<br />
que es el Promedio <strong>de</strong> las estimaciones<br />
correspondientes a “e” para el Vector <strong>de</strong> Medias,<br />
don<strong>de</strong> e ={Clásico, M Huber, T-Bicuadrático,<br />
Bicuadrático, MCD, DS};<br />
( e) { ( e)<br />
max =<br />
}<br />
max<br />
x x<br />
que representa a la estimación “más alejada” <strong>de</strong>l<br />
verda<strong>de</strong>ro valor <strong>de</strong>l parámetro, en términos <strong>de</strong> la<br />
distancia Euclidiana, <strong>de</strong> entre los Vectores <strong>de</strong><br />
Medias correspondientes al estimador e en las N<br />
repeticiones.<br />
Con estos dos vectores se obtiene el Sesgo<br />
Promedio Total y Sesgo Máximo Total, haciendo<br />
T<br />
( e)<br />
( )<br />
Sesgo Promedio Total = Prom ( x ) = x x<br />
T<br />
( e) ( e) ( e)<br />
Sesgo Máximo T = Max ( x ) = ( x max ) x max<br />
es <strong>de</strong>cir, calculando Distancia Euclidiana entre el<br />
verda<strong>de</strong>ro valor <strong>de</strong>l Vector <strong>de</strong> Medias “0” con<br />
( e)<br />
y con x respectivamente.<br />
Se <strong>de</strong>fine también<br />
6<br />
( e) ( e)<br />
sdtotal ( x ) sd ( x )<br />
= ∑<br />
i=<br />
1<br />
i<br />
e ( e)<br />
( ) ( )<br />
( )<br />
( e)<br />
x<br />
que es la suma <strong>de</strong> las Desviaciones Estándar <strong>de</strong> cada<br />
componente <strong>de</strong>l Vector <strong>de</strong> Medias correspondiente<br />
( e)<br />
al estimador e, <strong>de</strong> tal manera que sdtotal ( x )<br />
representa la Desviación Total <strong>de</strong>l estimador e.
Por último, bajo el supuesto que el mejor estimador<br />
es el que presente un mejor balance entre: su<br />
comportamiento promedio, su “peor”<br />
comportamiento y la dispersión <strong>de</strong> sus estimaciones,<br />
se ha elaborado un índice que es:<br />
( e) ( e) ( e)<br />
( Prom ( x ) + Max ( x ) + sdtotal<br />
( x ) )<br />
Indice =<br />
3<br />
(3.1)<br />
la media aritmética entre el Sesgo Promedio Total,<br />
Sesgo Máximo Total y la Desviación Total; <strong>de</strong> tal<br />
manera que el estimador que presente menor índice<br />
será el más Eficiente y Estable en cada escenario<br />
estudiado, nótese que se da la misma importancia a<br />
las tres medidas.<br />
Por otro lado, en la práctica no se conoce cuan<br />
contaminada está la muestra, ni que Distribución<br />
genera la contaminación, etc. solo se tiene la matriz<br />
<strong>de</strong> observaciones y el tamaño muestral, por lo que<br />
en el presente estudio también se explora el<br />
comportamiento <strong>de</strong> los estimadores en función <strong>de</strong>l<br />
Sesgo y Curtosis Muestral, con el propósito <strong>de</strong> que<br />
dichas medidas junto con el tamaño <strong>de</strong> la muestra<br />
sirvan como criterios para <strong>de</strong>cidir que estimador<br />
utilizar.<br />
4. RESUMEN DE RESULTADOS<br />
Se simula en total 184 escenarios, el análisis<br />
<strong>de</strong>tallado <strong>de</strong> los mismos es presentado en [10], en<br />
esta sección se presenta algunos <strong>de</strong> los resultados<br />
obtenidos dando un breve resumen <strong>de</strong> los más<br />
relevantes.<br />
4.1 ANÁLISIS POR ESCENARIO SIMULADO<br />
Las tablas <strong>de</strong> resultado se encuentran divididas en<br />
tres secciones verticales, presentando los resultados<br />
para la estimación <strong>de</strong>l vector <strong>de</strong> medias, los valores<br />
propios y la matriz <strong>de</strong> varianzas y covarianzas, y en<br />
tres secciones horizontales, correspondientes a cada<br />
tamaño muestral k=5 ,10 y 20 . En cada sección se<br />
muestra en la columna <strong>de</strong>nominada “Prom” el<br />
Sesgo Promedio Total, el Sesgo Máximo Total es<br />
presentado en la columna “Max”, mientras que la<br />
Desviación Total se presenta en la columna “Desv”<br />
y en la última columna se muestra el Índice (3.1).<br />
La Tabla I presenta los resultados obtenidos para<br />
el escenario <strong>de</strong> muestras generadas a partir <strong>de</strong> una<br />
Distribución Normal N(0,Σ), Σ=Σ1 sin contaminar;<br />
N. MONTAÑO & G. ZURITA<br />
26<br />
se pue<strong>de</strong> ver que los Estimadores Robustos son<br />
comparables al Estimadores <strong>de</strong> Máxima<br />
Verosimilitud, pues en todos los casos sus<br />
resultados no difieren consi<strong>de</strong>rablemente <strong>de</strong> los<br />
resultados <strong>de</strong>l estimador <strong>de</strong> máxima verosimilitud.<br />
En la simulación realizada en [10], para muestras<br />
generadas a partir <strong>de</strong> una Distribución Normal<br />
N(0,Σ), Σ=Σ2 se notó un comportamiento parecido,<br />
es <strong>de</strong>cir, se verifica que los estimadores Robustos<br />
Estudiados son Eficientes. Consi<strong>de</strong>rando el Sesgo<br />
Promedio Total como medida <strong>de</strong> la “bondad” <strong>de</strong>l<br />
Estimador, en los escenarios simulados, el<br />
Estimador Clásico presenta su “peor” rendimiento<br />
al tratar <strong>de</strong> estimar la Matriz <strong>de</strong> Covarianzas y los<br />
Valores Propios asociados a la misma.<br />
La Tabla II presenta los resultados obtenidos para<br />
muestras generadas a partir <strong>de</strong> una Distribución<br />
Normal N(0,Σ), Σ=Σ1 contaminada con ε =0.10 y<br />
H=N(0,9Σ1), se pue<strong>de</strong> ver como el Estimador<br />
Clásico estima incorrectamente a los Valores<br />
Propios y Matriz <strong>de</strong> Covarianzas, teniendo un índice<br />
más <strong>de</strong> dos veces mayor al índice alcanzado por el<br />
“peor” estimador robusto cuando k =10 y 20. En<br />
general, cuando la muestra es generada a partir <strong>de</strong><br />
una Población Normal N(0,Σ), Σ=Σ1 contaminada<br />
con H=N(0,9Σ1), o H = U esf (d=5) los estimadores<br />
sobreestiman el primer y segundo valor propio para<br />
luego estimar con error “pequeño” los valores<br />
propios restantes; en este caso, los Estimadores<br />
Clásico y MCD son los que sobreestiman con<br />
mayor error el primer valor propio, sin embrago, el<br />
Estimador MCD reduce consi<strong>de</strong>rablemente su error<br />
mientras aumenta el tamaño muestral. Mientras que,<br />
cuando Σ=Σ2 los Estimadores sobreestiman el<br />
primer y segundo valor propio, sin embargo, al final<br />
generalmente subestiman el menor valor propio. De<br />
acuerdo a los resultados obtenidos, el tamaño<br />
muestral influye en la estimación, pues en todos los<br />
estimadores se cumple que al aumentar el mismo, se<br />
disminuye el Sesgo Promedio Total y la Desviación<br />
Total. El estimador T-Bicuadrático es casi siempre<br />
superado por los <strong>de</strong>más Estimadores Robustos,<br />
situación que era previsible pues este estimador fue<br />
construido para mejorar el comportamiento <strong>de</strong> los<br />
estimadores S para p “gran<strong>de</strong>” y en el presente<br />
estudio se consi<strong>de</strong>ra p =6. La Tabla III muestra que<br />
a pesar <strong>de</strong> que la mayoría <strong>de</strong> los Estimadores<br />
Robustos consi<strong>de</strong>rados han sido construidos bajo el<br />
supuesto <strong>de</strong> contaminación simétrica, al ser<br />
sometidos a contaminación asimétrica se comportan<br />
<strong>de</strong> manera similar a cuando la misma es simétrica.
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />
ALEATORIOS MULTIVARIADOS<br />
TABLA I<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados para Población Normal N (0,Σ), Σ=Σ1 sin Contaminar<br />
TABLA II<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados para Población Normal N(0,Σ1) Contaminada con ε =0.10 y H=N (0,9 Σ1)<br />
27
N. MONTAÑO & G. ZURITA<br />
TABLA III<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados para Población Normal N(0,Σ1) Contaminada con ε =0.10 y H=N (0.537α6,9 Σ1)<br />
TABLA IV<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados para Población Normal N(0,Σ1) Contaminada por variable con ε =0.10 y H=U (-5,5)<br />
28
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />
ALEATORIOS MULTIVARIADOS<br />
TABLA V<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados para Población Cauchi CAU(0,Σ), Σ=Σ1 sin Contaminar<br />
Así también, los estimadores han sido construidos<br />
siguiendo el entorno <strong>de</strong> contaminación (2.1), sin<br />
embargo, al contaminar por variable, según lo<br />
explicado en la sección 3.1, los Estimadores brindan<br />
“buenas” estimaciones, véase la Tabla IV; no<br />
obstante, en el presente estudio no se analiza las<br />
consecuencias que pue<strong>de</strong> tener la contaminación por<br />
variable en las Técnicas <strong>de</strong> Análisis Multivariado.<br />
Cuando las Muestras son generadas a partir <strong>de</strong> la<br />
Distribución Cauchy, el Estimador Clásico en todos<br />
los casos brinda las estimaciones más distantes <strong>de</strong><br />
cada parámetro poblacional, la Tabla V presenta el<br />
caso cuando se generan muestras a partir <strong>de</strong> una<br />
Cauchy sin contaminar. A<strong>de</strong>más, en estos casos, el<br />
algoritmo utilizado para el Estimador M <strong>de</strong> Huber<br />
no siempre converge a una solución. Los valores<br />
propios son siempre sobreestimados; en la parte<br />
<strong>de</strong>recha <strong>de</strong> la Tabla V se muestra los errores<br />
absolutos y relativos <strong>de</strong> la estimación <strong>de</strong> los valores<br />
propios para k=20.<br />
A las estimaciones brindadas por el estimador DS<br />
en varias ocasiones les correspon<strong>de</strong> un Sesgo<br />
Promedio Total menor al Sesgo presentado por los<br />
<strong>de</strong>más estimadores, sin embargo su “peor”<br />
estimación pue<strong>de</strong> incluso encontrarse más alejada<br />
que la “peor” estimación utilizando el método<br />
Clásico; esto implica que no presente un Balance<br />
a<strong>de</strong>cuado y no sea consi<strong>de</strong>rado el mejor estimador<br />
(<strong>de</strong> acuerdo al índice planteado) en los escenarios<br />
simulados.<br />
29<br />
4.2 ANÁLISIS POR TAMAÑO MUESTRAL,<br />
SESGO Y CURTOSIS<br />
En esta parte <strong>de</strong>l estudio se trata <strong>de</strong> establecer una<br />
“regla empírica” en la cual se utilice el tamaño <strong>de</strong> la<br />
Muestra, el Sesgo y la Curtosis Muestral como<br />
elementos <strong>de</strong> <strong>de</strong>cisión sobre que estimador utilizar<br />
en ese caso.<br />
A cada muestra generada se le ha calculado Sesgo<br />
y Curtosis, a<strong>de</strong>más se <strong>de</strong>terminan la distancia<br />
Euclidiana entre el verda<strong>de</strong>ro valor <strong>de</strong>l Vector <strong>de</strong><br />
Medias, la Matriz <strong>de</strong> Covarianzas y los Valores<br />
Propios asociados a la misma con la estimación<br />
obtenida por cada Método; a partir <strong>de</strong> esto se<br />
establece el estimador “más cercano” en cada<br />
muestra.<br />
En las Tablas VI y VII se presenta un resumen <strong>de</strong><br />
los resultados obtenidos para muestra tamaño 30 y<br />
60 respectivamente; en las mencionadas tablas se<br />
pue<strong>de</strong> observar los tres estimadores que con mayor<br />
frecuencia presentan la menor distancia entre el<br />
valor <strong>de</strong>l parámetro y la estimación; para cada<br />
estimador se presenta la distancia Promedio y su<br />
Desviación Estándar, a<strong>de</strong>más <strong>de</strong> la Frecuencia<br />
Relativa <strong>de</strong> ser el estimador “más cercano” al valor<br />
real.<br />
Así, por ejemplo, con tamaño <strong>de</strong> muestra igual a<br />
30, cuando el Sesgo es menor a 45 y la Curtosis se<br />
encuentra en el intervalo [20, 65) el 25,3% <strong>de</strong> las
ocasiones el estimador Clásico es el que presenta la<br />
menor distancia para la estimación <strong>de</strong>l Vector <strong>de</strong><br />
Medias, siendo su distancia Promedio igual a<br />
0.503±0.174. Mientras que para los Valores Propios<br />
y la Matriz <strong>de</strong> Varianzas y Covarianzas el<br />
Estimador M <strong>de</strong> Huber en más <strong>de</strong>l 50% <strong>de</strong> los casos<br />
brinda la estimación “más cercana”.<br />
A<strong>de</strong>más, para valores <strong>de</strong> Sesgo Muestral superiores<br />
a 45 pero inferiores a 90, el Estimador DS es con<br />
mayor frecuencia el “mejor” estimador, sin embrago<br />
su Promedio y Desviación Estándar <strong>de</strong> la distancia<br />
para el caso <strong>de</strong> los Valores Propios y Matriz <strong>de</strong><br />
Covarianzas es mayor a la presentada por los otros<br />
dos estimadores, por ejemplo, cuando la Curtosis se<br />
encuentra en el intervalo [110, 155) la distancia<br />
promedio correspondiente al Estimador DS al<br />
estimar la Matriz <strong>de</strong> Varianzas y Covarianzas es<br />
11.075 mientras que para el Estimador Bicuadrático<br />
es 8.397, situación que pue<strong>de</strong> ser causada por la alta<br />
dispersión observada en el Estimador DS.<br />
N. MONTAÑO & G. ZURITA<br />
30<br />
De acuerdo a la Tabla VII, cuando el Sesgo<br />
Muestral es mayor a 90 y menor a 180 y la Curtosis<br />
Muestral se encuentra en el intervalo [130, 220) el<br />
estimador MCD alcanza la proporción 0.688 <strong>de</strong> ser<br />
el estimador “más cercano” a los Valores Propios;<br />
es seguido por el estimador DS y Bicuadrático.<br />
Nótese que el estimador que con mayor frecuencia<br />
es el mejor estimador <strong>de</strong> la Matriz <strong>de</strong> Covarianzas y<br />
los Valores Propios asociados a la misma es, para<br />
sesgos mayores a 90, el Estimador MCD.<br />
De acuerdo a los resultados obtenidos, para n =120,<br />
cuando la Curtosis es menor a 230 el Estimador M<br />
<strong>de</strong> Huber o el Estimador Bicuadrático son los que<br />
con mayor frecuencia se constituyen en los<br />
“mejores” estimadores, mientras que para Curtosis<br />
mayor a 230 el mejor estimador es con mayor<br />
frecuencia el MCD.<br />
TABLA VI<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados en función <strong>de</strong>l Sesgo y la Curtosis para tamaño muestral 30
ESTIMADORES ROBUSTOS PARA EL VECTOR DE MEDIAS Y LA MATRIZ DE VARIANZAS Y COVARIANZAS DE VECTORES<br />
ALEATORIOS MULTIVARIADOS<br />
TABLA VII<br />
Estimadores robustos para el vector <strong>de</strong> medias y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> vectores aleatorios multivariados<br />
Resultados en función <strong>de</strong>l Sesgo y la Curtosis para tamaño muestral 60<br />
5. CONCLUSIONES<br />
Se confirma la sensibilidad <strong>de</strong> los Estimadores <strong>de</strong><br />
Máxima Verosimilitud para el Vector <strong>de</strong> Medias y<br />
Matriz <strong>de</strong> Varianzas y Covarianzas ante<br />
<strong>de</strong>sviaciones <strong>de</strong> la Distribución Normal<br />
Multivariada. Cuando la muestra es generada a<br />
partir <strong>de</strong> la Distribución Normal Multivariada, para<br />
cualquier tamaño muestral los Estimadores M <strong>de</strong><br />
Huber y Bicuadrático son generalmente los que<br />
alcanzan el menor índice al estimar el Vector <strong>de</strong><br />
Medias, Matriz <strong>de</strong> Covarianzas y Valores Propios.<br />
Cuando se consi<strong>de</strong>ra muestras generadas a partir <strong>de</strong><br />
una Distribución Cauchy, el Estimador Bicuadrático<br />
31<br />
presenta el mejor comportamiento para k =5,<br />
mientras que para k =10 y k =20 el Estimador MCD<br />
es el que “mejor” estima la Matriz <strong>de</strong> Covarianzas y<br />
los Valores propios, todo ello en base al índice<br />
planteado en 3.2.<br />
Para ε =0.30 los estimadores Robustos estudiados,<br />
se comportan <strong>de</strong> forma parecida a cuando ε =0.05 y<br />
ε =0.10, se concluye entonces que el Punto <strong>de</strong><br />
Ruptura, para p =6 variables, es mayor a 0.3<br />
Finalmente, se recomienda la realización <strong>de</strong><br />
próximos estudios que complementen el presente<br />
trabajo.
N. MONTAÑO & G. ZURITA<br />
REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />
[1]. ANDREWS, D. et al. (1972). Robust<br />
Estimates of Location: Survey and Advances.<br />
Princeton Univ. Press.<br />
[2]. DEVLIN, S., GNANADESIKAN, R., Y<br />
KETTENRING J. (1981). “Robust<br />
estimation of dispersion matrices and<br />
Principal Components”, Journal of the<br />
American Statistical Association; 76, 354-<br />
362.<br />
[3]. HAMPEL, F. (1971). “A general<br />
qualitative <strong>de</strong>finition of robustness”, The<br />
Annals of Mathematical Statistics; 42, 1887–<br />
1896.<br />
[4]. HAMPEL, F. (1974). “The influence curve<br />
and its role in robust estimation”, Journal of<br />
the American Statistical Association; 69,<br />
383–393.<br />
[5]. HUBER, P. (1964). “Robust estimation of a<br />
location parameter”, The Annals of<br />
Mathematical Statistics; 35, 73–101.<br />
[6]. HUBER, P. (1972). “The 1972 wald lecture.<br />
Robust Statistics: A Review”, The Annals of<br />
Mathematical Statistics; 43, 1041–1067.<br />
[7]. HUBER, P. (1979). “Robust Statistical<br />
Procedures”, Society for industrial and<br />
Applied Mathematics.<br />
[8]. MARONNA, R., MARTIN, D. Y YOHAI,<br />
V. (2006). “Robust Statistics: Theory and<br />
Methods”, John Willey & Sons, New York–<br />
USA.<br />
[9]. MARONNA, R. (1976). “Robust M-<br />
Estimators of Multivariate Location and<br />
Scatter”, The Annals of Statistics; 4, 51–67.<br />
[10]. MONTAÑO, N. (2009) “Estimadores<br />
Robustos para el Vector <strong>de</strong> Medias y la<br />
Matriz <strong>de</strong> Varianzas y Covarianzas <strong>de</strong><br />
Vectores Aleatorios Multivariados”, Tesis <strong>de</strong><br />
Grado.<br />
32<br />
[11]. R DEVELOPMENT CORE TEAM<br />
(2008). “R: A language and environment for<br />
statistical computing. R Foundation for<br />
Statistical Computing”, Vienna, Austria.<br />
[12]. ROCKE D. (1996) “Robustness<br />
properties of multivariate location and shape<br />
in high dimension”, The Annals of Statistics;<br />
24, 1327–1345.<br />
[13]. RENCHER, A. (1998). “Multivariate<br />
Statistical Inference and Applications”, John<br />
Willey & Sons, New York–USA.<br />
[14]. SEBER, G. (1984). “Multivariate<br />
observation”, John Willey & Sons, New<br />
York–USA.<br />
[15]. TUKEY, J. (1960). “A survey of<br />
sampling from contaminated distributions”,<br />
Contributions to Probability and Statistics:<br />
Essays in Honor of Harold Hotelling”, Olkin<br />
Ediciones Stanford University Press,<br />
Stanford. CA.<br />
[16]. YOHAI, V. (2004). “Notas <strong>de</strong><br />
probabilidad y estadística”, [en línea]<br />
Universidad <strong>de</strong> Buenos Aires, Buenos Aires<br />
– Argentina.<br />
[17]. ZAMAR, R. (1994) “Estimación<br />
Robusta” , Estadística Española; 36, 327–<br />
387.<br />
[18]. ZUO, Y. (2006). “Robust location and<br />
scatter estimators in multivariate análisis”<br />
(invited book chapter to honor Peter Bickel<br />
on his 65th Birthday), The Frontiers in<br />
Statistics, Imperial College Press.
matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />
<strong>2010</strong>, Vol. 8, No. 2<br />
DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />
Páez Chávez Joseph 1<br />
Abstract. In this manuscript we introduce some important concepts concerning dynamical systems theory. We <strong>de</strong>vote special attention to<br />
studying differential equations from a dynamical systems viewpoint. The introduced concepts are illustrated by examples.<br />
Keywords: Dynamical Systems, discrete-time systems, continuous-time systems, differential equations, vector fields.<br />
Resumen. En este manuscrito presentamos algunos conceptos importantes concernientes a la teoría <strong>de</strong> los sistemas dinámicos. Se presta<br />
especial atención al estudio <strong>de</strong> ecuaciones diferenciales <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> sistemas dinámicos. Los conceptos presentados son<br />
ilustrados mediante ejemplos.<br />
Keywords: Sistemas dinámicos, sistemas <strong>de</strong> tiempo discreto, sistema <strong>de</strong> tiempo contínuo, mo<strong>de</strong>laje matemático.<br />
RECIBIDO: Agosto, <strong>2010</strong><br />
ACEPTADO: Septiembre, <strong>2010</strong><br />
1. INTRODUCTION<br />
Nowadays dynamical systems phenomena appear<br />
in almost every area of science, from the oscillating<br />
Belousov-Zhabotinsky reaction in chemistry to the<br />
chaotic Lorenz system in meteorology, from<br />
complicated behavior in celestial mechanics to the<br />
bifurcations arising in ecological mo<strong>de</strong>ls. It turns<br />
out that many of the phenomena mentioned above<br />
can be <strong>de</strong>scribed by means of differential equations.<br />
For this reason, it is an important task to un<strong>de</strong>rstand<br />
the connections between differential equations and<br />
dynamical systems. By doing this, we obtain a<br />
powerful tool which allows us to study the<br />
qualitative behavior of differential equations<br />
without having to solve them analytically. This is<br />
specially useful when a general solution is not<br />
available or the numerical simulations are too<br />
expensive.<br />
In this article, we continue the study started in [7].<br />
We recall some basic Concepts introduced in that<br />
manuscript and bring some new ones. We also<br />
present a theorem concerning existence and<br />
uniqueness of the solution of initial value problems<br />
and show the connection between these problems<br />
and dynamical systems. Most of the material<br />
presented in this manuscript can be found in the<br />
lectures notes of Prof. Beyn, [4, 5]. There is<br />
nevertheless plenty of literature on this subject, e.g.,<br />
see [1, 2, 3, 6, 8].<br />
______________________________<br />
1 Joseph Páez Chávez, Ph.D, Profesor <strong>de</strong>l Instituto <strong>de</strong> Ciencias<br />
Matemáticas, <strong>ESPOL</strong>. (e_mail: jpaez@espol.edu.ec)<br />
2. BASIC CONCEPTS AND THEOREMS<br />
To begin with, we recall the <strong>de</strong>finition of<br />
dynamical system (cf. [7]):<br />
Definition 2.1. A dynamical system is a triple<br />
{ T , X , { ϕ<br />
t}<br />
} , where T is a time set, X is a state<br />
t∈T<br />
space and t<br />
ϕ : X → X is a family of operators<br />
parametrized by t ∈ T , such that:<br />
0 0<br />
DS1 ∀u∈ X : ϕ ( u) = u, ie . ., ϕ = Idx,<br />
DS2 ∀u ∈ X, ∀s, t ∈T :<br />
( u) ( ( u) ) ,.., ie o<br />
t+ s t s t s t+ s<br />
ϕ = ϕ ϕ ϕ ϕ = ϕ<br />
Here, the set X stands for a metric space. The<br />
t<br />
function ϕ is known as evolution operator. This<br />
operator can be thought of as a “law” that governs<br />
the behavior of the system. Furthermore, the time<br />
set T has the following properties:<br />
• ∃0 ∈ T, ∀t ∈ T : t + 0 = t ,<br />
• ∀ts , ∈ T: s+ t∈T,<br />
• ∀ts , ∈ T : s+ t= t+ s.<br />
This means that T equipped with the operation + is<br />
a commutative semigroup. In [7, Example 2.1], the<br />
author explains the fact that a discrete-time system<br />
is completely <strong>de</strong>fined by knowing the function<br />
1<br />
g:= ϕ . Hence the evolution operator can be<br />
constructed as follows<br />
0<br />
k<br />
ϕ = Idx<br />
, andϕ = g o g o ... o g , (2.1)<br />
<br />
k times<br />
k ∈ . Further, if g is invertible, the system admits<br />
negative values of k. For this reason, the function g<br />
is said to be the generator of the dynamical system.<br />
Now the natural question that arises from this fact is
whether continuous-time systems also have, in some<br />
sense, generators. Note that in this case we <strong>de</strong>al<br />
with values of time on the real line, so the function<br />
1<br />
ϕ does not allow us to construct the evolution<br />
operator, at least not on the whole real line. These<br />
consi<strong>de</strong>rations lead us to the following <strong>de</strong>finition:<br />
Definition 2.2. Let { T , X ,<br />
t { ϕ } } , where<br />
∈T<br />
+<br />
T = or ∪ {} 0 , be a dynamical system such<br />
that ϕ ( x)<br />
•<br />
is differentiable for all x ∈ X . Then<br />
the function f: X → X given by<br />
h 0<br />
d<br />
ϕ ( x) − ϕ ( x<br />
t<br />
)<br />
f ( x) : = ( ϕ ( x)<br />
) = lim<br />
dt t=<br />
0 h→0<br />
h<br />
h∈T<br />
is referred to as infinitesimal generator of the<br />
dynamical system 2 .1Of course, the spirit of a<br />
generator is that we can in some way construct the<br />
evolution operator from the generator. In (2.1) we<br />
explained how the evolution operator of a discretetime<br />
system can be obtained from its generator.<br />
Now we will show that this is possible for<br />
continuous-time systems, too:<br />
N N<br />
Theorem 2.3. Let f : → be the<br />
infinitesimal generator of a dynamical system<br />
N<br />
T , <br />
t<br />
, . Then the function<br />
{ { ϕ } } t∈T<br />
1 ( , ) N<br />
u∈C <br />
T<br />
t<br />
<strong>de</strong>fined as u() t = ϕ ( u0)<br />
is a<br />
solution of the initial value problem<br />
y t = f y t , y(0) = u .<br />
() ( () ) 0<br />
Proof. By DS1 we have that ( 0)<br />
0<br />
ϕ ( )<br />
u = u0 = u0,<br />
so the initial condition is satisfied. According to the<br />
<strong>de</strong>finition of infinitesimal generator we have that<br />
ϕ<br />
∀t ∈ T:<br />
f ( u() t ) = lim<br />
h→0<br />
h∈T<br />
= lim<br />
h→∈<br />
0<br />
h T<br />
h<br />
( u() t ) − u( t)<br />
t<br />
( ( u0) ) − u() t<br />
h t<br />
ϕ ϕ<br />
( ) − ( )<br />
DS2 h t<br />
ϕ u0u t<br />
lim<br />
h 0 h<br />
h<br />
+<br />
=<br />
→<br />
∈T<br />
______________________________<br />
2 Also called vector field of the dynamical system.<br />
h<br />
h<br />
J. PÁEZ<br />
34<br />
()<br />
( + ) − ( )<br />
u t h u t<br />
= lim<br />
h→0<br />
h<br />
h∈T<br />
= u t<br />
This theorem asserts that every dynamical system<br />
(of the type introduced in Definition 2.2) is<br />
completely <strong>de</strong>fined by its infinitesimal generator,<br />
or, more precisely, by the initial value problem<br />
presented above. Now the natural question is<br />
whether every inicial value problem represents a<br />
dynamical system. For this issue to be <strong>de</strong>alt with,<br />
we first present a standard result about the existence<br />
and uniqueness of the solution of inicial value<br />
problems:<br />
N<br />
Theorem 2.4. Let Ω⊂ be open and<br />
1<br />
( ,<br />
N )<br />
y ( t) = f ( y( t) ) , y(0) = u0<br />
f ∈C Ω . Then the initial value problem<br />
(2.2)<br />
has for each u0 ∈ Ω exactly one nonextendible<br />
solution ( , 0 )<br />
t T( u ) t ( u ) t ( u )<br />
u t u ∈Ω, where<br />
( )<br />
∈ 0 =<br />
−<br />
the function u<br />
0 ,<br />
+ 0 ∋ 0.<br />
The domain of<br />
D = t, u ∈ ×Ω: t ∈ J u<br />
{ ( 0) ( 0)<br />
}<br />
is open and u<br />
1<br />
C ( D,<br />
N )<br />
k N<br />
f ∈C ( Ω, ) , then u<br />
k<br />
C ( D<br />
N)<br />
k<br />
∈ . Furthermore, if<br />
∈ , , ≥1.<br />
FIGURE 1<br />
Dynamical systems and differential equations<br />
Domain of <strong>de</strong>finition of the solution of (2.2)<br />
Proof. This is a classical result and its proof can be<br />
found in any book on Differential Equations, e.g.,<br />
see [1, Chapter II].<br />
Besi<strong>de</strong>s guaranteeing existence and uniqueness, this<br />
theorem also gives valuable information about the<br />
domain D of <strong>de</strong>finition of the solution. This domain<br />
turns out to be open and furthermore the solution of
the initial value problem (2.2) does not exist outsi<strong>de</strong><br />
D. For this reason, the interval J(u0) is referred to as<br />
the maximal interval of existence. Here, it is<br />
important to point out that this interval varies with<br />
the initial value u0, see Figure 1. With this few<br />
remarks we can turn back to the question we<br />
outlined before, that is, whether an initial value<br />
problem <strong>de</strong>fines a dynamical system. We will see<br />
that this is true, but in a local sense:<br />
Theorem 2.5. Let the assumptions of Theorem 2.4<br />
N<br />
hold. Then the operador ϕ<br />
i (): i D → , given<br />
t<br />
by ϕ ( u0) = u( t, u0)<br />
, <strong>de</strong>fines a local dynamical<br />
system.<br />
Proof. Let us first show DS1. By the initial value<br />
condition in (2.2), we have that<br />
0<br />
∀u0 ∈Ω : ϕ ( u0) = u( 0, u0) = u0<br />
Now let us work with DS2. Let u0 ∈ Ω and<br />
s ∈ J u be arbitrary, but fixed. Then the<br />
( )<br />
0<br />
t s s<br />
function v() t : ϕ ( ϕ ( u ) ) , t J( ϕ ( u0)<br />
)<br />
=<br />
0<br />
∈ , is<br />
a solution of<br />
y t = f y t ,<br />
s<br />
y(0) = ϕ u (2.3)<br />
() ( () ) ( 0 )<br />
Now consi<strong>de</strong>r the function w() t :<br />
t s<br />
ϕ ( u)<br />
+<br />
If follows that<br />
(2.2)<br />
DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />
= .<br />
d () = ( ( + , 0) ) = ( ( + , 0)<br />
) = ( () )<br />
wt <br />
dt<br />
ut su f ut su f wt<br />
0+<br />
s s<br />
and w( 0)<br />
= ϕ ( u0) = ϕ ( u0)<br />
.<br />
Therefore, w is another solution of (2.3) and by<br />
uniqueness (cf. Theorem 2.4), v = w,i.e.<br />
( ( u0) ) ( u0)<br />
t s t s<br />
ϕ ϕ ϕ +<br />
= .<br />
FIGURE 2<br />
Dynamical systems and differential equations<br />
Forced pendulum<br />
0<br />
35<br />
According to this theorem, the initial value<br />
problem (2.2) always represents an autonomous<br />
dynamical system. Thus, by combining this result<br />
with Theorem 2.3, we can realize that the concept of<br />
dynamical system is closely related to initial value<br />
problems, and, more generally, to differential<br />
equations (see [7, Example 3.2]). In many cases,<br />
physical phenomena inclu<strong>de</strong>s the action of an<br />
external time-<strong>de</strong>pen<strong>de</strong>nt “force”, which leads us to<br />
mo<strong>de</strong>ling the un<strong>de</strong>rlying phenomena by means of<br />
non-autonomous differential equations of the form<br />
y ( t) = f ( t, y( t) ) , y( t0) = u0, t ∈[<br />
t0, tE]<br />
(2.4)<br />
1<br />
N<br />
Where f ∈ C ( ×Ω, ) . Studying in <strong>de</strong>tail<br />
non-autonomous dynamical systems is beyond the<br />
scope of this article, however, we do want to point<br />
out that such systems can be written in an<br />
autonomous way as the following example shows.<br />
Example 2.6. Consi<strong>de</strong>r a pendulum of mass m<br />
attached to a string of length L, which is displaced<br />
by an angle from the vertical rest position, see<br />
Figure 2. Suppose that there exists an external<br />
sinusoidal force F(t) acting on the system. The<br />
dynamics of the pendulum can then be <strong>de</strong>scribed by<br />
the ODE<br />
<br />
g<br />
θ() t + sin ( θ() t ) = Asin ( βt) + Bcos ( βt)<br />
, t ∈<br />
L<br />
(2.5)<br />
where ABβ , , ∈ , β > 0 are fixed and g stands for<br />
the gravity constant. The case where there is no<br />
external force (i.e. A = B = 0) was studied in [7,<br />
Example 2.3]. There, it is proved that the pendulum<br />
can be seen as an autonomous dynamical system.<br />
Now we will show how to <strong>de</strong>al with the external<br />
force in or<strong>de</strong>r to preserve the autonomous carácter<br />
of the system. One way to achieve this is adding a<br />
nonlinear oscillator to the system. An example of<br />
such an oscillator is given by<br />
2 2<br />
⎧x()<br />
t = x() t + β y() t − x() t( x() t + y() t ) ,<br />
⎪<br />
⎨<br />
2 2<br />
⎪y()<br />
t = y() t − β x() t − y() t ( x() t + y() t ) ,<br />
⎩<br />
which has the solution<br />
x( t) = sin ( βt) , y( t) = cos(<br />
βt)<br />
. Now consi<strong>de</strong>r<br />
the functions u( t) = θ( t) , v( t) = θ(<br />
t) , t ∈<br />
, and<br />
<strong>de</strong>fine
⎛ ⎞<br />
v<br />
⎜ g<br />
⎟<br />
− sin + +<br />
G( u, v, x, y)<br />
: = ⎜ L<br />
⎟,<br />
⎜x + β y − x x + y ⎟<br />
⎜<br />
⎟<br />
y − β x − y x + y ⎟<br />
Where ( ) 4<br />
( u) Ax By<br />
2 (<br />
2 (<br />
2)<br />
2)<br />
⎝ ⎠<br />
z : = u, v, x, y ∈ . Thus, it is easy to see<br />
that the non-autonomous system (2.5) can be<br />
written as<br />
z () t = G( z() t ) ,<br />
which is an autonomous differential equation of the<br />
type of (2.2). This discussion provi<strong>de</strong>s us with a<br />
way of applying the theory <strong>de</strong>veloped for<br />
autonomous dynamical systems to the present nonautonomous<br />
case. In many cases it may happen that<br />
the external force is not periodic, or difficult to<br />
mo<strong>de</strong>l by an autonomous oscillator. If this is so, we<br />
can resort to writing system (2.4) in autonomous<br />
form as follows:<br />
⎧y()<br />
t = f ( h() t , y() t ) , t ∈[<br />
t0, tE]<br />
,<br />
⎪<br />
⎪h()<br />
t = 1,<br />
⎪<br />
⎨<br />
⎪y(<br />
t0) = u0,<br />
⎪<br />
⎪h(<br />
t0) = t0.<br />
⎩<br />
This is an autonomous system of N + 1 ODEs with<br />
N + 1 initial conditions.<br />
3. EQUILIBRIA, ORBITS, AND PHASE<br />
DIAGRAMS<br />
A common approach for starting the study of<br />
dynamical systems consists in introducing<br />
geometrical objects that allow us to visualize<br />
dynamical properties, thereby making their analysis<br />
easier. To achieve this, we will begin with the<br />
concept of orbit. Then we will realize that a<br />
dynamical system can be qualitatively <strong>de</strong>scribed by<br />
drawing some “typical” orbits. This process leads us<br />
to the so-called phase diagram. To begin with, let us<br />
first introduce the notion of equilibrium, which is<br />
the simplest object of study in dynamical systems.<br />
To this end, we consi<strong>de</strong>r the Example 2.6 without<br />
forcing, see Figure 2. In [7, Example 3.1], the<br />
(approximate) evolution operator<br />
( ) 2 2<br />
ϕ () :<br />
⋅<br />
i × → is found to be<br />
J. PÁEZ<br />
36<br />
t θ<br />
θ ′<br />
⎛ ⎞ ⎛θ⎞ ω θ ω g<br />
ϕ ⎜ = = , ω =<br />
θ ⎟<br />
⎝ ⎠ t L<br />
where<br />
⎛ 0<br />
⎞<br />
0 () t ⎜ sin( t) + 0 cos( t)<br />
⎟<br />
ω<br />
′ ⎜<br />
0 θ ′ () ⎟ ⎜ ⎟<br />
⎝ ⎠ ⎜θ0cos( ωt) θ0ωsin( ωt)<br />
⎟<br />
⎝ ′ − ⎠<br />
θ and<br />
0<br />
(3.1)<br />
θ ′ represent the angle and angular<br />
0<br />
velocity of the pendulum, respectively, at t = 0.<br />
Now suppose that we let the pendulum run with the<br />
initial conditions θ = θ′<br />
= 0 . How does the<br />
0 0<br />
system evolve in time? From the formula for the<br />
evolution operador presented above, it is easy to see<br />
t<br />
that ϕ ( θ , θ′<br />
0 0)<br />
= 0,<br />
for all t. We can also arrive at<br />
this conclusion from a physical point of view.<br />
Initializing the system with θ = θ′<br />
= 0 amounts<br />
0 0<br />
to placing the pendulum at the vertical position with<br />
initial angular velocity equal to zero. It is then clear<br />
that the pendulum will remain at the vertical<br />
position θ = 0 forever. This illustrates the simplest<br />
behavior that a dynamical system may present.<br />
However, this simple behavior can be seen in more<br />
complicated/abstract systems, too. Consi<strong>de</strong>r for<br />
example the PDE<br />
⎧∂u<br />
∂u<br />
( xt , ) + x ( xt , ) = 0<br />
⎪ ∂t ∂x<br />
⎨<br />
,<br />
⎪<br />
u( x,0) = f ( x)<br />
⎪⎩<br />
( , ) , ( )<br />
1 2 1<br />
u ∈C f ∈C<br />
with evolution operator<br />
() 1 1<br />
ϕ (): C ( ) C ( )<br />
⋅<br />
⋅ × → given by<br />
t −t<br />
( ϕ ( f ) )( x) = f ( xe ) (cf. [7, Example 3.2]).<br />
Choose the initial condition f ( x) = K for all<br />
x ∈ being a real constant. Then it follows that<br />
t −t<br />
t<br />
( ϕ ( ) )( ) ( ) ( ) ϕ ( )<br />
∀t∈ :<br />
f x = f xe = K= f x ⇒ f = f<br />
This means that if we initialize the system at a<br />
constant function, the system will remain at that<br />
function forever. These two examples illustrate the<br />
concept of equilibrium of a dynamical system,<br />
which is formally <strong>de</strong>fined as follows:<br />
Definition 3.1. Let { T, X , { ϕ<br />
t}<br />
} be a dynamical<br />
t∈T<br />
system. A point x0 ∈ X is referred to as<br />
equilibrium point if<br />
t ∀t∈ T : ϕ ( x0) = x0<br />
In other words, we can say that if a dynamical<br />
system is placed at an equilibrium point, it will
emain there forever. This fact was already seen in<br />
the examples above. In the literature, equilibrium<br />
points are also called “steady states”, “equilibrium<br />
solutions”, “stationary points”, “rest points”, and<br />
“fixed points”, among others. Some authors reserve<br />
the name “equilibrium” for continuous-time<br />
systems, while the term “fixed point” is used when<br />
<strong>de</strong>aling with discrete-time systems. However, the<br />
rea<strong>de</strong>r should have in mind that both terms stand for<br />
the same dynamical object. Now that we have<br />
introduced our first (and the simplest) dynamical<br />
object of study, our next task will be to investigate<br />
how to <strong>de</strong>tect such objects, provi<strong>de</strong>d the<br />
(infinitesimal) generator of the system is known.<br />
This task is accomplished in the following:<br />
1 N N<br />
Theorem 3.2. Let f, g C ( , )<br />
the Systems<br />
() ( () ) , ( 0)<br />
DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />
∈ . Consi<strong>de</strong>r<br />
x t = f x t x = ξ , (3.2)<br />
( )<br />
x = g x , x = ξ , n∈<br />
(3.3)<br />
n n−1<br />
0<br />
N<br />
Then z0 ∈ is an equilibrium (resp. fixed point)<br />
f z 0 = 0<br />
(resp. g(z0) = z0).<br />
Proof. Let us first work with system (3.2). Assume<br />
that z0 is an equilibrium of (3.2). This means that<br />
t ϕ ( z0) = z0<br />
for all t. Thus, according to<br />
Definition 2.2, we have that<br />
d t<br />
d<br />
f ( z0) = ( ϕ ( z ) ) = ( z0)<br />
= 0<br />
dt 0<br />
t= 0 dt t=<br />
0<br />
f z = 0 . Define the constant<br />
of (3.2) (resp. (3.3)), if and only if ( )<br />
Now suppose that ( )<br />
0<br />
function () 0 , xt = z t∈<br />
. It is then easy to check<br />
that x is a solution of (3.2), and by uniqueness (cf.<br />
t<br />
Theorem 2.4), we can conclu<strong>de</strong> that ( )<br />
ϕ z = z<br />
0 0<br />
for all t ∈ . Hence z 0 is an equilibrium of (3.2).<br />
Now let us turn to the discrete-time case. Assume z0<br />
n<br />
to be a fixed point of (3.3), i.e., ϕ ( z0) = z0<br />
for all<br />
n ∈ ∪ { 0}<br />
. By (2.1), it is readily seen that<br />
( 0) 1<br />
ϕ ( 0) 0<br />
( ) = , and that<br />
n ( )<br />
g z = z = z . Now suppose that<br />
g z z<br />
0 0<br />
ϕ z = z for some fixed<br />
0 0<br />
n ∈ holds. It follows by induction that<br />
DS 2<br />
n+ 1 n 1<br />
n<br />
z = z0 = z0 = z0<br />
( 0 ) ( ( ) ) ( )<br />
ϕ ϕ ϕ ϕ<br />
<br />
= z<br />
0<br />
37<br />
n<br />
Hence ϕ ( z ) = z for all { 0}<br />
0 0<br />
n ∈ ∪ , i.e., z0 is<br />
a fixed point of (3.3).<br />
The principal significance of the theorem is that it<br />
provi<strong>de</strong>s us with a way of finding and<br />
characterizing equilibrium points of dynamical<br />
systems. In other words, if we are interested in<br />
equilibrium points (resp. fixed points) of system<br />
(2.2) (resp. (3.3)), we should look for the solutions<br />
of the equation f ( x ) = 0 (resp. g ( x) = x.<br />
Now<br />
that we have un<strong>de</strong>rstood the meaning of equilibrium<br />
point, we can proceed with the concept of a<br />
somewhat more elaborated dynamical object, the<br />
so-called orbit.<br />
{ }<br />
Definition 3.3. Let , ,<br />
t { }<br />
T X ϕ<br />
t∈T<br />
be a<br />
dynamical system and x0 ∈ X . The set<br />
r<br />
t<br />
( 0) = { ∈ : = ϕ ( 0)<br />
, ∈T }<br />
O x x X x x t<br />
is referred to as orbit of x0.<br />
Before showing some examples, it is worth<br />
presenting a few remarks:<br />
• ∀x0 ∈ X : Or( x0) ⊂ X ,<br />
• If x 0 is an equilibrium point, then<br />
( ) { }<br />
Orx0 = x0<br />
, i.e., an equilibrium point is<br />
•<br />
the simplest orbit,<br />
in continuous-time dynamical systems, the<br />
orbits are curves parametrized by the time t,<br />
• in discrete-time dynamical systems, the orbits<br />
are sequences in X, i.e., OΓ( x0) ∈ X<br />
T for all<br />
x0 ∈ X .<br />
Let us illustrate the concept of orbit by some<br />
examples.<br />
FIGURE 3<br />
Dynamical systems and differential equations<br />
Orbit of the pendulum system
Example 3.4. Consi<strong>de</strong>r again the pendulum system<br />
of Example 2.6, without external forcing. The<br />
evolution operator can be written as (cf. (3.1))<br />
⎛ R<br />
0 ⎛ ⎞⎞<br />
t ⎛R0⎞ sin ⎜ωt φ ⎟<br />
ϕ = ⎜ +<br />
ω ⎝ 0 ⎠⎟<br />
⎜φ⎟ , where<br />
⎝ 0 ⎠ ⎜ ⎛ ⎞ ⎟<br />
R COS ⎜ωt+ φ ⎟ ⎟<br />
⎝ 0 ⎝ 0 ⎠ ⎠<br />
R = θ ′<br />
2<br />
+<br />
2<br />
ωθ0<br />
θω and sin ( φ ) =<br />
( ) ( )<br />
0 0 0<br />
∞<br />
⎜ ⎟<br />
⎝ ⎠n=<br />
0<br />
R0<br />
Here, we must choose small (why?). Thus, an<br />
ω<br />
orbit of the pendulum system is <strong>de</strong>scribed by the<br />
parametric curve<br />
⎧⎛ R ⎞ ⎫<br />
⎪ 0 ⎛ ⎞<br />
sin ⎜ωt+ φ ⎟ ⎪<br />
Or( θ , θ′ 0 ) = 0 : t<br />
0 ⎨<br />
⎜<br />
ω ⎝ ⎠⎟<br />
∈<br />
⎬.<br />
⎛ ⎞<br />
⎪<br />
⎜ R COS ⎜ωt+ φ ⎟ ⎟<br />
⎩⎝ ⎪<br />
0 ⎝ 0 ⎠ ⎠ ⎭<br />
A typical example of an orbit of this system is<br />
<strong>de</strong>picted in Figure 3. Note that, in this case, the<br />
orbits are always closed curves, which reveals the<br />
periodic nature of the system (in the absence of<br />
friction!). In the figure, the arrow stands for the<br />
direction of the evolution as the time increases.<br />
How does the orbit Or ( 0,0)<br />
look like?<br />
Example 3.5. Let g : → be <strong>de</strong>fined by<br />
2<br />
g ( x) = x . Consi<strong>de</strong>r the system<br />
( 1 ) ,<br />
xn = g xn−n∈ .<br />
Choose x 0 = 2 as initial point. Then we have that<br />
( ) n<br />
Or2 = { x∈ : x= ϕ ( 2 ) , n=<br />
0,1,... } = { 2,4,16,... }<br />
⎛ n<br />
2 ⎞ {} 0<br />
= 2 ∈ ∪<br />
<br />
.<br />
<br />
Clearly, x = 1 and x = 0 are fixed points of the<br />
system, and so it follows that O r ( 1) = { 1}<br />
and<br />
O r ( 0) = { 0}<br />
. In the examples above we have<br />
illustrated the concept of orbit for both continuous<br />
and discrete-time dynamical systems. As we pointed<br />
out before, an orbit is a subset of the state space,<br />
and so we can ask ourselves whether the state space<br />
could be, in some sense, <strong>de</strong>composed into a<br />
collection of orbits of a dynamical system. To this<br />
end, the following theorem gives us important<br />
information:<br />
t<br />
Theorem 3.6. Let { T , X , { ϕ } } be an invertible<br />
t∈T<br />
(cf. [7, Section 3]) dynamical system.<br />
0<br />
R<br />
0<br />
J. PÁEZ<br />
38<br />
Let u0, v0 ∈ X . Then r ( 0) r ( 0)<br />
Or ( u0) ∩ Or ( v0)<br />
.<br />
Proof. Suppose that ( ) ( ) ≠<br />
means that<br />
O u ∩ O v = φ or<br />
O u ∩ O v φ . This<br />
r 0 r 0<br />
( 0) ( 0)<br />
t s<br />
ϕ ( ) ϕ ( )<br />
∃y∈ X : y∈Or u<br />
: y =<br />
∧ y∈Or u0 =<br />
v<br />
v0<br />
⇔ ∃s, t ∈T<br />
Therefore, we have that<br />
Γ<br />
DS2 Γ−t Γ−t s<br />
DS 2<br />
Γ−+ t s<br />
0 0 0 0<br />
( )<br />
: ( ) t(<br />
)<br />
<br />
= ϕs(<br />
v0<br />
)<br />
( )<br />
This implies that Or ( u0) Or ( v0)<br />
analogously that Or ( v0) Or ( u0)<br />
O ( u ) = O ( v ) .<br />
( ) ( ) Γ ( )<br />
∀Γ ∈ ϕ u = ϕ ϕ u = ϕ ϕ v = ϕ v ∈O<br />
v<br />
0<br />
r 0 r 0<br />
⊆ . We can prove<br />
⊆ and hence<br />
From this Theorem, we can conclu<strong>de</strong> the following:<br />
• Two orbits satisfying the conditions of the<br />
theorem above are either disjoint or i<strong>de</strong>ntical,<br />
• through every point in the state space passes only<br />
one orbit. Consequently, it follows that<br />
.<br />
X = ∪ Or( x0)<br />
x0∈X This means that the state space can be represented<br />
as the disjoint union of orbits of un<strong>de</strong>rlying<br />
dynamical system. This motivates the <strong>de</strong>finition of<br />
phase diagram (see below).<br />
t<br />
Definition 3.7. Let { T, X , { ϕ } } be a dynamical<br />
t∈T<br />
system. The partitioning of the state space into<br />
orbits is referred to as phase diagram 2 of the<br />
dynamical system. Let us restrict our attention to<br />
initial value problems (cf. (2.2)). In this case, the<br />
phase diagram consists of a family of solution<br />
curves of the system (2.2) obtained by varying the<br />
initial condition u 0 . It is clear that if x is any point<br />
in OΓ ( u0)<br />
, then f ( x ) represents tangent vector of<br />
the solution curve at x. For this reason, the ODE<br />
(2.2) is also referred to as vector field.<br />
Let us consi<strong>de</strong>r again the pendulum system of<br />
Example 3.4. How does its phase diagram look<br />
like? We have seen that any orbit of that system is<br />
given by<br />
r<br />
⎧⎛ R ⎞ ⎫<br />
θ θ = ω<br />
∈<br />
.<br />
( , ′ 0 )<br />
0<br />
⎪ 0 ⎛ ⎞<br />
sin ⎜ωt+ φ ⎟ ⎪<br />
⎨<br />
⎜ ⎝ 0 ⎠⎟:<br />
⎬<br />
⎛ ⎞<br />
⎪<br />
⎜ R COS ⎜ωt+ φ ⎟ ⎟ ⎪<br />
0 ⎝ 0 ⎠<br />
O t<br />
⎩⎝ ⎠ ⎭
FIGURE 4<br />
Dynamical systems and differential equations<br />
Phase diagram of the pendulum system<br />
If we vary the initial conditions<br />
0 0 , θ θ ′ , we will then<br />
obtain several closed curves centered at the origin,<br />
see Figure 4. The phase diagram provi<strong>de</strong>s us with<br />
an easy way of visualizing the behavior of a<br />
dynamical system. Useful information can be<br />
obtained from the phase plot, even if we do not<br />
know the evolution operator. For instance, suppose<br />
that a pendulum system presents the phase plot as<br />
shown in Figure 5. From this picture, we can see<br />
that the orbits are no longer periodic, but they spiral<br />
into the origin, which is an equilibrium point. Hence<br />
this point is called a spiral sink. What does this<br />
mean from a physical point of view? Note that the<br />
phase diagram tells us that any initial point will,<br />
after a long time, end at the equilibrium point. This<br />
fact reveals the presence of friction, which prevents<br />
the system from oscillating forever as it happens in<br />
the pendulum system <strong>de</strong>scribed in Figure 4.<br />
DYNAMICAL SYSTEMS AND DIFFERENTIAL EQUATIONS<br />
39<br />
4. CONCLUSIONS<br />
In this manuscript we have seen that dynamical<br />
systems and autonomous differential equations are<br />
intimately related objects. In particular, Theorems<br />
2.3 and 2.5 reflect this fact. We have also learned<br />
how to <strong>de</strong>al with non-autonomous differential<br />
equations, which appear when an external forcing is<br />
present. More importantly, we have introduced<br />
several geometrical objects such as equilibrium<br />
points, orbits and phase diagrams. With these<br />
concepts, our goal was to provi<strong>de</strong> the rea<strong>de</strong>r with<br />
tools for facilitating the study of the qualitative<br />
behavior of dynamical systems. In forthcoming<br />
articles we will explain in more <strong>de</strong>tail how the<br />
objects mentioned above can be used for the<br />
analysis of dynamical systems.<br />
FIGURE 5<br />
Dynamical systems and differential equations<br />
Phase diagram of a damped pendulum system
[1]. AMANN, H. (1995). “Gewöhnliche<br />
Differentialgleichungen”, second ed. Walter <strong>de</strong><br />
Gruyter, Berlin.<br />
[2]. ARROWSMITH, D., AND PLACE, C. M.<br />
(1990). “An Introduction to Dynamical<br />
Systems”. Cambridge University Press.<br />
[3]. ARROWSMITH, D., AND PLACE, C. M.<br />
“Dynamical Systems: Differential Equations,<br />
Maps, and Chaotic Behaviour”. Chapman &<br />
Hall, 1992.<br />
[4]. BEYN, W.-J. (1991). “Dynamische Systeme.<br />
Vorlesungsskriptum”, Bielefeld University.<br />
[5]. BEYN, W.-J. (2009). “Numerik dynamischer<br />
Systeme”. Vorlesungsskriptum, Bielefeld<br />
University.<br />
J. PÁEZ<br />
REFERENCES AND ELECTRONIC<br />
40<br />
[6]. GUCKENHEIMER, J., AND HOLMES, P.<br />
(1993). “Nonlinear Oscillations, Dynamical<br />
Systems, and Bifurcations of Vector Fields”,<br />
vol. 42 of Applied Mathematical Sciences.<br />
Springer-Verlag, New York. Fourth printing.<br />
[7]. PÁEZ CHÁVEZ, J. (<strong>2010</strong>). “A short<br />
Introduction to Dynamical Systems”.<br />
Matemática: Una Publicación <strong>de</strong>l ICM -<br />
<strong>ESPOL</strong> 8, 1, 28–33.<br />
[8]. WIGGINS, S. (2003). “Introduction to<br />
Applied Nonlinear Dynamical Systems and<br />
Chaos”, second ed., vol. 2 of Texts in Applied<br />
Mathematics. Springer-Verlag, New York.
matemática: Una publicación <strong>de</strong>l ICM – <strong>ESPOL</strong><br />
<strong>2010</strong>, Vol. 8, No. 2<br />
RESOLUCIÓN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO<br />
PARA EL PROBLEMA DE LA DISPERSIÓN MÁXIMA<br />
1 Sandoya Fernando<br />
Resumen. El problema <strong>de</strong> la dispersión equitativa, o <strong>de</strong> la dispersión máxima consiste en que dado un conjunto <strong>de</strong> nodos y una función<br />
<strong>de</strong> “distancias” entre estos nodos, se trata <strong>de</strong> escoger un subconjunto <strong>de</strong> ellos <strong>de</strong> tal manera que este sea lo más “diverso” posible, en<br />
términos <strong>de</strong> alguna métrica consi<strong>de</strong>rada, aquí se resuelve un problema <strong>de</strong>nominado <strong>de</strong>l MAXIMO PROMEDIO en el cual el número <strong>de</strong><br />
elementos a seleccionarse también es una variable <strong>de</strong> <strong>de</strong>cisión. Otros mo<strong>de</strong>los han sido extensamente estudiados por otros autores<br />
Martí y Duarte [1], Glover [2], Prokopyev [3] y Resen<strong>de</strong> y Martí [4]. En este artículo se estudia el mo<strong>de</strong>lo <strong>de</strong>l MAXIMO PROMEDIO<br />
(MAXMEAN), que en general es un problema difícil <strong>de</strong> optimización combinatorio, <strong>de</strong>l tipo Strongly NP-hard. También se estudia la<br />
utilización <strong>de</strong>l mo<strong>de</strong>lo MAXSUM para la resolución <strong>de</strong>l MAXMEAN, y se <strong>de</strong>termina un procedimiento exacto más eficiente para<br />
resolverlo. Para comprobar los mo<strong>de</strong>los se <strong>de</strong>sarrollaron instancias <strong>de</strong> prueba aleatorias para diferentes tamaños <strong>de</strong>l problema. Todos<br />
los problemas en su formulación como mo<strong>de</strong>lo <strong>de</strong> programación matemática MIP o MIQCP fueron implementados en GAMS y<br />
resueltos con CPLEX 12.0 y con CONOPT3.<br />
Palabras Claves. Diversidad máxima, Optimización combinatoria, Programación cuadrática.<br />
Abstrat. The equitable dispersion problem, or the maximum dispersion problem is that given a set of no<strong>de</strong>s and a function of "distance"<br />
between these no<strong>de</strong>s, it comes to choosing a subset of them so this is as "different" possible in terms of some metric consi<strong>de</strong>red. Here we<br />
solve a problem called the maximum average in which the number of elements to be selected is also a <strong>de</strong>cision variable. Other mo<strong>de</strong>ls<br />
have been extensively studied by other authors: Marti and Duarte [1], Glover [2], Prokopyev [3] and Resen<strong>de</strong> and Marti [4]. In this<br />
paper we study the mo<strong>de</strong>l MAXIMUM AVERAGE (MAXMEAN), which in general is a difficult combinatorial optimization, type Strongly<br />
NP-hard. To test the mo<strong>de</strong>ls <strong>de</strong>veloped random test instances for different sizes of the problem. All the problems in its formulation as a<br />
mathematical programming mo<strong>de</strong>l or MIQCP MIP were implemented in GAMS and solved with CPLEX 12.0 and CONOPT3.<br />
Key words. Combinatorial Optimization, Maximum Diversity, Quadratic Programming.<br />
Recibido: Agosto, <strong>2010</strong><br />
Aceptado: Septiembre, <strong>2010</strong><br />
1. INTRODUCCIÓN<br />
El problema <strong>de</strong> la dispersión equitativa, o <strong>de</strong> la<br />
dispersión máxima consiste en que dado un<br />
conjunto N = {1,2,…,n} <strong>de</strong> nodos y una función<br />
<strong>de</strong> “distancias” dij entre estos nodos, se trata <strong>de</strong><br />
escoger un subconjunto M <strong>de</strong> cardinalidad m (m ≤<br />
n) <strong>de</strong> tal manera que M sea lo más “diverso”<br />
posible, don<strong>de</strong> el término “diverso” se explica en<br />
términos <strong>de</strong> una métrica consi<strong>de</strong>rada; es <strong>de</strong>cir, la<br />
dispersión <strong>de</strong>be relacionarse con algún tipo <strong>de</strong><br />
medida, en la literatura se han planteado 3<br />
mo<strong>de</strong>los distintos, <strong>de</strong>notados como: MAXMIN,<br />
MAXSUM, y MAXMINSUM, últimamente<br />
Prokopyev [3] ha planteado dos problemas<br />
adicionales: <strong>de</strong>nominados <strong>de</strong>l MAXIMO<br />
PROMEDIO y MINDIFF, <strong>de</strong> los cuales en uno <strong>de</strong><br />
ellos, el <strong>de</strong>l MAXIMO PROMEDIO, el número<br />
<strong>de</strong> elementos a seleccionarse también es una<br />
variable <strong>de</strong> <strong>de</strong>cisión, y en los restantes cuatro<br />
mo<strong>de</strong>los este es un valor pre<strong>de</strong>terminado, estos<br />
autores enuncian los problemas pero no plantean<br />
sus soluciones.<br />
Los mo<strong>de</strong>los MAXMIN y MAXSUM han sido<br />
extensamente estudiados por Martí y Duarte [1],<br />
________________________<br />
1 Sandoya Fernando, M.Sc., Profesor <strong>de</strong> la <strong>Escuela</strong> Superior<br />
Politécnica <strong>de</strong>l Litoral (<strong>ESPOL</strong>); Coordinador <strong>de</strong> la carrera<br />
Ingeniería en Logística y Transporte ICM – <strong>ESPOL</strong>.<br />
(e_mail: fsandoya@espol.edu.ec)<br />
Glover [2], Prokopyev [3] y Resen<strong>de</strong> y Martí [4].<br />
En este artículo se estudia el mo<strong>de</strong>lo <strong>de</strong>l<br />
MAXIMO PROMEDIO (MAXMEAN), que en<br />
general es un problema difícil <strong>de</strong> optimización<br />
combinatorio, <strong>de</strong>l tipo Strongly NP-hard.<br />
También se estudia la utilización <strong>de</strong>l mo<strong>de</strong>lo<br />
MAXSUM para la resolución <strong>de</strong>l MAXMEAN, y<br />
se <strong>de</strong>termina un procedimiento exacto más<br />
eficiente para resolverlo.<br />
Para comprobar los mo<strong>de</strong>los se <strong>de</strong>sarrollaron<br />
instancias <strong>de</strong> prueba para diferentes valores <strong>de</strong> n y<br />
m, en estos problemas <strong>de</strong> prueba se generaron los<br />
valores <strong>de</strong> dij, usando primero una distribución<br />
uniforme (0,20). En vista <strong>de</strong> las soluciones que se<br />
observaron en el mo<strong>de</strong>lo MAXMEAN para estos<br />
valores <strong>de</strong> dij, se consi<strong>de</strong>ró luego instancias en las<br />
cuales los valores <strong>de</strong> dij son positivos y negativos,<br />
generándolos por medio <strong>de</strong> una distribución<br />
uniforme (-10,10)<br />
Todos los problemas en su formulación como<br />
mo<strong>de</strong>lo <strong>de</strong> programación matemática MIP (Mixed<br />
integer Programming) con variables binarias<br />
fueron implementados en GAMS y resueltos con<br />
CPLEX 12.0, y a<strong>de</strong>más se trató el problema<br />
MAXSUM en su formulación <strong>de</strong> programación<br />
matemática MIQCP (Mixed Integer Quadratically<br />
Constrained Programming) con variables binarias<br />
usando el solver en período <strong>de</strong> prueba CONOPT3.
2. FORMULACIONES<br />
Los mo<strong>de</strong>los consi<strong>de</strong>rados son: MAXSUM<br />
IQCP, MAXSUM IP, MAX-MEAN, MAX-MIN<br />
SUM y MIN-DIFF. La formulación <strong>de</strong> estos<br />
mo<strong>de</strong>los es la siguiente:<br />
2.1 MAXSUM IQCP<br />
El problema <strong>de</strong> la máxima diversidad<br />
originalmente fue planteado en términos <strong>de</strong><br />
seleccionar el conjunto <strong>de</strong> elementos que<br />
maximice la suma <strong>de</strong> las distancias entre los<br />
nodos seleccionados, esta pue<strong>de</strong> ser la forma más<br />
“obvia” <strong>de</strong> plantear el problema, esta línea <strong>de</strong><br />
pensamiento dio origen al mo<strong>de</strong>lo <strong>de</strong> la Máxima<br />
Suma o MAXSUM, que se formula como un<br />
problema <strong>de</strong> programación cuadrática binaria <strong>de</strong><br />
la siguiente manera:<br />
Para i = 1, 2,..., n,<br />
la variable x i toma el valor 1<br />
si el elemento i-ésimo es seleccionado y 0 sino; el<br />
mo<strong>de</strong>lo MAXSUM IQCP es entonces formulado<br />
como un problema <strong>de</strong> programación cuadrática<br />
binaria:<br />
( )<br />
n= 1 n<br />
MaxSum IQCP Max∑∑<br />
dxx ij i j (1)<br />
n<br />
i=<br />
1<br />
i= 1 j= i+<br />
1<br />
s.. t∑ xi= m<br />
(2)<br />
x = 0,1 i = 1, 2,..., n (3)<br />
2.2 MAXSUM IP<br />
i<br />
El mo<strong>de</strong>lo MAXSUM IQCP pue<strong>de</strong> ser<br />
fácilmente linealizado introduciendo nuevas<br />
variables variables zij <strong>de</strong> la siguiente manera:<br />
n= 1 n<br />
MaxSum IP Max ∑ ∑ dij zij<br />
(4)<br />
i= 1 j= i+<br />
1<br />
( )<br />
s.t. (2), (3) y:<br />
zij ≥ xi+ xj−1, zij ≤ xi, (5)<br />
zij ≤ xj, 1 ≤ i ≤ j ≤ n;<br />
2.3 MAX MIN<br />
{ }<br />
z ∈ 0,1 , 1 ≤ i ≤ j ≤ n (6)<br />
ij<br />
Seleccionar un subconjunto <strong>de</strong> dispersión<br />
máxima <strong>de</strong> cardinalidad m también pue<strong>de</strong> ser<br />
entendido como la selección <strong>de</strong> los m elementos<br />
F. SANDOYA<br />
42<br />
para los cuales se maximiza la menor <strong>de</strong> las<br />
distancias dij entre los elementos seleccionados:<br />
( MaxMin) max { min dxx ij i j<br />
i,j M }<br />
M: M = m ∈<br />
{ }<br />
xi ∈ 0,1 ; 1 ≤ i ≤ n (8)<br />
(7)<br />
El mo<strong>de</strong>lo MAXMIN pue<strong>de</strong> ser linealizado y<br />
planteado como un problema <strong>de</strong> programación<br />
entera con variables binarias, como se <strong>de</strong>muestra<br />
en [8].<br />
2.4 MIN DIFF<br />
Para formular el problema Min-Diff<br />
introducimos<br />
dicomo: ()<br />
el concepto <strong>de</strong>l diferencial<br />
di () = ∑ dij<br />
j∈M, j≠i (9)<br />
Así el problema MIN DIFF pue<strong>de</strong> ser formulado<br />
como:<br />
( MinDiff ) Min { maxi M di () −mini<br />
M di () }<br />
n<br />
s.. t∑ xi= m (11)<br />
i=<br />
1<br />
x = 0,1 i = 1, 2,..., n (12)<br />
i<br />
∈ ∈ (10)<br />
Y que pue<strong>de</strong> ser reformulado como un problema<br />
MIP con variables binarias <strong>de</strong> la siguiente<br />
manera:<br />
mintrsxt (13)<br />
, , ,<br />
s. t. t ≥ r − s, i = 1,..., n;<br />
(14)<br />
−<br />
( ) ( ) ( )<br />
r ≥ ∑ d i<br />
i∈M −Ui 1− x<br />
i<br />
+ M<br />
(15)<br />
1 − xi , i = 1,..., n;<br />
+<br />
( ) ( ) ( )<br />
s ≤ ∑ d i<br />
i∈M − Li 1− xi + M<br />
(16)<br />
1 − xi , i = 1,..., n;<br />
n<br />
n<br />
∑ xi = m, xi ∈ { 0,1} i = 1,..., n;<br />
(17)<br />
i=<br />
1<br />
Don<strong>de</strong> i U y L i cotas superior e inferior<br />
convenientemente escogidas para d() i , y
RESOLUCIÒN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPERSIÒN MÁXIMA<br />
− +<br />
M , M son constantes gran<strong>de</strong>s, estos valores<br />
pue<strong>de</strong>n ser <strong>de</strong>terminados y ajustados<br />
a<strong>de</strong>cuadamente, como se observa en [5].<br />
2.5 MAXMEAN<br />
El mo<strong>de</strong>lo MAXMEAN, o <strong>de</strong>l máximo<br />
promedio, implica seleccionar cierto número <strong>de</strong><br />
elementos <strong>de</strong>l conjunto original, <strong>de</strong> tal manera<br />
que este represente la máxima diferencia<br />
promedio. De esta manera también es variable <strong>de</strong><br />
<strong>de</strong>cisión la cantidad <strong>de</strong> elementos a seleccionarse.<br />
El mo<strong>de</strong>lo pue<strong>de</strong> representarse como:<br />
∑ ∑<br />
MaxMean Max<br />
( )<br />
i=<br />
1<br />
n= 1 n<br />
i= 1 j=+ i 1<br />
dijxixj n<br />
∑ i= 1 xi<br />
n<br />
st .. ∑ xi<br />
≥ 2 (19)<br />
x = 0,1 i = 1, 2,..., n (20)<br />
i<br />
(18)<br />
Tal como se lo presenta este es un problema <strong>de</strong><br />
optimización binaria fraccional, pero pue<strong>de</strong> ser<br />
linealizado utilizando ciertas transformaciones,<br />
así en su formulación linealizada el problema<br />
MAXMEAN se presenta como:<br />
n−1n Max ∑ ∑ dij zij<br />
(21)<br />
i= 1 j= i+<br />
1<br />
st .. y − z<br />
i<br />
≤1 − x<br />
i<br />
, z<br />
i<br />
≤ y, z<br />
i<br />
≤ x<br />
i<br />
,<br />
z<br />
i<br />
≥ 0, i = 1,..., n<br />
(22)<br />
y − z<br />
ij<br />
≤ 2 − x<br />
i<br />
− x<br />
j<br />
, z<br />
ij<br />
≤ y, z<br />
ij<br />
≤ x<br />
i<br />
,<br />
(23)<br />
z<br />
ij<br />
≥ 0,1 ≤ i < j ≤ n<br />
n n<br />
n<br />
∑xi ≥ 1∑ zi = 1, xi<br />
∈{<br />
0,1}<br />
(24)<br />
i= 1 i=<br />
1<br />
43<br />
3. RESOLUCION EXACTA DEL<br />
PROBLEMA MAXMEAN<br />
La siguiente propiedad indica que si d es una<br />
distancia, la solución al problema MAXMEAN es<br />
que todos los puntos <strong>de</strong>ben ser seleccionados, con<br />
lo cual la solución <strong>de</strong>l problema en este caso se<br />
vuelve trivial.<br />
PROPIEDAD: En el problema MAXMEAN si dij<br />
satisfacen la <strong>de</strong>sigualdad triangular, son<br />
simétricas y no negativas, es <strong>de</strong>cir d es una<br />
distancia, entonces m = n.<br />
Demostración:<br />
n−1 ∑ n<br />
i= 1 ∑ j=+ i 1<br />
dij<br />
Se <strong>de</strong>mostrará que<br />
es una<br />
n<br />
estrictamente creciente en función <strong>de</strong> n<br />
(1) Como ejemplo observemos el caso n = 3<br />
Por <strong>de</strong>mostrar:<br />
d + d + d d<br />
><br />
3 2<br />
12 13 23 12<br />
1<br />
d < d ≤ d + d<br />
2<br />
Como: 12 12 13 23<br />
3<br />
d < d + d + d<br />
2<br />
12 12 13 23<br />
d + d + d d<br />
><br />
3 2<br />
12 13 23 12<br />
Lo mismo para<br />
d + d + d d<br />
><br />
3 2<br />
12 13 23 23<br />
(2) Para n = k+1<br />
Por <strong>de</strong>mostrar:<br />
d + d + d d<br />
3 2<br />
> y<br />
12 13 23 12<br />
k k 1<br />
1 1<br />
d<br />
k−<br />
∑ k<br />
i= ∑ j=+ i ij ∑i=<br />
1 ∑ j=+ i 1<br />
dij<br />
><br />
k + 1<br />
k<br />
Es <strong>de</strong>cir por <strong>de</strong>mostrar:<br />
k−1 k k<br />
k 1 k<br />
i 1 j i 1<br />
dij i 1 d<br />
−<br />
= ∑ =+ + = ik , + 1 i=<br />
1 ∑ j=+ i 1<br />
dij<br />
∑ ∑ ∑<br />
><br />
k +<br />
1<br />
k
Es <strong>de</strong>cir:<br />
k−1 k k k−1 k k−1 k<br />
1<br />
∑∑dij + ∑di, k + 1 > ∑∑dij + ∑∑dij<br />
i= 1 j= i+ 1 i= 1 i= 1 j= i+ 1 k i= 1 j= i+<br />
1<br />
Luego hay que <strong>de</strong>mostrar:<br />
k k−1k 1<br />
∑dik , + 1 > ∑ ∑ dij<br />
i= 1 k i= 1 j= i+<br />
1<br />
d ≤ d + d<br />
Como: 12 1, k+ 1 2, k+<br />
1<br />
Como:<br />
está!!<br />
d ≤ d + d<br />
13 1, k+ 1 3, k+<br />
1<br />
d ≤ d + d<br />
1k 1, k+ 1 k, k+<br />
1<br />
<br />
d ≤ d + d<br />
k−1, k k− 1, k+ 1 k, k+<br />
1<br />
k−1k k<br />
∑∑dij < ( k −1)<br />
∑ di,<br />
k + 1<br />
i= 1 j= i+ 1 i=<br />
1<br />
k−1 ∑ k<br />
i= 1 ∑ j=+ i 1<br />
dij<br />
k −1<br />
<<br />
k<br />
∑<br />
i=<br />
1<br />
d<br />
ik , + 1<br />
k−1 k k 1<br />
1 1<br />
d<br />
−<br />
∑ k<br />
i= ∑ j=+ i ij ∑i=<br />
1 ∑ j=+ i 1<br />
dij<br />
<<br />
k k −1<br />
OBSERVACION: La propiedad anterior no es<br />
cierta si dij son positivas y simétricas pero no<br />
satisfacen la <strong>de</strong>sigualdad triangular, es <strong>de</strong>cir se<br />
pue<strong>de</strong>n encontrar contrajemplos en los cuales para<br />
los cuales dij ≥0 y simétrica y sin embargo m < n.<br />
Aunque estos ejemplos serían la excepción, pues<br />
al <strong>de</strong>sarrollar simulaciones con los dij generados<br />
aleatoriamente en todas las simulaciones m<br />
resultó ser igual a n, tal como se observa en la<br />
tabla 2, en la cual se presentan los resultados para<br />
valores <strong>de</strong> n = 10, 15, 20, 25 y 30, para cada uno<br />
<strong>de</strong> los cuales se generaron 10 instancias<br />
aleatoriamente.<br />
Ejemplo: Sea n = 4 y las distancias dij dadas en la<br />
tabla 1:<br />
F. SANDOYA<br />
ya<br />
44<br />
TABLA I<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />
<strong>de</strong> la dispersión máxima<br />
Ejemplo con dij ≥ 0 y simétricas con el cual la solución <strong>de</strong>l<br />
MAXMEAN es m < n<br />
1<br />
2<br />
3<br />
4<br />
1 2 3 4<br />
0 20 18 1<br />
20 0 20 2<br />
18 20 0 1<br />
1 2 1 0<br />
En este caso m = 3, y se seleccionan los puntos 1,<br />
2 y 3<br />
El mejor promedio es 19.33, consi<strong>de</strong>rando X1 = X2<br />
= X3 = 1, X4 = 0.<br />
En cambio seleccionando todos los puntos; es<br />
<strong>de</strong>cir, X1 = X2 = X3 = X4 = 1 el promedio es 15.5.<br />
TABLA II<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />
<strong>de</strong> la dispersión máxima<br />
Resultados <strong>de</strong>l mo<strong>de</strong>lo MAXMEAN con dij seleccionados<br />
aleatoriamente U[0,20]<br />
n m<br />
Mínimo 10<br />
10 Máximo 10<br />
Mínimo 15<br />
15 Máximo 15<br />
Mínimo 20<br />
20 Máximo 20<br />
Mínimo 25<br />
25 Máximo 25<br />
Mínimo 30<br />
30 Máximo 30<br />
SOLUCION DEL PROBLEMA MAXMEAN<br />
EN EL CASO NO TRIVIAL<br />
Se consi<strong>de</strong>ra ahora la generación <strong>de</strong> instancias<br />
con dij seleccionadas aleatoriamente con una<br />
distribución U[-10,10], y se resuelve el mo<strong>de</strong>lo<br />
MAXMEAN según la formulación (21) – (24),<br />
usando C-PLEX 12 con los parámetros por<br />
<strong>de</strong>fecto. Los experimentos fueron <strong>de</strong>sarrollados<br />
en una Laptop Intel Core Solo 1.40 GHz, 3 Gb<br />
RAM. Los resultados son mostrados en la tabla 3.
RESOLUCIÒN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPERSIÒN MÁXIMA<br />
TAMAÑO<br />
PARAMETR<br />
O<br />
TABLA III<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema <strong>de</strong> la dispersión máxima<br />
Soluciones exactas para el mo<strong>de</strong>lo MaxMean para tamaños variando entre n = 10 a n = 30 nodos<br />
TIEMPO CPU (SEGUNDOS) VALOR OBJETIVO M<br />
MAXIMUM MEDIAN MINIMUM<br />
MAXIMU<br />
M<br />
45<br />
MEDIAN<br />
MINIMU<br />
M<br />
MAXIMU<br />
M<br />
MEDIA<br />
N<br />
n = 10 0.330 0.264 0.172 11.75 7.206 6.258 6 4 3<br />
n = 15 3.002 1.5715 0.905 14.63 11.942 7.707 9 7 3<br />
n = 20 72.009 49.1605 25.532 18.505 14.091<br />
5<br />
11.034 11 7.5 5<br />
n = 25 2087.09 1191.71<br />
1<br />
658.721 19.215 16.923 14.503 15 9 5<br />
n = 30<br />
> 5<br />
hours<br />
> 5<br />
hours<br />
> 5<br />
hours<br />
- - - - - -<br />
4. RELACION ENTRE EL PROBLEMA<br />
MAXSUM Y EL PROBLEMA<br />
MAXMEAN<br />
Nótese que se podría resolver alternativamente<br />
el problema MAXMEAN a través <strong>de</strong> la resolución<br />
<strong>de</strong>l problema MAXSUM <strong>de</strong> la siguiente manera:<br />
Si resolvemos óptimamente el problema<br />
MAXSUM para todos los valores <strong>de</strong> m posibles;<br />
es <strong>de</strong>cir, para m = 2, 3, …, n, y dividimos estos<br />
valores óptimos para su respectivo valor <strong>de</strong> m,<br />
tendríamos todos los valores <strong>de</strong> los mejores<br />
promedios, <strong>de</strong> ahí al seleccionar el máximo valor<br />
<strong>de</strong> ellos se tendrá el óptimo <strong>de</strong>l problema<br />
MAXMEAN. Curiosamente en los resultados<br />
computacionales, esta estrategia <strong>de</strong> resolver m<br />
problemas MAXSUM resultó más eficiente que<br />
resolver el problema MAXMEAN formulado en<br />
(21)-(24), tal como se observa en la tabla 4.<br />
SOLUCION DEL PROBLEMA MAXMEAN<br />
UTILIZANDO EL MODELO MAXSUM<br />
Se consi<strong>de</strong>ra ahora la generación <strong>de</strong> instancias<br />
con dij seleccionadas aleatoriamente con una<br />
distribución U[-10,10], y se resuelve el mo<strong>de</strong>lo<br />
MAXMEAN siguiendo la estrategia <strong>de</strong> resolver m<br />
problemas MAXSUM en su formulación<br />
MAXSUM IQCP (1) –(3) usando el solver <strong>de</strong><br />
prueba CONOPT3 y MAXSUM IP (4) – (6)<br />
usando C-PLEX 12 con los parámetros por<br />
<strong>de</strong>fecto. Los experimentos fueron <strong>de</strong>sarrollados<br />
en una Laptop Intel Core Solo 1.40 GHz, 3 Gb<br />
RAM.<br />
MINIMU<br />
M<br />
En los experimentos computacionales, al resolver<br />
los m problemas MAXSUM, y dividiendo su<br />
óptimo para m, se observó en todas las instancias<br />
generadas que estos problemas tienen sólo un<br />
óptimo local, tal como se observa en las figuras 1,<br />
2 y 3.<br />
Tomando en cuenta la forma que toma el máximo<br />
promedio para distintos valores <strong>de</strong> m, con un solo<br />
máximo local, se pue<strong>de</strong> explotar esta<br />
característica para generar una estrategia <strong>de</strong><br />
resolver los problemas MAXSUM para valores<br />
crecientes <strong>de</strong> m, dividir su valor para m y parar el<br />
momento en que para el siguiente valor <strong>de</strong> m este<br />
valor <strong>de</strong>l promedio <strong>de</strong>crece, con lo cual se<br />
reduciría aún más el tiempo <strong>de</strong> ejecución<br />
utilizando este procedimiento.<br />
En cambio en la tabla 4 se observan los tiempos<br />
en los cuales se obtuvieron los resultados, cuando<br />
se utilizó este procedimiento resolviendo los<br />
problemas MAXSUM con la formulación MIP y<br />
utilizando C-PLEX12, y resolviendo los<br />
problemas MAXSUM con su formulación IQCP<br />
utilizando CONOPT3. También se reporta el GAP<br />
para el cual el solver CONOPT3 dio el resultado<br />
como óptimo, nótese que en este caso también se<br />
resolvieron m problemas pero <strong>de</strong>l tipo MAXSUM.<br />
Hay que <strong>de</strong>stacar el hecho <strong>de</strong> que a pesar que con<br />
CONOPT3 no se garantiza que se obtenga la<br />
solución óptima exacta, en el 40% <strong>de</strong> los<br />
experimentos si se alcanzó el óptimo.
FIGURA 1<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />
<strong>de</strong> la dispersión máxima<br />
Valores óptimos <strong>de</strong>l problema MAXSUM divididos para m<br />
para una instancia con n=30<br />
FIGURA 2<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />
<strong>de</strong> la dispersión máxima<br />
Valores óptimos <strong>de</strong>l problema MAXSUM divididos para m<br />
para una instancia con n=40<br />
FIGURA 3<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />
<strong>de</strong> la dispersión máxima<br />
Valores óptimos <strong>de</strong>l problema MAXSUM divididos para m<br />
para una instancia con n=50<br />
F. SANDOYA<br />
46<br />
TABLA IV<br />
Resolución exacta <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong>l máximo promedio para el problema<br />
<strong>de</strong> la dispersión máxima<br />
Tiempos para el problema MAXMEAN al resolverlo con<br />
los tres métodos planteados<br />
n método tiempo CPU m GAP<br />
MAXMEAN 17.74 7 -<br />
20<br />
MAXSUM IP<br />
MAXSUM<br />
IQCP<br />
8.506<br />
0.675<br />
7<br />
8<br />
-<br />
1.19%<br />
MAXMEAN 788.448 7 -<br />
25<br />
MAXSUM IP<br />
MAXSUM<br />
IQCP<br />
41.884<br />
0.783<br />
7<br />
7<br />
-<br />
1.93%<br />
MAXMEAN 57723.918 7 -<br />
30<br />
MAXSUM IP<br />
MAXSUM<br />
IQCP<br />
99.408<br />
0.757<br />
7<br />
7<br />
-<br />
5.72%<br />
MAXMEAN ∞ 12 -<br />
40<br />
MAXSUM IP<br />
MAXSUM<br />
IQCP<br />
745.025<br />
1.611<br />
12<br />
10<br />
-<br />
0.95%<br />
MAXMEAN ∞ 14 -<br />
50<br />
MAXSUM IP 122576.938 14 -<br />
MAXSUM<br />
IQCP<br />
5. CONCLUSIONES Y<br />
RECOMENDACIONES<br />
3.66 13 1.86%<br />
En esta investigación se pudo <strong>de</strong>terminar que el<br />
problema MAXMEAN sólo tiene sentido<br />
estudiarlo para distancias inter elemento dij<br />
negativas y positivas, pues si las dij son todas<br />
negativas las solución es siempre m =1, mientras<br />
que si todas las dij son positivas es casi seguro que<br />
m = n.<br />
Por otro lado resulta curioso el hecho que el<br />
mo<strong>de</strong>lo MIP planteado requiere un tiempo<br />
excesivo <strong>de</strong> ejecución incluso para tamaños <strong>de</strong>l<br />
problema pequeños, y sólo pue<strong>de</strong> ser resuelto en<br />
un tiempo pru<strong>de</strong>ncial para valores <strong>de</strong> n inferiores<br />
a 25. Sin embargo se pue<strong>de</strong> resolver <strong>de</strong> manera<br />
exacta el mismo problema resolviendo m<br />
problemas <strong>de</strong>l tipo MAXSUM en un tiempo<br />
mucho menor. Incluso, tomando en cuenta la<br />
forma que toma el máximo promedio para<br />
distintos valores <strong>de</strong> m, con un solo máximo local,<br />
podría utilizarse la estrategia <strong>de</strong> parar el momento<br />
en que para un m mayor el valor <strong>de</strong>l promedio<br />
<strong>de</strong>crece, con lo cual se reduciría aún más el<br />
tiempo <strong>de</strong> ejecución utilizando este<br />
procedimiento.
RESOLUCIÒN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPERSIÒN MÁXIMA<br />
La utilización <strong>de</strong> otro tipo <strong>de</strong> solvers que están en<br />
etapa <strong>de</strong> prueba, tales como CONOPT3 que<br />
utiliza procedimientos <strong>de</strong> optimización numérica<br />
no lineal, reduce drásticamente los tiempos <strong>de</strong><br />
ejecución, en base a los tiempos alcanzados para<br />
el tamaño máximo consi<strong>de</strong>rado en la versión<br />
<strong>de</strong>mo disponible, n = 50. Se especula que se<br />
47<br />
podrían resolver con la versión profesional<br />
problemas <strong>de</strong> tamaño muy gran<strong>de</strong>, la <strong>de</strong>sventaja<br />
es que no está garantizado que este solver alcance<br />
la solución óptima, a pesar que el programa<br />
reporta GAP cero, sin embargo si lo hizo el 40%<br />
<strong>de</strong> las veces en los experimentos<br />
computacionales.
F. SANDOYA<br />
REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS<br />
[1]. DUARTE A, MARTÍ R. (2007). “Tabu<br />
Search and GRASP for the Maximum<br />
Diversity Problem”, European Journal of<br />
Operational Research; 178, 71-84.<br />
[2]. GLOVER F, KUO CC, DHIR KS. (1998),<br />
“Heuristic Algorithms for the Maximum<br />
Diversity Problem”, Journal of Information<br />
and Optimization Sciences 1998; vol. 19, no.<br />
1, 109-132.<br />
[3]. PROKOPYEV OA, KONG N,<br />
MARTINEZ-TORRES DL. (2009).<br />
48<br />
“The equitable dispersion problem”.<br />
European Journal of Operational Research;<br />
197: 59-67.<br />
[4]. RESENDE MGC, MARTÍ R, GALLEGO<br />
M, DUARTE A. (<strong>2010</strong>). GRASP with path<br />
relinking for the max-min diversity problema.<br />
Computers and Operations Research; 37:<br />
498-508.<br />
[5]. C-PLEX 12.0 User’s Manual (2009), GAMS<br />
documents.