Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ... Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

repositorio.bib.upct.es
from repositorio.bib.upct.es More from this publisher
24.01.2013 Views

Capitulo 5. Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre. 1. Introducción 207 Capítulo 5 En este capitulo se introduce una arquitectura Multi-Red para el estudio de los distintos (en cuanto a la naturaleza de la información sensorial involucrada) y progresivos procesos (en cuanto a que se producen en distintos momentos del desarrollo) de aprendizaje relacionados con una tarea de agarre de objetos. Se propone un sistema modular, compuesto de varias redes neuronales de idéntica arquitectura (Redes de Regularización HYPBF, Poggio y Girosi, 1989), que permite el aprendizaje progresivo de los subprocesos que conforman un movimiento completo y correcto de agarre (subprocesos que se aprenden y ejecutan en distintos módulos del sistema y que requieren el intercambio y procesamiento de señales de modalidad sensorial muy dispar). En definitiva, se propone un sistema que, tras una serie de etapas de aprendizaje, es capaz de generar movimientos de agarre correctos cuando se le presentan objetos de distinta forma y tamaño, independientemente de su localización u orientación en el espacio. Se discuten las propiedades del modelo en relación a la neurobiología y teorías existentes sobre el movimiento de agarre, y se muestran sus capacidades en simulación. Los resultados de la implementación que de ciertas partes de ese modelo se ha llevado a cabo sobre una plataforma robótica real serán expuestas en un capítulo posterior.

Capitulo 5. Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre 2. Modelos neuronales para el aprendizaje de tareas de alcance y agarre En esta sección se describen una serie de modelos presentes en la literatura relacionados con el aprendizaje de tareas de alcance y agarre. Resulta importante destacar que las bases biológicas de los modelos comentados en esta sección y de los modelos desarrollados en este capítulo han sido ampliamente discutidas en el apartado 4 del Capítulo 1. 2.1 Movimientos de alcance: Modelos conexionistas. Existen una serie de modelos conexionistas 1 que se han venido desarrollando a lo largo de los últimos años relacionados con el aprendizaje y la generación realista de movimientos de alcance. Aunque muchos de ellos no nacen con la intención de ser un modelo fisiológico realista, todos ellos ilustran de una forma u otra el rango de soluciones que son competentes a la hora de resolver los problemas computacionales que implican los movimientos de alcance. Por ejemplo el controlador robótico INFANT (Figura 5.1A) aprende la cinemática inversa entre la localización espacial del objetivo y la postura del brazo requerida para colocar la mano sobre dicho objetivo (Kuperstein, 1988). En INFANT, distintos mapas neuronales codifican la entrada del campo visual proveniente de una cámara estereoscópica, el ángulo de la mirada de las cámaras y la ‘actividad muscular’ (lo que se codifica en este mapa es la posición de los ángulos de articulación como longitudes de músculos). Los mapas neuronales correspondientes al campo visual y a la mirada están conectados al mapa muscular mediante una serie de pesos adaptativos modificables. Durante un periodo inicial de aprendizaje, una señal externa genera patrones aleatorios en el mapa brazo – muscular que desplazan el brazo robot hacia diferentes posturas (balbuceo motor). Las cámaras fovean la posición de la mano después de cada ‘balbuceo’. El campo visual y el ángulo de mirada resultantes se ‘filtran’ por medio de los pesos adaptativos para generar un vector de activación estimado. La diferencia entre esta estimación y el vector de activaciones musculares generado externamente que generó el balbuceo, se usa como señal de error para el ajuste adaptativo de los pesos variables antes mencionados. Después de un número suficiente de balbuceos aleatorios, los vectores musculares externos y los estimados convergen, punto en el cual INFANT es capaz de alcanzar con precisión objetivos previamente foveados en el espacio de trabajo. Las matrices de pesos adaptables representan de una manera distribuida la transformación entre todas las combinaciones posibles de campo visual y ángulo de mirada y las correspondientes longitudes musculares. INFANT es 1 Modelos de redes neuronales 208

Capitulo 5. Mo<strong>de</strong>lo Neuronal para el aprendizaje progresivo <strong>de</strong> tareas <strong>de</strong> Agarre<br />

2. Mo<strong>de</strong>los neuronales para el aprendizaje <strong>de</strong> tareas <strong>de</strong> alcance y agarre<br />

En esta sección se <strong>de</strong>scriben una serie <strong>de</strong> mo<strong>de</strong>los presentes en la literatura<br />

relacionados con el aprendizaje <strong>de</strong> tareas <strong>de</strong> alcance y agarre. Resulta importante<br />

<strong>de</strong>stacar que las bases biológicas <strong>de</strong> los mo<strong>de</strong>los comentados en esta sección y <strong>de</strong> los<br />

mo<strong>de</strong>los <strong>de</strong>sarrollados en este capítulo han sido ampliamente discutidas en el apartado<br />

4 <strong>de</strong>l Capítulo 1.<br />

2.1 Movimientos <strong>de</strong> alcance: Mo<strong>de</strong>los conexionistas.<br />

Existen una serie <strong>de</strong> mo<strong>de</strong>los conexionistas 1 que se han venido <strong>de</strong>sarrollando a lo<br />

largo <strong>de</strong> los últimos años relacionados con el aprendizaje y la generación realista <strong>de</strong><br />

movimientos <strong>de</strong> alcance. Aunque muchos <strong>de</strong> ellos no nacen con la intención <strong>de</strong> ser un<br />

mo<strong>de</strong>lo fisiológico realista, todos ellos ilustran <strong>de</strong> una forma u otra el rango <strong>de</strong><br />

soluciones que son competentes a la hora <strong>de</strong> resolver los problemas computacionales<br />

que implican los movimientos <strong>de</strong> alcance.<br />

Por ejemplo el controlador robótico INFANT (Figura 5.1A) apren<strong>de</strong> la cinemática<br />

inversa entre la localización espacial <strong>de</strong>l objetivo y la postura <strong>de</strong>l brazo requerida para<br />

colocar la mano sobre dicho objetivo (Kuperstein, 1988). En INFANT, distintos mapas<br />

neuronales codifican la entrada <strong>de</strong>l campo visual proveniente <strong>de</strong> una cámara<br />

estereoscópica, el ángulo <strong>de</strong> la mirada <strong>de</strong> las cámaras y la ‘actividad muscular’ (lo que<br />

se codifica en este mapa es la posición <strong>de</strong> los ángulos <strong>de</strong> articulación como longitu<strong>de</strong>s<br />

<strong>de</strong> músculos). Los mapas neuronales correspondientes al campo visual y a la mirada<br />

están conectados al mapa muscular mediante una serie <strong>de</strong> pesos adaptativos<br />

modificables. Durante un periodo inicial <strong>de</strong> aprendizaje, una señal externa genera<br />

patrones aleatorios en el mapa brazo – muscular que <strong>de</strong>splazan el brazo robot hacia<br />

diferentes posturas (balbuceo motor). Las cámaras fovean la posición <strong>de</strong> la mano <strong>de</strong>spués<br />

<strong>de</strong> cada ‘balbuceo’. El campo visual y el ángulo <strong>de</strong> mirada resultantes se ‘filtran’ por<br />

medio <strong>de</strong> los pesos adaptativos para generar un vector <strong>de</strong> activación estimado. La<br />

diferencia entre esta estimación y el vector <strong>de</strong> activaciones musculares generado<br />

externamente que generó el balbuceo, se usa como señal <strong>de</strong> error para el ajuste<br />

adaptativo <strong>de</strong> los pesos variables antes mencionados. Después <strong>de</strong> un número suficiente<br />

<strong>de</strong> balbuceos aleatorios, los vectores musculares externos y los estimados convergen,<br />

punto en el cual INFANT es capaz <strong>de</strong> alcanzar con precisión objetivos previamente<br />

foveados en el espacio <strong>de</strong> trabajo. Las matrices <strong>de</strong> pesos adaptables representan <strong>de</strong> una<br />

manera distribuida la transformación entre todas las combinaciones posibles <strong>de</strong> campo<br />

visual y ángulo <strong>de</strong> mirada y las correspondientes longitu<strong>de</strong>s musculares. INFANT es<br />

1 Mo<strong>de</strong>los <strong>de</strong> re<strong>de</strong>s neuronales<br />

208

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!