Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

24.01.2013 Views
Capitulo 5. Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre donde C2(y) posee un mínimo absoluto cuando las articulaciones metacarpiales MCP de los dedos y la articulación carpometacarpal (CMC) del pulgar están flexionadas al máximo, y las articulaciones interfalangeales proximales (PIP) e interfalangeal del pulgar (IP) se encuentran totalmente extendidas. El algoritmo de aprendizaje permite obtener valores de las funciones de selección que son óptimos (lo más cercanos posibles a 1) ante la entrada visual de las características de los objetos a ser agarrados. Figura 5.3. Izquierda: Red neuronal para el aprendizaje de posturas de la mano (Uno y col, 1993). Derecha: Representación interna de los objetos agarrados en base a la actividad neuronal inducida para, a) Agarre de cilindros de distinto tamaño empleando un agarre de fuerza, b) Agarre de cilindros de distinto tamaño en agarre de precisión, c) Agarre de esferas de distinto tamaño en agarre de fuerza y d) Agarre de esferas de distinto tamaño en agarre de precisión. Aprendizaje por refuerzo en la planificación del agarre En el tipo de aproximación llevada a cabo por Fagg (Fagg, 1992) más que aprender a mimetizar acciones llevadas a cabo por un sujeto humano, la red neuronal aprende a asociar propiedades intrínsecas de un objeto con posturas de agarre adecuadas mediante la observación y evaluación de sus propios actos motores. Hay que remarcar el hecho de que sigue existiendo un ‘maestro’ en el proceso, lo que ocurre es que ahora, en lugar de decirle al robot cómo llevar a cabo exactamente la tarea lo que se le dice es cómo de bien la ha realizado en su último intento. Esta aproximación permite obtener planes de agarre mejor orientados a las capacidades de actuación y de sensado del robot, propiedad que no es directamente derivable de un proceso de mimetización pura. La medida de ‘lo bien que ha hecho el robot la tarea’ también denominada ‘señal de refuerzo’ generalmente adopta la forma de un escalar. En el caso de una tarea de agarre este escalar debe medir dos parámetros: el éxito y la eficiencia del agarre. El sistema neuronal artificial propuesto por Fagg emplea esta señal de realimentación para ajustar la fuerza de las conexiones entre las distintas capas de neuronas que conforman 215

Capitulo 5. Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre el modelo a través de un algoritmo de aprendizaje por refuerzo propuesto por Barto y col, 1983 y Sutton, 1988, que permite al sistema maximizar tanto el éxito como la eficiencia de los agarres. La arquitectura computacional de Fagg (Figura 5.4) puede describirse de la siguiente manera: La información visual y la información asociada al tipo de tarea constituyen las entradas al modelo y se representan como un patrón de actividad a lo largo del conjunto de neuronas V. Se emplean un total de 11 neuronas en la capa V: tres se emplean para representar el tipo de objeto (cilindro, cubo o cono), tres se emplean para codificar el tamaño del objeto (pequeño, mediano, grande), otras tres para representar su diámetro (estrecho, medio, ancho) y otras dos neuronas codifican el tipo de acción a optimizar en el agarre (manipulabilidad o estabilidad). En el mono este tipo de información visual la proporcionan regiones del córtex parietal posterior; la información relativa al tipo de tarea a realizar proviene de una serie de regiones del córtex prefrontal, del área motora suplementaria y del córtex promotor dorsal. Esta información se proyecta a lo largo de un grupo de sinapsis (W) hacia una capa de neuronas (F/G) que actúa como detector de características, y en la cual cada neurona representa una característica de mayor nivel de abstracción que en la capa anterior (por ejemplo, una característica que representa ‘cilindro’ y ‘manipulabilidad’ recibirá conexiones desde las neuronas de la capa V correspondientes). La actividad de la unidad Fj viene dad por la ecuación: donde ( ) F = ∑ V ⋅ W + Ruido (5.4) j i ij j i Fj , es la actividad de la unidad j de la capa F/G Vi , es el nivel de la actividad de la unidad de entrada i. Wij , es el valor de la conexión entre la unidad de entrada i y la unidad j F/G. Ruidoj , es una señal aleatoria que se inyecta en el detector de la características j. Estos detectores de características interaccionan a través de mecanismos de competición local para resaltar las diferencias de actividad entre todas las neuronas de la capa. En la implementación de Fagg este paso se resuelve con una operación de máximo realizada localmente. La salida G de la capa F/G se computa de la siguiente manera: Gj vale Fj si Fj = Max{ F l} ; para valores de l que están comprendidos en el intervalo [j-N j+N] y cero en cualquier otro caso. Tras esta operación los detectores de características de la capa F/G que queden activos ‘votan’ para la configuración que se impone a la mano haciendo pasar su actividad hacia las unidades de salida L: 216

Page 1 and 2: Universidad Politécnica de Cartage

Page 3 and 4: Neuro - Robotics constitutes an eme

Page 5 and 6: The results of the research develop

Page 7 and 8: Índice General Agradecimientos Int

Page 9 and 10: 5.2 Simulaciones del modelo. Modeli

Page 11 and 12: Introducción 1 Introducción Intro

Page 13 and 14: Introducción la hora de inspirar m

Page 15 and 16: Introducción 1. Análisis experime

Page 17 and 18: Introducción 3.7 Transferencia tec

Page 19 and 20: Introducción presentan objetos de

Page 21 and 22: Capitulo 1. El Movimiento de Agarre
















Page 53 and 54: Capitulo 2. Modelos Computacionales






















Page 97 and 98: Capitulo 3. El Agarre en la EP. Mod





























Page 155 and 156: Capitulo 4. Modelo Neuronal para la




























Page 211 and 212: Capitulo 5. Modelo Neuronal para el



Page 217: Capitulo 5. Modelo Neuronal para el















Page 249 and 250: 2.5 cm 3.0 cm 3.5 cm 2 cm Capitulo








Page 265 and 266: R1 HYPBF # 1 HYPBF # 2 R2 AIP VD Mu


Page 269 and 270: Capitulo 6. Implantación de algori







Page 283 and 284: Capitulo 7. Conclusiones y Trabajos

Page 285 and 286: Capitulo 7. Conclusiones y Trabajos

Page 287 and 288: 1. Cinemática Directa del brazo ma

Page 289 and 290: x 0 l 3 I -M c l 2 z 0 l 1 d θ 4 b

Page 291 and 292: Los pesos adaptativos wijk y zijkm

Page 293 and 294: Arbib, M.A. (1985a). Schemas for th

Page 295 and 296: Castiello, U., Stelmach, G.E., Lieb

Page 297 and 298: Fagg, A.H., Arbib, M.A. (1998). Mod

Page 299 and 300: Graybiel, A.M. (1997). The basal ga

Page 301 and 302: Jaeger, D., Kita, H., Wilson., C.J.

Page 303 and 304: Kimura, M., Matsumoto, N., Okahashi

Page 305 and 306: Mottet, D., Bootsma, R. J. (2001).

Page 307 and 308: Rezzoug, N., Gorce, P. (2001). A Ne

Page 309 and 310: Tanee, J., Boussaoud, D., Boyer-Zel

universidad

cartagena

tesis

doctoral

repositorio.bib.upct.es

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ... ... View more Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Delete template?

Save as template ?

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ... Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...