Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

24.01.2013 Views
Capitulo 5. Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre ' ( ) L = ∑ G ⋅ W + Ruido (5.5) k j jk k j La configuración final de la mano hace referencia a qué dedos participarán en el agarre y como se van a posicionar los dedos durante la ejecución de la preconfiguración y el agarre. Este modelo fue diseñado para comandar la mano artificial Belgrado/USC (Bekey y col, 1990), los pares de dedos índice/medio y anular/meñique se consideran entidades únicas a ser controladas. La salida C consiste de 7 subvectores separados, cada uno de ellos especificando un detalle distinto de la configuración de agarre. Tres de esos subvectores (cada uno de ellos formado de dos unidades o componentes) especifica la participación del pulgar, del dedo I/M y del dedo A/m respectivamente. Uno de estos vectores (también constituido por dos unidades) determina si el pulgar se encuentra abducido o no. Los tres vectores restantes (cada uno de ellos consistente en tres unidades, que a su vez representan las cantidades pequeña, media y grande) determinan el grado de flexión, durante la preconfiguración, del pulgar del dedo I/M y del dedo A/m. Para cada subvector, un circuito de ‘el ganador se lo lleva todo’ determina la unidad más activa del subconjunto; es decir Ck = 1 si Lk = Max{ L m} ; donde m es un índice que pertenece al conjunto de unidades pertenecientes al mismo subvector que la unidad k; y Ck = 0 en cualquier otro caso. Este es el patrón de actividad que emplea el sistema de ejecución de la tarea. En el sistema de Fagg, la ejecución de la preconfiguración antes del agarre y del propio agarre no la maneja un sistema neuronal. Tras la ejución del agarre especificado por el sistema neuronal descrito más arriba, un ‘maestro o entrenador’ evalúa la ejecución del sistema. Existen dos elementos relacionados con esta evaluación, el éxito y la eficiencia. El éxito nos dice si el movimiento de agarre implementado ha sido capaz de levantar el objeto. Si el robot no es capaz de hacer esto, entonces el maestro establece una señal de refuerzo negativo R = -0.1. Si el agarre resulta exitoso entonces el maestro establece una señal de refuerzo positivo (R = 1) con cierto descuento si el agarre resulta ineficiente. Un agarre se considera ineficiente si los dedos se preconfiguran en una apertura mayor de la necesaria para el objeto que se requiere agarrar. La señal de refuerzo se utiliza por el algoritmo de aprendizaje para actualizar las conexiones sinápticas (W) en las proyecciones desde la capa visual/tareas (V) hacia la capa de detectores de características (F/G) y las conexiones sinápticas (W’) entre esta última capa y la capa de actuadotes, con el único objetivo de conseguir que el sistema completo reciba la señal de refuerzo máxima en sus acciones. Los ajustes en las conexiones sinápticas se realizan a través de un algoritmo Hebbiano / Anti – Hebbiano tal y como se detalla a continuación: Al sistema se le presenta una entrada concreta para la cual se computa un plan de agarre que posteriormente se ejecuta. Si el maestro emite una señal de refuerzo positivo, 217

Capitulo 5. Modelo Neuronal para el aprendizaje progresivo de tareas de Agarre el algoritmo debe asegurar que cuando al sistema se le presente en el futuro la misma entrada, éste produzca el mismo plan de agarre como salida. Esto se consigue mediante • Asegurándonos de que el mismo conjunto de detectores de características se active la próxima vez que se presente la misma entrada incrementando la fuerza de conexión entre las unidades activas en la capa V y los detectores de características G activos ante esa entrada. • Incrementando el apoyo activo que ejercen los detectores de características activos sobre los programas de agarre seleccionados mediante el aumento del valor de las conexiones sinápticas entre los detectores activos G y las unidades de salida C. Por otro lado supongamos que se produce una evaluación negativa del agarre (R < 0). Esto puede deberse tanto al hecho de que la selección de detectores ha sido errónea, o a que la selección misma del programa de agarre ha sido incorrecta. Ya que no conocemos en principio a que se debe esa evaluación negativa, asumiremos que se debe a ambos factores • Debemos reducir el valor de las conexiones sinápticas entre las unidades activadas por la entrada en V con los detectores de características activos (G) de manera que en el siguiente ensayo se de la oportunidad a otros detectores para activarse. • También debemos reducir el apoyo activo que los detectores activos ejercen sobre el plan de agarre seleccionado. Esto permitirá que en el siguiente ensayo con la misma entrada, se prueben distintas configuraciones de agarre. Estas reglas se pueden escribir como ecuaciones de actualización de pesos sinápticos ∆ W = α ⋅ R ⋅V ⋅G ⋅W ij i j ij ∆ W = α ⋅ R ⋅G ⋅C ⋅W ' ' jk j k jk donde ∆Wij e ∆Wjk son los cambios en las conexiones sinápticas, α es la tasa de aprendizaje y R es la señal de refuerzo. 218 (5.6)

Page 1 and 2: Universidad Politécnica de Cartage

Page 3 and 4: Neuro - Robotics constitutes an eme

Page 5 and 6: The results of the research develop

Page 7 and 8: Índice General Agradecimientos Int

Page 9 and 10: 5.2 Simulaciones del modelo. Modeli

Page 11 and 12: Introducción 1 Introducción Intro

Page 13 and 14: Introducción la hora de inspirar m

Page 15 and 16: Introducción 1. Análisis experime

Page 17 and 18: Introducción 3.7 Transferencia tec

Page 19 and 20: Introducción presentan objetos de

Page 21 and 22: Capitulo 1. El Movimiento de Agarre
















Page 53 and 54: Capitulo 2. Modelos Computacionales






















Page 97 and 98: Capitulo 3. El Agarre en la EP. Mod





























Page 155 and 156: Capitulo 4. Modelo Neuronal para la




























Page 211 and 212: Capitulo 5. Modelo Neuronal para el




Page 219: Capitulo 5. Modelo Neuronal para el














Page 249 and 250: 2.5 cm 3.0 cm 3.5 cm 2 cm Capitulo








Page 265 and 266: R1 HYPBF # 1 HYPBF # 2 R2 AIP VD Mu


Page 269 and 270: Capitulo 6. Implantación de algori







Page 283 and 284: Capitulo 7. Conclusiones y Trabajos

Page 285 and 286: Capitulo 7. Conclusiones y Trabajos

Page 287 and 288: 1. Cinemática Directa del brazo ma

Page 289 and 290: x 0 l 3 I -M c l 2 z 0 l 1 d θ 4 b

Page 291 and 292: Los pesos adaptativos wijk y zijkm

Page 293 and 294: Arbib, M.A. (1985a). Schemas for th

Page 295 and 296: Castiello, U., Stelmach, G.E., Lieb

Page 297 and 298: Fagg, A.H., Arbib, M.A. (1998). Mod

Page 299 and 300: Graybiel, A.M. (1997). The basal ga

Page 301 and 302: Jaeger, D., Kita, H., Wilson., C.J.

Page 303 and 304: Kimura, M., Matsumoto, N., Okahashi

Page 305 and 306: Mottet, D., Bootsma, R. J. (2001).

Page 307 and 308: Rezzoug, N., Gorce, P. (2001). A Ne

Page 309 and 310: Tanee, J., Boussaoud, D., Boyer-Zel

universidad

cartagena

tesis

doctoral

repositorio.bib.upct.es

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ... ... View more Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Delete template?

Save as template ?

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ... Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...