24.01.2013 Views

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capitulo 5. Mo<strong>de</strong>lo Neuronal para el aprendizaje progresivo <strong>de</strong> tareas <strong>de</strong> Agarre<br />

' ( )<br />

L = ∑ G ⋅ W + Ruido<br />

(5.5)<br />

k j jk k<br />

j<br />

La configuración final <strong>de</strong> la mano hace referencia a qué <strong>de</strong>dos participarán en el<br />

agarre y como se van a posicionar los <strong>de</strong>dos durante la ejecución <strong>de</strong> la<br />

preconfiguración y el agarre. Este mo<strong>de</strong>lo fue diseñado para comandar la mano<br />

artificial Belgrado/USC (Bekey y col, 1990), los pares <strong>de</strong> <strong>de</strong>dos índice/medio y<br />

anular/meñique se consi<strong>de</strong>ran entida<strong>de</strong>s únicas a ser controladas. La salida C consiste<br />

<strong>de</strong> 7 subvectores separados, cada uno <strong>de</strong> ellos especificando un <strong>de</strong>talle distinto <strong>de</strong> la<br />

configuración <strong>de</strong> agarre. Tres <strong>de</strong> esos subvectores (cada uno <strong>de</strong> ellos formado <strong>de</strong> dos<br />

unida<strong>de</strong>s o componentes) especifica la participación <strong>de</strong>l pulgar, <strong>de</strong>l <strong>de</strong>do I/M y <strong>de</strong>l<br />

<strong>de</strong>do A/m respectivamente. Uno <strong>de</strong> estos vectores (también constituido por dos<br />

unida<strong>de</strong>s) <strong>de</strong>termina si el pulgar se encuentra abducido o no. Los tres vectores restantes<br />

(cada uno <strong>de</strong> ellos consistente en tres unida<strong>de</strong>s, que a su vez representan las cantida<strong>de</strong>s<br />

pequeña, media y gran<strong>de</strong>) <strong>de</strong>terminan el grado <strong>de</strong> flexión, durante la preconfiguración,<br />

<strong>de</strong>l pulgar <strong>de</strong>l <strong>de</strong>do I/M y <strong>de</strong>l <strong>de</strong>do A/m. Para cada subvector, un circuito <strong>de</strong> ‘el ganador<br />

se lo lleva todo’ <strong>de</strong>termina la unidad más activa <strong>de</strong>l subconjunto; es <strong>de</strong>cir Ck = 1 si Lk =<br />

Max{ L m}<br />

; don<strong>de</strong> m es un índice que pertenece al conjunto <strong>de</strong> unida<strong>de</strong>s pertenecientes al<br />

mismo subvector que la unidad k; y Ck = 0 en cualquier otro caso. Este es el patrón <strong>de</strong><br />

actividad que emplea el sistema <strong>de</strong> ejecución <strong>de</strong> la tarea. En el sistema <strong>de</strong> Fagg, la<br />

ejecución <strong>de</strong> la preconfiguración antes <strong>de</strong>l agarre y <strong>de</strong>l propio agarre no la maneja un<br />

sistema neuronal. Tras la ejución <strong>de</strong>l agarre especificado por el sistema neuronal<br />

<strong>de</strong>scrito más arriba, un ‘maestro o entrenador’ evalúa la ejecución <strong>de</strong>l sistema. Existen<br />

dos elementos relacionados con esta evaluación, el éxito y la eficiencia. El éxito nos dice<br />

si el movimiento <strong>de</strong> agarre implementado ha sido capaz <strong>de</strong> levantar el objeto. Si el robot<br />

no es capaz <strong>de</strong> hacer esto, entonces el maestro establece una señal <strong>de</strong> refuerzo negativo<br />

R = -0.1. Si el agarre resulta exitoso entonces el maestro establece una señal <strong>de</strong> refuerzo<br />

positivo (R = 1) con cierto <strong>de</strong>scuento si el agarre resulta ineficiente. Un agarre se<br />

consi<strong>de</strong>ra ineficiente si los <strong>de</strong>dos se preconfiguran en una apertura mayor <strong>de</strong> la<br />

necesaria para el objeto que se requiere agarrar. La señal <strong>de</strong> refuerzo se utiliza por el<br />

algoritmo <strong>de</strong> aprendizaje para actualizar las conexiones sinápticas (W) en las<br />

proyecciones <strong>de</strong>s<strong>de</strong> la capa visual/tareas (V) hacia la capa <strong>de</strong> <strong>de</strong>tectores <strong>de</strong><br />

características (F/G) y las conexiones sinápticas (W’) entre esta última capa y la capa <strong>de</strong><br />

actuadotes, con el único objetivo <strong>de</strong> conseguir que el sistema completo reciba la señal <strong>de</strong><br />

refuerzo máxima en sus acciones. Los ajustes en las conexiones sinápticas se realizan a<br />

través <strong>de</strong> un algoritmo Hebbiano / Anti – Hebbiano tal y como se <strong>de</strong>talla a continuación:<br />

Al sistema se le presenta una entrada concreta para la cual se computa un plan <strong>de</strong><br />

agarre que posteriormente se ejecuta. Si el maestro emite una señal <strong>de</strong> refuerzo positivo,<br />

217

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!