24.01.2013 Views

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

Universidad Politécnica de Cartagena TESIS DOCTORAL “UNA ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capitulo 5. Mo<strong>de</strong>lo Neuronal para el aprendizaje progresivo <strong>de</strong> tareas <strong>de</strong> Agarre<br />

don<strong>de</strong> C2(y) posee un mínimo absoluto cuando las articulaciones metacarpiales MCP<br />

<strong>de</strong> los <strong>de</strong>dos y la articulación carpometacarpal (CMC) <strong>de</strong>l pulgar están flexionadas al<br />

máximo, y las articulaciones interfalangeales proximales (PIP) e interfalangeal <strong>de</strong>l<br />

pulgar (IP) se encuentran totalmente extendidas. El algoritmo <strong>de</strong> aprendizaje permite<br />

obtener valores <strong>de</strong> las funciones <strong>de</strong> selección que son óptimos (lo más cercanos posibles<br />

a 1) ante la entrada visual <strong>de</strong> las características <strong>de</strong> los objetos a ser agarrados.<br />

Figura 5.3. Izquierda: Red neuronal para el aprendizaje <strong>de</strong> posturas <strong>de</strong> la mano (Uno y col, 1993).<br />

Derecha: Representación interna <strong>de</strong> los objetos agarrados en base a la actividad neuronal inducida para,<br />

a) Agarre <strong>de</strong> cilindros <strong>de</strong> distinto tamaño empleando un agarre <strong>de</strong> fuerza, b) Agarre <strong>de</strong> cilindros <strong>de</strong><br />

distinto tamaño en agarre <strong>de</strong> precisión, c) Agarre <strong>de</strong> esferas <strong>de</strong> distinto tamaño en agarre <strong>de</strong> fuerza y d)<br />

Agarre <strong>de</strong> esferas <strong>de</strong> distinto tamaño en agarre <strong>de</strong> precisión.<br />

Aprendizaje por refuerzo en la planificación <strong>de</strong>l agarre<br />

En el tipo <strong>de</strong> aproximación llevada a cabo por Fagg (Fagg, 1992) más que apren<strong>de</strong>r<br />

a mimetizar acciones llevadas a cabo por un sujeto humano, la red neuronal apren<strong>de</strong> a<br />

asociar propieda<strong>de</strong>s intrínsecas <strong>de</strong> un objeto con posturas <strong>de</strong> agarre a<strong>de</strong>cuadas<br />

mediante la observación y evaluación <strong>de</strong> sus propios actos motores. Hay que remarcar<br />

el hecho <strong>de</strong> que sigue existiendo un ‘maestro’ en el proceso, lo que ocurre es que ahora,<br />

en lugar <strong>de</strong> <strong>de</strong>cirle al robot cómo llevar a cabo exactamente la tarea lo que se le dice es<br />

cómo <strong>de</strong> bien la ha realizado en su último intento. Esta aproximación permite obtener<br />

planes <strong>de</strong> agarre mejor orientados a las capacida<strong>de</strong>s <strong>de</strong> actuación y <strong>de</strong> sensado <strong>de</strong>l<br />

robot, propiedad que no es directamente <strong>de</strong>rivable <strong>de</strong> un proceso <strong>de</strong> mimetización<br />

pura. La medida <strong>de</strong> ‘lo bien que ha hecho el robot la tarea’ también <strong>de</strong>nominada ‘señal<br />

<strong>de</strong> refuerzo’ generalmente adopta la forma <strong>de</strong> un escalar. En el caso <strong>de</strong> una tarea <strong>de</strong><br />

agarre este escalar <strong>de</strong>be medir dos parámetros: el éxito y la eficiencia <strong>de</strong>l agarre. El<br />

sistema neuronal artificial propuesto por Fagg emplea esta señal <strong>de</strong> realimentación para<br />

ajustar la fuerza <strong>de</strong> las conexiones entre las distintas capas <strong>de</strong> neuronas que conforman<br />

215

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!