Un petit pas pour l’IA sera-t-il un grand pas pour la robotique ?

🔥 Produits recommandés : Canon EOS R6 IIDJI Mini 4 ProMacBook Pro M4

ergoneon/Pixabay
Source : ergoneon/Pixabay

Vous êtes-vous déjà demandé jusqu’à quel point un robot pouvait devenir humain ? Les chercheurs ont fait un pas de plus, littéralement, vers des machines dotées de capacités plus proches de celles de l’homme. Une équipe de recherche interdisciplinaire des départements d’ingénierie (biomédicale, électrique, aérospatiale et mécanique), d’informatique, de biokinésiologie et de kinésithérapie de l’université de Californie du Sud (USC) a uni ses forces pour créer un robot capable de s’auto-apprendre à marcher.

L’équipe de l’USC, composée d’Ali Marjaninejad, Darío Urbina-Meléndez, Brian A. Cohn et Francisco J. Valero-Cuevas, a récemment publié ses conclusions dans Nature Machine Intelligence le 11 mars 2019.

Les chercheurs ont créé un « algorithme biologiquement plausible » appelé « G2P » (du général au particulier). L’algorithme a été créé en deux phases distinctes : l’apprentissage et le raffinement.

Au départ, dans la phase d’apprentissage, un membre robotisé à traction tendineuse subit une phase de balbutiement moteur au cours de laquelle le système tente des séquences de commande aléatoires et recueille la cinématique associée. Les données d’entrée-sortie issues du balbutiement moteur sont transmises à un réseau neuronal artificiel (RNA) à perceptron multicouche pour l’entraîner. À son tour, le RNA formé produit une carte initiale sortie-entrée (inverse) basée sur la dynamique du système.

L’ANN de la carte inverse de la cinématique 6D à une séquence de commande de moteur 3D comporte trois couches et vingt-quatre nœuds au total. Il y a six nœuds dans la couche d’entrée, quinze nœuds dans la couche cachée et trois nœuds dans la couche de sortie.

La fonction de transfert sigmoïde à tangente hyperbolique a été utilisée pour calculer la sortie d’une couche à partir de son entrée nette, ce qui convient bien aux réseaux neuronaux lorsque la vitesse est une priorité par rapport à la forme précise de la fonction de transfert. Une mise à l’échelle a été utilisée pour la couche de sortie.

l’article continue après l’annonce

L’ANN a été formé en utilisant la rétropropagation de Levenberg-Marquardt. Les algorithmes de Levenberg-Marquardt sont utilisés pour résoudre les problèmes de moindres carrés. Ces algorithmes sont une combinaison de Gauss-Newton et de descente de gradient : À chaque itération, la taille de la valeur du paramètre algorithmique λ détermine lequel est utilisé. Levenberg-Marquardt est capable de traiter des modèles avec plusieurs paramètres libres et converge plus rapidement que les méthodes de Gauss-Newton ou de descente de gradient.

L’algorithme d’initialisation de Nguyen-Widrow, dont les valeurs contiennent un certain degré d’aléa, a été utilisé pour déterminer les poids et les biais de l’ANN.

La phase suivante affine l’apprentissage initial et se compose de deux parties : l’exploration et la convergence vers une récompense élevée. L’exploration de tentatives aléatoires au fil du temps aboutira à des solutions assorties d’une récompense de type tapis roulant. Ensuite, le comportement est renforcé par une récompense pour affiner la carte inverse. Les poids de l’ANN sont ajustés entre les tentatives pour permettre au système d’apprendre par l’expérience.

Les résultats sont les suivants : l’algorithme G2P est capable d’apprendre à propulser un tapis roulant de manière autonome, sans modélisation explicite de la dynamique ni détection d’erreur en boucle fermée. En fait, les chercheurs ont créé des robots qui apprennent par l’expérience et l’expérimentation, plutôt que par des instructions explicites ou des simulations préalables.

Les chercheurs ont écrit que leur création « pourrait conduire à une classe de robots présentant des avantages uniques en termes de conception, de polyvalence et de performance » et « contribue aux neurosciences computationnelles en fournissant une stratégie d’apprentissage biologiquement et développementalement défendable pour des membres anatomiquement plausibles ».

Copyright © 2019 Cami Rosso Tous droits réservés.

Références

Marjaninejad, Ali, Urbina-Meléndez, Darío, Cohn, Brian A., J. Valero-Cuevas, Francisco. « Autonomous functional movements in a tendon-driven limb via limited experience ». Nature Machine Intelligence. 11 mars 2019.

MathWorks. « tansig ». Consulté le 4-24-2019 à l’adresse suivante : https://www.mathworks.com/help/deeplearning/ref/tansig.html

Statistiques Comment Faire. « Algorithme de Levenberg-Marquardt (moindres carrés amortis) : Définition ». Consulté le 4-24-2019 à l’adresse https://www.statisticshowto.datasciencecentral.com/levenberg-marquardt-…

MathWorks.  » initnw « . Consulté le 4-24-2019 à l’adresse suivante : https://www.mathworks.com/help/deeplearning/ref/initnw.html