Gripper aprende… através de tentativa e erro

Dec 26, 2019

Inspirado pela mão humana, o LearningGripper tem quatro dedos. Com a ajuda do software de aprendizado de máquina, essa pinça pode dominar uma ação complexa, como pegar e orientar um artigo. As posições básicas dos dedos e a função de feedback do ambiente precisam ser definidas com antecedência; a garra aprende todas as outras seqüências de movimento por tentativa e erro.

A tarefa do LearningGripper, como ilustrado, era girar a bola até o logotipo estar no topo. No início, a pinça movia a bola aleatoriamente. Um sensor de posição na bola forneceu feedback sobre a distância do logotipo da “palma da pinça”. O LearningGripper recebeu uma recompensa com base em um sistema de pontos; pontos são processados no software de aprendizado de máquina. Com o tempo, o software desenvolveu uma estratégia de movimento e a garra aprendeu que ação tomar em um ponto específico. Ele muda seus movimentos para receber o máximo de feedback positivo possível e, finalmente, encontra uma solução confiável para sua tarefa. Se a estratégia de uma pinça é transferida para outra, a segunda pinça usa isso como base de conhecimento para aprender sua própria estratégia com mais eficiência.

O LearningGripper demonstra como os sistemas no futuro poderão resolver tarefas complexas de forma autônoma, sem programação complexa. Sistemas de autoaprendizagem, como o LearningGripper, podem ser instalados em uma linha de produção e, em seguida, autorizados a otimizar seu comportamento independentemente