Este robô com inteligência artificial continua funcionando mesmo se você o atacar com uma motosserra

Um robô de quatro patas que continua rastejando mesmo depois de ter todas as quatro patas cortadas com uma serra elétrica é o pesadelo da maioria das pessoas.
Para Deepak Pathak, cofundador e CEO da startup Skild AI, o feito distópico de adaptação é um sinal encorajador de um novo tipo mais geral de inteligência robótica.
"Isso é o que chamamos de cérebro onicorporal", me conta Pathak. Sua startup desenvolveu o algoritmo de inteligência artificial generalista para enfrentar um desafio fundamental no avanço da robótica: "Qualquer robô, qualquer tarefa, um cérebro. É absurdamente genérico."
Muitos pesquisadores acreditam que os modelos de IA usados para controlar robôs podem experimentar um grande avanço, semelhante ao que produziu modelos de linguagem e chatbots, se dados de treinamento suficientes puderem ser coletados.
O robô controlado por IA é capaz de se adaptar a circunstâncias novas e extremas, como a perda de membros.
Os métodos existentes para treinar modelos de IA robótica, como fazer com que algoritmos aprendam a controlar um sistema específico por meio de teleoperação ou simulação, não geram dados suficientes, diz Pathak.
A abordagem da Skild consiste em fazer com que um único algoritmo aprenda a controlar um grande número de robôs físicos diferentes em uma ampla gama de tarefas. Com o tempo, isso produz um modelo que a empresa chama de Skild Brain, com uma capacidade mais geral de se adaptar a diferentes formas físicas — incluindo aquelas nunca vistas antes. Os pesquisadores criaram uma versão menor do modelo, chamada LocoFormer, para um artigo acadêmico que descreve sua abordagem.
O modelo também foi projetado para se adaptar rapidamente a uma nova situação, como uma perna faltando ou um novo terreno traiçoeiro, descobrindo como aplicar o que aprendeu à sua nova situação. Pathak compara a abordagem à maneira como grandes modelos de linguagem podem lidar com problemas particularmente desafiadores, decompondo-os e alimentando suas deliberações em sua própria janela de contexto — uma abordagem conhecida como aprendizagem em contexto.
Outras empresas, incluindo o Instituto de Pesquisa Toyota e uma startup rival chamada Physical Intelligence , também estão correndo para desenvolver modelos de IA robótica com capacidades mais gerais. A Skild, no entanto, é incomum na forma como está construindo modelos que se generalizam para tantos tipos diferentes de hardware.
O LocoFormer é treinado com RL em larga escala em uma variedade de robôs gerados proceduralmente com randomização de domínio agressiva.
Cortesia de SkildEm um experimento, a equipe do Skild treinou seu algoritmo para controlar um grande número de robôs ambulantes de diferentes formatos. Quando o algoritmo foi executado em robôs reais de duas e quatro patas — sistemas não incluídos nos dados de treinamento —, ele conseguiu controlar seus movimentos e fazê-los andar.
Em determinado momento, a equipe descobriu que um robô de quatro patas que opera o cérebro omnicorporal da empresa se adapta rapidamente quando é colocado sobre as patas traseiras. Como ele detecta o chão sob as patas traseiras, o algoritmo opera o cão-robô como se fosse um humanoide, fazendo-o andar sobre as patas traseiras.
O LocoFormer aprende continuamente por meio da experiência online. A política pode aprender com as quedas nos testes iniciais para aprimorar as estratégias de controle nos testes posteriores.
Cortesia de SkildO algoritmo generalista também conseguiu se adaptar a mudanças extremas no formato de um robô — quando, por exemplo, suas pernas eram amarradas, cortadas ou modificadas para ficarem mais longas. A equipe também tentou desativar dois motores em um robô quadrúpede com rodas e pernas. O robô conseguiu se adaptar equilibrando-se sobre duas rodas, como uma bicicleta instável.
Ao enfrentar grandes perturbações — como alterações morfológicas, falhas motoras ou alterações de peso — o LocoFormer pode reconstruir essas representações para alcançar a adaptação online.
Cortesia de SkildA Skild está testando a mesma abordagem para a manipulação de robôs. Ela treinou o Skild Brain em uma série de braços robóticos simulados e descobriu que o modelo resultante conseguia controlar hardware desconhecido e se adaptar a mudanças repentinas no ambiente, como a redução da iluminação. A startup já está trabalhando com algumas empresas que utilizam braços robóticos, diz Pathak. Em 2024, a empresa levantou US$ 300 milhões em uma rodada que a avaliou em US$ 1,5 bilhão.
Pathak diz que os resultados podem parecer assustadores para alguns, mas para ele eles mostram os primeiros sinais de uma espécie de superinteligência física para robôs. "É muito emocionante para mim, cara", diz ele.
O que você acha do cérebro robótico multitalentoso do Skild? Envie um e-mail para [email protected] para me contar.
Esta é uma edição do boletim informativo do Laboratório de IA de Will Knight . Leia os boletins anteriores aqui.
wired