De agilidade física a cognição
Durante anos, o progresso da robótica móvel foi medido pela agilidade física — a capacidade de uma máquina de se deslocar por um piso cheio de obstáculos ou subir um lance de escadas. O quadrúpede Spot, da Boston Dynamics, há muito é referência nesse tipo de mobilidade. Mas a próxima fronteira para essas máquinas não é o movimento — é a cognição. Em uma nova parceria com o Google DeepMind e o Google Cloud, a Boston Dynamics está integrando o modelo de linguagem Gemini à sua frota para preencher a lacuna entre percepção e raciocínio.
Raciocínio em primeiro lugar
A integração gira em torno do Gemini Robotics ER 1.6, uma versão especializada da IA multimodal do Google projetada para aplicações que priorizam raciocínio. Ao incorporar essa inteligência ao sistema Orbit AIVI-Learning, o Spot ultrapassa o simples reconhecimento de objetos. Em vez de apenas identificar uma válvula ou um medidor, o robô agora consegue interpretar o estado de uma instalação industrial com grau mais alto de nuance, utilizando compreensão multi-view e planejamento de tarefas para navegar ambientes complexos e de alto risco.
De plataforma remota a agente autônomo
Essa mudança transforma o robô de uma plataforma de sensores controlada remotamente em um agente industrial mais autônomo. O Gemini permite que o hardware acione ferramentas externas — incluindo o Google Search e diversos modelos de visão-linguagem-ação (VLA) — para resolver ambiguidades em tempo real. À medida que essas máquinas passam a "compreender" as instalações que patrulham, o objetivo é superar rotinas pré-programadas rumo a uma forma mais fluida e adaptativa de inteligência mecânica.
Com reportagem de The Robot Report.
Source · The Robot Report



