DeepMind Lança Novos Modelos de IA que Ajudam Robôs a Realizar Tarefas no Mundo Real

Ouça este artigo


O Google DeepMind lançou dois novos modelos de inteligência artificial: Gemini Robotics e Gemini Robotics-ER. Esses modelos foram projetados para ajudar robôs a realizar uma variedade maior de tarefas no mundo real. Carolina Parada, diretora sênior da equipe de robótica no DeepMind, destacou que o Gemini Robotics pode entender situações novas sem precisar de treinamento prévio. O Gemini-ER, focado em raciocínio, pode lidar com cenários dinâmicos e complexos. A empresa prioriza segurança e interatividade ao desenvolver suas tecnologias.

  • O Google DeepMind lançou dois novos modelos de IA: Gemini Robotics e Gemini Robotics-ER.
  • O Gemini Robotics assume tarefas no mundo real, mesmo sem treinamento prévio.
  • O Gemini-ER é um modelo avançado que entende melhor o mundo e realiza ações físicas.
  • Ambos os modelos melhoram a interação com pessoas e a precisão nas tarefas.
  • A segurança das ações dos robôs é considerada com novos métodos de treinamento.

DeepMind Lança Novos Modelos de IA para Robôs

Novas Inovações em Robótica

A DeepMind, uma empresa do Google, apresentou dois modelos inovadores de inteligência artificial (IA): Gemini Robotics e Gemini Robotics-ER. Esses modelos visam ajudar robôs a realizar uma variedade maior de tarefas no mundo real, representando um avanço significativo na interação robótica com o ambiente e com as pessoas.

Gemini Robotics: A Revolução na Interação

O modelo Gemini Robotics é um sistema de visão-linguagem-ação, capaz de compreender situações sem treinamento específico. Isso significa que, ao se deparar com novos cenários, o robô pode analisar e reagir de forma apropriada, superando desafios anteriores da tecnologia robótica.

Carolina Parada, líder na área de robótica da DeepMind, afirma que o Gemini Robotics opera com a versão mais recente do modelo de IA do Google, chamada Gemini 2.0, que utiliza entendimento multimodal para ações físicas no mundo real, possibilitando nova interação entre robôs e ambientes físicos.

Avanços em Três Áreas-Chave

A equipe da DeepMind foca em três áreas cruciais para o desenvolvimento de robôs úteis:

  • Generalidade: Capacidade de aplicar aprendizados em novos contextos.
  • Interatividade: Habilidade de se comunicar e interagir com humanos e o ambiente.
  • Destreza: Precisão na execução de tarefas físicas.

O Gemini Robotics se destaca nessas áreas, conseguindo generalizar novos cenários e interagir mais eficientemente com pessoas e o ambiente. O robô pode executar tarefas físicas com maior precisão, como dobrar papel ou remover tampas de garrafa.

Gemini Robotics-ER: Raciocínio Incorporado

O modelo Gemini Robotics-ER (raciocínio incorporado) é uma inovação avançada. Carolina Parada exemplifica sua função: ao preparar uma lancheira, é necessário saber a localização de cada item, abrir a lancheira e onde colocar os itens. Esse raciocínio complexo é o que o Gemini Robotics-ER foi projetado para realizar.

Segurança em Primeiro Lugar

Vikas Sindhwani, pesquisador da DeepMind, destaca a importância da segurança no desenvolvimento desses modelos. A empresa adota uma abordagem em camadas para garantir que as ações dos robôs sejam seguras, programando os modelos do Gemini Robotics-ER para avaliar a segurança de uma ação antes de executá-la.

Compromisso com a Indústria de IA

Além dos modelos, a DeepMind lançou benchmarks e frameworks para auxiliar na pesquisa sobre segurança na indústria de IA. A empresa disponibilizou o modelo Gemini Robotics-ER para testadores confiáveis, incluindo empresas como Agile Robots, Agility Robotics, Boston Dynamics e Enchanted Tools, demonstrando um compromisso com a segurança e eficácia na implementação da tecnologia em ambientes reais.

O Futuro da Robótica

Com esses avanços, a DeepMind está moldando o futuro da robótica. A capacidade dos robôs de compreender e interagir com o mundo pode abrir portas para uma ampla gama de aplicações, desde tarefas domésticas simples até operações complexas em ambientes industriais, transformando a utilização de robôs.

Implicações para o Cotidiano

Os novos modelos de IA não apenas melhoram a eficiência dos robôs, mas também têm o potencial de impactar a vida cotidiana. Imagine um robô capaz de ajudar na cozinha, organizando ingredientes e realizando tarefas simples, ou um assistente pessoal que compreenda e atenda às necessidades dos usuários de forma mais intuitiva.

Rolar para cima