Conecte-se conosco

Tecnologia

Nova inteligência artificial V-JEPA 2 da Meta ajuda robôs a prever e planejar usando apenas vídeos brutos

Publicado

em

Seja o primeiro a reagir!

A Meta está redefinindo como máquinas interpretam o mundo físico com seu mais recente avanço em inteligência artificial. Anunciado recentemente, o V-JEPA 2 representa um salto significativo na capacidade das máquinas de compreender a realidade física, abrindo caminho para robôs mais intuitivos e sistemas de IA capazes de pensar antes de agir em ambientes complexos do mundo real.

Um novo modelo para entender o mundo físico

O V-JEPA 2 foi desenvolvido com uma abordagem revolucionária: aprender exclusivamente a partir de dados de vídeo não rotulados. Diferentemente dos sistemas convencionais que dependem de extensos conjuntos de dados anotados manualmente, este modelo observa como objetos e pessoas interagem no mundo real, extraindo padrões e princípios físicos fundamentais como gravidade e movimento.

A Meta afirma que o modelo consegue entender conceitos como a permanência de objetos – saber que uma bola ainda existe mesmo quando rola para trás de uma caixa – ou prever que um item colocado na borda de uma mesa provavelmente cairá. Estas habilidades são cruciais para máquinas que precisam navegar e interagir em ambientes do mundo real.

“O V-JEPA 2 representa um progresso significativo em direção ao nosso objetivo final de desenvolver uma inteligência avançada de máquina (AMI)”, afirmou a Meta em seu anúncio oficial.

Publicidade

Do laboratório para aplicações práticas

A empresa já está testando o modelo em robôs de laboratório, com resultados promissores. Estas máquinas demonstraram capacidade de manipular objetos desconhecidos, alcançar alvos específicos e posicionar itens em novos locais – tarefas que exigem uma compreensão intuitiva da física e das relações espaciais.

O potencial de aplicação é vasto, especialmente para tecnologias como robôs de entrega e veículos autônomos, que precisam tomar decisões rápidas baseadas na interpretação do ambiente físico. Com o V-JEPA 2, estas máquinas podem começar a antecipar os resultados de suas ações de maneira mais semelhante aos humanos.

Operando em um espaço “latente” simplificado, o modelo processa informações com maior eficiência, tornando-o mais rápido e adaptável a diferentes contextos – uma necessidade para sistemas que precisam responder em tempo real.

A corrida pelos modelos de mundo

A Meta não está sozinha nesta jornada. A DeepMind, do Google, está trabalhando em uma tecnologia similar chamada Genie, enquanto a startup World Labs, liderada por Fei-Fei Li, já garantiu US$ 230 milhões para desenvolver grandes modelos focados na interpretação do espaço físico.

Publicidade

Estes investimentos refletem uma tendência crescente no setor: o deslocamento do foco dos modelos puramente linguísticos para sistemas que compreendem o mundo físico. A própria Meta planeja investir US$ 14 bilhões na Scale AI e trazer o CEO Alexandr Wang para fortalecer sua estratégia de IA, segundo reportado pela CNBC.

Para fomentar o avanço coletivo nesta área, a empresa também lançou três novos benchmarks que permitem aos pesquisadores avaliar a capacidade de modelos de IA em raciocinar e aprender a partir de vídeos. Estas ferramentas são essenciais para medir quanto os sistemas realmente compreendem, preveem e planejam em cenários reais.

Com o V-JEPA 2, a Meta sinaliza claramente que o próximo campo de batalha da IA não será apenas o domínio da linguagem, mas a compreensão e interação com o mundo físico – um passo que a empresa considera crucial para o desenvolvimento de uma verdadeira inteligência artificial geral.

Publicidade
Publicidade
Destaques

Ofertas Imperdíveis

Garimpamos os melhores preços da semana. Economize com nossa curadoria exclusiva.

Ver Ofertas

Copyright © 2026 SoCientífica e a terceiros, quando indicado.