Tecnologia
Nova inteligência artificial V-JEPA 2 da Meta ajuda robôs a prever e planejar usando apenas vídeos brutos

A Meta está redefinindo como máquinas interpretam o mundo físico com seu mais recente avanço em inteligência artificial. Anunciado recentemente, o V-JEPA 2 representa um salto significativo na capacidade das máquinas de compreender a realidade física, abrindo caminho para robôs mais intuitivos e sistemas de IA capazes de pensar antes de agir em ambientes complexos do mundo real.
Um novo modelo para entender o mundo físico
O V-JEPA 2 foi desenvolvido com uma abordagem revolucionária: aprender exclusivamente a partir de dados de vídeo não rotulados. Diferentemente dos sistemas convencionais que dependem de extensos conjuntos de dados anotados manualmente, este modelo observa como objetos e pessoas interagem no mundo real, extraindo padrões e princípios físicos fundamentais como gravidade e movimento.
A Meta afirma que o modelo consegue entender conceitos como a permanência de objetos – saber que uma bola ainda existe mesmo quando rola para trás de uma caixa – ou prever que um item colocado na borda de uma mesa provavelmente cairá. Estas habilidades são cruciais para máquinas que precisam navegar e interagir em ambientes do mundo real.
“O V-JEPA 2 representa um progresso significativo em direção ao nosso objetivo final de desenvolver uma inteligência avançada de máquina (AMI)”, afirmou a Meta em seu anúncio oficial.
Do laboratório para aplicações práticas
A empresa já está testando o modelo em robôs de laboratório, com resultados promissores. Estas máquinas demonstraram capacidade de manipular objetos desconhecidos, alcançar alvos específicos e posicionar itens em novos locais – tarefas que exigem uma compreensão intuitiva da física e das relações espaciais.
O potencial de aplicação é vasto, especialmente para tecnologias como robôs de entrega e veículos autônomos, que precisam tomar decisões rápidas baseadas na interpretação do ambiente físico. Com o V-JEPA 2, estas máquinas podem começar a antecipar os resultados de suas ações de maneira mais semelhante aos humanos.
Operando em um espaço “latente” simplificado, o modelo processa informações com maior eficiência, tornando-o mais rápido e adaptável a diferentes contextos – uma necessidade para sistemas que precisam responder em tempo real.
A corrida pelos modelos de mundo
A Meta não está sozinha nesta jornada. A DeepMind, do Google, está trabalhando em uma tecnologia similar chamada Genie, enquanto a startup World Labs, liderada por Fei-Fei Li, já garantiu US$ 230 milhões para desenvolver grandes modelos focados na interpretação do espaço físico.
Estes investimentos refletem uma tendência crescente no setor: o deslocamento do foco dos modelos puramente linguísticos para sistemas que compreendem o mundo físico. A própria Meta planeja investir US$ 14 bilhões na Scale AI e trazer o CEO Alexandr Wang para fortalecer sua estratégia de IA, segundo reportado pela CNBC.
Para fomentar o avanço coletivo nesta área, a empresa também lançou três novos benchmarks que permitem aos pesquisadores avaliar a capacidade de modelos de IA em raciocinar e aprender a partir de vídeos. Estas ferramentas são essenciais para medir quanto os sistemas realmente compreendem, preveem e planejam em cenários reais.
Com o V-JEPA 2, a Meta sinaliza claramente que o próximo campo de batalha da IA não será apenas o domínio da linguagem, mas a compreensão e interação com o mundo físico – um passo que a empresa considera crucial para o desenvolvimento de uma verdadeira inteligência artificial geral.


Aproveite nossas ofertas imperdíveis
Garimpamos as promoções mais quentes da internet para você economizar no que realmente vale a pena.
VER OFERTAS