Connect with us

Tecnologia

Nova inteligência artificial V-JEPA 2 da Meta ajuda robôs a prever e planejar usando apenas vídeos brutos

Published

on

A Meta está redefinindo como máquinas interpretam o mundo físico com seu mais recente avanço em inteligência artificial. Anunciado recentemente, o V-JEPA 2 representa um salto significativo na capacidade das máquinas de compreender a realidade física, abrindo caminho para robôs mais intuitivos e sistemas de IA capazes de pensar antes de agir em ambientes complexos do mundo real.

Um novo modelo para entender o mundo físico

O V-JEPA 2 foi desenvolvido com uma abordagem revolucionária: aprender exclusivamente a partir de dados de vídeo não rotulados. Diferentemente dos sistemas convencionais que dependem de extensos conjuntos de dados anotados manualmente, este modelo observa como objetos e pessoas interagem no mundo real, extraindo padrões e princípios físicos fundamentais como gravidade e movimento.

A Meta afirma que o modelo consegue entender conceitos como a permanência de objetos – saber que uma bola ainda existe mesmo quando rola para trás de uma caixa – ou prever que um item colocado na borda de uma mesa provavelmente cairá. Estas habilidades são cruciais para máquinas que precisam navegar e interagir em ambientes do mundo real.

Advertisement

“O V-JEPA 2 representa um progresso significativo em direção ao nosso objetivo final de desenvolver uma inteligência avançada de máquina (AMI)”, afirmou a Meta em seu anúncio oficial.

Do laboratório para aplicações práticas

A empresa já está testando o modelo em robôs de laboratório, com resultados promissores. Estas máquinas demonstraram capacidade de manipular objetos desconhecidos, alcançar alvos específicos e posicionar itens em novos locais – tarefas que exigem uma compreensão intuitiva da física e das relações espaciais.

O potencial de aplicação é vasto, especialmente para tecnologias como robôs de entrega e veículos autônomos, que precisam tomar decisões rápidas baseadas na interpretação do ambiente físico. Com o V-JEPA 2, estas máquinas podem começar a antecipar os resultados de suas ações de maneira mais semelhante aos humanos.

Advertisement

Operando em um espaço “latente” simplificado, o modelo processa informações com maior eficiência, tornando-o mais rápido e adaptável a diferentes contextos – uma necessidade para sistemas que precisam responder em tempo real.

A corrida pelos modelos de mundo

A Meta não está sozinha nesta jornada. A DeepMind, do Google, está trabalhando em uma tecnologia similar chamada Genie, enquanto a startup World Labs, liderada por Fei-Fei Li, já garantiu US$ 230 milhões para desenvolver grandes modelos focados na interpretação do espaço físico.

Estes investimentos refletem uma tendência crescente no setor: o deslocamento do foco dos modelos puramente linguísticos para sistemas que compreendem o mundo físico. A própria Meta planeja investir US$ 14 bilhões na Scale AI e trazer o CEO Alexandr Wang para fortalecer sua estratégia de IA, segundo reportado pela CNBC.

Advertisement

Para fomentar o avanço coletivo nesta área, a empresa também lançou três novos benchmarks que permitem aos pesquisadores avaliar a capacidade de modelos de IA em raciocinar e aprender a partir de vídeos. Estas ferramentas são essenciais para medir quanto os sistemas realmente compreendem, preveem e planejam em cenários reais.

Com o V-JEPA 2, a Meta sinaliza claramente que o próximo campo de batalha da IA não será apenas o domínio da linguagem, mas a compreensão e interação com o mundo físico – um passo que a empresa considera crucial para o desenvolvimento de uma verdadeira inteligência artificial geral.

Advertisement
Advertisement
Colagem de produtos em oferta

Aproveite nossas ofertas imperdíveis

Garimpamos as promoções mais quentes da internet para você economizar no que realmente vale a pena.

VER OFERTAS

Copyright © 2025 SoCientífica e a terceiros, quando indicado.