A nova versão do ChatGPT da OpenAI, que está sendo implementada nas próximas semanas, permitirá que os usuários interajam com o bot usando a voz. Basta fazer uma pergunta verbalmente para que o serviço converta o áudio em texto, envie-o ao ChatGPT e, em seguida, converta a resposta novamente em áudio para o usuário.

Segundo o The Verge, o ChatGPT oferecerá cinco opções de voz, cada uma projetada para fornecer “áudio semelhante ao humano”. Embora essa versão inicial ofereça uma seleção limitada de vozes, a OpenAI planeja expandir seu repertório no futuro.

Outra adição significativa ao ChatGPT é a capacidade de processar consultas de fotos. Os usuários agora podem carregar uma imagem e fazer perguntas ao bot relacionadas ao conteúdo da imagem.

A OpenAI reconhece que foram estabelecidas limitações com relação à capacidade do ChatGPT de comentar sobre indivíduos. No entanto, pode haver áreas cinzentas onde a interpretação é necessária. Por exemplo, os usuários poderiam carregar fotos de figuras históricas ou até mesmo de vizinhos, levantando questões sobre privacidade e considerações éticas.

Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.

Sound on 🔊 pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023

A OpenAI desenvolveu o recurso de consulta de fotos como um meio de refinar as respostas do ChatGPT. Os usuários podem carregar imagens e fazer perguntas para ajudar a ajustar as respostas do bot. Por exemplo, um usuário pode carregar uma foto de sua bicicleta e perguntar sobre como abaixar o assento.

O ChatGPT forneceria instruções e, se forem necessários mais esclarecimentos, o usuário pode carregar imagens adicionais para obter orientações mais específicas. Esse processo iterativo visa aumentar a precisão e a eficácia das respostas do ChatGPT.

Atualmente, o Google Lens oferece funcionalidade semelhante, permitindo que os usuários analisem e obtenham informações de imagens. No entanto, o recurso de consulta de fotos do ChatGPT se diferencia por oferecer um refinamento interativo das consultas.

Enquanto o Google Lens oferece resultados imediatos com base no reconhecimento de imagens, a abordagem do ChatGPT permite que os usuários busquem esclarecimentos e obtenham respostas mais personalizadas. Esse processo iterativo pode ser vantajoso em cenários em que são necessárias instruções precisas ou informações detalhadas.

ChatGPT agora consegue conversar por voz e analisar imagens

Últimos artigos

Assim como em ‘Twisters’, é possível um ser humano parar um tornado?

Notebook Acer Aspire 5 está saindo pelo menor preço histórico; são 35% de desconto

Água na Amazônia enfrenta aquecimento generalizado, segundo cientistas

Compre o Smartwatch My Watch I Fit com 25% de desconto na Amazon

Matérias relacionadas

IAs são confiáveis para identificar espécies?

Mira Murati afirma que GPT-5 terá o nível de inteligência de alguém com doutorado

Mesmo para as IAs mais avançadas, este quebra-cabeça lógico simples é um desafio

IA ajuda a criar imã de ferro mais forte do mundo