A nova versão do ChatGPT da OpenAI, que está sendo implementada nas próximas semanas, permitirá que os usuários interajam com o bot usando a voz. Basta fazer uma pergunta verbalmente para que o serviço converta o áudio em texto, envie-o ao ChatGPT e, em seguida, converta a resposta novamente em áudio para o usuário.
Segundo o The Verge, o ChatGPT oferecerá cinco opções de voz, cada uma projetada para fornecer “áudio semelhante ao humano”. Embora essa versão inicial ofereça uma seleção limitada de vozes, a OpenAI planeja expandir seu repertório no futuro.
Outra adição significativa ao ChatGPT é a capacidade de processar consultas de fotos. Os usuários agora podem carregar uma imagem e fazer perguntas ao bot relacionadas ao conteúdo da imagem.
A OpenAI reconhece que foram estabelecidas limitações com relação à capacidade do ChatGPT de comentar sobre indivíduos. No entanto, pode haver áreas cinzentas onde a interpretação é necessária. Por exemplo, os usuários poderiam carregar fotos de figuras históricas ou até mesmo de vizinhos, levantando questões sobre privacidade e considerações éticas.
A OpenAI desenvolveu o recurso de consulta de fotos como um meio de refinar as respostas do ChatGPT. Os usuários podem carregar imagens e fazer perguntas para ajudar a ajustar as respostas do bot. Por exemplo, um usuário pode carregar uma foto de sua bicicleta e perguntar sobre como abaixar o assento.
O ChatGPT forneceria instruções e, se forem necessários mais esclarecimentos, o usuário pode carregar imagens adicionais para obter orientações mais específicas. Esse processo iterativo visa aumentar a precisão e a eficácia das respostas do ChatGPT.
Atualmente, o Google Lens oferece funcionalidade semelhante, permitindo que os usuários analisem e obtenham informações de imagens. No entanto, o recurso de consulta de fotos do ChatGPT se diferencia por oferecer um refinamento interativo das consultas.
Enquanto o Google Lens oferece resultados imediatos com base no reconhecimento de imagens, a abordagem do ChatGPT permite que os usuários busquem esclarecimentos e obtenham respostas mais personalizadas. Esse processo iterativo pode ser vantajoso em cenários em que são necessárias instruções precisas ou informações detalhadas.