Software de IA promete incluir efeitos sonoros aos vídeos de Sora

Leandro da Silva Monteiro
Imagem: Pixabay

Nessa semana a OpenAI, empresa de inteligência artificial (IA) que vem chamando atenção de todo mundo no ramo da tecnologia, revelou o seu mais novo produto: Sora. Esse modelo de IA generativa de texto para vídeo pretende revolucionar a indústria gerando vídeos de até um minuto de duração enquanto mantém a qualidade visual segundo os comandos, prompts em inglês, fornecidos pelos seus usuários.

A inteligência artificial é um tema que já ronda o campo da tecnologia há um bom tempo. Porém, mais recentemente, ela passou a atrair mais olhares com a chegada de softwares de IA generativa. Essas são tecnologias capazes de criar novos conteúdos, como texto, imagens, música, áudio e vídeos de acordo com as solicitações dos usuários. Para isso, esses softwares usam grandes modelos de linguagem que contam com conjunto de dados de treinamento usado para criá-los.

A OpenIA ficou amplamente conhecida para além da bolha de tecnologia ao lançar o ChatGPT, em 2022, um software para processamento de texto e geração de respostas de forma natural de acordo com o contexto. O ChatGPT se tornou imensamente popular angariando mais de 100 milhões de usuários num curto espaço de tempo e segue sendo um dos softwares mais utilizados na internet. 

Mas da mesma forma que as IAs geram interesse pelo seu potencial impacto na economia global elas também trazem preocupações em relação ao mercado de trabalho. IAs generativas que produzem imagens vem sendo largamente criticadas por artistas que alegam que tais plataformas estão se utilizando de trabalho alheio sem dar a devida remuneração.

De qualquer modo, muitas empresas têm se aproveitado do entusiasmo que circunda as tecnologias de IAs para criarem seus próprios serviços e softwares revolucionários. Uma delas é a ElevenLabs, startup norte-americana que está apostando na pesquisa de voz por IA. Com o anúncio do Sora da OpenAI, a ElevenLabs oportunamente também anunciou seu software que promete gerar efeitos sonoros como uma forma de complementar os vídeos gerados no Sora.

Como o Sora e a ElevenLabs irão revolucionar a geração de conteúdo

A plataforma da OpenAI quer trazer uma nova era cinematográfica com seus vídeos de um minuto gerados rapidamente através de simples comandos. Contudo, até o momento o software possui a desvantagem de apenas gerar vídeos silenciosos. Portanto, a ElevenLabs está mirando nessa oportunidade para satisfazer uma necessidade do novo mercado que o Sora irá produzir.

A empresa fez o anúncio no seu próprio blog que é atualizado constantemente com as suas mais recentes atividades. A ElevenLabs vai trabalhar numa forma de IA que é capaz de gerar clipes de áudio com precisão e qualidade. Ela já é conhecida por um software de síntese de voz que consegue traduzir para outro idioma sem alterações na voz original. Agora ela utilizou sua nova IA, chamada de Sound Effects, para gerar efeitos sonoros que acompanham os vídeos produzidos no Sora.

Para criar os efeitos sonoros a ElevenLabas utilizou prompts simples como os de ‘ondas quebrando’, ‘metal batendo’, ‘pássaros cantando’ e ‘motor de carro de corrida’. Por enquanto a IA só reconhece solicitações imputadas de forma escrita, mas a ideia é dar a capacidade do software gerar uma trilha sonora automaticamente analisando um vídeo. Como as inteligências artificiais vêm evoluindo com velocidades impressionantes, a funcionalidade não deve demorar muito a surgir no mercado, seja pela ElevenLabs ou até outra empresa do ramo.

O Sound Effects segue em desenvolvimento e portanto o seu acesso não foi liberado ao público. A empresa também não indicou quaisquer datas de lançamentos, mas você pode se inscrever numa lista de espera para ser um dos primeiros usuários quando o software for aberto ao público. Se você é um dos interessados em testar a plataforma, é só preencher o formulário que se encontra no blog da ElevenLabs. Para poupar o tempo do leitor, basta clicar aqui.

Compartilhar