Voicebox: Conheça a IA capaz de gerar áudio.

banner_posts

A Meta está entrando de vez no mercado de inteligência artificial com o Voicebox, uma IA capaz de gerar áudio e trabalhar de forma surpreendente. As maiores empresas do mundo estão trabalhando e acompanhando as tendências da internet, como inteligência artificial, metaverso e blockchain.

Chegou a vez da Meta de entrar nesse mercado com uma ferramenta incrível. Entenda como o Voicebox funciona e quais são as características dessa inteligência artificial.

Voicebox

Ilustração Voicebox.
Ilustração Voicebox.

Em junho, a Meta anunciou o Voicebox, um modelo de inteligência artificial baseado em aprendizado de máquina capaz de gerar fala por meio de texto. 

O Voicebox é uma inteligência artificial generativa, assim como o ChatGPT, mas que atua apenas na geração de fala. Uma das diferenças do Voicebox de outros modelos de geração de fala por texto é a sua capacidade de realizar muitas tarefas, pois a IA consegue aprender novas tarefas para as quais não obteve treinamento.

O aplicativo é poderoso e não gera apenas áudio, mas segundo a Meta, consegue remover ruídos, buzinas de carro e até latidos de cachorro, preservando o conteúdo do áudio.

O modelo foi lançado com seis idiomas: português, francês, alemão, polonês ou espanhol, mas novos idiomas podem ser lançados no futuro. 

TTS do Voicebox:

Modelos TTS (Speech-to-speak) estão surgindo no mercado, como o TTS da Microsoft, mas dificilmente são gratuitos por causa da capacidade de reconhecer vozes e replicá-las. 

A própria Meta inseriu uma nota informando sobre os riscos da IA generativa, em especial os TTS, pois podem oferecer certos riscos, como roubo de identidade. 

Desse modo, essas ferramentas são treinadas com uma grande quantidade de dados, como amostras de voz. A Meta utilizou a técnica de “flow matching” fugindo do padrão das demais IA generativas. 

A técnica utilizada permite que a IA do Voicebox tenha um treinamento mais abrangente sem a necessidade de rotular cada áudio inserido no treinamento. Os pesquisadores utilizaram mais de 50 mil horas de áudios e transcrições de audiolivros para o treinamento do Voicebox.

Características do Voicebox

O Voicebox possui características poderosas para uma ferramenta TTS. Algumas dessas características são:

Transferência entre idiomas:

Em suma, o Voicebox é capaz de ler e gerar voz em diversos idiomas, ajudando na compreensão do usuário. Ele também consegue transferir as amostras entre os idiomas.

Amostra de apenas 2 segundos:

O Voicebox precisa de apenas dois segundos de um áudio para conseguir sintetizar e replicar ele em novos áudios. Assim, com essa capacidade, o aplicativo pode gerar voz para personagens de jogos, assistentes virtuais, filmes e outros produtos com muita fidelidade.

Edição poderosa e sem treinamento:

O Voicebox consegue realizar edições de áudio incríveis porque possui uma alta capacidade para aprender. Por exemplo, o aplicativo consegue pegar um áudio com ruídos e remover esses ruídos, substituir uma fala não compreendida, palavras mal ditas ou corrompidas sem precisar regravar o áudio, sem que o usuário tenha conhecimento de edição.

banner_posts

TTS no metaverso

Os aplicativos TTS são um recurso importante para o futuro do metaverso, pois podem auxiliar no desenvolvimento do metaverso de diversas maneiras. 

O metaverso pode possuir diferentes tipos de experiências e ambientes digitais, então, com TTS capazes de gerar voz por meio de texto, as plataformas poderiam oferecer experiências mais ricas e reais. 

Por exemplo, poderiam ser utilizados para aumentar a interação entre personagens não jogáveis com os usuários, aumentar a acessibilidade e também servir como assistentes de voz dentro do metaverso.

Uma outra possibilidade para aplicar TTS no metaverso consiste em ambientes de sala de aula ou trabalho, onde as ferramentas podem ler livros didáticos, tornar reuniões mais interessantes entre os avatares, facilitar na comunicação e criar um ambiente inclusivo.

De fato, o potencial do metaverso cresce cada vez mais com ferramentas de inteligência artificial e um dos beneficiados é o Agrispace, o metaverso do agronegócio.

A inteligência artificial (IA) desempenha um papel fundamental no desenvolvimento e aprimoramento do metaverso. A IA pode ser aplicada em várias áreas dentro do metaverso para melhorar a interação entre os usuários, criar personagens virtuais inteligentes, personalizar o conteúdo e fornecer suporte em tempo real. Saiba como levar sua empresa para o metaverso e aproveitar dos benefícios que os ambientes digitais podem proporcionar: clique aqui.

INFORMAÇÕES SOBRE AGRISPACE – O METAVERSO DO AGRO [email protected] ou pelo WhatsApp clicando Aqui!!

Quer ficar por dentro de nossas postagens e notícias, entre em nosso canal no WhatsApp e venha conosco, descobrir o mundo do metaverso

Deixar um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.