O Grupo Meta, de Mark Zuckerberg, anunciou sua nova solução no mundo de IA generativas com vozes, o Voicebox, um modelo de IA de última geração que pode executar tarefas de geração de voz, como edição, amostragem e estilização, para as quais não foi especificamente treinado através da aprendizagem em contexto.
“O mapeamento não-determinístico é útil porque permite ao Voicebox aprender a partir de dados de fala variados sem que essas variações tenham de ser cuidadosamente identificadas. Isto significa que o Voicebox pode treinar com dados mais diversificados e numa escala de dados muito maior “, comenta o Grupo Meta em seu anúncio de lançamento.
Confira aqui o Mídia Kit do Startupi!
O Voicebox pode produzir clipes de áudio de alta qualidade e editar áudios pré-gravados, como remover buzinas de carros ou latidos, enquanto preserva o conteúdo e o estilo do áudio principal. O modelo é também multilingue e pode produzir discurso em seis línguas.
Meta deve incluir o Voicebox em outras ferramentas
A Meta ainda anunciou que pretende incluir o Voicebox em outras ferramentas do grupo, como dar vozes naturais a assistentes virtuais e a personagens no Metaverso. Poderão permitir que pessoas com deficiência visual ouçam mensagens escritas de amigos lidas pela IA nas suas vozes, dar aos criadores novas ferramentas para criar e editar facilmente faixas de áudio para vídeos e muito mais.
Com uma amostra de voz e uma passagem de texto em inglês, francês, alemão, espanhol, polaco ou português, o Voicebox pode produzir ou ler um texto nessa língua. No futuro esta capacidade poderá ser utilizada para ajudar as pessoas a comunicar de forma natural e autêntica, mesmo que não falem as mesmas línguas.
Acesse aqui e saiba como você e o Startupi podem se tornar parceiros para impulsionar seus esforços de comunicação. Startupi – Jornalismo para quem lidera a inovação.