Alibaba cria IA que transforma imagem em vídeo; conheça o EMO

O Alibaba criou um novo sistema de IA chamado EMO (Emite Portrait Alive), que faz com que imagens se transformem em vídeos musicais ou cenas de conversas.

O sistema, descrito em um artigo de pesquisa publicado no arXiv, é capaz de criar movimentos faciais fluidos e expressivos e fazer com que a imagem reproduza áudios fornecidos para a IA. No vídeo de apresentação da ferramenta, é mostrado um vídeo da atriz Audrey Hepburn cantando uma música de Ed Sheeran, e uma mulher caracterizada como a Monalisa cantando Miley Cyrus.

“Técnicas tradicionais muitas vezes não conseguem capturar todo o espectro de expressões humanas e a singularidade dos estilos faciais individuais”, disse o autor Linrui Tian no artigo. “Para resolver essas questões, propomos o EMO, um novo framework que utiliza uma abordagem de síntese direta de áudio para vídeo, evitando a necessidade de modelos 3D intermediários ou pontos de referência faciais.”

This is mind blowing.

This AI can make single image sing, talk, and rap from any audio file expressively! 🤯

Introducing EMO: Emote Portrait Alive by Alibaba.

10 wild examples: 🧵👇

1. AI Lady from Sora singing Dua Lipa pic.twitter.com/CWFJF9vy1M
— Min Choi (@minchoi) February 28, 2024

O EMO tem uma tecnologia de modelo de difusão que facilita para o desenvolvimento de vídeos realistas com base em imagens fixas. Os pesquisadores treinaram o modelo com um conjunto de dados de mais de 250 horas de vídeos de cabeças falantes em filmes, programas de TV e concertos.

“Resultados experimentais demonstram que o EMO é capaz de produzir não apenas vídeos convincentes de fala, mas também vídeos de canto em vários estilos, superando significativamente as metodologias de última geração existentes em termos de expressividade e realismo”, afirma o artigo.

O problema dessa IA está no uso inadequado da ferramenta para espalhar desinformação e vídeos sem consentimento da pessoa. Os pesquisadores afirmam que planejam explorar métodos para detectar vídeos sintéticos.

Acesse aqui e saiba como você e o Startupi podem se tornar parceiros para impulsionar seus esforços de comunicação. Startupi – Jornalismo para quem lidera a inovação.

Assine nossa newsletter e receba em seu email todas as novidades, antes.

Tendências da Black Friday 2024: o que os consumidores mais desejam

Startup gaúcha auxilia governo de Valência após inundação histórica

KGeN capta R$ 55 milhões e reforça o controle de dados dos jogadores no mercado global

Clinia capta R$ 2 milhões em rodada pré-seed

A ilusão que alimenta a disrupção

Alibaba cria IA que transforma imagem em vídeo; conheça o EMO

Sistema é capaz de criar movimentos faciais fluidos e expressivos e fazer com que a imagem reproduza áudios fornecidos para a IA

Tendências da Black Friday 2024: o que os consumidores mais desejam

Startup gaúcha auxilia governo de Valência após inundação histórica

KGeN capta R$ 55 milhões e reforça o controle de dados dos jogadores no mercado global

Como criar imagens no estilo Disney Pixar usando IA?

Saiba como ativar o “modo Diabo” do ChatGPT e confira algumas respostas

Conheça 5 aplicativos que utilizam IA para te ajudar a montar o roteiro da sua próxima viagem

Begen: IA generativa e expansão global marcam trajetória da startup brasileira no e-commerce

Além do ChatGPT: conheça 15 IAs que podem resolver desafios do seu dia a dia

Assine nossa newsletter e receba em seu email todas as novidades, antes.

Projeto mantido por:

Assine nossa newsletter e receba em seu email todas as novidades, antes.

Alibaba cria IA que transforma imagem em vídeo; conheça o EMO

Sistema é capaz de criar movimentos faciais fluidos e expressivos e fazer com que a imagem reproduza áudios fornecidos para a IA

Curtir isso:

LEIA TAMBÉM

Assine nossa newsletter e receba em seu email todas as novidades, antes.

Projeto mantido por: