Google apresentou o Gemini Live, uma nova funcionalidade de conversação por voz, como resposta ao Advanced Voice Mode da OpenAI. Anunciado no evento “Made by Google 2024”, a ferramenta possibilita diálogos mais aprofundados com o chatbot Gemini, movido por inteligência artificial generativa, diretamente em smartphones.
A principal inovação é o motor de fala aprimorado, que proporciona conversas mais coerentes e realistas, além de permitir que os usuários interrompam o chatbot para fazer perguntas adicionais em tempo real. A ferramenta é totalmente “viva-voz”, permitindo que o usuário continue a conversa mesmo com o aplicativo em segundo plano ou o celular bloqueado.
“O Gemini Live é uma experiência de conversação que permite que você tenha conversas fluidas com o Gemini”, informou a empresa em comunicado. “Você pode até interromper no meio da resposta para se aprofundar em um ponto específico, ou pausar uma conversa e voltar a ela mais tarde. É como ter um ajudante no seu bolso com quem você pode conversar sobre novas ideias ou se preparar para uma conversa importante”.
Gemini Live é pago e deve receber novas funcionalidades
A IA também oferece uma memória aprimorada, capaz de processar grandes volumes de dados antes de formular respostas, o que pode ser útil em situações como a preparação para entrevistas de emprego. Algumas funcionalidades, como a entrada multimodal, ainda não estão disponíveis, mas devem ser lançadas até o final do ano.
Por enquanto, o chatbot por voz está disponível apenas em inglês e para assinantes do plano Google One AI Premium, que custa US$ 20 por mês. Nas próximas semanas, a Google planeja liberar recursos adicionais, incluindo a integração do Gemini a outros aplicativos em dispositivos Android e a disponibilidade em aparelhos iOS.
Aproveite e junte-se ao nosso canal no WhatsApp para receber conteúdos exclusivos em primeira mão. Clique aqui para participar. Startupi | Jornalismo para quem lidera inovação!