Nesta terça-feira (3), durante o evento anual AWS re:Invent, em Las Vegas, a Amazon apresentou o Amazon Nova, uma nova geração de ferramentas de inteligência artificial projetadas para empresas. Com a proposta de ser acessível e eficiente, o Amazon Nova permite criar textos, imagens e vídeos de maneira rápida e econômica.
A principal novidade do Amazon Nova está em seus modelos de IA, que foram desenvolvidos para diferentes tipos de tarefas:
Amazon Nova Micro: foca na criação de textos e respostas rápidas, ideal para chatbots e outros sistemas que precisam ser ágeis e econômicos.
Amazon Nova Lite, Pro e Premier: trabalham com diferentes tipos de conteúdo, como texto, imagens e vídeos, podendo ser usados para traduzir ou interpretar dados visuais, como gráficos ou documentos.
Amazon Nova Canvas: cria imagens de qualidade profissional, com opções de personalização e edição.
Amazon Nova Reel: gera vídeos curtos, perfeitos para campanhas publicitárias e marketing. No momento, a ferramenta consegue gerar vídeos de até 6 segundos, mas será possível criar conteúdo até 2 minutos já nos próximos meses.
Essas ferramentas são integradas ao Amazon Bedrock, um serviço que reúne modelos de IA e oferece acesso simplificado por meio de uma API. Empresas podem ajustar os modelos para suas necessidades específicas, como criar conteúdos baseados em seus próprios dados ou treinar sistemas menores e mais rápidos.
Além disso, o Amazon Nova foi projetado para ser mais econômico. De acordo com a Amazon, seus modelos custam até 75% menos do que as opções equivalentes no mercado, mantendo qualidade e velocidade.
A novidade já está sendo adotada por grandes empresas como SAP, Palantir e Shutterstock, que estão utilizando o Amazon Nova para melhorar processos como criação de imagens, geração de conteúdo e análise de dados.
A Amazon também anunciou planos para expandir as funcionalidades do Nova em 2025. No primeiro trimestre, será lançado um modelo de reconhecimento de voz capaz de entender conversas em tempo real, analisando não só o conteúdo falado, mas também o tom e o ritmo da fala. A partir do meio do ano, a empresa pretende introduzir um modelo avançado que poderá receber diferentes tipos de entrada – como texto, imagens, áudio e vídeo – e gerar saídas em qualquer um desses formatos. Esse recurso promete facilitar tarefas como traduzir conteúdos entre mídias, editar arquivos multimodais e criar agentes de IA mais completos e versáteis.
Aproveite e junte-se ao nosso canal no WhatsApp para receber conteúdos exclusivos em primeira mão. Clique aqui para participar. Startupi | Jornalismo para quem lidera inovação!