Ouça este artigo
- Nova Sonic é uma nova inteligência artificial de voz da Amazon.
- É 80% mais barato que o GPT-4 da OpenAI.
- Lançado em 8 de outubro, melhora a conversa com usuários.
- Possui baixa taxa de erro em ambientes ruidosos.
- A latência do Nova Sonic é mais rápida que a da OpenAI.

Nova Sonic: A Nova IA da Amazon que Conversa como Gente
Na última terça-feira, dia 08, a Amazon apresentou o Nova Sonic, um modelo de inteligência artificial (IA) que promete revolucionar a forma como as máquinas se comunicam. Essa IA processa voz de forma nativa e gera fala natural, permitindo que converse como uma pessoa. Essa inovação surge como resposta a modelos de voz avançados, como o ChatGPT.
Desempenho Competitivo
A Amazon afirma que o desempenho do Nova Sonic rivaliza com os modelos de voz mais sofisticados da OpenAI e do Google. Testes indicam que ele apresenta vantagens em velocidade, reconhecimento de fala e qualidade da conversação. O modelo é descrito como o modelo de voz por IA mais econômico do mercado, sendo cerca de 80% mais barato que o GPT-4 da OpenAI.
| Característica | Nova Sonic | GPT-4 |
|---|---|---|
| Custo | 80% mais barato | – |
| Latência média | 1,09 segundo | 1,18 segundo |
| Taxa de erro de palavras | 4,2% em vários idiomas | – |
| Precisão em ambientes ruidosos | 46,7% mais preciso | – |
Funcionalidades Avançadas
O Nova Sonic gera respostas rápidas e entende a intenção do usuário, mesmo diante de erros ou ruídos. Durante as conversas, a IA aguarda o momento certo para falar, considerando pausas e interrupções do usuário. Além disso, ela gera transcrições em texto, úteis para desenvolvedores aprimorarem aplicações.
Testes e Resultados
Os testes com o Nova Sonic mostram resultados impressionantes. No teste Multilingual LibriSpeech, que avalia o reconhecimento em diversos idiomas, a IA obteve uma taxa de erro de palavras de apenas 4,2% em idiomas como inglês, francês, italiano, alemão e espanhol. Em outro teste, o Augmented Multi Party Interaction, que mede a precisão em ambientes com múltiplos participantes e ruídos, o Nova Sonic superou o GPT-4 da OpenAI com uma precisão 46,7% superior.
Integração com a Alexa
Componentes do Nova Sonic já estão sendo utilizados na Alexa, a versão aprimorada do assistente de voz da Amazon. Rohit Prasad, vice-presidente sênior e cientista-chefe de IA Geral da Amazon, explicou que o Nova Sonic resulta da experiência da empresa com grandes sistemas de orquestração, a infraestrutura que suporta a Alexa. Essa integração permite acesso a informações em tempo real e interação com aplicativos externos de maneira mais eficiente.
Visão Futura: Inteligência Artificial Geral
Prasad revelou que o Nova Sonic faz parte da estratégia da Amazon para desenvolver uma Inteligência Artificial Geral (AGI), capaz de realizar qualquer tarefa que um ser humano pode fazer em um computador. Essa ambição coloca a Amazon em um caminho interessante, onde o desenvolvimento contínuo da IA pode levar a inovações significativas no futuro.
Velocidade e Eficiência
A velocidade do Nova Sonic é um destaque importante. Com uma latência média de 1,09 segundo, ele se mostra mais rápido que o GPT-4 da OpenAI, que possui uma latência de 1,18 segundo, segundo análise da Artificial Analysis. Essa rapidez é crucial para proporcionar uma experiência de conversa mais fluida e natural.


