Ouça este artigo
- Alibaba lançou o modelo de IA QwQ-32B com 32 bilhões de parâmetros.
- O QwQ-32B é comparável ao DeepSeek, oferecendo boa relação custo-benefício.
- Testes mostraram que menos parâmetros podem ser mais eficientes.
- Ações da Alibaba subiram 8,4% após o anúncio do QwQ-32B.
- O modelo utiliza aprendizado por reforço para melhorar seu desempenho.
Nova DeepSeek? Alibaba Lança IA Boa, Bonita e Barata
A Alibaba apresentou recentemente o novo modelo de inteligência artificial QwQ-32B. O anúncio ocorreu em 6 de outubro, e a empresa demonstra otimismo em relação a essa tecnologia. O QwQ-32B é projetado para competir diretamente com o DeepSeek, que teve grande impacto no mercado no início do ano.
O Segredo da Tecnologia
O QwQ-32B possui 32 bilhões de parâmetros, garantindo desempenho semelhante a modelos de ponta com um número muito maior de parâmetros. A Alibaba enfatiza que menos parâmetros podem significar mais eficiência, desafiando as noções tradicionais de estruturação de IAs.
A Alibaba repostou uma mensagem do braço de IA, Qwen, destacando o lançamento do QwQ-32B e sua capacidade de rivalizar com modelos como o DeepSeek-R1. Um gráfico foi apresentado, comparando o desempenho do QwQ-32B com outros modelos, como o o1-mini da OpenAI e o DeepSeek-R1.
Modelo | Parâmetros (bilhões) | Desempenho Comparativo |
---|---|---|
QwQ-32B | 32 | Semelhante ao DeepSeek-R1 |
DeepSeek-R1 | 175 | Alto |
o1-mini | 13 | Moderado |
Como Faço Para Testar as IAs da Alibaba?
Os chatbots da Qwen estão disponíveis no site da empresa, permitindo que os usuários interajam com a nova tecnologia. Para testar, basta acessar o site da Alibaba e clicar na seção dedicada aos chatbots. Essa acessibilidade é uma estratégia da empresa para incentivar a interação e o feedback dos usuários.
Será Que Vem uma Nova DeepSeek Por Aí?
Após o anúncio do QwQ-32B, as ações da Alibaba subiram 8,4%, atingindo o maior valor desde o final de 2021. Essa reação positiva do mercado indica alta confiança na nova tecnologia. O blog da Qwen revelou que a equipe utilizou a mesma metodologia aplicada no desenvolvimento do DeepSeek, gerando resultados promissores.
O conceito de Scaling Reinforcement Learning (RL) é um dos pilares do desenvolvimento do QwQ-32B. Essa abordagem pode melhorar o desempenho do modelo, superando métodos convencionais de pré-treinamento e pós-treinamento. Estudos recentes mostram que o RL pode aprimorar significativamente as capacidades de raciocínio das IAs.
O Impacto do Aprendizado por Reforço
O aprendizado por reforço permite que um agente autônomo aprenda a realizar tarefas através de tentativa e erro, sem depender de instruções humanas. Isso abre novas possibilidades para a inteligência artificial, permitindo que a máquina desenvolva suas próprias estratégias para resolver problemas.
Esses avanços demonstram o potencial transformador do RL e abrem caminho para mais inovações na busca pela inteligência artificial geral, afirmou a equipe da Qwen.