Alibaba Lança Novo Modelo de IA QwQ-32B

Ouça este artigo

Alibaba lançou o modelo de IA QwQ-32B com 32 bilhões de parâmetros.

O QwQ-32B é comparável ao DeepSeek, oferecendo boa relação custo-benefício.

Testes mostraram que menos parâmetros podem ser mais eficientes.

Ações da Alibaba subiram 8,4% após o anúncio do QwQ-32B.

O modelo utiliza aprendizado por reforço para melhorar seu desempenho.

Nova DeepSeek? Alibaba Lança IA Boa, Bonita e Barata

A Alibaba apresentou recentemente o novo modelo de inteligência artificial QwQ-32B. O anúncio ocorreu em 6 de outubro, e a empresa demonstra otimismo em relação a essa tecnologia. O QwQ-32B é projetado para competir diretamente com o DeepSeek, que teve grande impacto no mercado no início do ano.

O Segredo da Tecnologia

O QwQ-32B possui 32 bilhões de parâmetros, garantindo desempenho semelhante a modelos de ponta com um número muito maior de parâmetros. A Alibaba enfatiza que menos parâmetros podem significar mais eficiência, desafiando as noções tradicionais de estruturação de IAs.

A Alibaba repostou uma mensagem do braço de IA, Qwen, destacando o lançamento do QwQ-32B e sua capacidade de rivalizar com modelos como o DeepSeek-R1. Um gráfico foi apresentado, comparando o desempenho do QwQ-32B com outros modelos, como o o1-mini da OpenAI e o DeepSeek-R1.

Modelo	Parâmetros (bilhões)	Desempenho Comparativo
QwQ-32B	32	Semelhante ao DeepSeek-R1
DeepSeek-R1	175	Alto
o1-mini	13	Moderado

Como Faço Para Testar as IAs da Alibaba?

Os chatbots da Qwen estão disponíveis no site da empresa, permitindo que os usuários interajam com a nova tecnologia. Para testar, basta acessar o site da Alibaba e clicar na seção dedicada aos chatbots. Essa acessibilidade é uma estratégia da empresa para incentivar a interação e o feedback dos usuários.

Será Que Vem uma Nova DeepSeek Por Aí?

Após o anúncio do QwQ-32B, as ações da Alibaba subiram 8,4%, atingindo o maior valor desde o final de 2021. Essa reação positiva do mercado indica alta confiança na nova tecnologia. O blog da Qwen revelou que a equipe utilizou a mesma metodologia aplicada no desenvolvimento do DeepSeek, gerando resultados promissores.

O conceito de Scaling Reinforcement Learning (RL) é um dos pilares do desenvolvimento do QwQ-32B. Essa abordagem pode melhorar o desempenho do modelo, superando métodos convencionais de pré-treinamento e pós-treinamento. Estudos recentes mostram que o RL pode aprimorar significativamente as capacidades de raciocínio das IAs.

O Impacto do Aprendizado por Reforço

O aprendizado por reforço permite que um agente autônomo aprenda a realizar tarefas através de tentativa e erro, sem depender de instruções humanas. Isso abre novas possibilidades para a inteligência artificial, permitindo que a máquina desenvolva suas próprias estratégias para resolver problemas.

Esses avanços demonstram o potencial transformador do RL e abrem caminho para mais inovações na busca pela inteligência artificial geral, afirmou a equipe da Qwen.