- Novo modelo de IA de raciocínio desenvolvido pela LG AI Research, EXAONE Deep, foi apresentado
- Modelo de raciocínio de alto desempenho, essencial para a transição para a era da Agentic AI
- Capacidade de raciocínio excepcional comprovada nas áreas de matemática, ciência e programação
- Principais características:
- Matemática: desempenho superior em benchmarks avançados de matemática em comparação com modelos concorrentes (alcançando desempenho equivalente com um modelo menor)
- Ciência & programação: 1º lugar em benchmarks principais (modelos 7.8B e 2.4B)
- MMLU: melhor desempenho entre os modelos nacionais (modelo 32B)
- Incluído na lista de modelos de IA notáveis da Epoch AI, com desempenho validado (o segundo modelo EXAONE a entrar na lista, após o EXAONE 3.5)
Desempenho excepcional em matemática
- Todos os modelos EXAONE Deep (32B, 7.8B, 2.4B) obtiveram a maior pontuação na seção de matemática do exame CSAT de 2025
- EXAONE Deep 32B:
- Pontuação de 94.5 no CSAT de matemática e 90.0 no AIME 2024
- Desempenho equivalente ao modelo DeepSeek-R1 (671B) no AIME 2025
- Em especial, mostrou excelente desempenho no AIME, um benchmark de alta dificuldade, comprovando eficiência de treinamento e de custos
- EXAONE Deep 7.8B & 2.4B:
- 1º lugar em benchmarks principais nas categorias de modelos leves e modelos on-device, respectivamente
- Modelo 7.8B: MATH-500 94.8, AIME 2025 59.6
- Modelo 2.4B: MATH-500 92.3, AIME 2024 47.9
- Principais benchmarks de matemática:
- CSAT (College Scholastic Ability Test)
- AIME (American Invitational Mathematics Examination)
- MATH-500
Excelência em ciência e programação
- Também demonstrou desempenho superior ao de modelos concorrentes nas áreas de ciência e programação
- EXAONE Deep 32B:
- 66.1 no teste GPQA Diamond (avalia capacidade de resolver problemas científicos em nível de PhD)
- 59.5 no LiveCodeBench (avalia capacidade de programação), superando modelos de IA de raciocínio de porte semelhante
- Indica alto potencial de uso também em áreas que exigem conhecimento especializado
- EXAONE Deep 7.8B & 2.4B:
- 1º lugar no GPQA Diamond e no LiveCodeBench
- Após o modelo EXAONE 3.5 2.4B, consolida-se como modelo líder global na categoria de modelos leves/on-device
- Principais benchmarks de ciência e programação:
- GPQA Diamond
- LiveCodeBench
9 comentários
Uau, torço pela LG. Não é praticamente o melhor LLM do nosso país? Ouvi dizer que também usam muito bem isso em sistemas internos... Mas a licença é uma pena. Quando sair uma nova versão, seria bom liberar a versão antiga sob MIT.
O EXAONE 3.5 já era bom para rodar localmente em notebook, então estou ansioso por esse também.
Fiquei surpreso. Achei que fosse só jogada de mídia, mas essa LG tão conservadora lançar algo assim e ainda abrir ao público...
Pelo que vi na licença, fico curioso sobre como isso poderia ser usado.
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.
3.1 Uso comercial: O licenciado está expressamente proibido de usar o Modelo, Derivados ou Saídas para
quaisquer fins comerciais, incluindo, entre outros, o desenvolvimento ou a implantação de produtos, serviços ou
aplicações que gerem receita, seja direta ou indiretamente.
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.
4.2 Saída: Todos os direitos, titularidade e interesses sobre a Saída gerada pelo Modelo e pelos Derivados,
seja em sua forma original ou modificada, são e permanecerão como propriedade exclusiva do licenciante.
Sim. É uma licença que não permite uso comercial. Por isso, para mim, fica fora de consideração.
Instalei no servidor e testei, mas em comparação com o qwq o tempo de thinking fica longo demais.
Não sei se acerta bem as respostas, mas a latência pareceu pior do que eu esperava.
Então era assim só para alguns problemas. Testando mais alguns e comparando, parece que os resultados saem de forma parecida.
Torcendo por vocês~ LG~Força~
Torcendo por vocês. Estou curtindo em todo lugar onde aparece no LinkedIn.