LG AI Research lança o EXAONE Deep

lemonmint · 2025-03-19T10:45:38+09:00

Novo modelo de IA de raciocínio desenvolvido pela LG AI Research, EXAONE Deep, foi apresentado Modelo de raciocínio de alto desempenho, essencial para a transição para a era da Agentic AI Capacidade de raciocínio excepcional comprovada nas áreas de matemática, ciência e programação Principais características: Matemática: desempenho superior em benchmarks avançados de matemática em comparação com modelos concorrentes (alcançando desempenho equivalente com um modelo menor) Ciência & programação: 1º lugar em benchmarks principais (modelos 7.8B e 2.4B) MMLU: melhor desempenho entre os modelos nacionais (modelo 32B) Incluído na lista de modelos de IA notáveis da Epoch AI, com desempenho validado (o segundo modelo EXAONE a entrar na lista, após o EXAONE 3.5) Desempenho excepcional em matemática Todos os modelos EXAONE Deep (32B, 7.8B, 2.4B) obtiveram a maior pontuação na seção de matemática do exame CSAT de 2025 EXAONE Deep 32B: Pontuação de 94.5 no CSAT de matemática e 90.0 no AIME 2024 Desempenho equivalente ao modelo DeepSeek-R1 (671B) no AIME 2025 Em especial, mostrou excelente desempenho no AIME, um benchmark de alta dificuldade, comprovando eficiência de treinamento e de custos EXAONE Deep 7.8B & 2.4B: 1º lugar em benchmarks principais nas categorias de modelos leves e modelos on-device, respectivamente Modelo 7.8B: MATH-500 94.8, AIME 2025 59.6 Modelo 2.4B: MATH-500 92.3, AIME 2024 47.9 Principais benchmarks de matemática: CSAT (College Scholastic Ability Test) AIME (American Invitational Mathematics Examination) MATH-500 Excelência em ciência e programação Também demonstrou desempenho superior ao de modelos concorrentes nas áreas de ciência e programação EXAONE Deep 32B: 66.1 no teste GPQA Diamond (avalia capacidade de resolver problemas científicos em nível de PhD) 59.5 no LiveCodeBench (avalia capacidade de programação), superando modelos de IA de raciocínio de porte semelhante Indica alto potencial de uso também em áreas que exigem conhecimento especializado EXAONE Deep 7.8B & 2.4B: 1º lugar no GPQA Diamond e no LiveCodeBench Após o modelo EXAONE 3.5 2.4B, consolida-se como modelo líder global na categoria de modelos leves/on-device Principais benchmarks de ciência e programação: GPQA Diamond LiveCodeBench

(lgresearch.ai)

24 pontos por lemonmint 2025-03-19 | 9 comentários | Compartilhar no WhatsApp

Novo modelo de IA de raciocínio desenvolvido pela LG AI Research, EXAONE Deep, foi apresentado
Modelo de raciocínio de alto desempenho, essencial para a transição para a era da Agentic AI
Capacidade de raciocínio excepcional comprovada nas áreas de matemática, ciência e programação
Principais características:
- Matemática: desempenho superior em benchmarks avançados de matemática em comparação com modelos concorrentes (alcançando desempenho equivalente com um modelo menor)
- Ciência & programação: 1º lugar em benchmarks principais (modelos 7.8B e 2.4B)
- MMLU: melhor desempenho entre os modelos nacionais (modelo 32B)
Incluído na lista de modelos de IA notáveis da Epoch AI, com desempenho validado (o segundo modelo EXAONE a entrar na lista, após o EXAONE 3.5)

Desempenho excepcional em matemática

Todos os modelos EXAONE Deep (32B, 7.8B, 2.4B) obtiveram a maior pontuação na seção de matemática do exame CSAT de 2025
EXAONE Deep 32B:
- Pontuação de 94.5 no CSAT de matemática e 90.0 no AIME 2024
- Desempenho equivalente ao modelo DeepSeek-R1 (671B) no AIME 2025
- Em especial, mostrou excelente desempenho no AIME, um benchmark de alta dificuldade, comprovando eficiência de treinamento e de custos
EXAONE Deep 7.8B & 2.4B:
- 1º lugar em benchmarks principais nas categorias de modelos leves e modelos on-device, respectivamente
- Modelo 7.8B: MATH-500 94.8, AIME 2025 59.6
- Modelo 2.4B: MATH-500 92.3, AIME 2024 47.9
Principais benchmarks de matemática:
- CSAT (College Scholastic Ability Test)
- AIME (American Invitational Mathematics Examination)
- MATH-500

Excelência em ciência e programação

Também demonstrou desempenho superior ao de modelos concorrentes nas áreas de ciência e programação
EXAONE Deep 32B:
- 66.1 no teste GPQA Diamond (avalia capacidade de resolver problemas científicos em nível de PhD)
- 59.5 no LiveCodeBench (avalia capacidade de programação), superando modelos de IA de raciocínio de porte semelhante
- Indica alto potencial de uso também em áreas que exigem conhecimento especializado
EXAONE Deep 7.8B & 2.4B:
- 1º lugar no GPQA Diamond e no LiveCodeBench
- Após o modelo EXAONE 3.5 2.4B, consolida-se como modelo líder global na categoria de modelos leves/on-device
Principais benchmarks de ciência e programação:
- GPQA Diamond
- LiveCodeBench

9 comentários

sice81 2025-03-20

Uau, torço pela LG. Não é praticamente o melhor LLM do nosso país? Ouvi dizer que também usam muito bem isso em sistemas internos... Mas a licença é uma pena. Quando sair uma nova versão, seria bom liberar a versão antiga sob MIT.

mindok 2025-03-19

O EXAONE 3.5 já era bom para rodar localmente em notebook, então estou ansioso por esse também.

bungker 2025-03-19

Fiquei surpreso. Achei que fosse só jogada de mídia, mas essa LG tão conservadora lançar algo assim e ainda abrir ao público...

halfenif 2025-03-20

Pelo que vi na licença, fico curioso sobre como isso poderia ser usado.

Restrictions
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.

3.1 Uso comercial: O licenciado está expressamente proibido de usar o Modelo, Derivados ou Saídas para
quaisquer fins comerciais, incluindo, entre outros, o desenvolvimento ou a implantação de produtos, serviços ou
aplicações que gerem receita, seja direta ou indiretamente.

Ownership
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 Saída: Todos os direitos, titularidade e interesses sobre a Saída gerada pelo Modelo e pelos Derivados,
seja em sua forma original ou modificada, são e permanecerão como propriedade exclusiva do licenciante.

yosemite 2025-03-20

Sim. É uma licença que não permite uso comercial. Por isso, para mim, fica fora de consideração.

junia3 2025-03-19

Instalei no servidor e testei, mas em comparação com o qwq o tempo de thinking fica longo demais.
Não sei se acerta bem as respostas, mas a latência pareceu pior do que eu esperava.

junia3 2025-03-19

Então era assim só para alguns problemas. Testando mais alguns e comparando, parece que os resultados saem de forma parecida.

nowdoit7 2025-03-19

Torcendo por vocês~ LG~Força~

jujumilk3 2025-03-19

Torcendo por vocês. Estou curtindo em todo lugar onde aparece no LinkedIn.

LG AI Research lança o EXAONE Deep

Desempenho excepcional em matemática

Excelência em ciência e programação

Leituras relacionadas

9 comentários