- Desde o lançamento do modelo Llama 3 em 18/4, a reação da comunidade de desenvolvedores foi enorme
- o modelo foi baixado mais de 1,2 milhão de vezes, e desenvolvedores compartilharam mais de 600 modelos derivados no Hugging Face
- o repositório do Llama 3 no GitHub recebeu mais de 17.000 estrelas
- no ranking do LMSYS Chatbot Arena, o modelo Llama 3 70B Instruct ficou em 1º lugar na avaliação apenas em inglês e em 6º lugar no geral, alcançando a posição mais alta entre os modelos abertos (atrás apenas dos modelos proprietários fechados)
Casos iniciais de adoção do Llama 3
- parceiros de silício, hardware e provedores de nuvem começaram a disponibilizar o Llama 3 para seus usuários
- na Escola de Medicina de Yale, em conjunto com a Escola de Ciência da Computação e Comunicação da EPFL, o Llama 3 foi ajustado com fine-tuning apenas 24 horas após o lançamento, apresentando o Llama-3[8B]-MeditronV1.0, o primeiro modelo Llama 3 8B para a área médica
- esse novo modelo superou todos os modelos abertos de última geração da mesma classe de parâmetros em benchmarks padrão como MedQA e MedMCQA
- mais detalhes sobre como Yale e a EPFL construíram a primeira versão do Meditron com base no Llama 2 podem ser encontrados no link correspondente
Planos futuros para o Llama 3
- nos próximos meses, serão lançados modelos com novos recursos, incluindo multimodalidade, conversação multilíngue, janelas de contexto mais longas e melhorias gerais de capacidade
- em breve, mais novidades serão compartilhadas, e há expectativa de ver a próxima onda de inovação liderada pela comunidade
3 comentários
Cada vez mais, os LLMs das grandes empresas coreanas estão perdendo competitividade. Se a estratégia é ser fechado, então deveriam ao menos ter desempenho suficiente para competir; ou, se a estratégia é ampliar os casos de uso mesmo com desempenho inferior, então não deveriam se promover com foco no coreano — mas a situação está exatamente no sentido oposto.
Ficam só nessa competição sem sentido de pesos no leaderboard coreano, usam isso para virar notícia e ainda segurar o preço das ações kkkkk