13 pontos por xguru 2024-04-29 | 3 comentários | Compartilhar no WhatsApp
  • Desde o lançamento do modelo Llama 3 em 18/4, a reação da comunidade de desenvolvedores foi enorme
    • o modelo foi baixado mais de 1,2 milhão de vezes, e desenvolvedores compartilharam mais de 600 modelos derivados no Hugging Face
    • o repositório do Llama 3 no GitHub recebeu mais de 17.000 estrelas
    • no ranking do LMSYS Chatbot Arena, o modelo Llama 3 70B Instruct ficou em 1º lugar na avaliação apenas em inglês e em 6º lugar no geral, alcançando a posição mais alta entre os modelos abertos (atrás apenas dos modelos proprietários fechados)

Casos iniciais de adoção do Llama 3

  • parceiros de silício, hardware e provedores de nuvem começaram a disponibilizar o Llama 3 para seus usuários
  • na Escola de Medicina de Yale, em conjunto com a Escola de Ciência da Computação e Comunicação da EPFL, o Llama 3 foi ajustado com fine-tuning apenas 24 horas após o lançamento, apresentando o Llama-3[8B]-MeditronV1.0, o primeiro modelo Llama 3 8B para a área médica
    • esse novo modelo superou todos os modelos abertos de última geração da mesma classe de parâmetros em benchmarks padrão como MedQA e MedMCQA
    • mais detalhes sobre como Yale e a EPFL construíram a primeira versão do Meditron com base no Llama 2 podem ser encontrados no link correspondente

Planos futuros para o Llama 3

  • nos próximos meses, serão lançados modelos com novos recursos, incluindo multimodalidade, conversação multilíngue, janelas de contexto mais longas e melhorias gerais de capacidade
  • em breve, mais novidades serão compartilhadas, e há expectativa de ver a próxima onda de inovação liderada pela comunidade

3 comentários

 
gcback 2024-04-29

Cada vez mais, os LLMs das grandes empresas coreanas estão perdendo competitividade. Se a estratégia é ser fechado, então deveriam ao menos ter desempenho suficiente para competir; ou, se a estratégia é ampliar os casos de uso mesmo com desempenho inferior, então não deveriam se promover com foco no coreano — mas a situação está exatamente no sentido oposto.

 
cosine20 2024-04-30

Ficam só nessa competição sem sentido de pesos no leaderboard coreano, usam isso para virar notícia e ainda segurar o preço das ações kkkkk

 
[Este comentário foi ocultado.]