Yi - LLM bilíngue open source de próxima geração
(github.com/01-ai)- Modelo de linguagem de grande porte open source de próxima geração, treinado do zero por desenvolvedores
- Projetado como um modelo bilíngue, foi treinado com um corpus multilíngue de 3T, demonstrando forte desempenho em compreensão de linguagem, raciocínio de senso comum, compreensão de leitura e mais
- Baseado em modelos de linguagem pré-treinados de 6B e 34B, e expandido para modelos de chatbot, modelos de contexto longo de 200K, modelos com upscale de profundidade e modelos visão-linguagem
- O modelo Yi-34B-Chat
- Ficou em 2º lugar no leaderboard do AlpacaEval, atrás apenas do GPT-4 Turbo, superando outros LLMs
- Supera os modelos open source existentes tanto em inglês quanto em chinês, ficando em 1º lugar em diversos benchmarks
- Adota a mesma arquitetura de modelo do Llama, mas não é um modelo derivado do Llama. Não utiliza os pesos do Llama
- Disponível em vários tamanhos, com possibilidade de ajuste fino do modelo para atender a requisitos específicos
- Modelos de chat
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Modelos base
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Modelos de chat
1 comentários
Opiniões no Hacker News