GPT4All - chatbot treinado com 800k conjuntos de instruções com base no LLaMA
(github.com/nomic-ai)- Modelo de linguagem de grande porte no estilo assistente
- Dados coletados, procedimento de coleta de dados, código de treinamento e pesos finais do modelo, tudo aberto ao público
- Treinado com 800k dados gerados pelo GPT 3.5 Turbo (código/histórias/conversas)
- Usa como conjunto de dados base o ajuste por instruções do LAION OIG, perguntas de programação do Stack Overflow e Big-Science/P3
- Com referência ao Stanford Alpaca, os dados foram enviados para o ATLAS para curadoria e limpeza
Ainda não há comentários.