- Todo o código-fonte, os pesos do modelo e os conjuntos de dados de treinamento foram disponibilizados sob Apache-2.0
- 4 componentes principais
- LLM ajustado por instruções, com fine-tuning do GPT-NEOX-20B em 43 milhões de conjuntos de instruções
- Receita de customização que permite fazer fine-tuning de acordo com a sua própria tarefa
- Sistema de recuperação extensível que pode reforçar as respostas ao buscar informações em um repositório de documentos, APIs e fontes atualizáveis em tempo real no momento da inferência
- Modelo de moderação projetado para filtrar as perguntas às quais o bot responderá, com fine-tuning do GPT-JT-6B
- Colaboração entre LAION e Ontocord: dataset OIG (divulgado separadamente) com 43 milhões de instruções
Ainda não há comentários.