BloombergGPT - modelo de linguagem de grande escala para finanças

xguru · 2023-04-03T09:38:07+09:00

Modelo de linguagem com 50 bilhões (50B) de parâmetros, treinado com um amplo conjunto de dados financeiros Foi construído um conjunto de dados de 363 bilhões de tokens com base nas fontes de dados da Bloomberg, complementado por 345 bilhões de tokens de dados gerais Não apresenta queda de desempenho em benchmarks gerais de LLM e mostra desempenho muito superior ao de modelos existentes em tarefas financeiras Também descreve as escolhas de modelagem, o processo de treinamento e a metodologia de avaliação Como próximo passo, há planos de divulgar um log de treinamento (crônica) detalhando a experiência de treinamento do BloombergGPT

(arxiv.org)

13 pontos por xguru 2023-04-03 | Ainda não há comentários. | Compartilhar no WhatsApp

Modelo de linguagem com 50 bilhões (50B) de parâmetros, treinado com um amplo conjunto de dados financeiros
Foi construído um conjunto de dados de 363 bilhões de tokens com base nas fontes de dados da Bloomberg, complementado por 345 bilhões de tokens de dados gerais
Não apresenta queda de desempenho em benchmarks gerais de LLM e mostra desempenho muito superior ao de modelos existentes em tarefas financeiras
Também descreve as escolhas de modelagem, o processo de treinamento e a metodologia de avaliação
Como próximo passo, há planos de divulgar um log de treinamento (crônica) detalhando a experiência de treinamento do BloombergGPT

BloombergGPT - modelo de linguagem de grande escala para finanças

Leituras relacionadas

Ainda não há comentários.