- Modelo fundacional para previsão de séries temporais desenvolvido pelo Google Research
- Pré-treinado com 100 bilhões de pontos de dados reais de séries temporais
- Apresenta excelente desempenho zero-shot em vários benchmarks públicos
- Pode ser aplicado a conjuntos de dados de diferentes domínios e granularidades de tempo
- A previsão de séries temporais é amplamente utilizada em diversas áreas, como varejo, finanças, manufatura, saúde e ciências naturais
- Por exemplo, no varejo, melhorar a precisão da previsão de demanda contribui para reduzir custos de estoque e aumentar a receita
- A ascensão dos modelos de deep learning
- Modelos de deep learning, que provaram desempenho superior em várias configurações, são amplamente usados na previsão de séries temporais
- No concurso M5, modelos de deep learning também obtiveram bons resultados
- O avanço dos grandes modelos de linguagem
- Grandes modelos de linguagem usados em tarefas de processamento de linguagem natural, como tradução, geração com recuperação e conclusão de código, estão evoluindo rapidamente
- Eles são treinados com grandes volumes de dados textuais e têm a capacidade de identificar padrões de linguagem
- Em combinação com busca, são usados como ferramentas poderosas de zero-shot capazes de responder perguntas sobre eventos atuais e fazer resumos
- Limitações dos modelos de previsão baseados em deep learning
- Embora apresentem desempenho superior aos métodos tradicionais, ainda há dificuldade em reduzir os custos de treinamento e inferência
- É necessário um longo ciclo de treinamento e validação antes de testar o modelo em novos dados de séries temporais
- TimesFM é um modelo fundacional decoder-only para previsão de séries temporais
- Um único modelo de previsão pré-treinado com 100 bilhões de dados reais de séries temporais
- Tem 2 milhões de parâmetros, muito menos do que os grandes modelos de linguagem mais recentes
- Em datasets de vários domínios e granularidades de tempo, apresenta em zero-shot desempenho próximo ao estado da arte de abordagens supervisionadas
- Fornece imediatamente previsões adequadas para dados de séries temporais nunca vistos, sem treinamento adicional
- Permite que o usuário se concentre em melhorar previsões para tarefas downstream reais, como planejamento de demanda no varejo
- Artigo: "A decoder-only foundation model for time-series forecasting", com apresentação prevista na ICML 2024
Opinião do GN⁺
- Parece um novo modelo promissor para previsão de séries temporais, mas ainda precisa ser validado em diversos casos reais de uso. Em especial, o fato de ainda não oferecer suporte a previsão probabilística é um ponto fraco do ponto de vista prático
- É interessante que o valor de frequência fornecido como entrada possa ser ajustado arbitrariamente, sem necessariamente refletir a frequência real dos dados de séries temporais, mas parece que será preciso experimentar com cada dado e caso de uso para descobrir qual valor é o ideal
- Como o primeiro checkpoint publicado tem foco em séries univariadas, também é esperado uma versão capaz de fazer previsão multivariada. Comparações de desempenho em benchmarks de séries temporais multivariadas também parecem necessárias
- Ao adotar esse modelo, será necessário contar com profissionais especializados capazes de escolher e ajustar o modelo de acordo com as características da série temporal prevista (comprimento, distribuição, sazonalidade, frequência etc.) e com o horizonte de previsão exigido. A oferta de uma API de inferência end-to-end parece facilitar o uso, mas as limitações de um modelo caixa-preta também devem ser consideradas
- Outras bibliotecas semelhantes para previsão de séries temporais incluem Kats, da Meta, GluonTS, Darts e sktime. O ideal é comparar as características, vantagens e desvantagens de cada biblioteca e então escolher o modelo mais adequado aos dados reais
Ainda não há comentários.