- Modelo fundacional dedicado a dados tabulares (estruturados), capaz de executar diretamente tarefas de classificação e regressão com uma interface
fit/predict no estilo scikit-learn
- O modelo base TabPFN-2.6 foi treinado com dados totalmente sintéticos e faz o download automático do checkpoint no primeiro uso, então não é necessário montar um pipeline de treinamento separado
- Também não requer pré-processamento dos dados: em vez de aplicar scaling, one-hot encoding etc., deve-se inserir os dados originais diretamente, e ele também consegue lidar com valores ausentes por conta própria
- GPU recomendada (~8GB de VRAM ou mais); em CPU, só é possível executar com cerca de 1.000 amostras ou menos, e para ambientes sem GPU é oferecido o TabPFN Client (inferência em nuvem)
- Previsão em lote é essencial: ao chamar
predict para cada amostra individualmente, o conjunto de treino é recalculado toda vez, ficando cerca de 100x mais lento do que uma chamada única — recomenda-se dividir o conjunto de teste em blocos de 1.000
- A faixa ideal de desempenho é de até 100 mil amostras e 2.000 features; para 50 mil a 100 mil amostras, use a configuração
ignore_pretraining_limits=True, e acima de 100 mil aplique o Large Datasets Guide
- Com TabPFN Extensions, oferece recursos expandidos como interpretação com SHAP, detecção de outliers, geração de dados sintéticos, extração de embeddings, otimização de hiperparâmetros e ensemble post-hoc
- Há vários checkpoints especializados disponíveis no HuggingFace: para grande volume de features (até 1.000), grande volume de amostras (30 mil+), poucas amostras (menos de 3K), versões fine-tuned com dados reais etc.
- Na Enterprise Edition, oferece inferência de baixa latência baseada em um motor de destilação, suporte a até 10 milhões de linhas e licença comercial
- Também há o TabPFN UX, que pode ser usado sem código (interface gráfica no-code), oferecido separadamente
- O código usa a Prior Labs License (Apache 2.0 + requisito de atribuição), e os pesos dos modelos TabPFN-2.5/2.6 têm licença não comercial
Ainda não há comentários.