12 pontos por xguru 2024-06-20 | 1 comentários | Compartilhar no WhatsApp
  • ETL baseado em Python, projetado para extrair, preparar e organizar dados de diversas fontes e formatos
    • Compatível com arquivos estruturados e não estruturados (CSV, Parquet, PDF, Word, HTML etc.)
  • Tem como objetivo permitir que tanto cientistas de dados quanto engenheiros de dados desenvolvam pipelines com facilidade por meio de uma interface intuitiva low-code, ao mesmo tempo em que gera código Python que pode ser implantado em qualquer lugar
    • Projete pipelines de dados com uma GUI e gere código Python nativo que pode ser implantado em qualquer ambiente on-premise ou na nuvem
  • Excelente desempenho para integração de dados de arquivos para bancos de dados, extração e preparação de dados para ciência de dados e sistemas baseados em LLM, além de consulta e enriquecimento de APIs

1 comentários

 
xguru 2024-06-20
Comentários no Hacker News
  • O Amphi é uma ferramenta ETL low-code para dados estruturados e não estruturados, útil para integração de arquivos, preparação de dados, migração de dados e criação de pipelines de dados para tarefas de IA. Ele gera código Python, que pode ser implantado em qualquer lugar.
  • Nem sempre é uma boa ideia facilitar demais o trabalho com dados para pessoas sem formação na área. Se escrever Python e SQL é difícil para você, talvez seja melhor considerar outro tipo de trabalho.
  • O título deveria ser alterado. Não é open source, e sim licenciado sob a Elastic License v2.
  • Não é open source. O título induz ao erro.
  • Seria bom adicionar uma explicação no site para quem não conhece a sigla ETL.
  • Como ferramenta Python ETL open source, dlthub.com e hub.meltano.com são opções melhores. Estou usando Meltano na prática e estou satisfeito.
  • Fico curioso para saber se o Amphi oferece suporte ao framework rapidsai dask_cudf, semelhante ao pandas.
  • A ideia é boa, mas a abstração de alto nível na documentação está errada. Em um pipeline de dados, deveria ser possível definir algo que se comporte como uma tabela e aplicar transformações sobre isso. O fato de ser uma ferramenta gratuita é louvável.
  • Estou satisfeito com o Dagster, mas o Amphi também parece interessante.
  • Fico curioso sobre como uma ferramenta como o Amphi surgiu. Já existem muitas ferramentas Python ETL open source, então queria saber se ela foi criada para resolver um problema específico ou se é mais um projeto por paixão.