29 pontos por GN⁺ 2026-01-06 | 1 comentários | Compartilhar no WhatsApp
  • 2025 foi um ano resumido pelo fortalecimento da dominância do PostgreSQL, difusão do padrão MCP, grandes fusões e aquisições, reanimação da disputa de formatos de arquivo e ascensão de Larry Ellison
  • O PostgreSQL se consolidou como DBaaS central das principais empresas de nuvem, e projetos distribuídos (Multigres, Neki, PgDog) surgiram recentemente
  • Todos os principais DBMS passaram a adotar o Model Context Protocol (MCP) da Anthropic, dando início de fato à integração entre LLMs e bancos de dados
  • A MongoDB abriu um processo relacionado à replicação de API contra a FerretDB, e no campo dos formatos de arquivo a competição para substituir o Parquet se intensificou
  • Com aquisições, encerramentos e captações acontecendo em todo o setor, 2025 é avaliado como um ano em que a reorganização e a concentração da indústria de bancos de dados se aceleraram

Expansão contínua do PostgreSQL

  • A versão PostgreSQL 18 foi lançada em novembro de 2025, introduzindo o subsistema de armazenamento com I/O assíncrono e o recurso skip scan
    • Reduz a dependência do cache de páginas do SO e melhora o uso de índices com múltiplas chaves
  • A Databricks adquiriu a Neon por US$ 1 bilhão, e a Snowflake comprou a CrunchyData por US$ 250 milhões
    • A Microsoft lançou o HorizonDB, fazendo com que todas as grandes empresas de nuvem passassem a ter serviços baseados em PostgreSQL
  • Surgiram novos projetos de PostgreSQL distribuído, como Multigres da Supabase, Neki da PlanetScale e o PgDog
    • A Supabase contratou Sugu, cofundador da Vitess, para liderar o desenvolvimento de middleware de sharding
  • Entre os serviços PostgreSQL independentes em atividade estão Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge e Nile
    • Algumas startups, como Hydra e PostgresML, encerraram as atividades em 2025
  • A disputa de M&A e a evolução tecnológica centradas no PostgreSQL atuaram como principal força motriz do setor

Expansão total do MCP (Model Context Protocol)

  • Em 2025, todos os principais DBMS passaram a oferecer suporte ao padrão MCP da Anthropic
    • O MCP é uma interface baseada em JSON-RPC que permite a interação de LLMs com bancos de dados
  • Depois que a OpenAI anunciou suporte ao MCP em março de 2025, sistemas importantes como ClickHouse, Snowflake, Oracle e MongoDB lançaram servidores MCP
    • Serviços baseados em PostgreSQL também passaram a oferecer seus próprios servidores MCP (Supabase, Timescale, Xata etc.)
  • Os servidores MCP acessam o banco de dados por solicitação individual e não oferecem suporte a joins entre bancos heterogêneos
  • A Neon, por meio do recurso de branching de dados, passou a responder por 80% dos bancos de dados gerados por agentes de IA
  • Em termos de segurança, foi enfatizada a necessidade de privilégio mínimo e mecanismos automáticos de proteção
    • Alguns sistemas oferecem proteções básicas como limitação a leitura, timeout de consultas e limite de resultados

Disputa judicial entre MongoDB e FerretDB

  • A MongoDB moveu em 2025 uma ação por violação de patente, direitos autorais e marca registrada contra a FerretDB
    • A FerretDB é um proxy de middleware que converte consultas MongoDB para PostgreSQL, e o uso da expressão “drop-in replacement” foi apontado como problemático
  • A Microsoft doou o DocumentDB, open source compatível com MongoDB, para a Linux Foundation
    • Amazon, Yugabyte e outras também participaram do projeto
  • Sobre a alegação da MongoDB de que “desbravou os bancos de dados não relacionais”, foi apontado que já existiam sistemas anteriores como IDS e IMS, da década de 1960
  • O fato de o nome inicial da FerretDB ter sido “MangoDB” também foi citado na controvérsia de confusão de marca

Reacendimento da disputa de formatos de arquivo

  • Em 2025, surgiram cinco novos formatos de arquivo open source para desafiar a posição dominante do Parquet
    • FastLanes (CWI), F3 (CMU + Universidade Tsinghua), Vortex (SpiralDB), AnyBlox (pesquisadores alemães), Amudai (Microsoft)
  • O Vortex da SpiralDB ganhou destaque ao ser doado à Linux Foundation, e o AnyBlox recebeu o prêmio de melhor artigo da VLDB
  • Em resposta, os desenvolvedores do Parquet passaram a impulsionar um trabalho de modernização da especificação
  • O formato F3, com participação de Pavlo, busca resolver problemas de interoperabilidade com um decoder embutido baseado em WASM
  • A próxima fase da disputa tende a girar em torno do suporte a GPU

Tendências em M&A, investimentos e encerramentos

  • Principais aquisições de 2025
    • A IBM adquiriu DataStax e Confluent; a Databricks adquiriu Neon, Tecton e Mooncake
    • A Snowflake adquiriu CrunchyData e Datometry; a Salesforce adquiriu a Informatica; a Nvidia adquiriu a HeavyDB
    • Fivetran e dbt Labs se fundiram de forma repentina, reorganizando-se como uma plataforma integrada de ETL
  • Principais rodadas de investimento
    • Databricks (US$ 4 bilhões e US$ 1 bilhão), ClickHouse (US$ 350 milhões), Supabase (US$ 200 milhões e US$ 100 milhões), Timescale (US$ 110 milhões) etc.
  • Casos de encerramento
    • Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby e outros
    • O fechamento do laboratório IBM Research Almaden foi citado como um ponto final simbólico da pesquisa em bancos de dados
  • Pavlo apontou os limites comerciais dos bancos de dados baseados em GPU e destacou a maturidade dos motores OLAP baseados em CPU e a concorrência centrada na experiência do usuário

O ‘melhor ano’ de Larry Ellison

  • Em 2025, o fundador da Oracle, Larry Ellison, tornou-se o homem mais rico do mundo (US$ 393 bilhões)
    • Seu patrimônio disparou com a forte alta das ações da Oracle e os investimentos em data centers para IA
  • A Oracle esteve envolvida em grandes negócios, como a aquisição da operação americana do TikTok e a tentativa da Paramount de adquirir a Warner Bros
  • Pavlo descreve a trajetória de Ellison como “o símbolo de alguém que conquistou o mundo com bancos de dados”
    • Apesar das críticas, a influência da Oracle e a presença de Ellison continuam extremamente fortes

Conclusão

  • A indústria de bancos de dados em 2025 pode ser resumida por uma reorganização centrada no PostgreSQL, aceleração da integração com IA e LLMs e polarização entre grandes M&A e encerramentos
  • Pavlo enfatiza que tanto pesquisadores quanto a indústria precisam se concentrar em segurança, padronização e automação operacional
  • Por fim, ele encerra o texto anunciando a estreia da nova startup Sydht.ai, criada por pesquisadores da CMU

1 comentários

 
GN⁺ 2026-01-06
Comentários do Hacker News
  • Vale muito a pena ver o estilo de aula único do CMU DB Group
    Dá para conferir nos resultados de busca do YouTube.
    Em especial, a intro gangsta e o set de DJ foram realmente marcantes.
    Também lembro de um vídeo antigo em que alguém estava dormindo no chão durante a aula. Isso me deixou mais curioso sobre o histórico e contexto do Andy

    • Quem é fã de Wu-Tang e hip-hop provavelmente vai se identificar. Aquela intro foi muito boa
    • Fico em dúvida se “Intro to Database Systems” da CMU é uma disciplina de nível de graduação ou um curso avançado que trata da estrutura interna. Como iniciante em bancos de dados, queria encontrar um curso introdutório adequado
    • Corrigi o link adicionando https:// para ficar clicável
  • É uma pena que, nas retrospectivas dos últimos anos, não tenham mencionado bancos de dados imutáveis ou bi-temporais
    Esses DBs são especialmente úteis na indústria fintech.
    Exemplos representativos são XTDB v2 (2025) e Datomic Free (2023)

    • A CMU fez um seminário técnico sobre XTDB há 5 semanas.
      Fico me perguntando se só mencionar que “ele existe” já seria suficiente
    • Dá para ir bem longe usando o tipo tstzrange do PostgreSQL e a extensão pg_bitemporal.
      Implementamos histórico de mudanças e função de undo com um sistema de log de auditoria baseado em row trigger.
      Também movemos os logs para um armazenamento separado para manter backup offline
    • As vantagens de DBs imutáveis estão sendo cada vez mais reconhecidas. Não é só auditoria simples; há vários benefícios, como leituras concorrentes, replicação rápida e undo de transações.
      Atualmente estou desenvolvendo um SQLite imutávelxitdb-java
    • Alguns estão adicionando temporalidade e imutabilidade a triple stores, porque xtdb e datomic são lentos em travessia de grafos com SPARQL.
      Estou na expectativa por um triple store com suporte a viagem no tempo
    • Também deixei uma opinião parecida em outro comentário
  • As tendências de banco de dados em 2025 podem ser resumidas em duas coisas
    1️⃣ migrar tudo para SQLite
    2️⃣ uso centrado em campos JSON
    O SQLite é fácil de lidar graças à estrutura de arquivo único e ao design sem daemon. E, com as funções JSON, também é agradável fazer tratamento flexível de dados

    • Do meu ponto de vista, hoje em dia é tudo sobre DuckDB. Arquivo único, suporte a vários formatos, S3, Parquet, armazenamento colunar, WASM — completo
    • Na real, dá até para perguntar: “precisamos mesmo de um DB?”. O SQLite fica num ponto intermediário entre um DB completo e um object storage feito à mão.
      Ele oferece uma espécie de API normalizada de acesso a objetos
    • Quando o SQLite não está em um ambiente multiusuário, fico curioso até onde ele aguenta se várias conexões web fizerem escritas ao mesmo tempo
    • Antigamente havia a ideia de que SQLite não devia ser usado em produção, mas parece que isso mudou hoje em dia
    • Para mim, a combinação ideal é “SQLite quando der, PostgreSQL quando precisar, DuckDB para análise e BigQuery para BI em grande escala”
  • Entendo por que o Pavlo é cético em relação à segurança do MCP. O MCP tem uma filosofia centrada em expor contexto, o que vai contra o princípio do menor privilégio
    Expor um DB por esse tipo de protocolo revela ao modelo não só os dados simples, mas também a complexidade do schema.
    No fim, parece uma reencenação de SQL injection — só que desta vez a causa não é um usuário malicioso, e sim a alucinação do modelo

    • Aproveitando o fato de que LLMs são stateless, criei um gateway MCP que rastreia a origem do contexto de entrada e bloqueia mudanças de estado perigosas.
      Ele é baseado no framework lethal trifecta do Simon Willison, e pode ser visto em open-edison
    • Ninguém vai usar um DB MCP com permissão de escrita em produção. Colocar a culpa disso no protocolo é injusto
    • Fico me perguntando se havia valor suficiente para abandonar os princípios. Provavelmente é só uma continuação do espírito “move fast, break things”
  • Sinto que precisamos migrar para DBs imutáveis.
    O Datomic é poderoso, mas complexo e com curva de aprendizado íngreme, e o immudb ainda não parece pronto para produção.
    Os problemas começam a aparecer depois de apenas algumas centenas de milhares de registros

  • O Supabase está mostrando um crescimento enorme. Ouvi dizer até que cerca de 70% das startups da YC estão usando.
    Fico curioso se depois elas vão migrar para self-hosted

  • Foi mencionado o motivo de o EdgeDB ter mudado o nome para Gel, mas isso também deveria ter sido incluído na seção de aquisições.
    A Gel se juntou à Vercel

    • Obrigado. Adicionei um link de errata no blog.
      Preciso encontrar uma forma de rastrear automaticamente esse tipo de mudança
    • Sinceramente, isso é decepcionante. Mesmo vendo o post oficial da Vercel, o futuro da Gel parece incerto.
      O último commit no GitHub foi há 2 semanas
  • Graças ao Andy e ao DB Group da CMU, bancos de dados ficaram muito mais populares. É realmente uma equipe de nível mundial

    • Fico curioso sobre o que exatamente eles fizeram
  • O lançamento do PostgreSQL 18 foi realmente excelente.
    A maioria fala só sobre async IO worker, mas Unicode locale, adição de constraints não validadas, colunas virtuais, btree skip scan e UUIDv7 também são grandes melhorias

  • A tendência de vários anos dos últimos tempos foi impressionante.
    Databricks e Snowflake provaram sua agilidade e capacidade de sobrevivência mesmo na competição da nuvem.
    Já Cloudera e Hortonworks fracassaram.
    Além disso, o ClickHouse está discretamente ocupando perfeitamente seu próprio nicho