- 2025 foi um ano resumido pelo fortalecimento da dominância do PostgreSQL, difusão do padrão MCP, grandes fusões e aquisições, reanimação da disputa de formatos de arquivo e ascensão de Larry Ellison
- O PostgreSQL se consolidou como DBaaS central das principais empresas de nuvem, e projetos distribuídos (Multigres, Neki, PgDog) surgiram recentemente
- Todos os principais DBMS passaram a adotar o Model Context Protocol (MCP) da Anthropic, dando início de fato à integração entre LLMs e bancos de dados
- A MongoDB abriu um processo relacionado à replicação de API contra a FerretDB, e no campo dos formatos de arquivo a competição para substituir o Parquet se intensificou
- Com aquisições, encerramentos e captações acontecendo em todo o setor, 2025 é avaliado como um ano em que a reorganização e a concentração da indústria de bancos de dados se aceleraram
Expansão contínua do PostgreSQL
- A versão PostgreSQL 18 foi lançada em novembro de 2025, introduzindo o subsistema de armazenamento com I/O assíncrono e o recurso skip scan
- Reduz a dependência do cache de páginas do SO e melhora o uso de índices com múltiplas chaves
- A Databricks adquiriu a Neon por US$ 1 bilhão, e a Snowflake comprou a CrunchyData por US$ 250 milhões
- A Microsoft lançou o HorizonDB, fazendo com que todas as grandes empresas de nuvem passassem a ter serviços baseados em PostgreSQL
- Surgiram novos projetos de PostgreSQL distribuído, como Multigres da Supabase, Neki da PlanetScale e o PgDog
- A Supabase contratou Sugu, cofundador da Vitess, para liderar o desenvolvimento de middleware de sharding
- Entre os serviços PostgreSQL independentes em atividade estão Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge e Nile
- Algumas startups, como Hydra e PostgresML, encerraram as atividades em 2025
- A disputa de M&A e a evolução tecnológica centradas no PostgreSQL atuaram como principal força motriz do setor
Expansão total do MCP (Model Context Protocol)
- Em 2025, todos os principais DBMS passaram a oferecer suporte ao padrão MCP da Anthropic
- O MCP é uma interface baseada em JSON-RPC que permite a interação de LLMs com bancos de dados
- Depois que a OpenAI anunciou suporte ao MCP em março de 2025, sistemas importantes como ClickHouse, Snowflake, Oracle e MongoDB lançaram servidores MCP
- Serviços baseados em PostgreSQL também passaram a oferecer seus próprios servidores MCP (Supabase, Timescale, Xata etc.)
- Os servidores MCP acessam o banco de dados por solicitação individual e não oferecem suporte a joins entre bancos heterogêneos
- A Neon, por meio do recurso de branching de dados, passou a responder por 80% dos bancos de dados gerados por agentes de IA
- Em termos de segurança, foi enfatizada a necessidade de privilégio mínimo e mecanismos automáticos de proteção
- Alguns sistemas oferecem proteções básicas como limitação a leitura, timeout de consultas e limite de resultados
Disputa judicial entre MongoDB e FerretDB
- A MongoDB moveu em 2025 uma ação por violação de patente, direitos autorais e marca registrada contra a FerretDB
- A FerretDB é um proxy de middleware que converte consultas MongoDB para PostgreSQL, e o uso da expressão “drop-in replacement” foi apontado como problemático
- A Microsoft doou o DocumentDB, open source compatível com MongoDB, para a Linux Foundation
- Amazon, Yugabyte e outras também participaram do projeto
- Sobre a alegação da MongoDB de que “desbravou os bancos de dados não relacionais”, foi apontado que já existiam sistemas anteriores como IDS e IMS, da década de 1960
- O fato de o nome inicial da FerretDB ter sido “MangoDB” também foi citado na controvérsia de confusão de marca
Reacendimento da disputa de formatos de arquivo
- Em 2025, surgiram cinco novos formatos de arquivo open source para desafiar a posição dominante do Parquet
- FastLanes (CWI), F3 (CMU + Universidade Tsinghua), Vortex (SpiralDB), AnyBlox (pesquisadores alemães), Amudai (Microsoft)
- O Vortex da SpiralDB ganhou destaque ao ser doado à Linux Foundation, e o AnyBlox recebeu o prêmio de melhor artigo da VLDB
- Em resposta, os desenvolvedores do Parquet passaram a impulsionar um trabalho de modernização da especificação
- O formato F3, com participação de Pavlo, busca resolver problemas de interoperabilidade com um decoder embutido baseado em WASM
- A próxima fase da disputa tende a girar em torno do suporte a GPU
Tendências em M&A, investimentos e encerramentos
- Principais aquisições de 2025
- A IBM adquiriu DataStax e Confluent; a Databricks adquiriu Neon, Tecton e Mooncake
- A Snowflake adquiriu CrunchyData e Datometry; a Salesforce adquiriu a Informatica; a Nvidia adquiriu a HeavyDB
- Fivetran e dbt Labs se fundiram de forma repentina, reorganizando-se como uma plataforma integrada de ETL
- Principais rodadas de investimento
- Databricks (US$ 4 bilhões e US$ 1 bilhão), ClickHouse (US$ 350 milhões), Supabase (US$ 200 milhões e US$ 100 milhões), Timescale (US$ 110 milhões) etc.
- Casos de encerramento
- Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby e outros
- O fechamento do laboratório IBM Research Almaden foi citado como um ponto final simbólico da pesquisa em bancos de dados
- Pavlo apontou os limites comerciais dos bancos de dados baseados em GPU e destacou a maturidade dos motores OLAP baseados em CPU e a concorrência centrada na experiência do usuário
O ‘melhor ano’ de Larry Ellison
- Em 2025, o fundador da Oracle, Larry Ellison, tornou-se o homem mais rico do mundo (US$ 393 bilhões)
- Seu patrimônio disparou com a forte alta das ações da Oracle e os investimentos em data centers para IA
- A Oracle esteve envolvida em grandes negócios, como a aquisição da operação americana do TikTok e a tentativa da Paramount de adquirir a Warner Bros
- Pavlo descreve a trajetória de Ellison como “o símbolo de alguém que conquistou o mundo com bancos de dados”
- Apesar das críticas, a influência da Oracle e a presença de Ellison continuam extremamente fortes
Conclusão
- A indústria de bancos de dados em 2025 pode ser resumida por uma reorganização centrada no PostgreSQL, aceleração da integração com IA e LLMs e polarização entre grandes M&A e encerramentos
- Pavlo enfatiza que tanto pesquisadores quanto a indústria precisam se concentrar em segurança, padronização e automação operacional
- Por fim, ele encerra o texto anunciando a estreia da nova startup Sydht.ai, criada por pesquisadores da CMU
1 comentários
Comentários do Hacker News
Vale muito a pena ver o estilo de aula único do CMU DB Group
Dá para conferir nos resultados de busca do YouTube.
Em especial, a intro gangsta e o set de DJ foram realmente marcantes.
Também lembro de um vídeo antigo em que alguém estava dormindo no chão durante a aula. Isso me deixou mais curioso sobre o histórico e contexto do Andy
https://para ficar clicávelÉ uma pena que, nas retrospectivas dos últimos anos, não tenham mencionado bancos de dados imutáveis ou bi-temporais
Esses DBs são especialmente úteis na indústria fintech.
Exemplos representativos são XTDB v2 (2025) e Datomic Free (2023)
Fico me perguntando se só mencionar que “ele existe” já seria suficiente
Implementamos histórico de mudanças e função de undo com um sistema de log de auditoria baseado em row trigger.
Também movemos os logs para um armazenamento separado para manter backup offline
Atualmente estou desenvolvendo um SQLite imutável — xitdb-java
Estou na expectativa por um triple store com suporte a viagem no tempo
As tendências de banco de dados em 2025 podem ser resumidas em duas coisas
1️⃣ migrar tudo para SQLite
2️⃣ uso centrado em campos JSON
O SQLite é fácil de lidar graças à estrutura de arquivo único e ao design sem daemon. E, com as funções JSON, também é agradável fazer tratamento flexível de dados
Ele oferece uma espécie de API normalizada de acesso a objetos
Entendo por que o Pavlo é cético em relação à segurança do MCP. O MCP tem uma filosofia centrada em expor contexto, o que vai contra o princípio do menor privilégio
Expor um DB por esse tipo de protocolo revela ao modelo não só os dados simples, mas também a complexidade do schema.
No fim, parece uma reencenação de SQL injection — só que desta vez a causa não é um usuário malicioso, e sim a alucinação do modelo
Ele é baseado no framework lethal trifecta do Simon Willison, e pode ser visto em open-edison
Sinto que precisamos migrar para DBs imutáveis.
O Datomic é poderoso, mas complexo e com curva de aprendizado íngreme, e o immudb ainda não parece pronto para produção.
Os problemas começam a aparecer depois de apenas algumas centenas de milhares de registros
O Supabase está mostrando um crescimento enorme. Ouvi dizer até que cerca de 70% das startups da YC estão usando.
Fico curioso se depois elas vão migrar para self-hosted
Foi mencionado o motivo de o EdgeDB ter mudado o nome para Gel, mas isso também deveria ter sido incluído na seção de aquisições.
A Gel se juntou à Vercel
Preciso encontrar uma forma de rastrear automaticamente esse tipo de mudança
O último commit no GitHub foi há 2 semanas
Graças ao Andy e ao DB Group da CMU, bancos de dados ficaram muito mais populares. É realmente uma equipe de nível mundial
O lançamento do PostgreSQL 18 foi realmente excelente.
A maioria fala só sobre async IO worker, mas Unicode locale, adição de constraints não validadas, colunas virtuais, btree skip scan e UUIDv7 também são grandes melhorias
A tendência de vários anos dos últimos tempos foi impressionante.
Databricks e Snowflake provaram sua agilidade e capacidade de sobrevivência mesmo na competição da nuvem.
Já Cloudera e Hortonworks fracassaram.
Além disso, o ClickHouse está discretamente ocupando perfeitamente seu próprio nicho