Thoughtworks Technology Radar, Volume 33 é lançado
(thoughtworks.com)- Visualiza e explica as tendências mais recentes nas áreas de técnicas/ferramentas/plataformas/linguagens de programação e frameworks em quatro estágios: Adopt (recomendado para adoção), Trial (uso experimental), Assess (avaliação) e Hold (cautela)
- 4 temas principais: orquestração de infraestrutura para IA, ascensão de agentes baseados em MCP, fluxos de trabalho de codificação com IA e surgimento de antipadrões de IA
Introdução de orquestração de infraestrutura para IA
- As cargas de trabalho de IA estão levando as organizações a exigir orquestração de grandes frotas de GPUs para treinamento e inferência
- Com o aumento de modelos grandes que ultrapassam o limite de capacidade de HBM (80 GB) de uma única GPU, treinamento distribuído e inferência multi-GPU tornaram-se essenciais
- Equipes de plataforma constroem pipelines complexos de múltiplos estágios e ajustam continuamente throughput e latência
- Fazem telemetria remota da frota com Nvidia DCGM Exporter e posicionam jobs onde a largura de banda de interconexão é maior com escalonamento com reconhecimento de topologia
- Kubernetes é a base central para gerenciar cargas de trabalho de IA em larga escala, mas plataformas alternativas como microVM (Firecracker) e Uncloud também estão ganhando atenção
- Estão evoluindo estratégias de posicionamento que consideram comunicação rápida entre links de GPU, como gerenciamento de filas e cotas com Kueue, topology-aware scheduling e gang scheduling
- Posicionamento de jobs multi-GPU dentro de “ilhas” contíguas de datacenter (rack ou pod) com links rápidos entre GPUs, como NVLink/NVSwitch, e RDMA
- As recentes melhorias de API com reconhecimento de multi-GPU e NUMA no Kubernetes fortalecem essas capacidades, aumentando a largura de banda entre dispositivos, reduzindo tail latency e elevando a taxa de utilização efetiva
- Com o aumento da demanda por fluxos de trabalho de codificação com IA e a ascensão de agentes aprimorados por MCP, espera-se inovação acelerada em infraestrutura de IA
- A orquestração com reconhecimento de GPU está se tornando um requisito básico, e a topologia agora emerge como uma consideração de primeira classe no escalonamento
Ascensão de agentes baseados em MCP
- A ascensão simultânea de MCP e dos agentes, junto com a expansão do ecossistema de protocolos e ferramentas construído em torno deles, é um tema central desta Radar
- O MCP está se consolidando como o protocolo de integração definitivo para viabilizar agentes e sua operação eficiente e semiautônoma
- Quase todos os principais vendors estão adicionando suporte a MCP, e fluxos de trabalho centrados em agentes estão crescendo rapidamente
- Observa-se inovação contínua nos fluxos de trabalho com agentes, e a engenharia de contexto emerge como fator-chave para otimizar o comportamento do modelo e a eficiência no uso de recursos
- Novos protocolos como A2A (Agent-to-Agent) e AG-UI reduzem a complexidade de construir apps colaborativos com múltiplos agentes
- Tecnologias como AGENTS.md, Anchoring coding agents e Context7 MCP server estão sendo adotadas em fluxos reais de desenvolvimento
- Pela própria natureza do ecossistema de IA, novas inovações explodem a cada edição da Radar
— da última vez foi RAG; desta vez são os fluxos de trabalho com agentes e a constelação crescente de ferramentas, técnicas e plataformas que os sustentam- E alguns antipadrões de IA dignos de atenção também estão surgindo
Fluxos de trabalho de codificação com IA
- A IA está transformando a forma como software é construído e mantido, sendo um tema dominante nas discussões recentes
- Do uso de IA para compreender codebases legados ao GenAI para engenharia forward, ela está sendo incorporada estrategicamente em toda a cadeia de valor do software
- As equipes estão aprendendo a fornecer conhecimento de forma mais eficaz aos agentes de codificação
- As equipes estão experimentando novas práticas, como definir instruções personalizadas por meio de arquivos AGENTS.md e integrar com servidores MCP como Context7 para buscar documentação atualizada de dependências
- Cresce a percepção de que a IA deve ampliar não apenas contribuidores individuais, mas a equipe inteira
- Instruções compartilhadas curadas e comandos personalizados estão surgindo para garantir uma disseminação mais equitativa do conhecimento
- O ambiente de ferramentas está evoluindo intensamente:
- Designers usam UX Pilot e AI Design Reviewer, enquanto desenvolvedores usam v0 e Bolt para criar protótipos rapidamente por meio de prototipação self-service de UI
- Segue o debate sobre o alcance do desenvolvimento orientado por especificação, seu nível de granularidade e seu potencial como fonte única de verdade para entrega incremental
- Mesmo com o entusiasmo, a complacência em relação ao código gerado por IA continua sendo uma preocupação comum, lembrando que a IA pode acelerar a engenharia, mas o julgamento humano segue indispensável
Surgimento de novos antipadrões de IA
- À medida que a adoção de IA acelera em toda a indústria, antipadrões emergentes também vêm à tona junto com práticas eficazes
- Embora se reconheça a utilidade clara de conceitos como prototipação self-service descartável de UI com GenAI, também se reconhece o potencial de levar organizações ao antipadrão de Shadow IT acelerado por IA
- Com o destaque dado ao MCP (Model Context Protocol), muitas equipes estão caindo no antipadrão de conversão ingênua de API para MCP
- A eficácia de soluções Text-to-SQL ficou aquém das expectativas iniciais, e a complacência em relação ao código gerado por IA continua sendo uma preocupação relevante
- Mesmo dentro de práticas emergentes como desenvolvimento orientado por especificação, existe o risco de regressão para antipadrões tradicionais de engenharia de software
— especialmente a especificação excessiva antecipada e o viés por lançamentos big bang
- Mesmo dentro de práticas emergentes como desenvolvimento orientado por especificação, existe o risco de regressão para antipadrões tradicionais de engenharia de software
- Como a GenAI está evoluindo em velocidade e escala sem precedentes, espera-se que novos antipadrões surjam rapidamente
- As equipes precisam se manter alertas a padrões que parecem eficazes no início, mas que com o tempo degradam desempenho, retardam feedback, prejudicam a adaptabilidade ou tornam a responsabilização mais nebulosa
ThoughtWorks Technology Radar Volume 33
[Techniques]
Adopt
1. Continuous compliance
- Prática que garante que o processo de desenvolvimento de software e a tecnologia atendam continuamente a padrões regulatórios e de segurança por meio de automação
- Integração de ferramentas policy-as-code como Open Policy Agent e geração de SBOM no pipeline de CD para detectar e resolver problemas de conformidade em estágios iniciais de acordo com as diretrizes SLSA
- Ao codificar regras e boas práticas, é possível aplicar padrões de forma consistente em toda a equipe sem criar gargalos
- Com o aumento do risco de complacência em relação ao código gerado por IA, embutir conformidade no processo de desenvolvimento é mais importante do que nunca
2. Curated shared instructions for software teams
- Para equipes que usam IA ativamente na entrega de software, o movimento é sair do prompting individual e avançar para instruções curadas
- A forma mais intuitiva de implementar isso é commitar arquivos de instruções como AGENTS.md diretamente no repositório do projeto
- A maioria das ferramentas de codificação com IA, como Cursor, Windsurf e Claude Code, oferece suporte ao compartilhamento de instruções por meio de comandos slash personalizados ou workflows
- Assim que os prompts são melhorados, toda a equipe se beneficia, garantindo acesso consistente às melhores instruções de IA
3. Pre-commit hooks
- Os Git hooks existem há muito tempo, mas continuam subutilizados
- Com a ascensão da codificação assistida por IA e da codificação com agentes, cresce o risco de commitar segredos ou código problemático por engano
- Há muitos mecanismos de validação de código, como continuous integration, mas hooks de pre-commit são uma proteção simples e eficaz que mais equipes deveriam adotar
- O ideal é mantê-los enxutos e focados nos riscos que são capturados com mais eficácia nessa etapa do workflow, como secret scanning
4. Uso de GenAI para entender codebases legados
- O uso de GenAI para compreender codebases legados acelera significativamente o entendimento de sistemas complexos em larga escala
- Ferramentas como Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ajudam a explicitar regras de negócio, resumir lógica e identificar dependências
- Quando usado em conjunto com frameworks abertos e prompting direto para LLMs, o tempo necessário para entender codebases legados é reduzido de forma drástica
- O esforço de configuração de abordagens avançadas como GraphRAG varia especialmente conforme o tamanho e a complexidade do codebase analisado, mas o impacto na produtividade é consistente e substancial
Trial
5. AGENTS.md
- Um formato comum para fornecer instruções a agentes de codificação com IA que trabalham em um projeto
- Essencialmente, é um arquivo README para agentes, sem campos obrigatórios nem formato além de Markdown
- Depende da capacidade dos agentes de codificação baseados em LLM de interpretar instruções escritas e legíveis por humanos
- É comum incluir dicas de uso de ferramentas no ambiente de desenvolvimento, instruções de teste e práticas preferidas para gerenciamento de commits
6. IA para migrações de código
- Migrações de código assumem várias formas, desde reescrita de linguagem até upgrades de dependências ou frameworks, e muitas vezes exigem meses de trabalho manual
- Equipes de upgrade de versão do framework .NET estão experimentando o uso de IA para encurtar o processo
- No passado, eram usadas ferramentas determinísticas de refatoração baseadas em regras, como OpenRewrite; usar apenas IA tende a ser caro e a conversa pode facilmente se perder
- Em vez de delegar o upgrade inteiro, o processo é decomposto em etapas menores e verificáveis, como análise de erros de compilação, geração de diff de migração e validação iterativa de testes
- Casos da indústria, como a migração em larga escala de int32 para int64 do Google, também refletem uma tendência semelhante
7. Delta Lake liquid clustering
- Uma tecnologia para tabelas Delta Lake que funciona como alternativa a particionamento e Z-ordering
- Historicamente, a otimização do desempenho de leitura de tabelas Delta exigia definir partições e chaves de Z-order no momento da criação da tabela, com base em padrões de consulta esperados
- O liquid clustering usa um algoritmo baseado em árvore para agrupar dados com base em chaves especificadas
- Pode ser alterado gradualmente sem reescrever todos os dados, oferecendo mais flexibilidade para atender a diferentes padrões de consulta
- O Databricks Runtime for Delta Lake oferece suporte a liquid clustering automático por meio da análise de workloads de consulta anteriores, identificação de colunas ideais e clustering dos dados de acordo com isso
8. Prototipagem de UI self-service com GenAI
- Ferramentas como Claude Code, Figma Make, Miro AI, v0 permitem que gerentes de produto gerem diretamente protótipos interativos e testáveis por usuários a partir de prompts de texto
- Em vez de criar wireframes manualmente, as equipes conseguem gerar artefatos funcionais em HTML, CSS e JS em poucos minutos
- Esses protótipos "descartáveis" trocam refinamento por aprendizado rápido, sendo ideais para validação inicial durante design sprints
- Maior fidelidade pode levar a foco equivocado em detalhes ou a expectativas irreais sobre o esforço de produção, tornando essencial um enquadramento claro e o gerenciamento de expectativas
9. Saída estruturada de LLMs
- Prática de restringir LLMs para que gerem respostas em formatos predefinidos, como JSON ou classes específicas de programação
- Converte o texto geralmente imprevisível dos LLMs em contratos de dados determinísticos e legíveis por máquina, algo essencial para construir aplicações confiáveis de nível de produção
- As abordagens variam desde formatação simples baseada em prompt e saídas estruturadas nativas do modelo até métodos mais robustos de constrained decoding com ferramentas como Outlines e Instructor
- Tem sido usado com sucesso para extrair dados complexos e não estruturados de vários tipos de documentos e convertê-los em JSON estruturado para lógica de negócio downstream
10. TCR (Test && Commit || Revert)
- Um workflow de programação derivado do desenvolvimento orientado a testes que incentiva etapas muito pequenas e contínuas por meio de regras simples
- Após cada mudança, se os testes passarem, as alterações são commitadas; se falharem, as alterações são revertidas
- A implementação é simples, exigindo apenas a definição de scripts que automatizem esse ciclo dentro do codebase
- Introduzido pela primeira vez no artigo oficial de Kent Beck, o TCR reforça práticas positivas de codificação como YAGNI e KISS
Assess
11. Testes de UI com IA
- No Radar anterior, os testes de UI baseados em IA eram voltados principalmente para testes exploratórios, e foi mencionado que a não determinismo dos LLMs poderia causar instabilidade
- Com a ascensão do MCP, frameworks importantes de teste de UI como Playwright e Selenium passaram a adotar seus próprios servidores MCP (playwright-mcp, mcp-selenium)
- Ao oferecer automação confiável de navegador por meio de tecnologias nativas, assistentes de codificação podem gerar testes de UI confiáveis em Playwright ou Selenium
- Há entusiasmo com desenvolvimentos como Playwright Agents nas releases mais recentes do Playwright, com expectativa pelo surgimento de orientações mais práticas e experiências de campo
12. Ancorando agentes de código a uma aplicação de referência
- No passado, sinalizamos o padrão de tailored service templates, que ajuda organizações que adotam microsserviços a iniciar novos serviços e integrá-los sem atrito à infraestrutura existente
- Com o tempo, à medida que surgem novas dependências, frameworks e padrões de arquitetura, tende a aumentar o desvio de código entre esses templates e os serviços existentes
- Na era dos agentes de código, estamos experimentando anchoring coding agents to a reference application para manter boas práticas e consistência arquitetural
- Um servidor Model Context Protocol (MCP) expõe tanto o código do template de referência quanto os diffs de commits, permitindo que os agentes detectem desvios e proponham correções
13. Engenharia de contexto
- Projeto e otimização sistemáticos das informações fornecidas ao LLM durante a inferência para gerar, de forma confiável, a saída desejada
- Inclui estruturação, seleção e ordenação de elementos de contexto como prompts, dados recuperados, memória, instruções e sinais do ambiente
- Diferentemente de prompt engineering, que foca apenas na formulação do prompt, context engineering considera a composição completa do contexto
- Hoje, engenheiros usam várias técnicas distintas que podem ser agrupadas em três áreas: Context setup, Context management for long-horizon tasks, Dynamic information retrieval
14. GenAI para forward engineering
- Técnica emergente para modernizar sistemas legados por meio de descrições de codebases legados geradas por AI
- Introduz uma etapa explícita focada no que o código legado faz (a especificação), ocultando deliberadamente como ele é implementado hoje
- Relaciona-se com spec-driven development, mas é aplicada especificamente à modernização de legados
- Seguindo o loop reverse-engineering → design/solutioning → forward-engineering, tanto humanos quanto agentes de AI podem raciocinar em um nível mais alto antes de se comprometer com a implementação
15. GraphQL como padrão de acesso a dados para LLMs
- Abordagem emergente para criar uma camada uniforme de acesso a dados, amigável ao modelo, para aprimorar context engineering
- Permite expor dados estruturados e consultáveis sem conceder ao modelo acesso direto ao banco de dados
- Ao contrário de APIs REST, que exigem novos endpoints ou filtros para cada caso de uso, GraphQL permite que o modelo recupere apenas os dados necessários
- Um schema GraphQL bem definido fornece metadados que o LLM pode usar para raciocinar sobre entidades e relacionamentos disponíveis
16. Fluxos de conhecimento acima de estoques de conhecimento
- Recebemos com frequência a pergunta “como melhorar a forma como as equipes compartilham informação entre si”
- O conceito de knowledge flows and knowledge stocks, uma perspectiva emprestada do pensamento sistêmico, é valioso
- Ele incentiva a ver o conhecimento organizacional como um sistema — os estoques representam o conhecimento acumulado e os fluxos representam como o conhecimento se move e evolui pela organização
- Aumentar o fluxo de conhecimento externo para dentro da organização tende a impulsionar a inovação, e estabelecer communities of practice é uma forma comprovada de melhorar esse fluxo
17. LLM como juiz
- O uso de LLM como juiz para avaliar a saída de outros sistemas (geralmente geradores baseados em LLM) chamou atenção por seu potencial de oferecer avaliação automatizada e escalável em AI generativa
- Este blip foi movido de Trial para Assess para refletir complexidades e riscos recentemente reconhecidos
- As avaliações são vulneráveis a position bias, verbosity bias e baixa robustez, e um problema ainda mais sério é scaling contamination
- Para lidar com essas falhas, estão sendo exploradas técnicas aprimoradas, como LLMs as a jury (uso de vários modelos para obter consenso) ou raciocínio chain-of-thought durante a avaliação
18. Recuperação de informação on-device
- Técnica que permite que busca, reconhecimento de contexto e retrieval-augmented generation (RAG) sejam executados inteiramente no dispositivo do usuário (móvel, desktop ou edge)
- Prioriza privacidade e eficiência computacional, combinando bancos de dados locais leves com modelos otimizados para inferência on-device
- Uma implementação promissora combina sqlite-vec (uma extensão do SQLite que oferece busca vetorial dentro do banco de dados embarcado) com EmbeddingGemma (um modelo de embeddings de 300 milhões de parâmetros baseado na arquitetura Gemma 3)
- Recomendado para avaliação em aplicações local-first e outros casos de uso em que soberania de dados, baixa latência e privacidade são críticas
19. SAIF
- SAIF (Secure AI Framework) é um framework desenvolvido pelo Google para oferecer orientação prática no gerenciamento de riscos de segurança em AI
- Trata sistematicamente ameaças comuns, como envenenamento de dados e prompt injection, por meio de mapas de risco claros, análise de componentes e estratégias práticas de mitigação
- Seu foco nos riscos em evolução da construção de sistemas agentes é especialmente oportuno e valioso
- Fornece um playbook conciso e acionável que pode ser usado para fortalecer práticas de segurança no uso de LLMs e em aplicações baseadas em AI
20. Service mesh sem sidecar
- À medida que persistem o custo e a complexidade operacional dos service meshes baseados em sidecar, há entusiasmo com o surgimento de opções sem sidecar, como o Istio ambient mode
- O ambient mode introduz uma arquitetura em camadas que separa responsabilidades entre dois componentes principais: um proxy L4 por nó (ztunnel) e um proxy L7 por namespace (Waypoint proxy)
- O ztunnel garante que o tráfego L3 e L4 seja transmitido de forma eficiente e segura, obtendo certificados para todas as identidades do nó e tratando o redirecionamento de tráfego com workloads compatíveis com ambient
- O Waypoints proxy é um componente opcional do ambient mode que habilita recursos mais avançados do Istio, como gerenciamento de tráfego, segurança e observabilidade
21. Small language models
- Ao longo de vários volumes do Technology Radar, foi observado o progresso contínuo dos small language models (SLMs)
- Com o aumento do interesse na construção de soluções com agentes, cresce a evidência de que SLMs podem impulsionar a IA de agentes com eficiência
- A maioria dos fluxos de trabalho de agentes atuais se concentra em tarefas estreitas e repetitivas que não exigem raciocínio avançado, o que os torna adequados para SLMs
- A evolução contínua de SLMs como Phi-3, SmolLM2 e DeepSeek oferece capacidade suficiente para essas tarefas
22. Spec-driven development
- Uma abordagem emergente para fluxos de trabalho de codificação assistidos por IA, cuja definição do termo ainda está em evolução
- Em geral, refere-se a um fluxo de trabalho que começa com especificações estruturadas de funcionalidades e depois as decompõe, ao longo de várias etapas, em partes menores, soluções e tarefas
- O Kiro da Amazon guia o usuário por três etapas do fluxo de trabalho: requisitos, design e geração de tarefas
- O spec-kit do GitHub segue um processo semelhante de três etapas, mas adiciona uma orquestração mais rica, prompts configuráveis e uma "constitution" que define princípios imutáveis a serem sempre seguidos
23. Team of coding agents
- Técnica em que o desenvolvedor orquestra vários agentes de codificação com IA, cada um com um papel específico, como architect, back-end specialist e tester
- Ferramentas como Claude Code, Roo Code e Kilo Code oferecem suporte a subagentes e a múltiplos modos de operação
- Com base no princípio já comprovado de que atribuir papéis e personas específicos a LLMs melhora a qualidade da saída, coordenar vários agentes especializados produz resultados melhores do que depender de um único agente genérico
- Indica uma transição para pipelines de desenvolvimento assistido por IA orquestrados e em múltiplas etapas
24. Topology-aware scheduling
- GPUs e LPUs já não são dispositivos independentes, mas redes de aceleradores fortemente acopladas, cujo desempenho depende da disposição e da topologia
- Em sistemas em escala de rack como o NVL72 da NVIDIA, 72 GPUs compartilham mais de 13 TB de VRAM e operam como um único acelerador, mas quando a carga de trabalho cruza switch islands, operações coletivas passam a ser um gargalo
- A arquitetura da Groq, com agendamento em software em tempo de compilação, pressupõe movimentação determinística de dados, e o agendamento aleatório quebra essas suposições e a previsibilidade
- Agendadores ingênuos que ignoram a topologia frequentemente distribuem cargas de trabalho multi-GPU de forma arbitrária, causando piora no tempo por etapa e na eficiência
25. Toxic flow analysis for AI
- A piada recorrente de que o S de MCP significa "security" esconde um problema bastante real
- Quando agentes se comunicam entre si por chamadas de ferramentas ou APIs, podem rapidamente encontrar o que é conhecido como lethal trifecta: acesso a dados pessoais, exposição a conteúdo não confiável e capacidade de comunicação externa
- Um agente com essas três capacidades é altamente vulnerável, e como LLMs tendem a seguir instruções presentes na entrada, conteúdo de fontes não confiáveis com instruções para exfiltrar dados pode facilmente levar a vazamento de dados
- A toxic flow analysis examina o grafo de fluxos de um sistema de agentes para identificar caminhos de dados potencialmente inseguros que merecem investigação adicional
Hold
26. AI-accelerated shadow IT
- A IA reduz a barreira para que não programadores construam e integrem software por conta própria, em vez de esperar pelo departamento de TI
- Embora haja entusiasmo com o potencial que isso libera, há atenção aos primeiros sinais de AI-accelerated shadow IT
- Plataformas no-code de automação de fluxos de trabalho agora oferecem integração com APIs de IA, como OpenAI ou Anthropic, criando a tentação de usar IA como fita adesiva para conectar integrações que antes eram impossíveis
- Ao mesmo tempo, assistentes de codificação com IA estão se tornando mais agentivos, permitindo que não programadores com treinamento básico criem aplicações utilitárias internas
27. Capacity-driven development
- Um elemento central do sucesso das práticas modernas de desenvolvimento de software é manter o foco no fluxo de trabalho
- Equipes stream-aligned concentram-se em um único fluxo de valor, como a jornada do usuário ou um produto, para entregar valor de ponta a ponta com eficiência
- No entanto, foi observada uma tendência preocupante em direção ao capacity-driven development, em que equipes alinhadas dessa forma assumem funcionalidades de outros produtos ou fluxos quando têm capacidade ociosa
- No curto prazo isso pode parecer eficiente, mas é uma otimização local adequada apenas para lidar com picos de demanda e, se normalizada, aumenta a carga cognitiva e a dívida técnica
28. Complacency with AI-generated code
- À medida que assistentes e agentes de codificação com IA ganham destaque, aumentam os dados e estudos que reforçam as preocupações com complacency with AI-generated code
- Há evidências suficientes de que essas ferramentas podem acelerar o desenvolvimento, mas pesquisas mostram que a qualidade do código pode se deteriorar com o tempo
- Na pesquisa de 2024 da GitClear, código duplicado e code churn aumentaram mais do que o esperado, enquanto a atividade de refatoração no histórico de commits diminuiu
- A pesquisa da Microsoft com trabalhadores do conhecimento mostra que a confiança impulsionada por IA frequentemente surge às custas do pensamento crítico
29. Naive API-to-MCP conversion
- Organizações demonstram grande interesse em converter de forma fluida e direta APIs internas para o Model Context Protocol (MCP), para que agentes de IA possam interagir com sistemas existentes
- Há um número crescente de ferramentas como MCP link e FastAPI-MCP que buscam apoiar essa conversão
- Há oposição a essa naive API-to-MCP conversion, porque APIs normalmente são projetadas para desenvolvedores humanos e consistem em operações atômicas granulares que, quando encadeadas por IA, podem levar a uso excessivo de tokens, poluição de contexto e piora no desempenho do agente
- Essas APIs com frequência expõem dados sensíveis ou permitem ações destrutivas, especialmente no caso de APIs internas
30. Equipes de engenharia de dados independentes
- Organizar uma equipe separada de engenharia de dados que desenvolve e é proprietária de pipelines e produtos de dados, à parte do domínio de negócio que fornece os fluxos ordenados, é um antipadrão que leva a ineficiências e resultados de negócio fracos
- Essa estrutura repete erros do passado ao separar capacidades de DevOps, testes ou implantação, gerando silos de conhecimento, gargalos e desperdício de esforço
- Sem colaboração próxima, engenheiros de dados frequentemente não têm o contexto de negócio e de domínio necessário para projetar produtos de dados significativos, limitando tanto a adoção quanto o valor
- Em vez disso, equipes de plataforma de dados devem se concentrar na manutenção da infraestrutura compartilhada, enquanto equipes de negócio multifuncionais constroem e são proprietárias de seus próprios data products de acordo com os princípios de data mesh
31. Text to SQL
- Text to SQL usa LLMs para traduzir linguagem natural em SQL executável, mas a confiabilidade muitas vezes fica aquém das expectativas
- Este blip foi movido para Hold para desaconselhar o uso em fluxos de trabalho não supervisionados — por exemplo, quando a saída fica oculta ou consultas geradas automaticamente por usuários são convertidas dinamicamente
- Nesses casos, os LLMs frequentemente alucinam devido à compreensão limitada do esquema ou do domínio, criando risco de recuperação incorreta de dados ou modificação não intencional de dados
- Para agentic business intelligence, evite acesso direto ao banco de dados e use, em vez disso, uma camada semântica de abstração de dados gerenciada, como Cube ou dbt's semantic layer
[Platforms]
Adopt
32. Arm na nuvem
- Instâncias de computação Arm na nuvem vêm ganhando popularidade nos últimos anos por sua eficiência de custo e energética em comparação com instâncias tradicionais baseadas em x86
- Grandes provedores de nuvem, incluindo AWS, Azure e GCP, agora oferecem opções Arm robustas
- Muitas equipes migraram com sucesso workloads como microsserviços, bancos de dados open source e até computação de alto desempenho para Arm com mudanças mínimas no código e apenas alguns ajustes em scripts de build
- Ferramentas modernas como multi-arch Docker images simplificam o build e a implantação tanto em ambientes Arm quanto x86
Trial
33. Apache Paimon
- Apache Paimon é um formato open source de data lake projetado para viabilizar a lakehouse architecture
- Integra-se de forma fluida com engines de processamento como Flink e Spark, oferecendo suporte tanto a tarefas de streaming quanto de batch
- Uma vantagem-chave da arquitetura do Paimon é a fusão entre formatos padrão de data lake e a estrutura LSM (log-structured merge tree)
- Essa combinação resolve desafios tradicionais dos data lakes relacionados a atualizações de alto desempenho e leituras de baixa latência
34. DataDog LLM Observability
- Datadog LLM Observability fornece rastreamento, monitoramento e diagnóstico de ponta a ponta para workflows de aplicações com grandes modelos de linguagem e agentes
- Mapeia cada prompt, chamada de ferramenta e etapa intermediária em spans e traces, rastreia latência, uso de tokens, erros e métricas de qualidade, e integra-se ao amplo conjunto de produtos de APM e observabilidade da Datadog
- Organizações que já usam Datadog e estão familiarizadas com sua estrutura de custos podem considerar os recursos de visibilidade para LLM uma forma intuitiva de obter visibilidade sobre workloads de IA, desde que consigam instrumentar esses workloads
- Configurar e usar a instrumentação de LLM exige cuidado e uma compreensão sólida do workload e da implementação, sendo recomendada colaboração próxima entre engenheiros de dados e equipe de operações durante a implantação
35. Delta Sharing
- Delta Sharing é um padrão aberto e protocolo para compartilhamento seguro de dados entre plataformas, desenvolvido pela Databricks e pela Linux Foundation
- É independente de nuvem e permite que organizações compartilhem dados ao vivo entre provedores de nuvem e ambientes on-premises sem copiar ou replicar os dados
- Usando uma API REST simples, emite URLs pré-assinadas de curta duração para que destinatários possam consultar grandes conjuntos de dados com ferramentas como pandas, Spark ou Power BI
- Oferece suporte ao compartilhamento de tabelas de dados, views, modelos de IA e notebooks, além de fornecer governança centralizada forte e auditoria
36. Dovetail
- A plataforma Dovetail aborda o desafio persistente de gerenciar dados de pesquisa qualitativa dispersos
- Fornece um repositório centralizado para entrevistas com usuários, transcrições e insights, transformando dados brutos em ativos estruturados e analisáveis
- É especialmente útil em workflows de product discovery para criar rastreabilidade de evidências, conectando diretamente citações de clientes e temas sintetizados a hipóteses de produto e ROI esperado
- Ao fazer isso, o Dovetail fortalece o papel dos dados qualitativos na tomada de decisão de produto
37. Langdock
- Langdock é uma plataforma para que organizações desenvolvam e executem agentes de IA generativa e workflows para operações internas
- Oferece um ambiente integrado com assistente interno de chat, uma camada de API para se conectar a vários LLMs e ferramentas para criar workflows de agentes integrados a sistemas como Slack, Confluence e Google Drive
- A plataforma enfatiza soberania de dados ao oferecer opções on-premises e hospedagem na UE com padrões de conformidade empresarial
- Organizações que implantam o Langdock ainda devem dar atenção cuidadosa à governança de dados e usar técnicas como toxic flow analysis para evitar a lethal trifecta
38. LangSmith
- LangSmith é a plataforma hospedada da equipe do LangChain para fornecer visibilidade, rastreamento e avaliação de aplicações com LLM
- Captura traces detalhados de chains, ferramentas e prompts para que equipes possam depurar e medir o comportamento do modelo, acompanhar regressões de desempenho e gerenciar conjuntos de dados de avaliação
- O LangSmith é uma plataforma SaaS proprietária com suporte limitado a workflows non-LangChain, sendo mais atraente para equipes que já investiram nesse ecossistema
- O suporte integrado para avaliação de prompts e experimentação é particularmente mais refinado do que alternativas open source como Langfuse
39. Model Context Protocol (MCP)
- Model Context Protocol (MCP) é um padrão aberto que define como aplicações e agentes de LLM se integram a fontes de dados e ferramentas externas
- O MCP se diferencia do protocolo Agent2Agent (A2A), que gerencia a comunicação entre agentes com foco em contexto e acesso a ferramentas
- Desde o último blip, a adoção do MCP disparou, com grandes empresas como JetBrains (IntelliJ) e Apple entrando no ecossistema junto com frameworks emergentes como FastMCP
- O padrão de prévia MCP Registry agora também oferece suporte à descoberta de ferramentas públicas e proprietárias
40. n8n
- n8n é uma plataforma de automação de workflows com licença fair-code, semelhante ao Zapier ou Make (antigo Integromat), mas criada para desenvolvedores que querem opções de self-hosting, extensibilidade e controle por código
- Oferece uma abordagem visual e low-code para criação de workflows em comparação com o Apache Airflow, ao mesmo tempo em que suporta código customizado em JavaScript ou Python
- O principal caso de uso é integrar vários serviços em workflows automatizados, mas também pode conectar LLMs a fontes de dados, memória e ferramentas configuráveis
- Muitas equipes usam o n8n para prototipar rapidamente workflows de agentes acionados por aplicações de chat ou webhooks, muitas vezes aproveitando os recursos de import e export para gerar workflows com ajuda de IA
41. OpenThread
- OpenThread é uma implementação open source do protocolo de rede Thread desenvolvida pelo Google
- Suporta todos os principais recursos da especificação Thread, incluindo camadas de rede como IPv6, 6LoWPAN e LR-WPAN, além de recursos de rede mesh em que dispositivos podem atuar como nós e border routers
- O OpenThread roda em uma ampla variedade de plataformas de hardware, usando uma camada de abstração flexível e hooks de integração que permitem aos fornecedores integrar seus próprios recursos de rádio e criptografia
- Esse protocolo maduro é amplamente usado em produtos comerciais e, pela experiência deles, é confiável para construir diversas soluções de IoT, de dispositivos de baixo consumo movidos a bateria a grandes redes mesh de sensores
Assess
42. AG-UI Protocol
- AG-UI é um protocolo e biblioteca abertos projetados para padronizar interfaces de usuário ricas e a comunicação entre agentes
- Foca em agentes voltados diretamente ao usuário e generaliza para qualquer frontend e backend por meio de integrações de middleware e cliente
- O protocolo define uma forma consistente de agentes de backend se comunicarem com aplicações de frontend, permitindo colaboração em tempo real com estado persistente entre IA e usuários humanos
- Suporta vários protocolos de transporte, incluindo SSE e WebSockets, e fornece tipos de eventos padronizados que representam diferentes estados da execução do agente
43. Agent-to-Agent (A2A) Protocol
- Agent2Agent (A2A) é um protocolo que define um padrão para comunicação e interação entre agentes em workflows complexos com múltiplos agentes
- Usa Agent Cards para descrever elementos centrais da comunicação entre agentes, incluindo especificações para descoberta de capacidades e transporte, além de esquemas de segurança
- O A2A complementa o Model Context Protocol (MCP) ao focar na comunicação entre agentes sem expor detalhes internos, como estado, memória ou componentes internos do agente
- O protocolo promove boas práticas como uma abordagem assíncrona por padrão para tarefas de longa duração, respostas em streaming para atualizações graduais e transporte seguro com HTTPS, autenticação e autorização
44. Amazon S3 Vectors
- Amazon S3 Vectors expande o armazenamento de objetos do S3 com recursos nativos de vetores, oferecendo armazenamento vetorial integrado e busca por similaridade
- Integra-se de forma fluida ao ecossistema AWS, incluindo Amazon Bedrock e OpenSearch, e oferece recursos adicionais como filtragem por metadados e governança via IAM
- Ainda está em prévia e tem limitações, mas sua proposta de valor é atraente — essa abordagem de armazenamento vetorial acessível e com bom custo-benefício pode viabilizar diversas aplicações envolvendo grandes volumes de dados, nas quais baixa latência não seja a principal preocupação
45. Ardoq
- Ardoq é uma plataforma de arquitetura corporativa (EA) que permite às organizações construir, gerenciar e ampliar uma base de conhecimento de arquitetura para planejar o futuro com mais eficácia
- Diferentemente da documentação estática tradicional, que tende a sofrer drift e ficar em silos, a abordagem orientada a dados da Ardoq cria um grafo de conhecimento dinâmico que importa informações de sistemas existentes e se mantém atualizado à medida que o ambiente evolui
- Um recurso especialmente útil é o Ardoq Scenarios, que permite modelar e definir visualmente estados futuros hipotéticos usando uma abordagem de branching e merge semelhante à do Git
- Organizações que buscam uma transformação arquitetural deveriam avaliar plataformas dedicadas de EA como a Ardoq pelo potencial de simplificar e acelerar esse processo
46. CloudNativePG
- CloudNativePG é um Kubernetes Operator que simplifica hospedar e gerenciar clusters PostgreSQL de alta disponibilidade no Kubernetes
- Executar serviços com estado, como PostgreSQL, no Kubernetes pode ser complexo, pois exige conhecimento profundo tanto de Kubernetes quanto de replicação do PostgreSQL
- O CloudNativePG abstrai boa parte dessa complexidade ao tratar um cluster PostgreSQL inteiro como um único recurso declarativo configurável
- Oferece uma arquitetura primary/standby fluida com replicação por streaming nativa e já inclui recursos de alta disponibilidade, como self-healing, failover automático promovendo a réplica mais sincronizada e recriação automática de réplicas com falha
47. Coder
- Coder é uma plataforma para provisionar rapidamente ambientes de programação padronizados, em linha com a prática já descrita de development environments in the cloud
- Em comparação com ferramentas semelhantes como Gitpod (agora renomeado para Ona) e GitHub Codespaces, o Coder oferece maior controle sobre a customização das workstations via Terraform
- As workstations são hospedadas na própria infraestrutura da organização, em sua nuvem ou data center, e não nos servidores do fornecedor
- Essa abordagem oferece mais flexibilidade, incluindo a capacidade de executar agentes de codificação com IA e acessar sistemas internos da organização
48. Graft
- Graft é um mecanismo de armazenamento transacional que possibilita sincronização de dados forte, consistente e eficiente em ambientes de borda e distribuídos
- Usa lazy replication para sincronizar dados apenas quando necessário, partial replication para minimizar o consumo de banda e serializable snapshot isolation para garantir a integridade dos dados
- Embora o Radar tenha mencionado Electric para casos de uso semelhantes, o Graft se destaca por transformar o object storage em um sistema transacional que suporta atualizações consistentes em nível de página sem impor um formato de dados
- É adequado para impulsionar aplicações móveis local-first, gerenciar sincronização complexa entre plataformas e servir como espinha dorsal de réplicas stateless em sistemas serverless ou embarcados
49. groundcover
- groundcover é uma plataforma cloud-native de observabilidade que unifica logs, traces, métricas e eventos do Kubernetes em uma única interface
- Usa eBPF para capturar dados granulares de observabilidade com instrumentação zero-code, sem inserir agentes ou SDKs no código da aplicação
- O sensor eBPF do groundcover é executado em um nó dedicado de cada cluster monitorado, operando de forma independente das aplicações observadas
- Os principais recursos incluem observabilidade profunda em nível de kernel, arquitetura bring-your-own-cloud (BYOC) para privacidade dos dados e um modelo de precificação independente do volume de dados, mantendo os custos previsíveis
50. Karmada
- Karmada ("Kubernetes Armada") é uma plataforma para orquestrar workloads em múltiplos clusters Kubernetes, nuvens e data centers
- Muitas equipes atualmente implantam em vários clusters combinando ferramentas GitOps como Flux ou ArgoCD com scripts customizados, então uma solução específica para esse propósito é bem-vinda
- O Karmada usa APIs nativas do Kubernetes, eliminando a necessidade de modificar aplicações já construídas para ambientes cloud-native
- Oferece recursos avançados de agendamento para gerenciamento multicloud, alta disponibilidade, recuperação de desastres e agendamento de tráfego
51. OpenFeature
- À medida que o negócio escala, o gerenciamento de feature flags frequentemente se torna cada vez mais complexo, e as equipes passam a precisar de uma camada de abstração que vá além do feature toggle mais simples
- OpenFeature fornece essa camada por meio de uma especificação de API independente de fornecedor e orientada pela comunidade, que padroniza como feature flags são definidas e consumidas
- A CLI oferece amplo suporte a vários esquemas de definição, desde configurações básicas com variáveis de ambiente ou configuração em memória até plataformas mais maduras como ConfigCat ou LaunchDarkly
- No entanto, permanece uma observação importante: as equipes devem gerenciar separadamente e com disciplina as diferentes categorias de flags para evitar proliferação de flags, complexidade na aplicação e excesso de overhead de testes
52. Oxide
- Construir e operar infraestrutura privada é algo complexo, e esse é um dos principais motivos pelos quais a nuvem pública é a opção padrão para a maioria das organizações
- Mas, para quem precisa disso, a Oxide oferece uma alternativa que monta e integra hardware e software desde o início
- Fornece racks pré-montados com computação, rede e armazenamento executando software de sistema totalmente integrado
- As equipes podem gerenciar recursos pela API de IaaS da Oxide usando Terraform e outras ferramentas de automação — o que a Oxide chama de infraestrutura elástica on-premises
53. Restate
- Restate é uma plataforma de execução durável projetada para resolver desafios complexos de sistemas distribuídos na construção de aplicações stateful e tolerantes a falhas
- Por meio de journaling de execução, registra cada etapa para garantir tolerância a falhas, recuperação confiável e comunicação exatamente uma vez entre serviços
- A principal vantagem arquitetural da plataforma é separar a lógica da aplicação em três tipos de serviços duráveis: Basic Services para funções stateless, Virtual Objects para modelar entidades stateful concorrentes e Workflows para orquestrar processos complexos com várias etapas
- Estamos avaliando o Restate com cuidado em um sistema de seguros de grande escala e, até agora, estamos muito satisfeitos com o desempenho
54. SkyPilot
- SkyPilot é uma plataforma open source para executar e escalar workloads de IA on-premises ou na nuvem
- Desenvolvido pelo Sky Computing Lab da UC Berkeley, o SkyPilot atua como um broker inteligente, encontrando e provisionando automaticamente as GPUs mais baratas e disponíveis entre os principais provedores de nuvem e clusters Kubernetes, frequentemente reduzindo os custos de computação
- Para equipes de infraestrutura, ele simplifica a execução de IA no Kubernetes ao oferecer recursos como a facilidade de uso do Slurm, robustez cloud-native, acesso SSH direto aos pods, gang scheduling e suporte a múltiplos clusters
- Suporta expansão fluida de workloads de treinamento ou inferência
55. StarRocks
- StarRocks é um banco de dados analítico que redefine a business intelligence em tempo real ao combinar a velocidade dos sistemas OLAP tradicionais com a flexibilidade dos data lakehouses modernos
- Alcança latência de consulta abaixo de um segundo em larga escala por meio de um engine de execução otimizado com SIMD, armazenamento colunar e um sofisticado otimizador baseado em custo
- Essa arquitetura de alto desempenho permite que usuários executem análises complexas diretamente em formatos de dados abertos como Apache Iceberg, sem pré-cálculo nem cópia de dados
- Existem muitas plataformas nesse espaço, mas vemos o StarRocks como um forte candidato a solução econômica para cenários que exigem simultaneamente concorrência extrema e atualização consistente dos dados mais recentes
56. Uncloud
- Uncloud é uma ferramenta leve de orquestração e clustering de contêineres que permite aos desenvolvedores levar aplicações Docker Compose para produção
- Oferece uma experiência simples, semelhante à nuvem, sem o overhead operacional do Kubernetes
- Alcança escalabilidade entre máquinas e deploys sem downtime ao configurar automaticamente uma rede mesh segura com WireGuard para comunicação e usar o proxy reverso Caddy para HTTPS automático e balanceamento de carga
- A principal vantagem arquitetural do Uncloud é seu design totalmente distribuído, eliminando a necessidade de um plano de controle central e garantindo que as operações do cluster continuem funcionais mesmo quando máquinas individuais ficam offline
[Tools]
Adopt
57. ClickHouse
- ClickHouse é um banco de dados OLAP distribuído, colunar e open source para análises em tempo real
- Amadureceu como um engine altamente performático e escalável, capaz de lidar com análise de dados em grande escala
- Views materializadas incrementais, engine de consulta eficiente e forte compressão de dados o tornam ideal para consultas interativas
- O suporte nativo a funções de agregação aproximada permite equilibrar precisão e desempenho, algo especialmente útil para análises de alta cardinalidade
58. NeMo Guardrails
- NeMo Guardrails é um toolkit open source da NVIDIA para adicionar facilmente mecanismos programáveis de segurança e controle a aplicações conversacionais baseadas em LLM
- Define e aplica regras de comportamento para garantir que as saídas sejam seguras, relevantes ao tema e compatíveis com conformidade regulatória
- Os desenvolvedores usam a linguagem específica de domínio Colang para criar fluxos conversacionais flexíveis, gerenciar conversas e aplicar caminhos predefinidos e procedimentos operacionais
- O NeMo Guardrails oferece uma API assíncrona em primeiro lugar para desempenho e suporte a guardrails para segurança de conteúdo, segurança, além de controle de entradas e saídas
59. pnpm
- Desde o último Radar, continuamos recebendo feedback positivo das equipes sobre o pnpm
- O pnpm é um gerenciador de pacotes para Node.js que oferece ganhos significativos de desempenho em relação às alternativas, tanto em velocidade quanto em eficiência de espaço em disco
- Ele oferece suporte a otimizações incrementais em nível de arquivo, que melhoram ainda mais o desempenho ao criar hard links de pacotes duplicados das pastas
node_modulesde vários projetos para um único local no disco - O pnpm se tornou a escolha padrão para gerenciamento de pacotes em Node.js, já que fornece um ciclo de feedback muito mais rápido com problemas mínimos de compatibilidade
60. Pydantic
- Pydantic é uma biblioteca Python que usa type hints padrão para definir modelos de dados e impor esquemas de dados em tempo de execução
- Originalmente, as anotações de tipo foram adicionadas ao Python para análise estática, mas sua diversidade crescente levou a usos mais amplos, incluindo validação em tempo de execução
- Construído sobre um núcleo rápido em Rust, oferece validação, parsing e serialização de dados de forma eficiente
- Tornou-se essencial em aplicações de LLM e normalmente é usado com a técnica de structured output from LLMs para lidar com a natureza imprevisível dos LLMs
Trial
61. AI Design Reviewer
- AI Design Reviewer é um plugin do Figma para realizar auditorias de design ou avaliações heurísticas e coletar feedback acionável sobre designs existentes ou novos
- As auditorias abrangem críticas de UX, inconsistências de UI, lacunas de acessibilidade, qualidade de conteúdo e cenários de edge case
- Além de identificar problemas, oferece recomendações sensíveis ao domínio que ajudam as equipes a construir um vocabulário de design compartilhado e a lógica por trás das escolhas de design
- As equipes usaram o AI Design Reviewer para analisar designs legados — identificando experiências positivas a serem mantidas e experiências negativas a serem resolvidas, ajudando a definir metas de UX para o redesign
62. Barman
- Barman (Backup and Recovery Manager) é uma ferramenta open source para gerenciar backup e recuperação de desastres de servidores PostgreSQL
- Simplifica a criação de backups físicos por vários métodos, organiza-os com um catálogo abrangente e dá suporte a todo o processo de recuperação de desastres ao restaurar backups em servidores ativos com capacidade de recuperação pontual
- Descobrimos que o Barman é robusto e fácil de usar, e ficamos profundamente impressionados com a velocidade das operações de recuperação pontual durante atividades de migração
- Também é competente em backups agendados e tem capacidade para lidar com configurações complexas e mistas de agendamento e retenção
63. Claude Code
- O Claude Code, da Anthropic, é uma ferramenta de codificação com IA agentic que oferece uma interface em linguagem natural e um modelo de execução por agentes para planejar e implementar fluxos de trabalho complexos em múltiplas etapas
- Embora tenha sido lançado há menos de um ano, já foi amplamente adotado por desenvolvedores dentro e fora da Thoughtworks, e foi colocado em Trial
- Agentes de codificação baseados em console, como o Codex CLI da OpenAI, o Gemini CLI do Google e o open source OpenCode, foram lançados, e assistentes baseados em IDE como Cursor, Windsurf e GitHub Copilot agora incluem modo agente
- Vimos equipes usá-lo não apenas para escrever e modificar código, mas também como um agente de IA de uso geral para gerenciar especificações, stories, configuração, infraestrutura e documentação
64. Cleanlab
- No paradigma de IA centrada em dados, melhorar a qualidade do dataset frequentemente traz ganhos de desempenho maiores do que ajustar o próprio modelo
- Cleanlab é uma biblioteca Python open source projetada para resolver esse problema, identificando automaticamente problemas comuns de dados como rotulagem incorreta, outliers e duplicatas em datasets de texto, imagem, dados tabulares e áudio
- Construído com base nos princípios de confident learning, o Cleanlab usa probabilidades de previsão do modelo para estimar ruído nos rótulos e quantificar a qualidade dos dados
- Essa abordagem independente de modelo permite que desenvolvedores diagnostiquem e corrijam erros no dataset e depois retreinem modelos para obter mais robustez e precisão
65. Context7
- Context7 é um servidor MCP que resolve imprecisões em código gerado por IA
- Enquanto os LLMs dependem de dados de treinamento desatualizados, o Context7 garante a geração de código preciso, atualizado e específico por versão para as bibliotecas e frameworks usados no projeto
- Ele busca documentação atualizada e exemplos de código funcionais diretamente dos repositórios-fonte dos frameworks e os injeta na janela de contexto do LLM no momento do prompting
- Em nossa experiência, o Context7 reduz significativamente alucinações de código e a dependência de dados de treinamento desatualizados
66. Data Contract CLI
- Data Contract CLI é uma ferramenta de linha de comando open source projetada para trabalhar com a especificação Data Contract
- Ela permite criar e editar contratos de dados e, mais importante, validar dados em relação ao contrato, algo essencial para garantir a integridade e a qualidade dos produtos de dados
- A CLI oferece amplo suporte a várias definições de esquema (Avro, SQL DDL, Open Data Contract Standard etc.) e pode comparar diferentes versões de contrato para detectar imediatamente mudanças que causem breaking changes
- Descobrimos que ela é especialmente útil, em especial no espaço de data mesh, para operacionalizar a governança de contratos entre produtos de dados por meio de integração com CI/CD
67. Databricks Assistant
- Databricks Assistant é uma ferramenta conversacional com IA integrada diretamente à plataforma Databricks, atuando como um pair programmer contextual para profissionais de dados
- Diferentemente de assistentes de programação de uso geral, ele se beneficia de um entendimento nativo do ambiente Databricks e do contexto dos dados, incluindo metadados do Unity Catalog
- O Assistant vai além da geração de snippets de código: ele pode escrever consultas complexas em SQL e Python com múltiplas etapas, diagnosticar erros e fornecer explicações detalhadas e específicas do workspace
- Para organizações que já investiram no ecossistema Databricks, ele pode acelerar a produtividade e reduzir a barreira de entrada para tarefas de dados complexas
68. Hoppscotch
- Hoppscotch é uma ferramenta open source leve para desenvolvimento, depuração, testes e compartilhamento de APIs
- Suporta vários protocolos, incluindo HTTP, GraphQL e WebSocket, e oferece clientes multiplataforma para ambientes web, desktop e CLI
- Embora o espaço de ferramentas de API esteja lotado de alternativas como Postman, Insomnia e Bruno, o Hoppscotch se destaca por sua pegada leve e design favorável à privacidade
- Ele dispensa analytics, usa armazenamento local-first e oferece suporte a self-hosting, sendo uma escolha forte para organizações que buscam uma forma intuitiva de compartilhar scripts de API mantendo forte privacidade de dados
69. NVIDIA DCGM Exporter
- NVIDIA DCGM Exporter é uma ferramenta open source que ajuda equipes a monitorar treinamento distribuído em GPU em larga escala
- Ela converte a telemetria proprietária do NVIDIA Data Center GPU Manager (DCGM) em um formato aberto compatível com sistemas de monitoramento padrão
- Expõe métricas críticas em tempo real, tanto das GPUs quanto dos servidores host, como utilização de GPU, temperatura, energia e contagem de erros ECC
- Essa visibilidade é essencial para organizações que fazem fine-tuning de LLMs customizados ou executam cargas de treinamento longas e intensivas em GPU
70. RelationalAI
- Quando grandes volumes de dados variados são trazidos para o Snowflake, as relações únicas e regras implícitas nesses dados podem se tornar obscuras
- Construído como um Snowflake Native App, o RelationalAI permite que equipes capturem conceitos significativos, definam entidades centrais de negócio e criem modelos sofisticados que incorporam lógica complexa diretamente sobre tabelas do Snowflake
- Com um poderoso Graph Reasoner, os usuários podem gerar, analisar e visualizar grafos de conhecimento relacionais com base nesses modelos
- Para organizações que gerenciam conjuntos de dados grandes e em rápida mudança, construir grafos de conhecimento pode ser essencial para monitoramento proativo e para gerar insights mais ricos e acionáveis
71. UX Pilot
- UX Pilot é uma ferramenta de IA que oferece suporte a várias etapas do processo de design de UX, do wireframing ao design visual de alta fidelidade e revisão
- Aceita entrada de texto ou imagem e pode gerar automaticamente telas, fluxos e layouts
- O recurso Autoflow gera transições de fluxo de usuário, e o Deep Design produz saídas mais ricas e detalhadas
- O UX Pilot também inclui um plugin para Figma que exporta os designs gerados para refinamento dentro de ferramentas de design padrão
72. v0
- O v0 evoluiu desde a última vez em que foi apresentado no Radar
- Agora inclui um modo de design que permite a gerentes de produto criar e ajustar protótipos de UI self-service com mais facilidade
- A versão mais recente introduz seu próprio modelo, com uma grande janela de contexto e recursos multimodais, permitindo que o v0 gere e refine UIs a partir de entradas textuais e visuais
- Outro acréscimo notável é o modo agente, no qual o sistema pode decompor tarefas mais complexas e selecionar o modelo apropriado para cada uma delas
Assess
73. Augment Code
- Augment Code é um assistente de codificação com IA que oferece suporte com profunda percepção de contexto em codebases de grande escala
- Destaca-se por meio de context engineering avançado, que permite atualizações rápidas do índice de código e buscas ágeis, mesmo quando o código muda com frequência
- O Augment oferece suporte a modelos como Claude Sonnet 4 e 4.5 e GPT-5, integra-se com GitHub, Jira e Confluence, e suporta Model Context Protocol (MCP) para interoperabilidade com ferramentas externas
- Fornece orientação passo a passo para mudanças complexas em codebases, de refatorações e upgrades de dependências a atualizações de schema
74. Azure AI Document Intelligence
- Azure AI Document Intelligence (anteriormente Form Recognizer) extrai texto, tabelas e pares chave-valor de documentos não estruturados e os converte em dados estruturados
- Usa modelos de deep learning pré-treinados para interpretar layout e significado, e permite treinar modelos personalizados para formatos especiais por meio de uma interface no-code
- Uma das equipes relatou que o ADI reduziu significativamente a entrada manual de dados, melhorou a precisão dos dados e acelerou os relatórios, levando a decisões mais rápidas orientadas por dados
- Assim como Amazon Textract e Google Document AI, oferece processamento de documentos de nível enterprise com forte compreensão de layout
75. Docling
- Docling é uma biblioteca open source em Python e TypeScript para processamento avançado de documentos de dados não estruturados
- Resolve o frequentemente negligenciado problema da “última milha” de converter documentos reais como PDF e PowerPoint em formatos limpos e legíveis por máquina
- Diferentemente de extratores tradicionais, o Docling usa uma abordagem baseada em visão computacional para interpretar o layout do documento e a estrutura semântica, tornando a saída especialmente valiosa para pipelines de retrieval-augmented generation (RAG)
- Converte documentos complexos em formatos estruturados como JSON ou Markdown, dando suporte a técnicas como structured output from LLMs
76. E2B
- E2B é uma ferramenta open source para executar código gerado por IA em sandboxes seguras e isoladas na nuvem
- Agentes podem usar essas sandboxes, construídas sobre microVMs Firecracker, para executar código com segurança, analisar dados, conduzir pesquisas ou operar máquinas virtuais
- Isso permite criar e implantar agentes de IA de nível enterprise com controle total do ambiente de execução e segurança
77. Helix editor
- Houve uma espécie de renascimento de editores de texto simples tentando substituir o favorito da linha de comando, o Vim
- O Helix é um dos concorrentes nesse espaço lotado, junto com Neovim e, mais recentemente, Kakoune
- Descrevendo-se de forma um tanto brincalhona como um editor de texto pós-moderno, o Helix oferece múltiplos cursores, suporte a Tree-sitter e suporte integrado a Language Server Protocol (LSP), o que inicialmente chamou nossa atenção
- Está em desenvolvimento ativo com um sistema de plugins em andamento e, no geral, é um editor modal leve que parece familiar para usuários de Vim, ao mesmo tempo em que adiciona algumas conveniências modernas
78. Kueue
- Kueue é um controlador nativo do Kubernetes para filas de jobs que gerenciam cotas e consumo de recursos
- Fornece uma API para lidar com workloads do Kubernetes com diferentes prioridades e exigências de recursos, funcionando como um gerenciador em nível de job que decide quando admitir ou remover jobs
- Projetado para gestão eficiente de recursos, priorização de jobs e agendamento avançado, o Kueue ajuda a otimizar a execução de workloads em ambientes Kubernetes, especialmente workloads de ML que usam ferramentas como Kubeflow
- Em vez de substituir o cluster-autoscaler e o kube-scheduler, trabalha em conjunto com eles e foca na admissão de jobs com base em ordem, cota, prioridade e percepção de topologia
79. MCPScan.ai
- MCPScan.ai é um scanner de segurança para servidores Model Context Protocol (MCP) que opera em dois modos: scan e proxy
- No modo scan, analisa configurações e descrições de ferramentas para detectar vulnerabilidades conhecidas, como prompt injection, tool poisoning e toxic flows
- No modo proxy, o MCPScan.ai atua como uma ponte entre o sistema de agentes e o servidor MCP, monitorando continuamente o tráfego em tempo de execução
- Esse modo também aplica regras de segurança e guardrails personalizados, incluindo validação de chamadas de ferramentas, detecção de PII e restrições de fluxo de dados
80. oRPC
- oRPC (OpenAPI Remote Procedure Call) oferece APIs type-safe de ponta a ponta em TypeScript, em total conformidade com a especificação OpenAPI
- Pode simplificar a integração e a documentação ao gerar automaticamente a especificação OpenAPI completa
- Enquanto alternativas como tRPC e ElysiaJS frequentemente exigem a adoção de novos frameworks para obter segurança de tipos, o oRPC se integra sem atritos a frameworks Node.js já existentes, incluindo Express, Fastify, Hono e Next.js
- Essa flexibilidade o torna uma excelente escolha para equipes que querem adotar segurança de tipos de ponta a ponta em APIs existentes sem refatorações disruptivas
81. Power user for dbt
- Power user for dbt é uma extensão para Visual Studio Code que se integra diretamente tanto a ambientes dbt quanto dbt Cloud
- Como o dbt continua sendo uma das nossas ferramentas favoritas, qualquer melhoria de usabilidade é uma adição bem-vinda ao ecossistema
- Antes, os desenvolvedores dependiam de várias ferramentas fora da IDE para validar código SQL ou inspecionar a linhagem dos modelos
- Com essa extensão, esses recursos agora ficam embutidos no VS Code, oferecendo autocompletar de código, resultados de consulta em tempo real e linhagem visual de modelos e colunas
82. Serena
- Serena é um poderoso toolkit de programação que oferece a agentes de codificação como Claude Code recursos semelhantes aos de uma IDE para busca e edição semântica de código
- Ao operar no nível de símbolos e compreender a estrutura relacional do código, o Serena melhora significativamente a eficiência de tokens
- Em vez de ler arquivos inteiros ou depender de substituições grosseiras de strings, agentes de codificação podem usar ferramentas precisas do Serena, como find_symbol, find_referencing_symbols e insert_after_symbol, para localizar e editar código
- Em projetos pequenos, o impacto pode ser modesto, mas, à medida que a base de código cresce, essa eficiência se torna muito valiosa
83. SweetPad
- A extensão SweetPad permite que desenvolvedores usem VS Code ou Cursor durante todo o ciclo de vida de desenvolvimento de aplicações Swift para plataformas Apple
- Ela integra ferramentas essenciais como xcodebuild, xcode-build-server e swift-format, eliminando a necessidade de alternar constantemente para o Xcode
- Os desenvolvedores podem gerenciar simuladores e fazer deploy em dispositivos, além de compilar, executar e depurar aplicações Swift para iOS, macOS e watchOS diretamente da IDE, sem abrir o Xcode
84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)
- Tape/Z (Tools for Assembly Program Exploration for Z/OS) é um toolkit em evolução para análise de código HLASM (High-Level Assembler) de mainframe
- Foi desenvolvido por Thoughtworkers e oferece recursos como parsing, construção de grafos de fluxo de controle, rastreamento de dependências e visualização de fluxogramas
- Há muito tempo mencionamos a escassez de ferramentas abertas e orientadas pela comunidade no espaço de mainframe, onde a maioria das opções é proprietária ou vinculada a ecossistemas de fornecedores
- O Tape/Z ajuda a preencher essa lacuna ao oferecer recursos de análise acessíveis e scriptáveis
[Languages and Frameworks]
Adopt
85. Fastify
- Continuamos tendo experiências positivas com Fastify — um framework web rápido, sem imposições e de baixo overhead para Node.js
- Ele oferece todos os recursos essenciais de um framework web minimalista, incluindo parsing, validação e serialização, além de um sistema robusto de plugins e forte suporte da comunidade
- As equipes não viram desvantagens significativas ao usar Fastify em comparação com alternativas como Express.js e também obtiveram ganhos de desempenho mensuráveis, tornando-o uma escolha atraente para desenvolvimento web minimalista em Node.js
86. LangGraph
- LangGraph é um framework de orquestração para construir aplicações multiagente com estado usando LLMs
- Ele fornece primitivas de baixo nível, como nós e arestas, além de recursos embutidos que dão aos desenvolvedores controle granular sobre fluxos de trabalho de agentes, gerenciamento de memória e persistência de estado
- Isso significa que desenvolvedores podem começar com grafos simples e pré-construídos e depois escalar para arquiteturas de agentes complexas e em evolução
- Com suporte a padrões de resiliência como streaming, gerenciamento avançado de contexto, fallback de modelos e tratamento de erros de ferramentas, o LangGraph permite construir aplicações de agentes robustas e prontas para produção
87. vLLM
- vLLM é um motor de inferência para LLMs de alta vazão e eficiência de memória, que pode ser executado na nuvem ou on-premises
- Suporta múltiplas arquiteturas de modelos e modelos open source populares
- Equipes implantaram workers dockerized do vLLM em plataformas de GPU como NVIDIA DGX e Intel HPC para hospedar modelos como Llama 3.1 (8B e 70B), Mistral 7B e Llama-SQL para assistência de programação a desenvolvedores, busca de conhecimento e interação com bancos de dados em linguagem natural
- O vLLM é compatível com o padrão do OpenAI SDK, permitindo model serving consistente
Trial
88. Crossplane
- Desde sua última aparição no Radar, a adoção do Crossplane continuou crescendo, especialmente para ampliar clusters Kubernetes
- No trabalho, descobrimos que o Crossplane se destaca em casos de uso específicos, e não como uma ferramenta de infraestrutura como código (IaC) de propósito geral
- A observação anterior continua válida: o Crossplane funciona melhor como companheiro de workloads implantados dentro do Kubernetes e não como substituto completo de ferramentas como Terraform
- Equipes que apostaram tudo no Crossplane como solução principal de IaC frequentemente enfrentaram dificuldades, mas equipes que o usaram de forma pragmática — para casos de uso customizados e direcionados — viram resultados fortes
89. DeepEval
- DeepEval é um framework de avaliação open source, baseado em Python, para avaliar o desempenho de LLMs
- Pode ser usado para avaliar retrieval-augmented generation (RAG) e outras aplicações construídas com LlamaIndex ou LangChain, além de linhas de base e benchmarks de modelos
- O DeepEval avalia precisão, relevância e consistência para oferecer avaliações mais confiáveis em cenários reais, indo além de pontuações de simples correspondência de palavras
- Inclui métricas como detecção de alucinação, relevância de respostas e otimização de hiperparâmetros, além de oferecer suporte ao GEval para criar métricas customizadas por caso de uso
90. FastMCP
- O Model Context Protocol (MCP) está se consolidando rapidamente como um padrão para fornecer contexto e ferramentas a aplicações com LLM
- No entanto, implementar servidores MCP normalmente envolve uma quantidade significativa de boilerplate para configuração, tratamento do protocolo e gerenciamento de erros
- O FastMCP é um framework Python que simplifica esse processo ao abstrair a complexidade do protocolo e permitir que desenvolvedores definam recursos e ferramentas MCP por meio de decorators Python intuitivos
- Essa abstração permite que as equipes foquem na lógica de negócio, resultando em implementações MCP mais limpas e fáceis de manter
91. LiteLLM
- O LiteLLM é um SDK que oferece integração fluida com vários provedores de LLM por meio de um formato padronizado da API da OpenAI
- Ele oferece suporte a uma ampla gama de provedores e modelos, fornecendo uma interface unificada para conclusão de texto, embeddings e geração de imagens
- Ao abstrair as diferenças entre APIs específicas de cada provedor, o LiteLLM simplifica a integração e roteia automaticamente as requisições para o endpoint de modelo correto
- Também inclui recursos prontos para produção, como guardrails, cache, logging, rate limiting e balanceamento de carga, por meio de um framework de proxy
92. MLForecast
- O MLForecast é um framework e biblioteca Python para previsão de séries temporais que aplica modelos de machine learning a conjuntos de dados em larga escala
- Ele simplifica o processo, normalmente complexo, de engenharia de atributos automatizada, incluindo lags, estatísticas móveis e recursos baseados em data
- É uma das poucas bibliotecas com suporte nativo a frameworks de computação distribuída como Spark e Dask, garantindo escalabilidade
- Também oferece suporte a previsão probabilística usando métodos como conformal prediction, fornecendo uma medida quantitativa da incerteza das previsões
93. Nuxt
- O Nuxt é um meta-framework opinativo construído sobre o Vue.js para criar aplicações web full stack, frequentemente conhecido como o “Next.js para Vue.js”
- Assim como seu equivalente no ecossistema React, o Nuxt oferece recursos amigáveis para SEO, como pré-renderização, server-side rendering (SSR) e gerenciamento de metadados
- O Nuxt conta com o apoio da Vercel, a mesma empresa por trás do Next.js, além de uma comunidade forte e um ecossistema de módulos oficiais e de terceiros
- Esses módulos simplificam a integração de recursos como processamento de imagens, sitemap e Tailwind CSS
94. Phoenix
- Continuamos tendo experiências positivas com o Phoenix — um framework web MVC server-side escrito em Elixir
- O Phoenix se baseia no aprendizado de desenvolvimento rápido de aplicações e experiência do desenvolvedor do Ruby on Rails, ao mesmo tempo em que evolui dentro do paradigma de programação funcional
- Neste volume, destacamos o lançamento do Phoenix LiveView 1.0
- O LiveView é uma solução de HTML-over-the-wire, semelhante a HTMX ou Hotwire, que permite aos desenvolvedores criar experiências de usuário ricas e em tempo real com HTML totalmente renderizado no servidor
95. Presidio
- O Presidio é um SDK de proteção de dados para identificar e anonimizar dados sensíveis em texto estruturado e não estruturado
- Ele usa named entity recognition, expressões regulares e lógica baseada em regras para detectar informações de identificação pessoal (PII), como números de cartão de crédito, nomes e localizações
- O Presidio oferece suporte a reconhecedores de entidades customizados e pipelines de anonimização, permitindo que organizações o adaptem às suas próprias exigências de privacidade e conformidade
- As equipes usam o Presidio ao integrá-lo com LLMs em ambientes corporativos com controles rígidos de compartilhamento de dados
96. Pydantic AI
- O Pydantic AI continua se provando um framework open source confiável e bem suportado para construir agentes de GenAI em produção
- Construído sobre a base confiável do Pydantic, ele oferece forte segurança de tipos, visibilidade de primeira classe via OpenTelemetry e ferramentas de avaliação integradas
- O lançamento da versão 1.0 em 4 de setembro de 2025 marca um importante marco de maturidade
- Desde então, ele tem se mostrado confiável e amplamente adotado por sua simplicidade e facilidade de manutenção, juntando-se a outros frameworks populares de agentes como LangChain e LangGraph
97. Tauri
- O Tauri é um framework para criar aplicações desktop de alto desempenho usando uma única base de código de UI web
- Diferentemente de wrappers web tradicionais como Electron, o Tauri é construído com base em Rust e aproveita a webview nativa do sistema operacional para oferecer binários menores e segurança mais forte
- Avaliamos o Tauri pela primeira vez há alguns anos, e desde então ele se expandiu além do desktop com suporte a iOS e Android
- A versão mais recente traz um modelo mais flexível de permissões e escopos, substituindo a lista anterior de permissões, além de uma camada aprimorada de comunicação entre processos (IPC) que oferece suporte à transferência de dados brutos e melhora o desempenho
Assess
98. Agent Development Kit (ADK)
- O Agent Development Kit (ADK) é um framework para desenvolvimento e implantação de agentes de IA que aplica disciplinas modernas de engenharia de software, em vez de depender apenas de prompting
- Ele introduz abstrações familiares, como classes, métodos, padrões de workflow e suporte a CLI
- Em comparação com frameworks como LangGraph ou CrewAI, o ponto forte do ADK é a integração profunda com a infraestrutura de IA do Google, oferecendo grounding, acesso a dados e monitoramento prontos para uso corporativo
- Foi projetado para interoperabilidade e oferece suporte ao A2A protocol para wrappers de ferramentas e comunicação entre agentes
99. Agno
- O Agno é um framework para construir, executar e gerenciar sistemas multiagente
- Ele oferece flexibilidade para criar agentes totalmente autônomos ou workflows controlados e baseados em etapas, incluindo suporte nativo a human-in-the-loop, gerenciamento de sessão, memória e conhecimento
- Valorizamos seu foco em eficiência, com tempos de inicialização de agentes impressionantes e baixo consumo de memória
- O Agno vem com seu próprio runtime, o AgentOS, uma aplicação FastAPI com um plano de controle unificado para testes, monitoramento e gerenciamento simplificados de sistemas de agentes
100. assistant-ui
- O assistant-ui é uma biblioteca open source em TypeScript e React para interfaces de chat com IA
- Ela lida com as partes complexas da implementação de uma UI de chat, como streaming, gerenciamento de estado e recursos comuns de UX para edição de mensagens e troca de branches, ao mesmo tempo em que permite que desenvolvedores criem seus próprios componentes usando primitives do Radix
- Oferece suporte à integração com runtimes populares, incluindo Vercel AI SDK e LangGraph, além de fornecer soluções de runtime customizáveis para casos de uso complexos
- Construímos com sucesso uma interface de chat simples com assistant-ui e ficamos satisfeitos com o resultado
101. AutoRound
- O AutoRound da Intel é um algoritmo avançado de quantização para comprimir grandes modelos de IA, como LLMs e vision language models (VLMs), minimizando a perda de precisão
- Usa otimização por sign-gradient descent para reduzir o tamanho do modelo a larguras de bits ultrabaixas (2–4 bits) e aplica larguras de bits mistas entre as camadas para eficiência ideal
- Esse processo de quantização também é muito rápido: é possível quantizar um modelo de 7 bilhões de parâmetros em poucos minutos em uma única GPU
- O AutoRound integra-se a mecanismos de inferência populares, como vLLM e Transformers, tornando-se uma opção atraente para quantização de modelos
102. Browser Use
- Browser Use é uma biblioteca Python open source que permite a agentes baseados em LLM operar navegadores web e interagir com aplicações web
- Pode navegar, inserir dados e extrair texto, além de gerenciar várias abas para coordenar tarefas entre aplicações
- A biblioteca é especialmente útil quando agentes de IA precisam acessar, manipular ou recuperar informações de conteúdo web
- Suporta vários LLMs e usa Playwright para combinar compreensão visual com extração da estrutura HTML, proporcionando interações web mais ricas
103. DeepSpeed
- DeepSpeed é uma biblioteca Python que otimiza deep learning distribuído tanto para treinamento quanto para inferência
- Para treinamento, integra técnicas como Zero Redundancy Optimizer (ZeRO) e paralelismo 3D para escalar modelos com eficiência em milhares de GPUs
- Para inferência, combina paralelismo de tensor, pipeline, especialistas e ZeRO com kernels customizados e otimizações de comunicação para minimizar a latência
- O DeepSpeed impulsiona alguns dos maiores modelos de linguagem do mundo, incluindo Megatron-Turing NLG (530B) e BLOOM (176B)
104. Drizzle
- Drizzle é um ORM leve para TypeScript
- Diferentemente do Prisma ORM, oferece aos desenvolvedores tanto uma API simples semelhante a SQL quanto uma interface de consultas em estilo ORM mais tradicional
- Também suporta extração de schema a partir de bancos de dados existentes, permitindo tanto abordagens database-first quanto code-first
- O Drizzle foi projetado com ambientes serverless em mente, tem tamanho de bundle pequeno e suporte a prepared statements
105. Java post-quantum cryptography
- Computadores quânticos continuam avançando rapidamente, e ofertas SaaS como AWS Braket agora fornecem acesso a algoritmos quânticos em várias arquiteturas
- Desde março, o Java 24 introduziu Java post-quantum cryptography, adicionando suporte a algoritmos de criptografia pós-quântica como ML-KEM e ML-DSA
- O .Net 10 também ampliou o suporte
- O conselho é simples: se você está construindo software nessas linguagens, comece agora a adotar algoritmos quantum-safe para preparar seus sistemas para o futuro
106. kagent
- Kagent é um framework open source para executar IA agente dentro de clusters Kubernetes
- Permite que agentes baseados em LLM planejem e executem tarefas operacionais, como diagnosticar problemas, modificar configurações e interagir com ferramentas de observabilidade, por meio de APIs nativas do Kubernetes e integração com Model Context Protocol (MCP)
- O objetivo é combinar gerenciamento declarativo com raciocínio autônomo para levar “AgentOps” à infraestrutura cloud native
- Como projeto Sandbox da CNCF, o Kagent deve ser adotado com cautela, especialmente considerando os riscos de conceder capacidades de gestão operacional a LLMs, e técnicas como toxic flow analysis podem ser particularmente valiosas para avaliar e mitigar esses riscos
107. LangExtract
- LangExtract é uma biblioteca Python que usa LLMs para extrair informações estruturadas de texto não estruturado com base em instruções personalizadas
- Processa materiais específicos de domínio, como notas clínicas e relatórios, para identificar e organizar detalhes essenciais, mantendo cada ponto de dado extraído rastreável até a fonte
- As entidades extraídas podem ser exportadas como arquivos
.jsonl(um formato padrão para dados de modelos de linguagem) e visualizadas por meio de uma interface HTML interativa para revisão de contexto - A equipe avaliou o LangExtract para extrair entidades a fim de preencher grafos de conhecimento de domínio e constatou que ele é eficaz em transformar documentos complexos em representações estruturadas e legíveis por máquina
108. Langflow
- Langflow é uma plataforma open source low-code para criar e visualizar workflows de LLM
- Construída sobre o LangChain, ela permite que desenvolvedores encadeiem prompts, ferramentas, bancos de dados vetoriais e componentes de memória por meio de uma interface drag-and-drop, ao mesmo tempo em que oferece suporte a código Python customizado para lógica avançada
- É especialmente útil para prototipar aplicações de agentes sem escrever todo o código de backend
- No entanto, o Langflow ainda é relativamente novo e tem algumas arestas para uso em produção, e as cautelas gerais sobre plataformas low-code também se aplicam aqui
109. LMCache
- LMCache é uma solução de cache chave-valor (KV) que acelera a infraestrutura de serving de LLMs
- Atua como uma camada de cache especializada em todo o pool de mecanismos de inferência de LLM, armazenando entradas de cache KV pré-computadas para textos que provavelmente serão processados várias vezes, como histórico de chat ou coleções de documentos
- Ao manter esses valores em disco, descarrega da GPU os cálculos de prefill, reduzindo o time-to-first-token (TTFT) e cortando custos de inferência em workloads exigentes, como pipelines RAG, aplicações de chat multi-turno e sistemas de agentes
- É possível integrar o LMCache a servidores de inferência importantes, como vLLM ou NVIDIA Dynamo, e vale a pena avaliar seu impacto na configuração
110. Mem0
- Mem0 é uma camada de memória projetada para agentes de IA
- Abordagens ingênuas frequentemente armazenam todo o histórico de chat em um banco de dados e o reutilizam em conversas futuras, o que leva a uso excessivo de tokens
- O Mem0 substitui isso por uma arquitetura mais sofisticada que separa a memória em recordação de curto prazo e uma camada inteligente de longo prazo que extrai e armazena apenas fatos e relações relevantes
- A arquitetura combina um vector store para similaridade semântica com um grafo de conhecimento para compreender dados temporais e relacionais
111. Open Security Control Assessment Language (OSCAL)
- Open Security Controls Assessment Language (OSCAL) é um formato aberto e legível por máquina para troca de informações, projetado para aumentar a automação em conformidade regulatória e gestão de riscos e ajudar equipes a se afastarem de abordagens manuais baseadas em texto
- Liderado pelo Instituto Nacional de Padrões e Tecnologia dos Estados Unidos (NIST), o OSCAL fornece representações padronizadas em XML, JSON e YAML para expressar controles de segurança relacionados a frameworks do setor como SOC 2 e PCI, além de frameworks governamentais como o FedRAMP dos EUA, o Cybersecurity Control Catalogue de Singapura e o Information Security Manual da Austrália
- Embora o OSCAL ainda não tenha sido amplamente adotado fora do setor público e seu ecossistema ainda esteja amadurecendo, há entusiasmo com seu potencial para simplificar avaliações de segurança, reduzir a dependência de planilhas e exercícios de checklist e viabilizar conformidade automatizada quando integrado a plataformas de compliance-as-code e continuous compliance
112. OpenInference
- OpenInference é um conjunto de convenções e plugins projetado para observar aplicações de IA, complementando o OpenTelemetry
- Fornece instrumentação padronizada para frameworks e bibliotecas de machine learning, ajudando desenvolvedores a rastrear chamadas de LLM junto com o contexto ao redor, como recuperação em vector stores ou chamadas de ferramentas externas para APIs e mecanismos de busca
- Os spans podem ser exportados para qualquer coletor compatível com OTEL, garantindo alinhamento com pipelines de telemetria já existentes
- Anteriormente, demos um blip na plataforma de visibilidade para LLM amplamente usada Langfuse, e o OpenInference SDK pode registrar traces no Langfuse e em outras plataformas de visibilidade compatíveis com OpenTelemetry
113. Valibot
- Valibot é uma biblioteca de validação de schema para TypeScript
- Assim como outras bibliotecas populares de validação em TypeScript, como Zod e Ajv, ela oferece inferência de tipos, mas seu design modular é o diferencial
- Essa arquitetura permite que bundlers façam tree shaking e code splitting de forma eficaz, incluindo apenas as funções de validação realmente usadas
- O Valibot pode reduzir o tamanho do bundle em até 95% em comparação com o Zod em cenários ideais, o que o torna uma escolha atraente para validação de schema em ambientes em que o tamanho do bundle é importante, como validação no lado do cliente ou funções serverless
114. Vercel AI SDK
- Vercel AI SDK é um toolkit full-stack open source para criar aplicações e agentes com IA no ecossistema TypeScript
- É composto por dois componentes principais: o AI SDK Core padroniza chamadas de LLM de forma independente de modelo, com suporte a geração de texto, geração de objetos estruturados e chamadas de ferramentas
- O AI SDK UI, de forma semelhante ao assistant-ui, simplifica o desenvolvimento de frontend em React, Vue, Next.js e Svelte com streaming, gerenciamento de estado e atualizações de UI em tempo real
- Para equipes que já trabalham dentro do ecossistema TypeScript e Next.js, o Vercel AI SDK oferece uma forma rápida e fluida de criar aplicações de IA com experiências ricas no lado do cliente
Ainda não há comentários.