A lição amarga de um fundador de IA (Bitter Lesson)

xguru · 2025-02-10T11:06:01+09:00

Resumo em um único texto da série de quatro artigos do fundador da startup de AI Safety Andon Labs (YC w24), Lukas Petersson Historicamente, abordagens gerais sempre venceram no campo da IA Hoje, fundadores de aplicações de IA estão repetindo os erros que pesquisadores de IA cometeram no passado Modelos de IA melhores viabilizarão aplicações de IA de propósito geral e, ao mesmo tempo, reduzirão o valor agregado do software relacionado a modelos de IA Capítulo 1: a história se repete Capítulo 2: sem vantagem competitiva Capítulo 3: rastros da história Capítulo 4: você é um mago Capítulo 1: a história se repete (History Repeats Itself) tl;dr: Os avanços recentes em IA tornaram possíveis novos produtos para resolver diversos problemas Porém, a maioria dos produtos opera dentro das capacidades limitadas dos modelos atuais e não aproveita a verdadeira força da IA: a flexibilidade A história da IA mostra repetidamente que abordagens gerais sempre vencem. Richard Sutton enfatiza isso em "The Bitter Lesson" Os fundadores de IA de hoje tendem a repetir os mesmos erros que pesquisadores de IA cometeram no passado Resumo do ensaio de Richard Sutton: The Bitter Lesson. (tradução em coreano) Ele apresenta as seguintes lições: Pesquisadores de IA tentam incorporar conhecimento ao agente Isso funciona no curto prazo e traz satisfação No longo prazo, o progresso estagna e pode até ser prejudicado No fim, os avanços acontecem por meio da escalada de capacidade computacional baseada na abordagem oposta Ele alerta que esse padrão foi observado repetidamente na pesquisa em IA e ainda não terminou Produtos de IA e The Bitter Lesson Produtos de IA geralmente são compostos por um modelo de IA e o software ao seu redor Há duas formas de melhorar o desempenho: trabalho de engenharia para restringir o software e reduzir erros esperar até que modelos melhores sejam lançados À medida que os modelos evoluem, o valor do trabalho de engenharia diminui A queda no valor de prompt engineering após o lançamento de novos modelos da OpenAI mostra isso Tipos de restrição e produtos de IA Os elementos de restrição em produtos de IA podem ser classificados em dois tipos: Especificidade: software focado em um problema específico (solução vertical) Autonomia: capacidade de a IA executar tarefas por conta própria Com base nisso, é possível classificar produtos de IA por especificidade (Vertical vs. Horizontal) e autonomia (Workflow vs. Agent) Vertical Workflow Sistema que opera em uma sequência fixa para resolver um problema específico Harvey é um exemplo representativo: um sistema de workflow projetado para lidar com problemas de escopo estreito, como tarefas jurídicas específicas Vertical Agent Sistema que atua de forma autônoma em uma área de trabalho específica, tomando decisões por conta própria durante o processo Devin é um exemplo representativo: executa tarefas repetitivas com ferramentas e dados limitados, ajustando etapas conforme necessário Horizontal Workflow Sistema de workflow geral capaz de resolver diferentes problemas ChatGPT é um exemplo representativo: responde a vários tipos de entrada seguindo procedimentos predefinidos, mas sem autonomia completa Horizontal Agent Sistema totalmente autônomo capaz de lidar com diversos problemas Claude computer-use é um exemplo representativo: usa o software padrão de uma empresa para executar tarefas conforme as instruções do usuário e resolver problemas de forma semelhante à humana A conexão entre Vertical Workflow e The Bitter Lesson A maior parte dos produtos apresentados no Demo Day se encaixa no formato Vertical Workflow A confiabilidade dos modelos atuais ainda não é suficiente, o que dificulta outras abordagens Há uma tendência de limitar até problemas complexos a Vertical Workflow para obter desempenho aceitável É possível melhorar essas soluções com trabalho de engenharia, mas há limites Para problemas que os modelos atuais não conseguem resolver, esperar por modelos mais avançados é uma estratégia melhor Observação de Leopold Aschenbrenner: o tempo de espera por modelos melhores pode ser menor do que o tempo gasto em trabalho de engenharia A relação entre The Bitter Lesson e os produtos de IA atuais Pesquisadores de IA desenvolveram soluções baseadas em conhecimento para obter “desempenho aceitável”, mas no fim soluções gerais com mais recursos computacionais as superaram A forma atual de desenvolver produtos de IA é semelhante a esse padrão As quatro observações de Bitter Lesson e sua aplicação aos tipos de restrição As quatro principais observações mencionadas em Bitter Lesson também aparecem com clareza nas restrições de autonomia e especificidade dos produtos de IA. Elas podem ser explicadas da seguinte forma para cada tipo de restrição: Primeira observação: pesquisadores de IA tentam incorporar conhecimento ao agente Restrição de autonomia: Desenvolvedores experimentam agentes autônomos, mas a confiabilidade ainda é baixa Em vez disso, fazem hardcode das etapas da tarefa em forma de workflow para que o sistema siga o mesmo procedimento que eles próprios usariam para resolver o problema Restrição de especificidade: Desenvolvedores tentam criar um sistema geral de análise de documentos, mas esbarram em problemas de confiabilidade Em vez disso, focam em tipos específicos de documento, como demonstrações financeiras, e fazem hardcode de métricas concretas e regras de validação Segunda observação: isso funciona no curto prazo e traz satisfação aos pesquisadores Restrição de autonomia: Fazer hardcode do workflow aumenta a estabilidade Restrição de especificidade: Especializar o sistema para lidar apenas com um conjunto estreito de documentos e métricas melhora a precisão Terceira observação: no longo prazo, o progresso estagna e pode até ser atrapalhado Restrição de autonomia: Workflows hardcoded não conseguem lidar com situações novas, o que leva a resultados imprecisos Restrição de especificidade: Um sistema que só trata problemas específicos não consegue lidar com tarefas relacionadas, como documentos mesclados ou análise de teleconferências de resultados Isso exige um sistema especializado separado para cada tarefa Quarta observação: os avanços vêm da escalada de recursos computacionais Restrição de autonomia: Novos modelos encontram dinamicamente a abordagem adequada, corrigem erros quando necessário e tornam possíveis agentes autônomos confiáveis Restrição de especificidade: Novos modelos conseguem compreender de forma abrangente todos os documentos de negócios e extrair informações relevantes, tornando sistemas especializados desnecessários Em problemas que exigem autonomia, produtos mais autônomos apresentam melhor desempenho Ao lidar com espaços de entrada amplos e complexos, produtos menos especializados entregam resultados melhores Encerramento: startups de IA e The Bitter Lesson Este texto é o primeiro de uma série de quatro partes que explora o papel das startups em IA, destacando o padrão histórico em que modelos de IA apoiados em conhecimento de domínio são continuamente substituídos por modelos baseados em capacidade computacional Os produtos de IA de hoje se parecem de forma surpreendente com esse padrão Desenvolver software para compensar as limitações dos modelos atuais é uma estratégia com alta chance de fracasso, especialmente quando os modelos evoluem rapidamente Observação de Jarred, parceiro da YC: os apps LLM de workflow vertical da primeira geração estão sendo substituídos pela próxima geração de modelos GPT Conselho de Sam Altman: é importante construir startups que não temam o lançamento de modelos melhores, mas que possam esperá-los com otimismo Muitos fundadores da camada de aplicações de IA ficam animados esperando o lançamento de novos modelos, mas isso pode ser um sinal perigoso Se modelos melhores forem lançados, é grande a chance de a vantagem competitiva atual encolher Esse risco fica ainda mais claro do ponto de vista de desempenho do produto, especialmente quando ele consegue resolver problemas mais difíceis com mais eficiência No próximo texto, será explorada outra dimensão, a adoção de mercado, e discutido por que melhor desempenho não garante necessariamente sucesso comercial Capítulo 2: sem vantagem competitiva (No Powers) tl;dr: Na história da IA, houve muitos casos em que abordagens que tentavam compensar as limitações do modelo com conhecimento de domínio acabaram sendo superadas por abordagens mais generalizadas apoiadas em recursos computacionais A IA vertical (vertical AI) entra primeiro no mercado ao elevar a precisão por meio da definição prévia de fluxos de trabalho específicos para compensar as limitações dos modelos atuais A IA horizontal (horizontal AI) usa modelos de propósito geral como o ChatGPT e continua evoluindo; à medida que os modelos melhoram, tende a apresentar desempenho superior em várias áreas No longo prazo, a IA horizontal pode levar vantagem por ter desempenho e flexibilidade maiores do que a IA vertical, que opera com várias restrições Dificuldade do problema e curva de desempenho A Figura 1 mostra um exemplo simples em que a IA vertical entra primeiro no mercado, mas a IA horizontal, com modelos melhores, acaba superando seu desempenho Quando a dificuldade do problema é alta (Figura 2), a IA vertical nem sequer consegue atingir um desempenho suficiente, e a solução só se torna possível quando a IA horizontal evolui Neste momento, os problemas aos quais a IA vertical pode ser aplicada são relativamente “problemas de baixa dificuldade”; nessa categoria, a IA vertical pode aproveitar o efeito de pioneirismo, mas sua competitividade de longo prazo é incerta O conceito de “colaborador remoto” oferecido pela IA horizontal No futuro, a IA horizontal pode evoluir para uma forma semelhante à de um trabalhador remoto, recebendo um computador e contas de acesso e sendo capaz de encontrar e usar por conta própria os dados necessários UIs como a do ChatGPT, com as quais muitos usuários já estão familiarizados, podem ser fortalecidas gradualmente, criando condições para adoção rápida nas empresas Como a IA horizontal incorpora imediatamente diversas capacidades sempre que o modelo melhora, é mais fácil para ela manter vantagem competitiva do que para a IA vertical Caso anterior: a experiência com o AcademicGPT Na época do GPT-3.5, foi lançado o AcademicGPT para contornar o limite de entradas longas, mas quando o GPT-4 passou a oferecer entradas longas nativamente, a solução existente rapidamente se tornou obsoleta Como disse Jared, parceiro da YC, “os aplicativos da primeira geração de LLM foram em sua maioria superados pela geração seguinte de modelos” Mesmo a IA vertical que oferece vários recursos ao mesmo tempo corre o risco de passar pelo mesmo processo quando o desempenho dos modelos evolui Análise das 7 Powers de Helmer Esta seção examina, por meio das 7 vantagens competitivas de Hamilton Helmer (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource), se a IA vertical pode competir com a IA horizontal Switching Cost (custo de troca) Mesmo que os usuários já estejam acostumados com a UI ou o fluxo de trabalho de uma solução específica de IA vertical, a IA horizontal pode ser aplicada de forma simples, “como ao contratar um novo funcionário”, por meio de onboarding Como já cresce o número de empresas que adotaram soluções de IA horizontal como o ChatGPT, é possível que o processo de transição não seja difícil Em termos de preço, a IA horizontal também pode integrar várias soluções verticais, o que sugere potencial de redução de custos Counter Positioning (reposicionamento contrário) A IA vertical pode oferecer valor sob medida como solução especializada em um mercado específico, mas, à medida que os modelos melhoram, é possível que a IA horizontal passe a mostrar desempenho melhor de forma geral Sempre que adota um novo modelo, a IA vertical enfrenta o dilema de perder sua diferenciação por causa das “restrições” existentes ou, ao remover essas restrições, acabar se tornando parecida com um modelo horizontal Scale Economy (economia de escala) Assim como no SaaS, a IA vertical também pode reduzir custos com escala, mas a IA horizontal tem a vantagem de poder diluir custos ao integrar vários campos Ao aplicar a diversos usos modelos horizontais desenvolvidos com grandes investimentos em P&D, é possível acelerar ainda mais a redução de custos Network Economy (efeito de rede) Tanto a IA vertical quanto a horizontal podem melhorar com base em dados de usuários, mas a IA horizontal tem a grande vantagem de obter feedback de um grupo muito mais amplo de usuários e, assim, elevar o desempenho geral do modelo Como o modelo melhora como um todo com dados acumulados em várias áreas, ele pode evoluir numa velocidade difícil de acompanhar para a IA vertical Brand Power (força de marca) Força de marca é uma vantagem difícil de obter na fase inicial de uma startup pequena Empresas como OpenAI e Google, que já têm grande influência de marca, são exceções, mas a maioria das startups de IA vertical dificilmente poderá usar a marca como trunfo Process Power (força de processo) A força de processo também é uma vantagem obtida por grandes empresas por meio de sistemas operacionais refinados ao longo de muito tempo Na fase inicial de uma startup, isso praticamente não se aplica Cornered Resource (recurso exclusivo) Um recurso exclusivo só se torna uma grande vantagem competitiva quando apenas uma empresa detém determinado dado ou recurso, e esse recurso é indispensável naquele setor Muitas startups de IA alegam ter “dados exclusivos”, mas, na prática, muitas vezes esses dados não são totalmente exclusivos ou o modelo consegue aprender suficientemente bem mesmo sem eles Excepcionalmente, empresas que garantirem recursos realmente exclusivos podem manter competitividade apesar do avanço da IA horizontal Encerramento No fim, mesmo em cenários em que a IA vertical aproveita o efeito de pioneirismo, se a IA horizontal alcançar desempenho superior, a maioria das IAs verticais terá dificuldade para se sustentar Entre as 7 Powers de Helmer, a IA vertical só tende a ganhar tração de longo prazo quando assegura um verdadeiro Cornered Resource Como no caso do AcademicGPT, que entrou em rápido declínio após o lançamento do GPT-4, até mesmo a IA vertical reforçada com várias funções pode acabar seguindo trajetória semelhante quando os modelos melhorarem No próximo capítulo (Capítulo 3), o autor pretende prever quando e como a IA horizontal no formato de “colaborador remoto” se tornará realidade, e examinar em detalhe os obstáculos técnicos, regulatórios, de confiança e econômicos que podem impedir isso Capítulo 3: Uma nota de rodapé na história (A Footnote in History) O CEO da Anthropic divulgou uma entrevista em que explica o conceito de “colaborador virtual (virtual collaborator)” Isso é semelhante ao conceito que o autor desta série chama de “produto de IA horizontal (horizontal AI product)” Espera-se que a OpenAI anuncie em breve o “Operator”, e benchmarks vazados indicam desempenho muito superior ao do Claude (no benchmark OSWorld, Claude ficou em 22% e Operator em 38%) Esse ganho de desempenho está dentro do intervalo esperado, e o autor mantém a mesma previsão feita três meses antes No capítulo anterior, foi explicado por que aplicações de IA vertical têm dificuldade para manter competitividade A diferença de desempenho em relação a soluções gerais de IA está diminuindo Quando produtos de IA horizontal se tornam competitivos, produtos de IA vertical quase não têm como se defender A pergunta importante: “Quando ocorrerá a transição da IA vertical para a IA horizontal?” Se for daqui a 10 anos, pode fazer sentido desenvolver IA vertical agora Mas, se a mudança vier em 1 a 2 anos, será necessária uma estratégia completamente diferente A transição de IA vertical para IA horizontal não acontecerá ao mesmo tempo em todos os setores No entanto, como o mercado em que a maioria das startups de IA atua hoje é relativamente simples, espera-se que a mudança aconteça em períodos semelhantes nos principais setores A projeção é que, até 2027, produtos de IA vertical terão dificuldade para sobreviver na maioria dos setores “Adoção (adoption)” significa qual produto os usuários escolhem ao resolver um novo problema ou ao mudar a forma de resolver um problema existente Os itens a seguir não são considerados Participação de mercado: contratos existentes e outros fatores podem influenciar Tamanho absoluto: embora a IA expanda o mercado ao abrir novos casos de uso, esta análise considera apenas mudanças relativas Valor potencial: avalia-se qual solução as pessoas escolhem no momento atual, sem incluir a possibilidade de melhorias futuras Por exemplo, se o fluxo muda de A para B, isso significa que antes A era preferido, mas agora B é visto como a melhor opção Conceitos de IA vertical/horizontal e workflow/agentes "IA vertical" e "IA horizontal" se referem a tipos diferentes de produtos de IA "Workflow" e "agent" também são conceitos usados para classificar produtos de IA Neste documento, os conceitos de workflow e agent dentro dos produtos de IA horizontais são explicados em conjunto É provável que a mesma empresa desenvolva um produto que inclua as duas funcionalidades Por exemplo, o ChatGPT pode adicionar recursos de agent mantendo ao mesmo tempo sua base atual de workflow Passado (1) O período pré-ChatGPT era uma situação em que o software tradicional dominava o mercado (2) Com o lançamento do ChatGPT, surgiu o primeiro produto horizontal de IA realmente significativo (3) Após o surgimento da API do GPT-3.5, começaram a ser lançados, pela primeira vez, vários produtos verticais especializados em IA Este ano (4) Há a expectativa de que, em 2025, o desempenho dos modelos se estabilize a ponto de poder ser usado como agents práticos Até agora, os agents vinham sendo usados apenas em projetos de pesquisa ou testes limitados, mas a perspectiva é de adoção em escala real Produtos verticais de workflow já existentes também podem migrar para o formato de agents de IA (5) Mesmo com o surgimento dos agents, a expectativa é que os workflows verticais continuem em posição dominante até 2025 Isso se deve tanto ao hábito dos usuários de evitarem trocar ferramentas já adotadas quanto à inércia dos desenvolvedores em continuar aproveitando os ativos de engenharia acumulados até agora (6) A expectativa é que os principais produtos horizontais de IA, como ChatGPT, Claude e Gemini, ampliem suas funcionalidades e passem a cobrir mais áreas verticais Há a possibilidade de que funcionalidades especializadas que hoje existem em produtos verticais de IA sejam rapidamente absorvidas por produtos horizontais de IA O ChatGPT já começou a se integrar com aplicativos de desktop Futuro próximo (7) A diferença de capacidade entre agents horizontais de IA e trabalhadores humanos deve diminuir gradualmente Ainda que não cheguem ao nível de especialistas, a expectativa é que obtenham desempenho suficiente para automatizar boa parte do trabalho administrativo geral Com isso, a razão de existir de soluções verticais de IA pode diminuir Exemplos concretos: Usuários individuais podem passar a delegar tarefas complexas, como declaração de imposto de renda ou preparação para emprego, a agents horizontais Empresas podem substituir ou reduzir uma parcela significativa da força de trabalho júnior Pode surgir um caso de uma única pessoa criando valor de nível unicórnio (8) A expectativa é que o software tradicional continue tendo valor como interface que os agents podem utilizar Pode ser mais eficiente em termos de custo para os agents aproveitarem softwares existentes do que recriar diretamente todo software do zero A análise é de que, em especial, softwares genéricos e horizontais têm maior probabilidade de sobreviver (9) A expectativa é que os produtos verticais de IA que sobreviverem sejam apenas uma minoria com recursos defensivos mencionados no capítulo 2, como dados proprietários e patentes Também existe a possibilidade de vender esses recursos por alto valor 2024 - o progresso parou? A avaliação é de que a alegação de que houve estagnação dos modelos de IA em 2024 tem pouca força Mesmo antes do lançamento do o3, o desempenho de modelos como GPT-4, Claude e modelos Open Weight vinha melhorando continuamente em várias áreas Houve uma tendência de avanço radical nas pontuações de benchmarks como ARC-AGI e GPQA Diamond A Anthropic evoluiu rapidamente de Claude 2 para Claude 3 e depois para Claude 3.5 Sonnet, e surgiu a especulação de que vinha usando internamente upgrades não divulgados Por isso, a visão de que 2024 foi um ano em que a melhoria dos modelos de IA parou é considerada pouco fundamentada Obstáculos potenciais Model Stagnation: embora 2024 não tenha mostrado estagnação, existe a preocupação de que o avanço dos modelos possa parar depois de 2025 Ilya Sutskever mencionou na NeurIPS os limites do pre-training tradicional, mas ao mesmo tempo sugeriu que existem outros caminhos, como Test-time compute Os principais institutos e empresas de pesquisa em IA continuam investindo ativamente em enormes recursos computacionais Regulation: regulações inesperadas podem surgir e restringir o avanço da IA Trust Barriers: há preocupações dos usuários sobre estabilidade e confiabilidade dos agents Com base no precedente histórico de que o medo da automação de elevadores acabou desaparecendo, há a expectativa de que isso também seja superado com o tempo AI Labs Hesitate: pode haver casos em que Anthropic ou OpenAI mantenham certas interações de usuários deliberadamente limitadas, mesmo tendo capacidade técnica real Expensive Inference: inferência de alto desempenho pode exigir custos muito altos, como no caso do o3 Mas o custo de inferência vem caindo com o tempo, e também é bastante provável que os agents não apliquem o mesmo nível de inferência de alto desempenho a todas as tarefas Considerando em conjunto os fatores acima, prever o avanço tecnológico continua difícil, mas a perspectiva é de que startups de IA vertical não tenham muito tempo É apresentado um gráfico de valor em forma de U, segundo o qual o valor baseado em engenharia existente pode desaparecer rapidamente à medida que os modelos de IA se sofisticam Observações A explicação é que a expansão de Test-time compute mostrada no o3 já era um resultado previsto por pesquisas anteriores Assim como demonstrado no caso do AlphaZero, há o insight de que, em ambientes verificáveis, o desempenho pode atingir rapidamente níveis sobre-humanos A análise é que o o3 se destaca em áreas como programação e matemática, mas em outras, como escrita criativa, não mostra grande diferença em relação ao o1 A implicação para fundadores é que, em vez de desenvolver uma nova IA vertical, pode ser mais vantajoso seguir em outra direção, lidando com recursos mais amplos ou mais proprietários Capítulo 4: Você é um mago (You’re a wizard Harry) O fundador é como um mago Tem a capacidade de criar algo a partir do nada Começar uma nova empresa exige pensamento original Frase de Paul Graham (PG): "As ideias precisam ser não apenas corretas, mas também originais. Você não deve começar algo que todos concordam ser uma boa ideia." Muitos fundadores estão ficando cegos pelo impressionante crescimento de receita de seus pares e perdendo a capacidade de pensar de forma independente Quando todos fazem a mesma coisa e isso parece estar funcionando, fica difícil pensar com independência O autor tenta pensar de forma independente e espera que essas ideias soem ruins O futuro dos agents horizontais e a concorrência A expectativa é que os agents horizontais que poderão dominar a camada de aplicações de IA sejam desenvolvidos por laboratórios de IA O desempenho dos modelos pode mudar e levar a um único vencedor, mas uma competição intensa entre Anthropic, OpenAI, GDM e xAI parece mais provável Isso provoca, no curto prazo, uma competição de preços que beneficia o usuário final Mesmo que, no curto prazo, os laboratórios de IA não capturem muito valor financeiro, a expectativa é que ainda ocupem uma posição extremamente forte Portanto, é razoável que fundadores pensem suas startups no contexto da relação com esses laboratórios Abordagem como cliente Como discutido no capítulo 2, é possível construir produtos verticais de IA usando APIs de LLM, mas isso só é viável quando há acesso exclusivo a recursos importantes Para construir um produto vertical de IA, é preciso dedicar um enorme esforço para encontrar esses recursos Abordagem como concorrente Se agentes horizontais são o futuro, por que não construí-los? São analisadas três abordagens Tomar o mercado primeiro Os laboratórios de IA só competirão seriamente com workflows verticais quando os modelos forem confiáveis o bastante para permitir a criação de agentes horizontais com esforço mínimo de engenharia Em teoria, é possível aplicar esforço de engenharia a modelos anteriores e entrar no mercado antes dos laboratórios, mas isso não é garantido Leopold Aschenbrenner acredita que esse esforço pode levar mais tempo do que construir o próximo modelo: "Pode demorar até que trabalhadores remotos consigam automatizar muitas tarefas, e, nesse meio-tempo, os modelos intermediários talvez ainda não tenham sido totalmente explorados e integrados" Independentemente de quem entrar primeiro no mercado, espera-se que essa vantagem não dure muito Wrapper de API de agente Um colega de apartamento perguntou: "Não existe ninguém no mundo com habilidade de UI?" Isso sugere dois problemas: 1) os custos de API tornam a margem insustentável, 2) os laboratórios não divulgam seus melhores modelos (o ChatGPT usa modelos proprietários para busca, navegação na web etc.) Hoje, ninguém usa a API do GPT para competir diretamente com o ChatGPT, e espera-se que esse padrão se repita também com agentes horizontais Modelos open source Modelos open source podem oferecer outro caminho O Perplexity mostra que é possível competir com os laboratórios em produtos horizontais No entanto, modelos open source vão bem em benchmarks simples, mas têm dificuldade em tarefas complexas de agentes O Llama-3.1-405b fica bem atrás dos modelos de ponta no MLE-bench A Andon Labs é especializada nesse tipo de benchmark, e isso é compatível com o que observamos O Deepseek V3 e o R1 foram lançados com resultados muito impressionantes, mas o mesmo vale para o o3, e há relatos de que a Anthropic tem versões ainda melhores internamente Modelos open source podem se aproximar do estado da arte, mas é duvidoso que o superem Ainda assim, isso pode ser suficiente para competir no jogo horizontal Os custos de inferência ainda serão muito altos Abordagem como fornecedor Se os laboratórios de IA realmente se tornarem tão poderosos, ser fornecedor deles será uma excelente posição Eles certamente precisarão de muito poder computacional e energia Se a análise do Leo estiver correta, talvez precisem de mais do que o esperado Essa oportunidade exige conhecimento especializado da indústria, o que pode não ser algo natural para fundadores hoje posicionados na camada de aplicações de IA Mas lembre-se de que você é um mago Os laboratórios também compram dados de terceiros A Scale AI está provando que isso é um ótimo negócio No entanto, é questionável se os laboratórios de IA conseguirão fazer o "autoaprendizado" funcionar O AlphaZero foi treinado sem dados externos, e isso é visto como o santo graal dos futuros modelos de IA Se eles não conseguirem fazer o autoaprendizado funcionar, a alternativa será combinar vários conjuntos de dados de pós-treinamento Nesse mundo, vender dados provavelmente será uma boa escolha Abordagem como contribuidor do ecossistema Por fim, outra relação a considerar com os laboratórios de IA é tornar-se um contribuidor do ecossistema Isso significa construir ferramentas que ajudem agentes horizontais, mas o importante é que elas precisam ser separadas do próprio agente Como mostrado no capítulo 3, softwares tradicionais continuarão existindo porque os agentes precisam de interfaces eficientes Os agentes podem escrever seu próprio software, mas os custos de inferência podem tornar isso impraticável No entanto, players do ecossistema correm o risco de se comoditizar, e a maior parte do valor pode ser capturada em outro lugar Isso vai depender de quão alto for o custo de inferência (inference cost) para executar agentes horizontais Se o custo de inferência for baixo, será mais comum que agentes gerem por conta própria o software de que precisam E se os agentes horizontais de IA demorarem a chegar? O cronograma (timeline) é muito importante Se os agentes horizontais só se tornarem competitivos daqui a 10 anos, construir workflows verticais de IA agora será uma excelente ideia Esse tempo é suficiente para construir uma empresa grande e sólida Mas, considerando a velocidade de avanço dos laboratórios de IA, 10 anos é irrealista Então, e daqui a 4 anos? Quatro anos podem não ser suficientes para criar uma grande empresa, mas oferecem oportunidades suficientes de iteração Começar na camada de aplicações de IA pode até ser vantajoso para depois migrar para fornecedor ou player do ecossistema Epílogo: foi um erro da YC (Y Combinator)? À primeira vista, pode parecer que a YC está fazendo a escolha errada Atualmente, a YC concentra a maior parte de seus investimentos em produtos verticais de IA Mas há uma grande chance de esse mercado desaparecer em breve No entanto, o autor não tem expertise suficiente em VC (venture capital) para tirar uma conclusão definitiva Ele está apenas compartilhando sua confusão e reflexão A YC afirma adotar uma estratégia de investimento relativamente neutra Investe em pessoas inteligentes e espera que elas encontrem as melhores ideias Essa é uma ótima estratégia, e centenas de fundadores talvez consigam prever o futuro melhor do que 14 parceiros da YC Mas o autor se preocupa com a possibilidade de o sistema de batches da YC induzir um pensamento de curto prazo Na YC, é muito importante definir metas semanais, e avançar em grupo é bom para a motivação Mas, se não houver diversidade suficiente de ideias, isso pode induzir um pensamento de curto prazo Criando um produto vertical de IA, é possível chegar rapidamente a US$ 5.000 de MRR Mas esse é realmente um jeito de construir um negócio sustentável? Se o autor estivesse numa batch da YC agora, provavelmente sentiria a tentação de criar um produto vertical de IA Além disso, o podcast da YC, "The Light Cone", traz bastante conteúdo defendendo produtos verticais de IA

(lukaspetersson.com)

30 pontos por xguru 2025-02-10 | 1 comentários | Compartilhar no WhatsApp

Resumo em um único texto da série de quatro artigos do fundador da startup de AI Safety Andon Labs (YC w24), Lukas Petersson
- Historicamente, abordagens gerais sempre venceram no campo da IA
- Hoje, fundadores de aplicações de IA estão repetindo os erros que pesquisadores de IA cometeram no passado
- Modelos de IA melhores viabilizarão aplicações de IA de propósito geral e, ao mesmo tempo, reduzirão o valor agregado do software relacionado a modelos de IA
Capítulo 1: a história se repete
Capítulo 2: sem vantagem competitiva
Capítulo 3: rastros da história
Capítulo 4: você é um mago

Capítulo 1: a história se repete (History Repeats Itself)

tl;dr:

Os avanços recentes em IA tornaram possíveis novos produtos para resolver diversos problemas
Porém, a maioria dos produtos opera dentro das capacidades limitadas dos modelos atuais e não aproveita a verdadeira força da IA: a flexibilidade
A história da IA mostra repetidamente que abordagens gerais sempre vencem. Richard Sutton enfatiza isso em "The Bitter Lesson"
Os fundadores de IA de hoje tendem a repetir os mesmos erros que pesquisadores de IA cometeram no passado

Resumo do ensaio de Richard Sutton: The Bitter Lesson. (tradução em coreano)

Ele apresenta as seguintes lições:
- Pesquisadores de IA tentam incorporar conhecimento ao agente
- Isso funciona no curto prazo e traz satisfação
- No longo prazo, o progresso estagna e pode até ser prejudicado
- No fim, os avanços acontecem por meio da escalada de capacidade computacional baseada na abordagem oposta
Ele alerta que esse padrão foi observado repetidamente na pesquisa em IA e ainda não terminou

Produtos de IA e The Bitter Lesson

Produtos de IA geralmente são compostos por um modelo de IA e o software ao seu redor
Há duas formas de melhorar o desempenho:
1. trabalho de engenharia para restringir o software e reduzir erros
2. esperar até que modelos melhores sejam lançados
À medida que os modelos evoluem, o valor do trabalho de engenharia diminui
A queda no valor de prompt engineering após o lançamento de novos modelos da OpenAI mostra isso

Tipos de restrição e produtos de IA

Os elementos de restrição em produtos de IA podem ser classificados em dois tipos:
- Especificidade: software focado em um problema específico (solução vertical)
- Autonomia: capacidade de a IA executar tarefas por conta própria
Com base nisso, é possível classificar produtos de IA por especificidade (Vertical vs. Horizontal) e autonomia (Workflow vs. Agent)
- Vertical Workflow
  - Sistema que opera em uma sequência fixa para resolver um problema específico
  - Harvey é um exemplo representativo: um sistema de workflow projetado para lidar com problemas de escopo estreito, como tarefas jurídicas específicas
- Vertical Agent
  - Sistema que atua de forma autônoma em uma área de trabalho específica, tomando decisões por conta própria durante o processo
  - Devin é um exemplo representativo: executa tarefas repetitivas com ferramentas e dados limitados, ajustando etapas conforme necessário
- Horizontal Workflow
  - Sistema de workflow geral capaz de resolver diferentes problemas
  - ChatGPT é um exemplo representativo: responde a vários tipos de entrada seguindo procedimentos predefinidos, mas sem autonomia completa
- Horizontal Agent
  - Sistema totalmente autônomo capaz de lidar com diversos problemas
  - Claude computer-use é um exemplo representativo: usa o software padrão de uma empresa para executar tarefas conforme as instruções do usuário e resolver problemas de forma semelhante à humana

A conexão entre Vertical Workflow e The Bitter Lesson

A maior parte dos produtos apresentados no Demo Day se encaixa no formato Vertical Workflow
- A confiabilidade dos modelos atuais ainda não é suficiente, o que dificulta outras abordagens
- Há uma tendência de limitar até problemas complexos a Vertical Workflow para obter desempenho aceitável
É possível melhorar essas soluções com trabalho de engenharia, mas há limites
- Para problemas que os modelos atuais não conseguem resolver, esperar por modelos mais avançados é uma estratégia melhor
- Observação de Leopold Aschenbrenner: o tempo de espera por modelos melhores pode ser menor do que o tempo gasto em trabalho de engenharia

A relação entre The Bitter Lesson e os produtos de IA atuais

Pesquisadores de IA desenvolveram soluções baseadas em conhecimento para obter “desempenho aceitável”, mas no fim soluções gerais com mais recursos computacionais as superaram
A forma atual de desenvolver produtos de IA é semelhante a esse padrão

As quatro observações de Bitter Lesson e sua aplicação aos tipos de restrição

As quatro principais observações mencionadas em Bitter Lesson também aparecem com clareza nas restrições de autonomia e especificidade dos produtos de IA.
Elas podem ser explicadas da seguinte forma para cada tipo de restrição:

Primeira observação: pesquisadores de IA tentam incorporar conhecimento ao agente

Restrição de autonomia:
- Desenvolvedores experimentam agentes autônomos, mas a confiabilidade ainda é baixa
- Em vez disso, fazem hardcode das etapas da tarefa em forma de workflow para que o sistema siga o mesmo procedimento que eles próprios usariam para resolver o problema
Restrição de especificidade:
- Desenvolvedores tentam criar um sistema geral de análise de documentos, mas esbarram em problemas de confiabilidade
- Em vez disso, focam em tipos específicos de documento, como demonstrações financeiras, e fazem hardcode de métricas concretas e regras de validação

Segunda observação: isso funciona no curto prazo e traz satisfação aos pesquisadores

Restrição de autonomia:
- Fazer hardcode do workflow aumenta a estabilidade
Restrição de especificidade:
- Especializar o sistema para lidar apenas com um conjunto estreito de documentos e métricas melhora a precisão

Terceira observação: no longo prazo, o progresso estagna e pode até ser atrapalhado

Restrição de autonomia:
- Workflows hardcoded não conseguem lidar com situações novas, o que leva a resultados imprecisos
Restrição de especificidade:
- Um sistema que só trata problemas específicos não consegue lidar com tarefas relacionadas, como documentos mesclados ou análise de teleconferências de resultados
- Isso exige um sistema especializado separado para cada tarefa

Quarta observação: os avanços vêm da escalada de recursos computacionais

Restrição de autonomia:
- Novos modelos encontram dinamicamente a abordagem adequada, corrigem erros quando necessário e tornam possíveis agentes autônomos confiáveis
Restrição de especificidade:
- Novos modelos conseguem compreender de forma abrangente todos os documentos de negócios e extrair informações relevantes, tornando sistemas especializados desnecessários
Em problemas que exigem autonomia, produtos mais autônomos apresentam melhor desempenho
Ao lidar com espaços de entrada amplos e complexos, produtos menos especializados entregam resultados melhores

Encerramento: startups de IA e The Bitter Lesson

Este texto é o primeiro de uma série de quatro partes que explora o papel das startups em IA, destacando o padrão histórico em que modelos de IA apoiados em conhecimento de domínio são continuamente substituídos por modelos baseados em capacidade computacional
Os produtos de IA de hoje se parecem de forma surpreendente com esse padrão
Desenvolver software para compensar as limitações dos modelos atuais é uma estratégia com alta chance de fracasso, especialmente quando os modelos evoluem rapidamente
Observação de Jarred, parceiro da YC: os apps LLM de workflow vertical da primeira geração estão sendo substituídos pela próxima geração de modelos GPT
Conselho de Sam Altman: é importante construir startups que não temam o lançamento de modelos melhores, mas que possam esperá-los com otimismo
Muitos fundadores da camada de aplicações de IA ficam animados esperando o lançamento de novos modelos, mas isso pode ser um sinal perigoso
- Se modelos melhores forem lançados, é grande a chance de a vantagem competitiva atual encolher
- Esse risco fica ainda mais claro do ponto de vista de desempenho do produto, especialmente quando ele consegue resolver problemas mais difíceis com mais eficiência
No próximo texto, será explorada outra dimensão, a adoção de mercado, e discutido por que melhor desempenho não garante necessariamente sucesso comercial

Capítulo 2: sem vantagem competitiva (No Powers)

tl;dr:

Na história da IA, houve muitos casos em que abordagens que tentavam compensar as limitações do modelo com conhecimento de domínio acabaram sendo superadas por abordagens mais generalizadas apoiadas em recursos computacionais
A IA vertical (vertical AI) entra primeiro no mercado ao elevar a precisão por meio da definição prévia de fluxos de trabalho específicos para compensar as limitações dos modelos atuais
A IA horizontal (horizontal AI) usa modelos de propósito geral como o ChatGPT e continua evoluindo; à medida que os modelos melhoram, tende a apresentar desempenho superior em várias áreas
No longo prazo, a IA horizontal pode levar vantagem por ter desempenho e flexibilidade maiores do que a IA vertical, que opera com várias restrições

Dificuldade do problema e curva de desempenho

A Figura 1 mostra um exemplo simples em que a IA vertical entra primeiro no mercado, mas a IA horizontal, com modelos melhores, acaba superando seu desempenho
Quando a dificuldade do problema é alta (Figura 2), a IA vertical nem sequer consegue atingir um desempenho suficiente, e a solução só se torna possível quando a IA horizontal evolui
Neste momento, os problemas aos quais a IA vertical pode ser aplicada são relativamente “problemas de baixa dificuldade”; nessa categoria, a IA vertical pode aproveitar o efeito de pioneirismo, mas sua competitividade de longo prazo é incerta

O conceito de “colaborador remoto” oferecido pela IA horizontal

No futuro, a IA horizontal pode evoluir para uma forma semelhante à de um trabalhador remoto, recebendo um computador e contas de acesso e sendo capaz de encontrar e usar por conta própria os dados necessários
UIs como a do ChatGPT, com as quais muitos usuários já estão familiarizados, podem ser fortalecidas gradualmente, criando condições para adoção rápida nas empresas
Como a IA horizontal incorpora imediatamente diversas capacidades sempre que o modelo melhora, é mais fácil para ela manter vantagem competitiva do que para a IA vertical

Caso anterior: a experiência com o AcademicGPT

Na época do GPT-3.5, foi lançado o AcademicGPT para contornar o limite de entradas longas, mas quando o GPT-4 passou a oferecer entradas longas nativamente, a solução existente rapidamente se tornou obsoleta
Como disse Jared, parceiro da YC, “os aplicativos da primeira geração de LLM foram em sua maioria superados pela geração seguinte de modelos”
Mesmo a IA vertical que oferece vários recursos ao mesmo tempo corre o risco de passar pelo mesmo processo quando o desempenho dos modelos evolui

Análise das 7 Powers de Helmer

Esta seção examina, por meio das 7 vantagens competitivas de Hamilton Helmer (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource), se a IA vertical pode competir com a IA horizontal
Switching Cost (custo de troca)
- Mesmo que os usuários já estejam acostumados com a UI ou o fluxo de trabalho de uma solução específica de IA vertical, a IA horizontal pode ser aplicada de forma simples, “como ao contratar um novo funcionário”, por meio de onboarding
- Como já cresce o número de empresas que adotaram soluções de IA horizontal como o ChatGPT, é possível que o processo de transição não seja difícil
- Em termos de preço, a IA horizontal também pode integrar várias soluções verticais, o que sugere potencial de redução de custos
Counter Positioning (reposicionamento contrário)
- A IA vertical pode oferecer valor sob medida como solução especializada em um mercado específico, mas, à medida que os modelos melhoram, é possível que a IA horizontal passe a mostrar desempenho melhor de forma geral
- Sempre que adota um novo modelo, a IA vertical enfrenta o dilema de perder sua diferenciação por causa das “restrições” existentes ou, ao remover essas restrições, acabar se tornando parecida com um modelo horizontal
Scale Economy (economia de escala)
- Assim como no SaaS, a IA vertical também pode reduzir custos com escala, mas a IA horizontal tem a vantagem de poder diluir custos ao integrar vários campos
- Ao aplicar a diversos usos modelos horizontais desenvolvidos com grandes investimentos em P&D, é possível acelerar ainda mais a redução de custos
Network Economy (efeito de rede)
- Tanto a IA vertical quanto a horizontal podem melhorar com base em dados de usuários, mas a IA horizontal tem a grande vantagem de obter feedback de um grupo muito mais amplo de usuários e, assim, elevar o desempenho geral do modelo
- Como o modelo melhora como um todo com dados acumulados em várias áreas, ele pode evoluir numa velocidade difícil de acompanhar para a IA vertical
Brand Power (força de marca)
- Força de marca é uma vantagem difícil de obter na fase inicial de uma startup pequena
- Empresas como OpenAI e Google, que já têm grande influência de marca, são exceções, mas a maioria das startups de IA vertical dificilmente poderá usar a marca como trunfo
Process Power (força de processo)
- A força de processo também é uma vantagem obtida por grandes empresas por meio de sistemas operacionais refinados ao longo de muito tempo
- Na fase inicial de uma startup, isso praticamente não se aplica
Cornered Resource (recurso exclusivo)
- Um recurso exclusivo só se torna uma grande vantagem competitiva quando apenas uma empresa detém determinado dado ou recurso, e esse recurso é indispensável naquele setor
- Muitas startups de IA alegam ter “dados exclusivos”, mas, na prática, muitas vezes esses dados não são totalmente exclusivos ou o modelo consegue aprender suficientemente bem mesmo sem eles
- Excepcionalmente, empresas que garantirem recursos realmente exclusivos podem manter competitividade apesar do avanço da IA horizontal

Encerramento

No fim, mesmo em cenários em que a IA vertical aproveita o efeito de pioneirismo, se a IA horizontal alcançar desempenho superior, a maioria das IAs verticais terá dificuldade para se sustentar
Entre as 7 Powers de Helmer, a IA vertical só tende a ganhar tração de longo prazo quando assegura um verdadeiro Cornered Resource
Como no caso do AcademicGPT, que entrou em rápido declínio após o lançamento do GPT-4, até mesmo a IA vertical reforçada com várias funções pode acabar seguindo trajetória semelhante quando os modelos melhorarem
No próximo capítulo (Capítulo 3), o autor pretende prever quando e como a IA horizontal no formato de “colaborador remoto” se tornará realidade, e examinar em detalhe os obstáculos técnicos, regulatórios, de confiança e econômicos que podem impedir isso

Capítulo 3: Uma nota de rodapé na história (A Footnote in History)

O CEO da Anthropic divulgou uma entrevista em que explica o conceito de “colaborador virtual (virtual collaborator)”
Isso é semelhante ao conceito que o autor desta série chama de “produto de IA horizontal (horizontal AI product)”
Espera-se que a OpenAI anuncie em breve o “Operator”, e benchmarks vazados indicam desempenho muito superior ao do Claude (no benchmark OSWorld, Claude ficou em 22% e Operator em 38%)
Esse ganho de desempenho está dentro do intervalo esperado, e o autor mantém a mesma previsão feita três meses antes
No capítulo anterior, foi explicado por que aplicações de IA vertical têm dificuldade para manter competitividade
- A diferença de desempenho em relação a soluções gerais de IA está diminuindo
- Quando produtos de IA horizontal se tornam competitivos, produtos de IA vertical quase não têm como se defender
A pergunta importante: “Quando ocorrerá a transição da IA vertical para a IA horizontal?”
- Se for daqui a 10 anos, pode fazer sentido desenvolver IA vertical agora
- Mas, se a mudança vier em 1 a 2 anos, será necessária uma estratégia completamente diferente
A transição de IA vertical para IA horizontal não acontecerá ao mesmo tempo em todos os setores
No entanto, como o mercado em que a maioria das startups de IA atua hoje é relativamente simples, espera-se que a mudança aconteça em períodos semelhantes nos principais setores
A projeção é que, até 2027, produtos de IA vertical terão dificuldade para sobreviver na maioria dos setores
“Adoção (adoption)” significa qual produto os usuários escolhem ao resolver um novo problema ou ao mudar a forma de resolver um problema existente
Os itens a seguir não são considerados
- Participação de mercado: contratos existentes e outros fatores podem influenciar
- Tamanho absoluto: embora a IA expanda o mercado ao abrir novos casos de uso, esta análise considera apenas mudanças relativas
- Valor potencial: avalia-se qual solução as pessoas escolhem no momento atual, sem incluir a possibilidade de melhorias futuras
Por exemplo, se o fluxo muda de A para B, isso significa que antes A era preferido, mas agora B é visto como a melhor opção

Conceitos de IA vertical/horizontal e workflow/agentes

"IA vertical" e "IA horizontal" se referem a tipos diferentes de produtos de IA
"Workflow" e "agent" também são conceitos usados para classificar produtos de IA
Neste documento, os conceitos de workflow e agent dentro dos produtos de IA horizontais são explicados em conjunto
- É provável que a mesma empresa desenvolva um produto que inclua as duas funcionalidades
- Por exemplo, o ChatGPT pode adicionar recursos de agent mantendo ao mesmo tempo sua base atual de workflow

Passado

(1) O período pré-ChatGPT era uma situação em que o software tradicional dominava o mercado
(2) Com o lançamento do ChatGPT, surgiu o primeiro produto horizontal de IA realmente significativo
(3) Após o surgimento da API do GPT-3.5, começaram a ser lançados, pela primeira vez, vários produtos verticais especializados em IA

Este ano

(4) Há a expectativa de que, em 2025, o desempenho dos modelos se estabilize a ponto de poder ser usado como agents práticos
- Até agora, os agents vinham sendo usados apenas em projetos de pesquisa ou testes limitados, mas a perspectiva é de adoção em escala real
- Produtos verticais de workflow já existentes também podem migrar para o formato de agents de IA
(5) Mesmo com o surgimento dos agents, a expectativa é que os workflows verticais continuem em posição dominante até 2025
- Isso se deve tanto ao hábito dos usuários de evitarem trocar ferramentas já adotadas quanto à inércia dos desenvolvedores em continuar aproveitando os ativos de engenharia acumulados até agora
(6) A expectativa é que os principais produtos horizontais de IA, como ChatGPT, Claude e Gemini, ampliem suas funcionalidades e passem a cobrir mais áreas verticais
- Há a possibilidade de que funcionalidades especializadas que hoje existem em produtos verticais de IA sejam rapidamente absorvidas por produtos horizontais de IA
- O ChatGPT já começou a se integrar com aplicativos de desktop

Futuro próximo

(7) A diferença de capacidade entre agents horizontais de IA e trabalhadores humanos deve diminuir gradualmente
- Ainda que não cheguem ao nível de especialistas, a expectativa é que obtenham desempenho suficiente para automatizar boa parte do trabalho administrativo geral
- Com isso, a razão de existir de soluções verticais de IA pode diminuir
- Exemplos concretos:
  - Usuários individuais podem passar a delegar tarefas complexas, como declaração de imposto de renda ou preparação para emprego, a agents horizontais
  - Empresas podem substituir ou reduzir uma parcela significativa da força de trabalho júnior
  - Pode surgir um caso de uma única pessoa criando valor de nível unicórnio
(8) A expectativa é que o software tradicional continue tendo valor como interface que os agents podem utilizar
- Pode ser mais eficiente em termos de custo para os agents aproveitarem softwares existentes do que recriar diretamente todo software do zero
- A análise é de que, em especial, softwares genéricos e horizontais têm maior probabilidade de sobreviver
(9) A expectativa é que os produtos verticais de IA que sobreviverem sejam apenas uma minoria com recursos defensivos mencionados no capítulo 2, como dados proprietários e patentes
- Também existe a possibilidade de vender esses recursos por alto valor

2024 - o progresso parou?

A avaliação é de que a alegação de que houve estagnação dos modelos de IA em 2024 tem pouca força
- Mesmo antes do lançamento do o3, o desempenho de modelos como GPT-4, Claude e modelos Open Weight vinha melhorando continuamente em várias áreas
- Houve uma tendência de avanço radical nas pontuações de benchmarks como ARC-AGI e GPQA Diamond
A Anthropic evoluiu rapidamente de Claude 2 para Claude 3 e depois para Claude 3.5 Sonnet, e surgiu a especulação de que vinha usando internamente upgrades não divulgados
Por isso, a visão de que 2024 foi um ano em que a melhoria dos modelos de IA parou é considerada pouco fundamentada

Obstáculos potenciais

Model Stagnation: embora 2024 não tenha mostrado estagnação, existe a preocupação de que o avanço dos modelos possa parar depois de 2025
- Ilya Sutskever mencionou na NeurIPS os limites do pre-training tradicional, mas ao mesmo tempo sugeriu que existem outros caminhos, como Test-time compute
- Os principais institutos e empresas de pesquisa em IA continuam investindo ativamente em enormes recursos computacionais
Regulation: regulações inesperadas podem surgir e restringir o avanço da IA
Trust Barriers: há preocupações dos usuários sobre estabilidade e confiabilidade dos agents
- Com base no precedente histórico de que o medo da automação de elevadores acabou desaparecendo, há a expectativa de que isso também seja superado com o tempo
AI Labs Hesitate: pode haver casos em que Anthropic ou OpenAI mantenham certas interações de usuários deliberadamente limitadas, mesmo tendo capacidade técnica real
Expensive Inference: inferência de alto desempenho pode exigir custos muito altos, como no caso do o3
- Mas o custo de inferência vem caindo com o tempo, e também é bastante provável que os agents não apliquem o mesmo nível de inferência de alto desempenho a todas as tarefas
Considerando em conjunto os fatores acima, prever o avanço tecnológico continua difícil, mas a perspectiva é de que startups de IA vertical não tenham muito tempo
É apresentado um gráfico de valor em forma de U, segundo o qual o valor baseado em engenharia existente pode desaparecer rapidamente à medida que os modelos de IA se sofisticam

Observações

A explicação é que a expansão de Test-time compute mostrada no o3 já era um resultado previsto por pesquisas anteriores
Assim como demonstrado no caso do AlphaZero, há o insight de que, em ambientes verificáveis, o desempenho pode atingir rapidamente níveis sobre-humanos
A análise é que o o3 se destaca em áreas como programação e matemática, mas em outras, como escrita criativa, não mostra grande diferença em relação ao o1
A implicação para fundadores é que, em vez de desenvolver uma nova IA vertical, pode ser mais vantajoso seguir em outra direção, lidando com recursos mais amplos ou mais proprietários

Capítulo 4: Você é um mago (You’re a wizard Harry)

O fundador é como um mago

Tem a capacidade de criar algo a partir do nada
Começar uma nova empresa exige pensamento original
Frase de Paul Graham (PG): "As ideias precisam ser não apenas corretas, mas também originais. Você não deve começar algo que todos concordam ser uma boa ideia."
Muitos fundadores estão ficando cegos pelo impressionante crescimento de receita de seus pares e perdendo a capacidade de pensar de forma independente
Quando todos fazem a mesma coisa e isso parece estar funcionando, fica difícil pensar com independência
O autor tenta pensar de forma independente e espera que essas ideias soem ruins

O futuro dos agents horizontais e a concorrência

A expectativa é que os agents horizontais que poderão dominar a camada de aplicações de IA sejam desenvolvidos por laboratórios de IA
O desempenho dos modelos pode mudar e levar a um único vencedor, mas uma competição intensa entre Anthropic, OpenAI, GDM e xAI parece mais provável
Isso provoca, no curto prazo, uma competição de preços que beneficia o usuário final
Mesmo que, no curto prazo, os laboratórios de IA não capturem muito valor financeiro, a expectativa é que ainda ocupem uma posição extremamente forte
Portanto, é razoável que fundadores pensem suas startups no contexto da relação com esses laboratórios

Abordagem como cliente

Como discutido no capítulo 2, é possível construir produtos verticais de IA usando APIs de LLM, mas isso só é viável quando há acesso exclusivo a recursos importantes
Para construir um produto vertical de IA, é preciso dedicar um enorme esforço para encontrar esses recursos

Abordagem como concorrente

Se agentes horizontais são o futuro, por que não construí-los? São analisadas três abordagens
Tomar o mercado primeiro
- Os laboratórios de IA só competirão seriamente com workflows verticais quando os modelos forem confiáveis o bastante para permitir a criação de agentes horizontais com esforço mínimo de engenharia
- Em teoria, é possível aplicar esforço de engenharia a modelos anteriores e entrar no mercado antes dos laboratórios, mas isso não é garantido
- Leopold Aschenbrenner acredita que esse esforço pode levar mais tempo do que construir o próximo modelo: "Pode demorar até que trabalhadores remotos consigam automatizar muitas tarefas, e, nesse meio-tempo, os modelos intermediários talvez ainda não tenham sido totalmente explorados e integrados"
- Independentemente de quem entrar primeiro no mercado, espera-se que essa vantagem não dure muito
Wrapper de API de agente
- Um colega de apartamento perguntou: "Não existe ninguém no mundo com habilidade de UI?"
- Isso sugere dois problemas: 1) os custos de API tornam a margem insustentável, 2) os laboratórios não divulgam seus melhores modelos (o ChatGPT usa modelos proprietários para busca, navegação na web etc.)
- Hoje, ninguém usa a API do GPT para competir diretamente com o ChatGPT, e espera-se que esse padrão se repita também com agentes horizontais
Modelos open source
- Modelos open source podem oferecer outro caminho
- O Perplexity mostra que é possível competir com os laboratórios em produtos horizontais
- No entanto, modelos open source vão bem em benchmarks simples, mas têm dificuldade em tarefas complexas de agentes
- O Llama-3.1-405b fica bem atrás dos modelos de ponta no MLE-bench
- A Andon Labs é especializada nesse tipo de benchmark, e isso é compatível com o que observamos
- O Deepseek V3 e o R1 foram lançados com resultados muito impressionantes, mas o mesmo vale para o o3, e há relatos de que a Anthropic tem versões ainda melhores internamente
- Modelos open source podem se aproximar do estado da arte, mas é duvidoso que o superem
- Ainda assim, isso pode ser suficiente para competir no jogo horizontal
- Os custos de inferência ainda serão muito altos

Abordagem como fornecedor

Se os laboratórios de IA realmente se tornarem tão poderosos, ser fornecedor deles será uma excelente posição
Eles certamente precisarão de muito poder computacional e energia
Se a análise do Leo estiver correta, talvez precisem de mais do que o esperado
Essa oportunidade exige conhecimento especializado da indústria, o que pode não ser algo natural para fundadores hoje posicionados na camada de aplicações de IA
Mas lembre-se de que você é um mago
Os laboratórios também compram dados de terceiros
A Scale AI está provando que isso é um ótimo negócio
No entanto, é questionável se os laboratórios de IA conseguirão fazer o "autoaprendizado" funcionar
O AlphaZero foi treinado sem dados externos, e isso é visto como o santo graal dos futuros modelos de IA
Se eles não conseguirem fazer o autoaprendizado funcionar, a alternativa será combinar vários conjuntos de dados de pós-treinamento
Nesse mundo, vender dados provavelmente será uma boa escolha

Abordagem como contribuidor do ecossistema

Por fim, outra relação a considerar com os laboratórios de IA é tornar-se um contribuidor do ecossistema
Isso significa construir ferramentas que ajudem agentes horizontais, mas o importante é que elas precisam ser separadas do próprio agente
Como mostrado no capítulo 3, softwares tradicionais continuarão existindo porque os agentes precisam de interfaces eficientes
Os agentes podem escrever seu próprio software, mas os custos de inferência podem tornar isso impraticável
No entanto, players do ecossistema correm o risco de se comoditizar, e a maior parte do valor pode ser capturada em outro lugar
Isso vai depender de quão alto for o custo de inferência (inference cost) para executar agentes horizontais
- Se o custo de inferência for baixo, será mais comum que agentes gerem por conta própria o software de que precisam

E se os agentes horizontais de IA demorarem a chegar?

O cronograma (timeline) é muito importante
- Se os agentes horizontais só se tornarem competitivos daqui a 10 anos, construir workflows verticais de IA agora será uma excelente ideia
- Esse tempo é suficiente para construir uma empresa grande e sólida
Mas, considerando a velocidade de avanço dos laboratórios de IA, 10 anos é irrealista
- Então, e daqui a 4 anos?
- Quatro anos podem não ser suficientes para criar uma grande empresa, mas oferecem oportunidades suficientes de iteração
- Começar na camada de aplicações de IA pode até ser vantajoso para depois migrar para fornecedor ou player do ecossistema

Epílogo: foi um erro da YC (Y Combinator)?

À primeira vista, pode parecer que a YC está fazendo a escolha errada
- Atualmente, a YC concentra a maior parte de seus investimentos em produtos verticais de IA
- Mas há uma grande chance de esse mercado desaparecer em breve
No entanto, o autor não tem expertise suficiente em VC (venture capital) para tirar uma conclusão definitiva
- Ele está apenas compartilhando sua confusão e reflexão
A YC afirma adotar uma estratégia de investimento relativamente neutra
- Investe em pessoas inteligentes e espera que elas encontrem as melhores ideias
- Essa é uma ótima estratégia, e centenas de fundadores talvez consigam prever o futuro melhor do que 14 parceiros da YC
Mas o autor se preocupa com a possibilidade de o sistema de batches da YC induzir um pensamento de curto prazo
- Na YC, é muito importante definir metas semanais, e avançar em grupo é bom para a motivação
- Mas, se não houver diversidade suficiente de ideias, isso pode induzir um pensamento de curto prazo
- Criando um produto vertical de IA, é possível chegar rapidamente a US$ 5.000 de MRR
- Mas esse é realmente um jeito de construir um negócio sustentável?
- Se o autor estivesse numa batch da YC agora, provavelmente sentiria a tentação de criar um produto vertical de IA
- Além disso, o podcast da YC, "The Light Cone", traz bastante conteúdo defendendo produtos verticais de IA

1 comentários

zkdlfrlwl2 2025-02-14

A distinção e a explicação entre Vertical AI e Horizontal AI são interessantes.

A lição amarga de um fundador de IA (Bitter Lesson)

Capítulo 1: a história se repete (History Repeats Itself)

tl;dr:

Resumo do ensaio de Richard Sutton: The Bitter Lesson. (tradução em coreano)

Produtos de IA e The Bitter Lesson

Tipos de restrição e produtos de IA

A conexão entre Vertical Workflow e The Bitter Lesson

A relação entre The Bitter Lesson e os produtos de IA atuais

As quatro observações de Bitter Lesson e sua aplicação aos tipos de restrição

Encerramento: startups de IA e The Bitter Lesson

Capítulo 2: sem vantagem competitiva (No Powers)

tl;dr:

Dificuldade do problema e curva de desempenho

O conceito de “colaborador remoto” oferecido pela IA horizontal

Caso anterior: a experiência com o AcademicGPT

Análise das 7 Powers de Helmer

Switching Cost (custo de troca)

Counter Positioning (reposicionamento contrário)

Scale Economy (economia de escala)

Network Economy (efeito de rede)

Brand Power (força de marca)

Process Power (força de processo)

Cornered Resource (recurso exclusivo)

Encerramento

Capítulo 3: Uma nota de rodapé na história (A Footnote in History)

Conceitos de IA vertical/horizontal e workflow/agentes

Passado

Este ano

Futuro próximo

2024 - o progresso parou?

Obstáculos potenciais

Observações

Capítulo 4: Você é um mago (You’re a wizard Harry)

O fundador é como um mago

O futuro dos agents horizontais e a concorrência

Abordagem como cliente

Abordagem como concorrente

Abordagem como fornecedor

Abordagem como contribuidor do ecossistema

E se os agentes horizontais de IA demorarem a chegar?

Epílogo: foi um erro da YC (Y Combinator)?

Leituras relacionadas

1 comentários