Meu jeito de acompanhar a evolução da IA (e por que você também deveria fazer isso)

(blog.nilenso.com)

87 pontos por GN⁺ 2025-07-21 | 5 comentários | Compartilhar no WhatsApp

A IA generativa é a tecnologia que evolui mais rápido, e tanto subestimá-la quanto superestimá-la é perigoso
Acompanhar consistentemente fontes confiáveis e especialistas de credibilidade é essencial
Recomenda-se um pipeline de informação equilibrado com Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought e outros
Anúncios oficiais de laboratórios de IA, blogs de engenharia e artigos acadêmicos são indispensáveis para entender o progresso real da tecnologia e seus limites
Com canais diversos como Twitter/X, curadoria de notícias e listas de especialistas, é possível acessar tanto as tendências mais recentes quanto análises aprofundadas

Introdução: mal-entendidos sobre IA e poluição informacional

A IA generativa é a tecnologia que mais avança rapidamente que o autor já viu na vida
Mas os equívocos sobre IA também estão por toda parte, e o ambiente informacional em si é extremamente confuso
Há casos reais em que empresas, governos ou pessoas que não entendem suficientemente a tecnologia a utilizam mal ou causam danos graves
Existem mal-entendidos extremos dos dois lados: subestimar a IA (tratando-a como uma “moda passageira”) ou superestimá-la (“programadores não serão mais necessários”)
A falta de compreensão correta da tecnologia é a origem desses equívocos

Como abordar o aprendizado sobre IA

Entender corretamente informações relacionadas à IA não é tão fácil quanto parece
Vivemos em um ambiente em que somos expostos rotineiramente a informações distorcidas, exageros ou debates reprimidos
Sem selecionar as informações de forma intencional e sistemática, há grande risco de exposição a erros, exageros e distorções
O autor tem sido ajudado por um pipeline de informação equilibrado e o recomenda como um bom ponto de partida para iniciantes

Princípios gerais para obter informação

É importante consultar informações próximas da fonte original
- É preciso verificar como fonte primária os anúncios oficiais de laboratórios de IA ou as opiniões de figuras centrais
- É necessário adotar uma postura de não confiar cegamente em coberturas de segunda ou terceira mão
Também é importante buscar ativamente e consultar comentários de especialistas confiáveis

Pontos de partida recomendados

Simon Willison’s Blog
- Simon Willison’s Blog (tag AI)
- O ponto de partida mais recomendado para pessoas técnicas, cobrindo amplamente a fronteira da IA, aplicações, segurança e questões éticas
- Também é conhecido como criador do Django e do Datasette
- Exemplos: The Lethal Trifecta, LLMs in 2024
Andrej Karpathy
- Twitter/X | YouTube
- Membro fundador da OpenAI e ex-diretor de IA da Tesla
- Canal ideal para aprender de forma mais acessível a estrutura interna e os princípios dos modelos de IA, além de observar seu impacto cultural e as mudanças sociais que ela provoca
- Exemplos: Deep Dive into LLMs like ChatGPT, How I Use LLMs

Every’s Chain of Thought

Every’s Chain of Thought
Escrito por Dan Shipper (cofundador da Every), oferece relatos práticos de uso de IA e experiências reais com modelos para além de benchmarks
Exemplos: Vibe Check: Codex, Vibe Check: o3

Como monitorar materiais oficiais de laboratórios de IA

OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) etc.: vale acompanhar regularmente blogs oficiais, notícias, model cards, guias de engenharia e artigos acadêmicos
- Exemplos: anúncio oficial do OpenAI o3, Claude 4 System Card
- Blogs de engenharia: Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- Exemplos de artigos: artigo do DeepSeek R1, artigo de biologia da Anthropic
Laboratórios menores: Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire também valem a pena

Especialistas em IA e engenheiros de prática para acompanhar

Informações de especialistas que criam ferramentas open source e têm experiência prática em engenharia de IA muitas vezes ajudam mais, na prática, do que guias oficiais

Principais nomes e blogs recomendados

Hamel Husain
- Your AI Product Needs Evals, LLM Eval FAQ
Shreya Shankar
- Data Flywheels for LLM Applications, Short Musings on AI Engineering and “Failed AI Projects”
Jason Liu
- The RAG Playbook, Common RAG Mistakes
Eugene Yan
- Task-Specific LLM Evals that Do & Don’t Work, AlignEval, Intuition on Attention
What We’ve Learned From A Year of Building with LLMs
- Arquivo de casos de aplicação de LLMs escrito por pessoas com experiência real de implementação
Chip Huyen
- Common pitfalls when building generative AI applications, Agents
Omar Khattab (Twitter)
- A Guide to Large Language Model Abstractions, post no Twitter
Kwindla Hultman Kramer (Twitter)
- Voice AI and Voice Agents: An Illustrated Primer, Advice on Building Voice AI in June 2025
Han Chung Lee
- MCP is not REST API, Poking around Claude Code, MLOps Lessons from ChatGPT’s ‘Sycophantic’ Rollback
Jo Kristian Bergum
- Search is the natural abstraction for augmenting AI with moving context
David Crawshaw
- How I program with LLMs, How I program with Agents
Alexander Doria / Pierre Carl-Langlais
- The Model is the Product, A Realistic AI Timeline
Nathan Lambert’s “Interconnects”
- What comes next with Reinforcement Learning, Reinforcement learning with random rewards actually works with Qwen 2.5
Ethan Mollick
- Using AI Right Now: A Quick Guide, Making AI Work: Leadership, Lab, and Crowd
AI Snake Oil – Arvind Narayanan & Sayash Kapoor
- AGI is not a milestone, Evaluating LLMs is a minefield

Como aproveitar notícias/mídia e comunidades de IA

Twitter/X
- Lista do Twitter/X
- Centro das discussões em tempo real e da coleta de informações sobre IA, útil para captar novidades e debates
  - Consumir o feed do Twitter como se estivesse lendo jornal por 15 a 20 minutos, adicionando novos nomes e fontes quando necessário
Shawn Wang(swyx) / smol.ai
- Twitter do swyx | AI News by smol.ai
- Newsletter Latent Space
- Como alternativa ao Twitter, oferece um resumo diário das tendências de IA
Dwarkesh Patel
- blog/podcast de Dwarkesh Patel

Comunidades para discussões e materiais mais avançados sobre IA

LessWrong (AI Alignment), AI Alignment Forum: segurança em IA, governança, análises técnicas etc.
- Há muitas discussões avançadas que raramente aparecem no mainstream ou no Twitter
- Exemplos: Claude plays Pokémon breakdown, The Waluigi Effect
Gwern: textos profundos, quase enciclopédicos, sobre IA, LLMs, transformers etc.
- Oferece um grande volume de textos sobre IA e conteúdos com insights preditivos, como sobre scaling de LLMs
- Exemplos: The Scaling Hypothesis, tutorial You could have invented transformers
Prompt Whisperers/Latent space explorers
- blog Janus, Twitter de Wyatt Walls, Claude Backrooms
- Exemplos: Anomalous tokens reveal the original identities of Instruct models, the void

Formas práticas de se informar

Não é preciso acompanhar todas as fontes perfeitamente; uma abordagem prática é ler o feed do Twitter como um jornal
Ao encontrar um texto interessante, vale seguir o autor e explorar também seus outros trabalhos, ampliando a leitura de forma orgânica
É uma forma de explorar informação parecida com descobrir músicas no passado
Se você encarar isso como prazer de exploração intelectual, pode se tornar diversão, e não obrigação

Conclusão e lista recomendada

Pela lista de Twitter/X fornecida, é possível seguir de uma vez só os especialistas e profissionais citados acima
Em breve, também será adicionada uma lista em formato RSS

Lista do Twitter

5 comentários

GN⁺ 2025-07-21

Comentários do Hacker News

Se você entende, no básico, como os LLMs funcionam, acho que não precisa acompanhar todo o fluxo constante de conteúdo de PRs, blogueiros, líderes da indústria e pensadores da internet
Na verdade, acompanhar essas entrevistas e textos pode te levar a seguir modinhas estranhas que, no fim, não ajudam de verdade
Na prática, as diferenças entre modelos têm sido mais de alguns anos de defasagem do que diferenças essenciais, e hoje a maior parte das mudanças acontece nas ferramentas ou no trabalho de integração
É preciso sempre lembrar que LLM é, no fim das contas, um "modelo de texto" e é gerado sem conhecimento de base; assim dá para filtrar onde ele é útil e onde não é adequado
- Concordo muito com isso, e também senti que a lista de "high signal" daquele blog é, na prática, composta majoritariamente por figuras de autopromoção (embora haja algumas boas), ficando mais perto de "buzz" do que de insight
  Também não me identifico muito com a afirmação de que "foi a tecnologia que evoluiu mais rápido em toda a minha vida"
  Eu vivi a época em que SVM estava em alta, em que "redes neurais eram uma piada", e depois mais de dez anos de deep learning e da explosão de vários frameworks de DL
  Naquela época também houve um avanço realmente muito rápido ao longo de dez anos
  Na web, foi como ver JS deixar de ser só um complemento de UX e virar padrão em aplicativos de página única
  O ponto central é que, a menos que você vá entrar para uma "lista de influenciadores essenciais", uma estratégia muito melhor é simplesmente seguir firme e esperar até o momento em que isso se torne importante para você
  Eu mesmo ignorei todas as tendências de desenvolvimento web por dez anos depois da era do backbone.js e, quando React passou a ser necessário, estudei por alguns dias e saí usando
  Cinco anos atrás todo mundo queria aprender a implementar LSTM, e agora isso ficou ultrapassado por causa dos transformers
  O que senti ao longo de toda a carreira é que "mover-se rápido" significa "não está maduro"
  Na prática, aprender modelos estatísticos mais antigos (como GLM etc.) e como usá-los de forma útil até hoje acaba sendo uma solução muito mais produtiva no trabalho real do que correr atrás do "prompt hack" da vez
- Se você conhece minimamente a estrutura dos LLMs, quase todas as novidades sobre LLM acabam caindo em dois grupos
  O primeiro é uma ferramenta nova que é um pouco diferente das existentes, ou tem desempenho um pouco melhor (se trouxer algo que não existia antes, pode valer a pena, mas a maioria logo fica obsoleta)
  Nomes como Kimi-K2 e GPT 4.1 talvez ninguém mais mencione daqui a alguns meses
  O segundo caso é quando uma capacidade realmente nova é adicionada ao modelo
  Por exemplo: RL(reinforcement learning), chain of thought, agentes de programação que realmente funcionam, modelos multimodais de altíssimo nível, integração inteligente com ferramentas
  Basta prestar atenção quando acontecerem esses grandes saltos
  Na prática, só de passar os olhos em posts do HN com mais de 500 pontos já dá para captar naturalmente a direção recente
  Acho que a melhor forma de aprender a capacidade real dos LLMs não é por blogs ou vídeos, e sim construindo coisas você mesmo e batendo cabeça
- Concordo totalmente. Sempre enfatizo isso para os estudantes
  - 1. Não foquem demais na experiência dos outros; foquem na própria experiência direta
  - 2. Em vez de ler blogs, criem um app vocês mesmos
  - 3. Como a experiência de cada um varia enormemente, não sigam mecanicamente o que os outros pensam
  - 4. Não saiam seguindo pesquisadores ou desenvolvedores no Twitter e no Substack sem critério (na maioria das vezes é vitrine pessoal)
  - 5. Não desperdicem tempo com ansiedade e FOMO; aprendam fazendo. Mudanças realmente importantes você vai acabar conhecendo de qualquer jeito, mais cedo ou mais tarde
  - 6. Saber informação é importante, mas não sejam obsessivos com a própria informação. Distribuam o tempo com inteligência. Sempre reforço esse ponto para os alunos
- Na verdade, isso vale também para a pesquisa
  Pesquisa, por natureza, é 99% avanço incremental (e isso é normal, não se frustre com isso)
  A maioria dos artigos é mais longa do que precisa e, se você ler direito, com alguma intuição matemática já dá para prever bastante coisa (se souber a ideia, já dá para estimar os resultados)
  É fácil sentir que a área muda rápido, mas na prática ela não anda tão depressa assim
  Eu mesmo fiquei um ano afastado por motivos pessoais e, quando voltei, percebi que não tinha mudado tanta coisa
  Ter essa perspectiva ajuda a se libertar da pressão de "se manter atualizado"
  Se está difícil agora, isso só significa que sua especialização ainda está um pouco insuficiente, não que você ficou para trás
  Assim como qualquer um consegue acompanhar mesmo um passo atrás se souber correr, essa pressa é, no fim, só uma preocupação na minha cabeça
- Quando explico LLMs, a parte que mais desperta interesse não é a arquitetura, e sim a "previsão token a token (autoregressão)" e o fato de que nem sempre sai o token de maior probabilidade, mas um token amostrado proporcionalmente à probabilidade
  O algoritmo central em si (a forma de prever o próximo token) não faz muito sentido para a maioria das pessoas de fora da área
  Detalhes como dot product e embedding não interessam a quase ninguém. Mesmo explicando, é difícil que fique, e também não ajuda tanto assim
Não acho que seja preciso acompanhar necessariamente as "últimas tendências"; o melhor é manter um interesse solto e ir testando seletivamente só os recursos e técnicas que realmente aumentem sua eficiência (não confio muito nessas coisas de alguém no X ter recomendado algo). Aliás, aprendi bastante ouvindo pesquisadores com visão crítica em relação ao hype de IA [https://x.com/burkov]. No cenário atual há exagero demais, mudança demais e incerteza demais. Se surgir uma inovação de verdade, você certamente vai ouvir falar no HN (ou em alguma comunidade mais mainstream)
- Usar por algumas horas você mesmo é um aprendizado muito mais valioso do que passar várias horas lendo material
Senti que o texto não explica bem o "porquê", então o "como" da lista fica pouco convincente. Meu tempo valioso pode muito bem ser usado em outra coisa
- Fico me perguntando se realmente é preciso "acompanhar continuamente" alguma coisa. Inovações prática e significativamente relevantes acabam se popularizando e chegando até mim de forma natural. Com Excel e Google Docs foi assim: no começo eu nem ligava muito, e ainda assim aprendi a usar bem depois que já tinham se popularizado. A não ser que exista um motivo claro para correr atrás, como no caso de uma startup de IA com pouco runway, não há razão para ansiedade
Assino a newsletter "Pragmatic Engineer", do Gergely Orosz (que tem bastante tema de IA ultimamente), e também acompanho o Substack do Gary Marcus (com uma visão mais cética sobre LLMs)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
Também acompanho automaticamente notícias de pacotes Python como Langchain e PydanticAI (projetos assim refletem em certa medida as tendências práticas do setor). Não uso mais o X (Twitter), mas gente como Simon Willison também posta às vezes no BlueSky e no Mastodon. Sebastian Raschka, Chip Huyen e outros também publicam no LinkedIn. Está tudo espalhado por vários lugares, mas no fim das contas a maioria das notícias importantes acaba chegando até você
Talvez eu tenha perdido algo importante, mas atualizações centrais e realmente relevantes acabam aparecendo naturalmente na capa do HN ou nos comentários
- Tentar acompanhar os movimentos da indústria é como subir numa esteira a 140 km/h. Eu simplesmente desisti de correr nela. Concordo que IA (especialmente LLM) não é uma moda passageira, mas agora as mudanças estão intensas demais. Não pretendo investir muito tempo nisso até que se torne realmente necessário. Espero que, em alguns anos, o cenário da indústria fique mais claro. E, mesmo que não fique, pelo menos não vou desperdiçar tempo com tendências que rapidamente deixam de fazer sentido. Para constar, atualmente não uso IA nem LLM de forma alguma no meu trabalho real
- Como as empresas investiram pesadamente em P&D e colocaram muito dinheiro nisso, na verdade elas tendem menos a esconder sua tecnologia (é o oposto de secretismo)
- Eu lido assim com todas as tendências da área de TI
Se você quer acompanhar principalmente notícias sobre LLMs e modelos de IA de fronteira, a lista de recomendações é excelente; mais da metade são pessoas que eu mesmo encontrei separadamente
Eu mantenho uma lista de contas de IA no X (Twitter) e sigo por lá; no geral, continua sendo a fonte de informação mais sólida
Alguns blogs e RSS de podcasts também valem a pena (para pesquisadores, RSS dos próprios artigos é essencial)
O que eu acrescentaria é https://epoch.ai, o podcast do Dwarkesh Patel, o blog do Peter Wildeford, @omarsar0 (DAIR elvis) e seguir vários pesquisadores diretamente (embora alguns sejam mais entretenimento do que informação)
O ambiente informacional dessa área está seriamente contaminado. Especialmente se você seguir só veículos como o NYT, que tratam isso de forma mais política, vai acabar ficando com uma visão enviesada e imprecisa
Vale notar que áreas de ML sem relação direta com IA generativa (como proteínas, genômica, modelos climáticos, diffusion e pesquisa de geração de imagem etc.) têm fontes de informação totalmente diferentes
A categoria AI/ML é ampla demais para acompanhar tudo de uma vez
E, se a pergunta é se você precisa mesmo acompanhar, a resposta é não
Para a maioria das pessoas, isso é mais curiosidade sobre tecnologia nova e tendência do momento
Ainda assim, em áreas como desenvolvimento de software, ignorar IA completamente pode ser fatal para a carreira no médio e longo prazo (mesmo que a resposta seja só aprender as ferramentas em si)
No meu caso, acompanho de forma contínua por causa da natureza do meu trabalho, que exige noção do panorama geral
Só o blog do Simon Willison já basta para aprender informação recente e de alta qualidade (quase sem ruído e com a melhor relação sinal/ruído)
- Se você apoiar o Simon no GitHub (US$ 10 ou mais), pode receber por e-mail "resumos principais em menor volume"
  
  "Resumo dos desenvolvimentos mais importantes no campo dos LLMs no último mês (leitura de menos de 10 minutos)"
  https://simonwillison.net/about/
- https://simonwillison.net
- Felizmente ele também oferece RSS, então dá para acompanhar tanto código quanto notícias
Não precisa necessariamente seguir "tendências"
- Verdade, já está na hora de largar isso e fazer outra coisa
- Na real, sair da indústria de tecnologia e construir outra carreira também é uma opção
  Os empregos em tecnologia vão diminuir cada vez mais e, em algum momento, a queda pode ficar acentuada (com IA fazendo o trabalho de 10 pessoas por 1, e depois o mesmo com white-collar e blue-collar, como robôs em centros logísticos da Amazon)
  Pessoalmente, cancelei meu GPT Plus esta semana; não quero mais alimentar "aquele monstro"
  Em recursos como suporte a mapas (por exemplo, rotas de viagem, trajetos de pedal com amigos etc.), a versão gratuita do Gemini até funciona melhor
Se você seguir só a primeira recomendação (ler o blog do simow), provavelmente já basta
- Até isso me dá preguiça, então substituo por vídeos do Fireship com o café da manhã
- Recomendo fortemente — resumos de altíssima qualidade com quase nada de clickbait
As aulas do Andrej Karpathy me ajudaram absurdamente
Também estão no YouTube (https://www.youtube.com/@AndrejKarpathy)
Mesmo estando numa posição de orientar e ajudar pesquisadores de machine learning, quando ouço a voz do Andrej eu me sinto um estudante que não sabe nada
No começo isso pareceu estranho, mas agora vejo essa humildade como um recurso valiosíssimo
Esse sentimento de "eu não sei nada" é realmente importante

makers 2025-07-22

T_T está muito difícil de ler

reagea0 2025-07-23

Se você acha isso ilegível, provavelmente o problema não está no texto principal.

harris 2025-07-28

Concordo.

supermaxi 2025-07-22

Um tipo de escrita que é essencial neste momento.