Meu jeito de acompanhar a evolução da IA (e por que você também deveria fazer isso)
(blog.nilenso.com)- A IA generativa é a tecnologia que evolui mais rápido, e tanto subestimá-la quanto superestimá-la é perigoso
- Acompanhar consistentemente fontes confiáveis e especialistas de credibilidade é essencial
- Recomenda-se um pipeline de informação equilibrado com Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought e outros
- Anúncios oficiais de laboratórios de IA, blogs de engenharia e artigos acadêmicos são indispensáveis para entender o progresso real da tecnologia e seus limites
- Com canais diversos como Twitter/X, curadoria de notícias e listas de especialistas, é possível acessar tanto as tendências mais recentes quanto análises aprofundadas
Introdução: mal-entendidos sobre IA e poluição informacional
- A IA generativa é a tecnologia que mais avança rapidamente que o autor já viu na vida
- Mas os equívocos sobre IA também estão por toda parte, e o ambiente informacional em si é extremamente confuso
- Há casos reais em que empresas, governos ou pessoas que não entendem suficientemente a tecnologia a utilizam mal ou causam danos graves
- Existem mal-entendidos extremos dos dois lados: subestimar a IA (tratando-a como uma “moda passageira”) ou superestimá-la (“programadores não serão mais necessários”)
- A falta de compreensão correta da tecnologia é a origem desses equívocos
Como abordar o aprendizado sobre IA
- Entender corretamente informações relacionadas à IA não é tão fácil quanto parece
- Vivemos em um ambiente em que somos expostos rotineiramente a informações distorcidas, exageros ou debates reprimidos
- Sem selecionar as informações de forma intencional e sistemática, há grande risco de exposição a erros, exageros e distorções
- O autor tem sido ajudado por um pipeline de informação equilibrado e o recomenda como um bom ponto de partida para iniciantes
Princípios gerais para obter informação
- É importante consultar informações próximas da fonte original
- É preciso verificar como fonte primária os anúncios oficiais de laboratórios de IA ou as opiniões de figuras centrais
- É necessário adotar uma postura de não confiar cegamente em coberturas de segunda ou terceira mão
- Também é importante buscar ativamente e consultar comentários de especialistas confiáveis
Pontos de partida recomendados
-
Simon Willison’s Blog
- Simon Willison’s Blog (tag AI)
- O ponto de partida mais recomendado para pessoas técnicas, cobrindo amplamente a fronteira da IA, aplicações, segurança e questões éticas
- Também é conhecido como criador do Django e do Datasette
- Exemplos: The Lethal Trifecta, LLMs in 2024
-
Andrej Karpathy
- Twitter/X | YouTube
- Membro fundador da OpenAI e ex-diretor de IA da Tesla
- Canal ideal para aprender de forma mais acessível a estrutura interna e os princípios dos modelos de IA, além de observar seu impacto cultural e as mudanças sociais que ela provoca
- Exemplos: Deep Dive into LLMs like ChatGPT, How I Use LLMs
Every’s Chain of Thought
- Every’s Chain of Thought
- Escrito por Dan Shipper (cofundador da Every), oferece relatos práticos de uso de IA e experiências reais com modelos para além de benchmarks
- Exemplos: Vibe Check: Codex, Vibe Check: o3
Como monitorar materiais oficiais de laboratórios de IA
- OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) etc.: vale acompanhar regularmente blogs oficiais, notícias, model cards, guias de engenharia e artigos acadêmicos
- Exemplos: anúncio oficial do OpenAI o3, Claude 4 System Card
- Blogs de engenharia: Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- Exemplos de artigos: artigo do DeepSeek R1, artigo de biologia da Anthropic
- Laboratórios menores: Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire também valem a pena
Especialistas em IA e engenheiros de prática para acompanhar
- Informações de especialistas que criam ferramentas open source e têm experiência prática em engenharia de IA muitas vezes ajudam mais, na prática, do que guias oficiais
Principais nomes e blogs recomendados
- Hamel Husain
- Shreya Shankar
- Jason Liu
- Eugene Yan
- What We’ve Learned From A Year of Building with LLMs
- Arquivo de casos de aplicação de LLMs escrito por pessoas com experiência real de implementação
- Chip Huyen
- Omar Khattab (Twitter)
- Kwindla Hultman Kramer (Twitter)
- Han Chung Lee
- Jo Kristian Bergum
- David Crawshaw
- Alexander Doria / Pierre Carl-Langlais
- Nathan Lambert’s “Interconnects”
- Ethan Mollick
- AI Snake Oil – Arvind Narayanan & Sayash Kapoor
Como aproveitar notícias/mídia e comunidades de IA
-
Twitter/X
- Lista do Twitter/X
- Centro das discussões em tempo real e da coleta de informações sobre IA, útil para captar novidades e debates
- Consumir o feed do Twitter como se estivesse lendo jornal por 15 a 20 minutos, adicionando novos nomes e fontes quando necessário
-
Shawn Wang(swyx) / smol.ai
- Twitter do swyx | AI News by smol.ai
- Newsletter Latent Space
- Como alternativa ao Twitter, oferece um resumo diário das tendências de IA
-
Dwarkesh Patel
Comunidades para discussões e materiais mais avançados sobre IA
- LessWrong (AI Alignment), AI Alignment Forum: segurança em IA, governança, análises técnicas etc.
- Há muitas discussões avançadas que raramente aparecem no mainstream ou no Twitter
- Exemplos: Claude plays Pokémon breakdown, The Waluigi Effect
- Gwern: textos profundos, quase enciclopédicos, sobre IA, LLMs, transformers etc.
- Oferece um grande volume de textos sobre IA e conteúdos com insights preditivos, como sobre scaling de LLMs
- Exemplos: The Scaling Hypothesis, tutorial You could have invented transformers
- Prompt Whisperers/Latent space explorers
Formas práticas de se informar
- Não é preciso acompanhar todas as fontes perfeitamente; uma abordagem prática é ler o feed do Twitter como um jornal
- Ao encontrar um texto interessante, vale seguir o autor e explorar também seus outros trabalhos, ampliando a leitura de forma orgânica
- É uma forma de explorar informação parecida com descobrir músicas no passado
- Se você encarar isso como prazer de exploração intelectual, pode se tornar diversão, e não obrigação
Conclusão e lista recomendada
- Pela lista de Twitter/X fornecida, é possível seguir de uma vez só os especialistas e profissionais citados acima
- Em breve, também será adicionada uma lista em formato RSS
5 comentários
Comentários do Hacker News
Se você entende, no básico, como os LLMs funcionam, acho que não precisa acompanhar todo o fluxo constante de conteúdo de PRs, blogueiros, líderes da indústria e pensadores da internet
Na verdade, acompanhar essas entrevistas e textos pode te levar a seguir modinhas estranhas que, no fim, não ajudam de verdade
Na prática, as diferenças entre modelos têm sido mais de alguns anos de defasagem do que diferenças essenciais, e hoje a maior parte das mudanças acontece nas ferramentas ou no trabalho de integração
É preciso sempre lembrar que LLM é, no fim das contas, um "modelo de texto" e é gerado sem conhecimento de base; assim dá para filtrar onde ele é útil e onde não é adequado
Também não me identifico muito com a afirmação de que "foi a tecnologia que evoluiu mais rápido em toda a minha vida"
Eu vivi a época em que SVM estava em alta, em que "redes neurais eram uma piada", e depois mais de dez anos de deep learning e da explosão de vários frameworks de DL
Naquela época também houve um avanço realmente muito rápido ao longo de dez anos
Na web, foi como ver JS deixar de ser só um complemento de UX e virar padrão em aplicativos de página única
O ponto central é que, a menos que você vá entrar para uma "lista de influenciadores essenciais", uma estratégia muito melhor é simplesmente seguir firme e esperar até o momento em que isso se torne importante para você
Eu mesmo ignorei todas as tendências de desenvolvimento web por dez anos depois da era do backbone.js e, quando React passou a ser necessário, estudei por alguns dias e saí usando
Cinco anos atrás todo mundo queria aprender a implementar LSTM, e agora isso ficou ultrapassado por causa dos transformers
O que senti ao longo de toda a carreira é que "mover-se rápido" significa "não está maduro"
Na prática, aprender modelos estatísticos mais antigos (como GLM etc.) e como usá-los de forma útil até hoje acaba sendo uma solução muito mais produtiva no trabalho real do que correr atrás do "prompt hack" da vez
O primeiro é uma ferramenta nova que é um pouco diferente das existentes, ou tem desempenho um pouco melhor (se trouxer algo que não existia antes, pode valer a pena, mas a maioria logo fica obsoleta)
Nomes como Kimi-K2 e GPT 4.1 talvez ninguém mais mencione daqui a alguns meses
O segundo caso é quando uma capacidade realmente nova é adicionada ao modelo
Por exemplo: RL(reinforcement learning), chain of thought, agentes de programação que realmente funcionam, modelos multimodais de altíssimo nível, integração inteligente com ferramentas
Basta prestar atenção quando acontecerem esses grandes saltos
Na prática, só de passar os olhos em posts do HN com mais de 500 pontos já dá para captar naturalmente a direção recente
Acho que a melhor forma de aprender a capacidade real dos LLMs não é por blogs ou vídeos, e sim construindo coisas você mesmo e batendo cabeça
Pesquisa, por natureza, é 99% avanço incremental (e isso é normal, não se frustre com isso)
A maioria dos artigos é mais longa do que precisa e, se você ler direito, com alguma intuição matemática já dá para prever bastante coisa (se souber a ideia, já dá para estimar os resultados)
É fácil sentir que a área muda rápido, mas na prática ela não anda tão depressa assim
Eu mesmo fiquei um ano afastado por motivos pessoais e, quando voltei, percebi que não tinha mudado tanta coisa
Ter essa perspectiva ajuda a se libertar da pressão de "se manter atualizado"
Se está difícil agora, isso só significa que sua especialização ainda está um pouco insuficiente, não que você ficou para trás
Assim como qualquer um consegue acompanhar mesmo um passo atrás se souber correr, essa pressa é, no fim, só uma preocupação na minha cabeça
O algoritmo central em si (a forma de prever o próximo token) não faz muito sentido para a maioria das pessoas de fora da área
Detalhes como dot product e embedding não interessam a quase ninguém. Mesmo explicando, é difícil que fique, e também não ajuda tanto assim
Não acho que seja preciso acompanhar necessariamente as "últimas tendências"; o melhor é manter um interesse solto e ir testando seletivamente só os recursos e técnicas que realmente aumentem sua eficiência (não confio muito nessas coisas de alguém no X ter recomendado algo). Aliás, aprendi bastante ouvindo pesquisadores com visão crítica em relação ao hype de IA [https://x.com/burkov]. No cenário atual há exagero demais, mudança demais e incerteza demais. Se surgir uma inovação de verdade, você certamente vai ouvir falar no HN (ou em alguma comunidade mais mainstream)
Senti que o texto não explica bem o "porquê", então o "como" da lista fica pouco convincente. Meu tempo valioso pode muito bem ser usado em outra coisa
Assino a newsletter "Pragmatic Engineer", do Gergely Orosz (que tem bastante tema de IA ultimamente), e também acompanho o Substack do Gary Marcus (com uma visão mais cética sobre LLMs)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
Também acompanho automaticamente notícias de pacotes Python como Langchain e PydanticAI (projetos assim refletem em certa medida as tendências práticas do setor). Não uso mais o X (Twitter), mas gente como Simon Willison também posta às vezes no BlueSky e no Mastodon. Sebastian Raschka, Chip Huyen e outros também publicam no LinkedIn. Está tudo espalhado por vários lugares, mas no fim das contas a maioria das notícias importantes acaba chegando até você
Talvez eu tenha perdido algo importante, mas atualizações centrais e realmente relevantes acabam aparecendo naturalmente na capa do HN ou nos comentários
Se você quer acompanhar principalmente notícias sobre LLMs e modelos de IA de fronteira, a lista de recomendações é excelente; mais da metade são pessoas que eu mesmo encontrei separadamente
Eu mantenho uma lista de contas de IA no X (Twitter) e sigo por lá; no geral, continua sendo a fonte de informação mais sólida
Alguns blogs e RSS de podcasts também valem a pena (para pesquisadores, RSS dos próprios artigos é essencial)
O que eu acrescentaria é https://epoch.ai, o podcast do Dwarkesh Patel, o blog do Peter Wildeford, @omarsar0 (DAIR elvis) e seguir vários pesquisadores diretamente (embora alguns sejam mais entretenimento do que informação)
O ambiente informacional dessa área está seriamente contaminado. Especialmente se você seguir só veículos como o NYT, que tratam isso de forma mais política, vai acabar ficando com uma visão enviesada e imprecisa
Vale notar que áreas de ML sem relação direta com IA generativa (como proteínas, genômica, modelos climáticos, diffusion e pesquisa de geração de imagem etc.) têm fontes de informação totalmente diferentes
A categoria AI/ML é ampla demais para acompanhar tudo de uma vez
E, se a pergunta é se você precisa mesmo acompanhar, a resposta é não
Para a maioria das pessoas, isso é mais curiosidade sobre tecnologia nova e tendência do momento
Ainda assim, em áreas como desenvolvimento de software, ignorar IA completamente pode ser fatal para a carreira no médio e longo prazo (mesmo que a resposta seja só aprender as ferramentas em si)
No meu caso, acompanho de forma contínua por causa da natureza do meu trabalho, que exige noção do panorama geral
Só o blog do Simon Willison já basta para aprender informação recente e de alta qualidade (quase sem ruído e com a melhor relação sinal/ruído)
Não precisa necessariamente seguir "tendências"
Os empregos em tecnologia vão diminuir cada vez mais e, em algum momento, a queda pode ficar acentuada (com IA fazendo o trabalho de 10 pessoas por 1, e depois o mesmo com white-collar e blue-collar, como robôs em centros logísticos da Amazon)
Pessoalmente, cancelei meu GPT Plus esta semana; não quero mais alimentar "aquele monstro"
Em recursos como suporte a mapas (por exemplo, rotas de viagem, trajetos de pedal com amigos etc.), a versão gratuita do Gemini até funciona melhor
Se você seguir só a primeira recomendação (ler o blog do simow), provavelmente já basta
As aulas do Andrej Karpathy me ajudaram absurdamente
Também estão no YouTube (https://www.youtube.com/@AndrejKarpathy)
Mesmo estando numa posição de orientar e ajudar pesquisadores de machine learning, quando ouço a voz do Andrej eu me sinto um estudante que não sabe nada
No começo isso pareceu estranho, mas agora vejo essa humildade como um recurso valiosíssimo
Esse sentimento de "eu não sei nada" é realmente importante
T_T está muito difícil de ler
Se você acha isso ilegível, provavelmente o problema não está no texto principal.
Concordo.
Um tipo de escrita que é essencial neste momento.