6 pontos por ashbyash 2025-12-22 | 4 comentários | Compartilhar no WhatsApp

1. OpenAI (ChatGPT/GPT-4o)

  • Líder em 1º lugar ao ultrapassar 1 bilhão de usuários, mas com taxa de atividade abaixo de 20%, e abandono severo após o efeito de novidade passar (original: "usage drop-off after novelty wears off").
  • Com força em multimodalidade (texto, imagem, voz e vídeo), tornou-se uma ferramenta do dia a dia para criação e conversa, elevando a produtividade em 25%. Porém, as alucinações (precisão de 85%) limitam a confiança.
  • Com o preço mensal reduzido para US$ 20, a acessibilidade aumentou, e os agentes (tarefas autônomas) estão em fase beta. É o modelo "all-round" para o consumidor, mas o uso contínuo segue sendo um desafio.

2. Google Gemini

  • Lidera a IA de ponta integrada a Android e Search, com vantagem em privacidade e velocidade graças ao processamento on-device. Compete com o Apple Intelligence.
  • Empatado em 1º lugar em vídeo e voz multimodais, com 90% de precisão em busca. A integração com o ecossistema Google elevou a retenção em 30%.
  • Apesar de ser gratuito e de ter fraquezas em criatividade, é muito útil na vida real e é visto como um "2º lugar em potencial". Está se desfazendo da imagem de hype exagerado.

3. Anthropic Claude (3.5 Sonnet)

  • Muito forte em geração de código e lógica; com integração ao Cursor, é preferido por 40% de desenvolvedores e profissionais especializados. A ênfase em segurança elevou a adoção por empresas (original: "integração multimodal do Claude 3.5").
  • O contexto longo (200K tokens) é um ponto forte na análise de documentos, com alucinações mínimas. Para o consumidor, tem imagem de ser "preciso, mas sem graça".
  • Com baixo custo por token, compete com o open source e contribui para enfraquecer o monopólio das big techs. Retenção em torno de 35%.

4. Perplexity AI

  • Especializado em busca e resumo em tempo real, aumenta em 40% a produtividade na exploração de informações como um "motor de busca com IA". Otimizado para resolver perguntas de consumidores (original: citado no contexto da tendência de integração multimodal).
  • Com 92% de precisão, tem poucas alucinações e aumenta a confiança ao citar fontes. O app mobile tem alta retenção.
  • Oferece modelo básico gratuito + Pro (US$ 20) e disputa a busca com o Grok. Consolida a posição de "ferramenta indispensável para trabalhadores do conhecimento".

5. xAI Grok

  • Tem estilo de humor e conversa diferenciado, com força em análise de redes sociais e tendências graças à integração com o X (Twitter). Vantagem no acesso a dados em tempo real (original: no contexto da ascensão da IA agente).
  • Ainda está no início em multimodalidade, mas se destaca em geração de imagens e compreensão de memes, com retenção de 28% entre os mais jovens.
  • Gratuito + premium, é avaliado como "divertido, mas fraco para trabalho prático". Cresce com base no fandom do Musk.

6. Meta (Llama 3 e ecossistema open source)

  • Com a distribuição gratuita do Llama 3 open source, a adoção por desenvolvedores e startups explodiu, tornando-se um dos principais responsáveis por enfraquecer o monopólio das big techs (original: "liderança dos modelos open source").
  • Como o fine-tuning customizado é fácil, houve aumento de IAs especializadas por domínio (ex.: marketing e e-commerce). O custo fica em cerca de 1/10.
  • Com integração ao WhatsApp e Instagram, a IA de ponta para o consumidor se expandiu, com retenção de 25%. Porém, ainda não é tão refinado quanto os modelos comerciais.

Tendências gerais e perspectivas

  • A diferença de desempenho entre modelos está diminuindo (85~95%), e a chave do sucesso está na integração de UX, compreensão de contexto e retenção. Agentes, personalização e multimodalidade estão se tornando padrão.
  • Em 2026, a disputa entre open source (Llama) e modelos fechados (GPT) deve se intensificar, com expectativa de popularização dos "companheiros de IA".

4 comentários

 
laeyoung 2025-12-23

Tenho uma pergunta para o ashbyash, que escreveu o post, então deixo um comentário aqui.

  1. Anthropic Claude (3.5 Sonnet)
  • Melhor em geração de código e lógica; com a integração ao Cursor, é a preferência de 40% dos desenvolvedores e profissionais especializados. A adoção por empresas também aumenta com a ênfase em segurança (texto original: "integração multimodal do Claude 3.5").

Foi assim que você resumiu. Mas, mesmo olhando tanto o post traduzido que você publicou quanto o texto original, não há nenhuma menção ou conteúdo sobre "3.5 Sonnet". Como você usou resumo por IA, será que isso aconteceu por alucinação? Como o knowledge cutoff da maioria dos foundation models costuma ser no fim do ano passado ou no começo deste ano, "Sonnet 3.5" até parece plausível, então fica a impressão de que a IA preencheu um espaço em branco. (Quando eu estava criando a Gemini Library, também pedi para uma IA fazer isso, e ela acabou usando o Gemini-1.5 mais recente que ela conhecia e trouxe assim mesmo ;_;)

 
ashbyash 2025-12-23

Agradeço por analisar com tanto detalhe.
Ah, sim, parece mesmo que foi uma alucinação. Peço desculpas por não ter conseguido revisar com mais cuidado T_T

 
jk34011 2025-12-23

Acho que a sensação que eu tinha de cada IA é bem parecida com isso mesmo
Pelo visto, no fim das contas, a percepção da maioria das pessoas é tudo meio parecida
Tirando a Meta, usei todas

GPT > pelo preço, não tem nada demais. O desempenho é decente
Gemini > em comparação com as outras IAs, parece ter um pouco menos de especialização. Em compensação, a Google libera bastante coisa e é bom de usar pela praticidade
Claude > é a que eu mais gosto, mas... para usar o plano Pro, parece que os tokens são limitados demais T_T
Perplexity > só para busca, fora isso, será que precisa? Hoje em dia outras IAs também já têm conexão com a web, então quase não uso
Grok > para diversão

Essas são minhas impressões usando na ordem GPT > Claude > GPT+Cluade > Claude > Gemini. Perplexity e Grok eu só testei por cerca de um mês no meio do caminho...

 
ashbyash 2025-12-23

Mesmo assim, o Gemini 3 ficou bem bom. Como sai um modelo melhor todo mês, parece que até escolher já virou um trabalho mesmo.