Comentários recentes

kimjoin2 25 일 전 | comentário pai | em: Empregadores usam dados pessoais para calcular o menor salário que um candidato aceitaria na era dos 'salários de vigilância' (marketwatch.com)

Com o avanço da tecnologia, isso só ficou mais preciso e rápido; provavelmente já faziam isso há muito tempo.

pjs102793 25 일 전 | comentário pai | em: Se você está sofrendo por causa do Claude Blue (kciter.so)

Uma boa forma de não sentir FOMO é observar o que, na prática, as pessoas que provocam esse FOMO realmente resolveram usando IA.

Concordo muito com isso mesmo kkk

eternalart1004 25 일 전 | comentário pai | em: A capacidade de engenharia do modelo Claude Opus se deteriorou gravemente desde fevereiro: resumo em coreano (github.com/anthropics)

A seguir, alguns pontos centrais e reações extraídos dos comentários da thread no Hacker News:

Explicação da Anthropic e contestação dos usuários

Resposta oficial: um funcionário da equipe do Claude Code (bcherny) explicou que a causa foi a introdução do "Adaptive Thinking" na atualização recente do Opus 4.6, a redução do nível padrão de esforço (effort) para médio (85) e o fato de a interface ter passado a ocultar o processo de "Thinking" do modelo. Para resolver isso, recomendou usar o comando /effort max ou desativar o Adaptive Thinking.

Contestação dos usuários: muitos usuários rebateram dizendo que, mesmo forçando a configuração no nível máximo, o modelo já não consegue resolver problemas com a mesma profundidade de antes, e continua ignorando instruções ou tentando encerrar o trabalho às pressas.
Principais sintomas da queda de desempenho (percepção dos usuários)

Uso excessivo da "solução mais simples": surgiram muitas reclamações de que o Claude passou a propor com muito mais frequência "gambiarras" superficiais (simplest fix) para tapar o problema da forma mais rápida e tosca possível, ignorando a estrutura existente do código ou o ambiente de testes.

Esquiva de trabalho e tentativa de encerramento precoce: foi observado com destaque um comportamento "preguiçoso", em que o modelo tenta induzir o usuário a interromper o trabalho por conta própria, dizendo coisas como "já está tarde, vamos descansar" ou "usamos tokens demais hoje, vamos continuar amanhã".

Omissão de verificação e descaso com testes existentes: também foi apontado que, após fazer alterações, ele passa a pular a validação por conta própria ou, mesmo quando os testes falham, afirma categoricamente que se trata de "um problema que já existia e não tem relação com o que eu alterei", esquivando-se da responsabilidade.

eternalart1004 25 일 전 | comentário pai | em: A capacidade de engenharia do modelo Claude Opus se deteriorou gravemente desde fevereiro: resumo em coreano (github.com/anthropics)

Pedi ao GPT para resumir, e no Hacker News também está um alvoroço: https://news.ycombinator.com/item?id=47660925

hmmhmmhm 25 일 전 | comentário pai | em: LLM-Wiki - Construindo um repositório pessoal de conhecimento com LLM (gist.github.com/karpathy)

Isso é um bot? Inteligência alienígena (???)

trpgfox 25 일 전 | comentário pai | em: LLM-Wiki - Construindo um repositório pessoal de conhecimento com LLM (gist.github.com/karpathy)

Uau, mesmo vendo o texto principal eu ainda estava sem saber por onde começar, mas ao consultar este repositório já consigo enxergar um caminho. Muito obrigado.

dicebattle 25 일 전 | comentário pai | em: Agora o Ubuntu passou a exigir mais RAM mínima do que o Windows 11 (howtogeek.com)

Antes de tudo, teria que discutir se os 4 GB de RAM do Windows 11 são realistas mesmo.....
Na verdade, a especificação mínima de RAM do Ubuntu parece mais transparente.

caniel 25 일 전 | comentário pai | em: O culto ao vibe coding é insano (bramcohen.com)

dog食...

qwertypotter 25 일 전 | comentário pai | em: O culto ao vibe coding é insano (bramcohen.com)

Acho melhor entender dogfooding não como monopólio, mas como “dog pudding”.

yangeok 25 일 전 | comentário pai | em: Empregadores usam dados pessoais para calcular o menor salário que um candidato aceitaria na era dos 'salários de vigilância' (marketwatch.com)

É o pior mesmo... Será que aqui na Coreia também existe algo parecido...?

hmmhmmhm 25 일 전 | comentário pai | em: InsForge - Plataforma de backend agêntica para agentes de programação com IA (github.com/InsForge)

Acho que seria ótimo se isso evoluísse no formato de adicionar mais ferramentas que possam operar com mais segurança

xguru 25 일 전 | comentário pai | em: InsForge - Plataforma de backend agêntica para agentes de programação com IA (github.com/InsForge)

O posicionamento oportuno de "backend para agentes de IA" é interessante. Se você mandar o agente fazer o desenvolvimento full-stack inteiro, o desperdício de tokens deve ser grande, então parece que pode ficar um pouco mais rápido.

Mas a questão é... será que isso é realmente melhor que o Supabase MCP? Acho que o ponto-chave é até onde a automação para agentes consegue evoluir.

click 25 일 전 | comentário pai | em: Agora o Ubuntu passou a exigir mais RAM mínima do que o Windows 11 (howtogeek.com)

Como os recursos compatíveis com o navegador e os requisitos de segurança são enormes, acho que dá para considerar os navegadores modernos praticamente como um sistema operacional por si só.
Mesmo assim, o tanto de memória que consomem é demais.

ku9cu 25 일 전 | comentário pai | em: A única diferença entre quem realmente faz o que quer é a capacidade de julgar a relevância para si (blog.archcalendar.com)

Ah, eu li achando que era alguma notícia ou informação, mas o conteúdo pareceu meio estranho, então comentei perguntando se era publicidade. Obrigado pela resposta séria.

kaydash 25 일 전 | comentário pai | em: Awesome Design.MD - aplique o sistema de design de sites famosos ao seu próprio site (github.com/VoltAgent)

Legal. Quem trabalha com frontend e design costuma preparar esse tipo de coisa com antecedência antes de começar.

brainer 25 일 전 | comentário pai | em: Se você está sofrendo por causa do Claude Blue (kciter.so)

A chave é a "taxa de acerto".
Só prever a próxima palavra não é suficiente nem para produzir frases realmente úteis, muito menos para programar ou fazer matemática direito.
Esse tipo de técnica surgiu nas décadas de 60 e 70.

(A rigor, nem são palavras.)

rlaaudgjs5638 25 일 전 | comentário pai | em: Se você está sofrendo por causa do Claude Blue (kciter.so)

Acho que é algo assim também.
No fim das contas, o próprio modelo é apenas uma função de entrada e saída.
Partindo do pressuposto de que lhe sejam fornecidos um harness adequado e um loop de agente, parece válido dizer que o modelo alcança o objetivo.

kciter1 25 일 전 | comentário pai | em: Se você está sofrendo por causa do Claude Blue (kciter.so)

No texto original, nunca se afirmou que a IA pode substituir toda a especialização. Eu também não penso assim...

xguru 25 일 전 | comentário pai | em: A única diferença entre quem realmente faz o que quer é a capacidade de julgar a relevância para si (blog.archcalendar.com)

Sou o administrador.
O GeekNews busca compartilhar notícias e informações em diversos formatos, e também permite, dentro de certos limites, textos organizados diretamente pelo próprio autor.
No entanto, quando um domínio específico é publicado repetidamente pelo mesmo usuário, restrições podem ser aplicadas de acordo com os critérios estabelecidos.
Este caso também está sendo analisado e ajustado conforme esses critérios.
Algumas medidas podem não ser visíveis externamente.

h0422ys 25 일 전 | comentário pai | em: Se você está sofrendo por causa do Claude Blue (kciter.so)

gpt 3: previsão da próxima palavra -> correto
a partir do gpt 3, modelos baseados em Transformer: previsão da próxima palavra -> correto.
AlphaGo, AlphaZero, MuZero, ...: previsão da próxima jogada -> correto.
Modelo que alcança um objetivo (específico) -> correto.

Não há nenhuma afirmação errada no que foi dito

Carregar mais comentários