Comentários recentes

chcv0313 2026-03-02 | comentário pai | em: Modelos open source Qwen3.5-Medium da Alibaba oferecem desempenho de nível Sonnet 4.5 localmente (venturebeat.com)

Tenho uma RTX Pro 6000 (96GB, na prática 94GB), mas o modelo 122B não sobe no ollama. Acho que é por ser um modelo de visão, por causa da parte que inclui o vision transformer. Já o modelo GPT OSS 120b sobe com folga.

kensin2 2026-03-02 | comentário pai | em: Modelos open source Qwen3.5-Medium da Alibaba oferecem desempenho de nível Sonnet 4.5 localmente (venturebeat.com)

Só entrega desempenho se for executado em um servidor llama.cpp baseado em CUDA.

yangeok 2026-03-02 | comentário pai | em: 9 habilidades para sobreviver à era da engenharia agentic (flowkater.io)

Obrigado. Eu estava com medo porque surgiu o cowork, que faz até o papel de servidor só de deixar o PC ligado, mas isso me tranquiliza um pouco e consigo imaginar na minha cabeça como as coisas vão mudar daqui para frente rs

xguru 2026-03-02 | comentário pai | em: portless - ferramenta que substitui números de porta por URLs `.localhost` baseadas em nome (github.com/vercel-labs)

Como comentaram no X, aparentemente, se você estiver usando com Docker e informar à força o PID do daemon do Docker, isso também funciona.

https://github.com/vercel-labs/portless/issues/61

bytecakelake 2026-03-02 | comentário pai | em: portless - ferramenta que substitui números de porta por URLs `.localhost` baseadas em nome (github.com/vercel-labs)

Texto útil.

xguru 2026-03-02 | comentário pai | em: portless - ferramenta que substitui números de porta por URLs `.localhost` baseadas em nome (github.com/vercel-labs)

Agora podemos dar adeus ao erro EADDRINUSE?

Hoje em dia, como a gente desenvolve de tudo um pouco usando agentes e fica subindo um monte de coisas, elas acabam entrando em conflito entre si e vira uma bagunça rs

armila 2026-03-02 | comentário pai | em: Não gere automaticamente o AGENTS.md com `/init` — isso só aumenta os custos em 20% (addyosmani.com)

Mas o próprio modelo muda em questão de poucos meses,
então é preciso ajustar os agents de acordo com o modelo...
Não é o caso de a mudança do modelo ser mais rápida do que o tempo necessário para criar uma estrutura de agents adequada?
Antes mesmo de as pessoas se acostumarem com a ferramenta, a ferramenta já muda...

armila 2026-03-02 | comentário pai | em: A era em que código de teste se torna o novo moat (saewitz.com)

Sou totalmente não desenvolvedor... mas, pela diversão de mexer com IA, às vezes peço para ela programar um pouco, e ela ficava criando e guardando um monte de código de teste que eu nem tinha pedido... então era por isso.
Quando perguntei por que diabos isso era necessário, ela disse que precisava disso na hora de escrever o código e pediu para eu não apagar.

armila 2026-03-02 | comentário pai | em: Anthropic proíbe oficialmente o uso de autenticação de assinatura por terceiros (code.claude.com)

O Gemini também foi bloqueado. O Claude também foi bloqueado.
Mas se você pagar para usar a API, não há problema.

Não consigo entender a ideia de alguns estrangeiros de que não seria problemático autenticar em terceiros via OAuth e usar tudo barato com uma assinatura mais em conta.

aldegad 2026-03-01 | comentário pai | em: A era em que código de teste se torna o novo moat (saewitz.com)

Oh... acho que faz sentido.

holywork 2026-03-01 | comentário pai | em: Por que senhas criadas por LLM são perigosas: parecem ter 100 bits, mas na prática têm 27 bits (irregular.com)

As pessoas também não são boas em escolher algo aleatoriamente. Não deveria haver padrão, mas evitar padrões de propósito também pode ser visto como um padrão.

holywork 2026-03-01 | comentário pai | em: Magpie — a linguagem de programação projetada para que LLMs escrevam código perfeitamente na primeira tentativa (magpie-lang.com)

Então, isso parece ser apenas uma suposição de que, ao usar o Magpie, as novas tentativas seriam reduzidas nesse nível, já que não há resultados de medição do uso real de tokens para uma única tarefa.

holywork 2026-03-01 | comentário pai | em: Magpie — a linguagem de programação projetada para que LLMs escrevam código perfeitamente na primeira tentativa (magpie-lang.com)

A comparação de tempo de compilação está estranha. Por que comparar ms/token?

kayws426 2026-03-01 | comentário pai | em: OpenAI: “Anthropic não deve ser designada como risco de cadeia de suprimentos” (twitter.com/OpenAI)

Acho que seria necessário organizar uma linha do tempo sobre isso. Também há quem diga que a OpenAI estava em negociações contratuais, não é?

kentakang 2026-03-01 | comentário pai | em: OpenAI: “Anthropic não deve ser designada como risco de cadeia de suprimentos” (twitter.com/OpenAI)

Sempre acompanho muito bem, obrigado.

xguru 2026-03-01 | comentário pai | em: OpenAI: “Anthropic não deve ser designada como risco de cadeia de suprimentos” (twitter.com/OpenAI)

Parece que há casos assim porque ficou meio complicado para o X rastrear. Vamos tentar melhorar.

kentakang 2026-03-01 | comentário pai | em: OpenAI: “Anthropic não deve ser designada como risco de cadeia de suprimentos” (twitter.com/OpenAI)

Esse erro de resumo como "sem conteúdo" é novidade pra mim..

dbs0829 2026-03-01 | comentário pai | em: A era em que código de teste se torna o novo moat (saewitz.com)

A área em que eu trabalho também não é tão extrema assim, mas atuo com pesquisa e desenvolvimento na área de IA.
Além dos frameworks mais usados em geral, às vezes o ambiente-alvo onde o modelo é de fato implantado é diferente do ambiente em que ele foi treinado.
Também há casos em que certas operações não são suportadas, então é preciso criar operações customizadas para cada plataforma. Nesses casos, muitas vezes não dá para testar diretamente no ambiente em que foi desenvolvido.
Também há situações em que modelamos o próprio modelo diretamente; dá para escrever testes com determinados dados, mas, dependendo do dataset, os valores mudam de forma probabilística, e fenômenos como explosão de valores em certos momentos são difíceis de cobrir com código de teste.
Imagino que existam muitos ambientes em que testar é ainda mais difícil do que no meu caso.

bakkum 2026-03-01 | comentário pai | em: A era em que código de teste se torna o novo moat (saewitz.com)

A abordagem do SQLite é realmente impressionante. Manter privada uma suíte de testes 590 vezes maior que o código significa, no fim das contas, que "o verdadeiro valor do software está na especificação de comportamento".

Na prática, quando você tenta criar projetos hoje em dia com ferramentas de IA para programação, se tiver apenas o README + a documentação da API + os testes de um projeto existente, dá para replicar as funcionalidades principais com uma velocidade surpreendente. Falo isso por experiência, operando diretamente 7 projetos: paradoxalmente, quanto melhor testado é um projeto, mais fácil também é copiá-lo.

Mas há um ponto ignorado no caso Cloudflare vs Vercel: "copiar" e "operar" são problemas completamente diferentes. Para reproduzir os edge cases do Next.js, o ecossistema de plugins e até a dependência da comunidade, só o código de testes não basta. No fim, me parece que o verdadeiro moat é a combinação de código de testes + comunidade + know-how operacional.

kimjoin2 2026-03-01 | comentário pai | em: Não seremos divididos (notdivided.org)

Uau

Carregar mais comentários