1 pontos por GN⁺ 4 시간 전 | 4 comentários | Compartilhar no WhatsApp
  • A Anthropic atualizou as proteções de cibersegurança do Fable 5 após conversas com o governo dos EUA, e a maioria das tarefas de programação pode continuar sendo usada normalmente
  • No curto prazo, as novas proteções podem sinalizar solicitações inofensivas com mais frequência do que as proteções anteriores do Fable, e a Anthropic pretende ajustá-las ao longo das próximas semanas
  • Quando uma solicitação for sinalizada, o usuário verá uma notificação, e a resposta correspondente será fornecida pelo Opus 4.8
  • Os classificadores de biologia e química permanecem iguais aos do lançamento inicial, então até perguntas básicas próximas à biologia podem levar a um fallback para o Opus 4.8
  • Planos pagos com uso incluído podem usar o Fable 5 até 50% do limite semanal de uso até 7 de julho; depois disso, será necessário usar outros modelos ou créditos de uso (usage credits)

Retomada do acesso ao Fable 5 e ajuste das proteções

  • A Anthropic atualizou as proteções de cibersegurança após conversas com o governo dos EUA
  • A maioria das tarefas de programação não será afetada por esta mudança
  • No curto prazo, as novas proteções podem sinalizar um pouco mais solicitações inofensivas do que as proteções anteriores do Fable
    • A Anthropic pretende melhorar os classificadores nas próximas semanas
    • Solicitações sinalizadas serão claramente informadas ao usuário
    • A resposta correspondente será fornecida pelo Opus 4.8

Limitações atuais dos classificadores de biologia e química

  • Os classificadores de biologia e química são os mesmos do lançamento inicial
    • Atualmente, os classificadores atuam de forma mais ampla do que o desejado
    • Mesmo perguntas básicas próximas à biologia podem acionar um fallback para o Opus 4.8
    • Melhorias nesses classificadores serão aplicadas em breve

Condições de uso em planos pagos e canais de feedback

  • Todos os planos pagos com uso incluído terão acesso ao Fable 5 até 7 de julho
  • O Fable 5 pode ser usado até no máximo 50% do limite semanal de uso
    • Depois disso, é possível alternar para outros modelos para o uso restante
    • Também é possível continuar usando o Fable com créditos de uso
  • Guia de acesso promocional: Claude Fable 5 promotional access
  • Se uma solicitação for sinalizada incorretamente no Claude Code, é possível reportar com /feedback
  • No Claude.ai e no Cowork, é possível compartilhar feedback pelo botão de thumbs
    • Esse feedback será usado para ajustar os classificadores e reduzir falsos positivos
  • Post do blog sobre o Fable 5: Claude Fable 5 Mythos 5

4 comentários

 
seoseonyu 1 시간 전

7 de julho... acho que vou simplesmente esperar firme pelo 5.6 Sol

 
treestae 11 분 전

Também estou aguardando o Sol.
Galaxy e Cosmos também devem sair...

 
GN⁺ 4 시간 전
Opiniões no Hacker News
  • Acho que os pesos do Fable/Mythos, com ou sem má intenção, podem vazar para uma força adversária ou parar em algum torrent por causa de um único erro
    É bem provável que os pesos do Fable sejam distribuídos por centenas de data centers, e que milhares de pessoas tenham acesso direto ou indireto a parte deles ou ao conjunto completo. Se fosse mesmo um modelo de nível fim do mundo, não acho que seria tratado assim; no caso do Mythos, dá para acreditar que ele rode apenas dentro de data centers em conformidade com regulamentações governamentais. Mas, se for um modelo tão valioso assim, hackers apoiados por Estados vão dedicar esforços muito maiores para extraí-lo. Seja qual for a situação real, é difícil vê-lo como tão revolucionário quanto a Anthropic diz

    • Desde o GPT-2 ouvimos que os modelos são perigosos demais
      A certa altura, deixa de ser só querer que o menino que gritava “lobo” pare de gritar e passa a ser quase querer que o lobo o coma
    • Talvez o melhor no longo prazo seja o Mythos vazar de algum jeito e ficar disponível para toda a humanidade usar em self-hosting
    • Pode ser mais complexo do que parece. Pelo que sei, a Nvidia oferece TEE nas linhas de produtos caras, então é bem possível que os pesos sejam usados em estado criptografado
      Isso não quer dizer que um vazamento seja impossível, mas vira uma tarefa consideravelmente grande. Pode ser por isso que a Anthropic não esteja tão preocupada com o lado do Elon servindo o modelo. O fluxo seria algo como fazer um handshake com o TEE da Nvidia, injetar a chave e depois enviar os pesos criptografados. Também é possível que haja um temporizador que expira sem um sinal de heartbeat, para impedir que equipamentos da Nvidia continuem rodando pesos roubados
    • Não parece que a Anthropic esteja de fato afirmando que ele é de nível fim do mundo. Parece mais algo potencialmente perigoso por ter capacidades ofensivas de cibersegurança
    • Acho que é tudo marketing. O governo tem se mostrado repetidamente como se fossem insiders operando com informação privilegiada
  • Coloquei o manuscrito de um livro sobre consciência humana e fui bloqueado. Este modelo é ridiculamente ruim, e a Anthropic o capou a ponto de parecer malicioso
    Não pretendo pagar por algo que é, na prática, inútil

    • Hoje pedi ao Sonnet para usar o MCP do navegador e inserir o nome de usuário e a senha de um projeto em que estou trabalhando, e ele respondeu que não podia fazer isso porque violaria o protocolo de segurança
      Antes funcionava bem. Eu gosto do Claude e continuei usando mesmo com gente dizendo que o Codex é melhor, mas isso está chegando mesmo ao meu limite. É completamente absurdo pagar mais de US$ 200 por mês, ainda promovê-lo quando faço trabalhos por contrato, e nem sequer receber um serviço que tenha um mínimo de respeito básico. Daqui a 6 meses, acho que só vão permitir falar de receitas de Easy-Bake e, se alguém se queimar em uma lâmpada, vão rebaixar ainda mais para falar de campos de flores silvestres
    • Mesmo problema. Um livro que estou escrevendo sobre linguagem e termodinâmica também foi bloqueado. Parece que o classificador é simplesmente uma regex
    • É um momento particularmente estranho. Isso porque o ponto forte anunciado deste modelo era seu escopo longo de trabalho, persistência e capacidade de levar adiante grandes tarefas de forma autônoma
      Mas, se no meio do caminho ele pode voltar para o Opus 4.8 ou ser interrompido a qualquer momento, fica difícil depender dessa capacidade. Ao rodar esses processos longos, ele segue de forma bastante sólida, até que algo é classificado como falha e o “trabalho de longo prazo” morre, exigindo que uma pessoa o recupere ou force um rollback e tente de novo
    • Fui bloqueado já no primeiro pedido. Pedi para ele ler anotações que minha parceira fez sobre bugs vistos no frontend do site, ajustes de copy do produto, bugs de CSS e problemas de redação, e ele bloqueou na hora. Inútil
    • Desta vez parece que tiveram que fazer isso. Basta ver o post de ontem sobre aumento da margem de segurança do classificador
  • Enquanto o Fable esteve fora, senti que só o Opus já era suficiente. Agora ele voltou, mas não senti falta nenhuma

  • Vou usar hoje à noite, mas sem muita vontade. É que depois de 7 de julho não quero passar de uma situação em que eu obtinha muito mais valor com a assinatura para, de repente, pagar preço de API
    Talvez isso seja a tal “economia dos tokens” que vai atingir todo mundo este ano. De qualquer forma, pretendo extrair o máximo enquanto der e depois voltar aos parceiros confiáveis, Opus 4.6 e Sonnet 4.6. Não sei até quando eles continuarão disponíveis

    • Usando assim, você não consome a cota imediatamente e acaba tendo que pagar preço de API de qualquer jeito?
    • Tenho quase certeza de que depois de 7 de julho vai aparecer o plano Max 350
    • Quando a queda de desempenho começou, fixei o modelo padrão no Opus 4.6. Os resultados são muito melhores do que no 4.7 ou superior
      Acho que é isso que chamam de degradação de serviço
  • A perda de confiança em modelos baseados nos EUA parece difícil de recuperar
    A confiança foi muito abalada pela mensagem apocalíptica exagerada da Anthropic e por uma administração que foi influenciada por ela, e isso ainda desencadeou uma espécie de corrida armamentista

    • Por outro lado, “nosso produto era tão bom que chegou a ser proibido” é a melhor propaganda possível. A OpenAI provavelmente faria de tudo para conseguir uma situação dessas
      Não estou com vontade de testar o Sonnet 5 agora, mas tenho bastante interesse no Fable
    • Espero que a OpenAI e as empresas chinesas tragam a concorrência necessária
    • Se você criou um produto baseado em IA, deve diversificar fornecedores ou criar uma camada de abstração para não ficar preso a um modelo. Tem que ser possível plugar qualquer modelo
      Se você é um engenheiro de software como usuário final, pode usar outros modelos, como Gemini ou ChatGPT. Isso é mais produtivo do que reclamar de uma confiança que nunca existiu para começo de conversa. A Anthropic é apenas uma empresa que presta um serviço e, com ou sem proibição de exportação, pode deixar de fornecê-lo a qualquer momento. O mesmo vale para qualquer empresa de IA de qualquer país. Se quiser um LLM de fato confiável, precisa rodar você mesmo um modelo de pesos abertos
    • Por outro lado, o que teria acontecido se a Anthropic não tivesse se comunicado como fez e o Fable tivesse sido usado para hackear o Pentágono? O Dario teria sido pendurado em uma árvore
    • É bem provável que a grande maioria dos usuários nem soubesse que isso aconteceu. Nós aqui no HN às vezes esquecemos que vivemos dentro de uma bolha. A empresa vai apresentar isso como sucesso e seguir em frente
  • Em alguns projetos, pode ser mais útil fazer o modelo gerar o plano e o loop de testes/verificação de formato, em vez de gerar o código inteiro.
    Esses artefatos consomem muito menos tokens do que o projeto completo, e os loops seguintes podem rodar em modelos mais antigos.

    • Fiz isso hoje em um projeto que envolvia 2 repositórios. Eu já tinha definido o design de um dos principais casos de uso, e a tarefa era fazer o Claude criar um superconjunto que não fosse muito diferente.
      Depois de criar o plano, restava só cerca de 10% do contexto de 5 horas do Fable 5, e isso foi tudo que consegui fazer hoje. Claro, é difícil generalizar.
    • Exato. Estou usando o Opus para escrever o plano e disparando vários subagentes Sonnet para implementar. É mais barato e mais rápido.
    • Esse é exatamente o objetivo do Devin Fusion, e os resultados até agora parecem bem bons.
      https://cognition.com/blog/devin-fusion
    • Fico curioso para saber se alguém já experimentou processamento em lote. Segundo https://claude.com/pricing#api, usar Batch Processing reduz o preço em 50%.
      Queria saber se seria possível fazer ferramentas de execução como OpenCode/Pi aproveitarem isso para tarefas como planejamento.
    • Essa é a ideia do opusplan.
      https://code.claude.com/docs/en/model-config#opusplan-model-...
  • Uso o Claude Pro só de vez em quando e a mensagem está confusa. Talvez eu esteja deixando passar algo óbvio.
    “Até 7 de julho, você pode usar até 50% do limite semanal de uso do seu plano no Fable 5” quer dizer que o acesso ao Fable na minha assinatura é uma promoção por tempo limitado? Se eu assino, por que não posso simplesmente usar o modelo? No futuro, a assinatura vai oferecer só modelos antigos, e os modelos novos vão exigir pagamento adicional?

    • Sim.
      Está escrito: “Depois de 7 de julho de 2026, o Claude Fable 5 não será mais incluído no limite semanal de uso do seu plano. O Claude Fable 5 continuará disponível por meio de créditos de uso, e você poderá pagar pelo uso além do que está incluído no seu plano”. Não sei o que isso significa no longo prazo. Se modelos mais fortes surgirem ou a capacidade computacional da Anthropic aumentar, o Fable 5 talvez volte a ser incluído na assinatura; ou talvez seja o começo do fim das assinaturas. Com outros fornecedores lançando modelos melhores o tempo todo, não faz muito sentido pagar uma assinatura presa ao Opus 4.8.
    • Nem demorou muito.
      Dynamic workflow “Multi-lens review of docs/membership-and-friends-model.md with adversarial verification” completed · 25m 59s
      Atingi o limite do Fable 5.
      Apareceu que usei todo o uso de Fable 5 incluído nesta semana e que, para continuar usando o Fable 5, preciso de créditos de uso.
    • No lançamento inicial, disseram que seria possível usar o Fable 5 como parte da assinatura por um período limitado, e que depois seriam necessários créditos de uso.
      Na época, também disseram que queriam eventualmente torná-lo parte dos planos de assinatura novamente. Neste retorno, estenderam o período de uso até 7 de julho, mas limitaram a 50% da cota de uso, e não repetiram a fala de que gostariam de incluí-lo permanentemente nos planos de assinatura algum dia. Ainda há esperança, mas definitivamente não parece que está indo em uma boa direção.
    • O acesso a modelos novos deve continuar disponível também nas assinaturas. Você deve ter acesso ao Sonnet 5, que é um modelo novo. Só que modelos no nível Mythos são exclusivos da API.
      Pelo menos é assim agora; com essas empresas, nunca se sabe quando isso muda.
    • O Fable custa mais caro para rodar, e parece que eles ainda não definiram a estratégia de go-to-market.
      Devem querer observar quanto as pessoas realmente usam para decidir se vale continuar subsidiando nos planos Max/Pro ou se criam um nível adicional acima deles.
  • “Quando o Claude Fable 5 recusa uma solicitação, a Messages API retorna stop_reason: "refusal" em uma resposta HTTP 200 bem-sucedida, em vez de um erro.”
    É exatamente isso que me vem à cabeça quando penso em “sucesso”.

    • Perderam a chance de usar o código de status HTTP 451.
      https://en.wikipedia.org/wiki/HTTP_451
    • Fico me perguntando se a recusa pode acontecer no meio do streaming, depois que o código de status e os headers já foram recebidos. Não cheguei a olhar a API.
  • No terminal do Claude Code aparece que “até 7 de julho, você pode usar até 50% do limite semanal de uso do seu plano no Fable 5; ao atingir o limite, pode continuar usando com créditos de uso; e o Fable 5 consome a cota mais rápido que o Opus 4.8”.
    Acho que essa regra dos 50% não existia antes?

    • O Opus 4.8 é lento demais em comparação com o GPT 5.5, então, mesmo sendo um pouco melhor, não faz diferença para tarefas comuns de engenharia.
      O GPT 5.6 deve sair em breve, e o plano Codex de US$ 249/mês tem sido muito generoso até agora. Para pagar o que imagino ser o novo custo do Fable 5, ele teria que ser muito melhor do que me lembro de ter sido quando usei antes.
    • Eles também não zeraram o uso. Boa sorte.
    • Depois de 7 de julho, só resta o modelo baseado em uso. Não será mais incluído em nenhum nível de assinatura.
      Às vezes acho que seria melhor nem terem colocado de volta. Se você usar em rajadas como antes, o custo efetivo fica 10 a 20 vezes mais caro do que o preço da assinatura 20x.
    • Antes não era assim.
  • Gostaria que reconsiderassem colocar o acesso ao Fable de volta nos planos de assinatura. Pelo menos ele deveria estar incluído no plano 20x.
    Quando aquele período inicial de cerca de 14 dias foi anunciado, entendi que essa era a intenção original e que eles estavam trabalhando para mantê-lo nos planos de assinatura. Mas agora nem dizem se isso ainda está em discussão.

    • O mercado vai acabar forçando a reinclusão. Por enquanto, talvez haja restrições de capacidade, ou eles ainda estejam avaliando se precisam de outra faixa de preço para encaixá-lo na assinatura.
      O cenário que eles provavelmente não querem é alguém programando 4 dias por semana e esgotando o limite toda semana.
    • Ele só fica incluído até a próxima semana.
      “O Fable 5 está incluído até 7 de julho em até 50% do limite semanal de uso; depois disso, poderá ser usado com créditos de uso.”
 
runai 2 시간 전

Quem vai conseguir usar isso com créditos? Por mês, pode acabar saindo bem mais de alguns milhões de wons, não? Eu preferiria usar a próxima versão do GPT, a 5.6.