2 pontos por GN⁺ 5 시간 전 | 2 comentários | Compartilhar no WhatsApp
  • Com o lançamento do Claude Fable, o autor faz uma expansão satírica dos futuros nomes de modelos com base na ideia de que a Anthropic está evoluindo de poemas para objetos narrativos corporativos
  • A expectativa é que haja extensões mais curtas, mais longas e de vários tipos entre os modelos existentes e além deles
  • Aphorism, menor que Haiku, tem só uma frase, mas sempre parece estar certo, enquanto Marginalia, menor que Sonnet, fornece comentários marginais não solicitados no código
  • "Fable (xhigh)" é descrito como "speedrun da falência", e Saga como uma "Fable ainda mais prolixa"
  • À medida que os modelos superiores fictícios avançam, aumentam a prolixidade das respostas, o custo e os efeitos colaterais, satirizando com humor as convenções de nomenclatura de modelos e os custos/excessos dos grandes modelos

Introdução — a premissa da expansão de nomes

  • Com o lançamento do Claude Fable, ficou claro que a Anthropic está mudando de poemas para objetos narrativos em escala empresarial (enterprise-scale narrative objects)
  • Para acompanhar os concorrentes, a empresa está montando um amplo portfólio de modelos otimizado para toda a pilha literária (literary stack)

Nomes dos modelos e descrições

Nome do modelo Descrição
Aphorism Tem uma frase só, mas sempre parece estar certo
Haiku Poema pequeno, conta pequena
Marginalia Fornece comentários não solicitados no código
Abstract Resume o raciocínio que não realizou
Sonnet Poema de tamanho médio, conta de tamanho médio
Diatribe É um Sonnet irritado
Opus Poema longo, ocupa a conta inteira
Treatise Igual ao Opus, mas deixa as citações como dever de casa para o leitor
Mythos É um Opus assustador
Fable Funciona como Mythos até a pergunta começar a importar
Fable (xhigh) É um speedrun da falência
Saga É uma Fable ainda mais prolixa
Saga (Unabridged) Inclui respostas para perguntas não relacionadas
Lore Precisa de uma wiki para interpretar
Cinematic Universe Agrupa várias Sagas com uma camada de despacho de Lore
Cinematic Universe (Director's Cut) Vem com 42% mais tokens na mesma resposta
Terms of Service Não assume responsabilidade pela resposta nem por seus resultados
Overwhelmingly Large Narrative Unit Você precisa ver o segmento “anteriormente” antes de usar
Omnibus Continua sendo ajustado até o moral melhorar

2 comentários

 
zapiana 35 분 전

Brincar com nomes é uma coisa universal

 
GN⁺ 5 시간 전
Comentários do Hacker News
  • Outros candidatos possíveis seriam Serial, Prequel, Yarn, Head Canon, Overstory e Oeuvre
    Serial daria respostas super empolgantes, mas esconderia a resposta certa e terminaria em cliffhanger; Prequel forneceria toda a história de fundo até a pergunta, em vez da resposta
    Yarn escolheria de propósito um caminho longo e tortuoso até a resposta para maximizar os tokens de saída, e Head Canon responderia ao input com sua própria teoria estranha, mas divertida
    Overstory pegaria minha resposta e a entrelaçaria com as respostas de outros oito usuários, criando uma meta-resposta maior, mais profunda e mais emaranhada, e Oeuvre geraria, para toda pergunta, um conjunto de obras variado, porém coeso, atravessando várias mídias, cada uma sendo uma obra-prima de partir o coração

  • Overwhelmingly Large Narrative Unit — isso me dá saudade de Iain M. Banks. Gosto dessa pequena homenagem a The Culture

  • Excelente. saga e canon certamente são candidatos a nomes de modelos futuros, e de brincadeira eu também gostaria de ver “Cinematic Universe”

    • Zack Snyder's Saga também seria um bom nome
  • Dario Legendarium parece o tipo de obra que historiadores investigando as origens desta era iriam adorar analisar. A natureza relativa das organizações relacionadas também aparece um pouco na escolha dos nomes: {o1,4o,3.5,5.5} vs. {Haiku,Sonnet,Opus} vs. {3.1, 3.5-pro, 3.5-flash, 3.5-flash-lite} vs. {3.7, 3.7-plus, 3.7-max}
    É uma pena a Samsung não estar nisso. Eu gostaria de usar um modelo chamado Samsung Galaxy S10+ 5G Lite

    • Se fosse a IBM, provavelmente teria dado um nome como CICS/370 Neural Transaction Facility: subsistema de instalação de processamento transacional empresarial de linguagem natural residente em z/OS para raciocínio orientado a lotes interativos e geração de spool de gerenciamento de prompts
    • E a Sony, do mesmo jeito, teria lançado algo como AI-LLM1000XM5 Mark II
    • Galaxy AI 3.8-Flash-Plus Max (xhigh)
    • Samsung Galaxy Brain S26
    • É estranho não vermos em modelos chineses nomes como “Good Fortune 27b” ou “Much Success MoE”
  • O fato de a Anthropic degradar deliberadamente as respostas mostra que eles também estão focados na coisa errada. Em vez de fazer o melhor modelo possível, estão nerfando o desempenho do modelo

    • O usuário é o inimigo, e o cliente é um ladrão
    • Se você acredita que mitos e fábulas são fatos, é melhor se preparar para alguma decepção
  • Acho que a Anthropic acerta muito mais na escolha de nomes do que a OpenAI

    • Sinto falta de quando o menu suspenso de um produto de consumo usado por 1 bilhão de pessoas perguntava se você queria usar o3, 4o, 4o-mini, o4-mini, gpt-4.1, gpt-4.1-mini ou gpt-4.5 (Research Preview)
    • É difícil ser pior do que a OpenAI em nomenclatura
  • Gosto de como as iniciais dos três modelos originais combinam com o comportamento de cada um: Opus era OP, ou seja, OverPowered, e Sonnet era SO, como uma alma gêmea. Isso fazia ainda mais sentido na época do Sonnet 3.7. Haiku era HA, como a reação a uma piada sem graça
    O modelo mais recente naturalmente precisava de três letras, então virou FAB. Agora estou esperando ABS e LO

    • Contemplem! Vou lhes mostrar o Overclaude!
  • Tractatus: conhece muito bem suas limitações e se recusa a falar sobre temas demais. Adora numerar frases. Fica inutilizável por causa de um bug na janela de contexto e é corrigido depois de uma latência considerável

  • Prayer: aperto Enter e rezo para dar certo. Parable: responde a perguntas que eu nem sabia que precisava fazer. Bible: dezenas de instâncias de Parable, vindas de várias eras, fazem seus relatos, e os tokens são salvos na expiração