- Com a prolongada restrição de acesso ao Mythos e ao Fable 5 pelo governo dos EUA, a japonesa Sakana AI e a chinesa 360 miram a lacuna criada, respectivamente, com Fugu e Tulongfeng/Yitianzhen
- O Fugu, da Sakana AI, é apresentado como um modelo capaz de competir com o Fable 5 e o Mythos Preview, e foi projetado como um modelo para agentes que orquestra APIs de vários modelos
- O Tulongfeng, da chinesa 360, foca na descoberta automática de vulnerabilidades de software, enquanto o Yitianzhen foca em defesa cibernética e automação de resposta a incidentes
- A Sakana AI disse que o momento do lançamento foi coincidência, mas mira empresas e órgãos governamentais japoneses ao destacar “frontier capability sem risco de controle de exportação”
- A importância dos modelos dos EUA ainda permanece, mas as restrições de exportação se tornaram um gatilho para empresas de Tóquio e da China acelerarem alternativas regionais ajustadas a idiomas e contextos locais
A lacuna de modelos criada pelas restrições de exportação da Anthropic
- A empresa chinesa de cibersegurança 360 revelou na quarta-feira o Tulongfeng, segundo informou a Reuters
- A 360 afirmou que o Tulongfeng pode enfrentar o Mythos, modelo de IA da Anthropic especializado em cibersegurança
- O Mythos e sua versão mais restrita, o Fable 5, atualmente não estão disponíveis para usuários que não sejam norte-americanos devido a uma medida da Trump Administration
- No início da mesma semana, a Sakana AI, sediada em Tóquio, lançou o Fugu, que significa baiacu em japonês
- O Fugu foi descrito como estando “lado a lado com modelos líderes como o Fable 5 e o Mythos Preview da Anthropic”
- Ele foi projetado para agentes e pode orquestrar o acesso às APIs de outros modelos
- Os dois produtos surgiram duas semanas após a ordem do governo dos EUA relacionada à Anthropic
A estratégia do Fugu, da Sakana AI
- Um porta-voz da Sakana AI disse que o lançamento do Fugu coincidir com as restrições de exportação do Mythos/Fable foi “entirely coincidental”
- Ainda assim, o site da empresa promove “frontier capability sem risco de controle de exportação”
- A Sakana AI explicou que vinha desenvolvendo o Fugu desde o ano passado e que a pesquisa relacionada foi apresentada na ICLR nesta primavera
- A empresa foi cofundada em 2023 por David Ha e Llion Jones, ex-Google, e Ren Ito, ex-Mercari e Stability AI
- Ela cria modelos de IA generativa mais baratos, que funcionam bem mesmo com datasets pequenos e são otimizados para a língua japonesa e a cultura do Japão
- Os clientes-alvo do Fugu são empresas e órgãos governamentais japoneses que buscam reduzir sua exposição a controles de exportação cada vez mais rígidos
- A Sakana AI não vê isso como um movimento de afastamento permanente da Ásia em relação à IA dos EUA
- O porta-voz afirmou que “U.S. models remain important to Asia”
- Em um artigo no Project Syndicate, Ren Ito argumentou que a primeira prioridade do governo federal dos EUA deveria ser preservar o acesso de aliados próximos, e que IA não é uma tecnologia a ser estocada, mas desenvolvida em conjunto
- David Ha escreveu no X: “Orchestration Models are the next frontier, beyond bigger models”
- Ele avalia que depender de um único provedor para infraestrutura nacional é arriscado, e que os controles de exportação recentes tornaram esse risco impossível de ignorar
- Ao escrever “Access to top models can disappear overnight”, ele descreveu a inteligência coletiva como um hedge prático contra a concentração de poder
A IA de segurança da 360 e a lógica de ativo estratégico
- A 360 revelou duas ferramentas de segurança com IA, segundo reportagens da Reuters e da Quartz
- Tulongfeng: projetada para descobrir automaticamente vulnerabilidades de software
- Yitianzhen: criada para automatizar a defesa cibernética e a resposta a incidentes
- Zhou Hongyi, fundador da 360, vê a IA de detecção de vulnerabilidades como um ativo estratégico nacional, segundo a Reuters
- Ele apontou o risco de “one-way transparency”, em que apenas alguns atores têm acesso a capacidades avançadas de detecção de vulnerabilidades
- A 360 não respondeu ao pedido de comentário da TechCrunch
O crescimento da Anthropic e a ascensão das alternativas regionais
- A Anthropic já afirmou que sua receita anualizada ultrapassou US$ 47 bilhões em maio de 2026
- A empresa não divulgou quanto disso depende de clientes corporativos da Ásia
- Nas semanas após a entrada em vigor da ordem de exportação, a Sakana AI e a 360 entraram no espaço deixado pelas restrições de acesso aos modelos da Anthropic
- Mesmo que empresas dos EUA consigam recuperar a confiança após o fim das proibições, alternativas regionais treinadas para entender melhor idiomas e nuances locais já estão preenchendo a lacuna
1 comentários
Opiniões do Hacker News
Usei o modelo Fugu em trabalho real com C# e Unity via MCP e OpenCode, e uma revisão do sistema de temas mais um plano de mudança de cores consumiram de uma vez o limite de 5 horas do plano de US$ 20
Fiz upgrade para o plano de US$ 100 para ver o resultado da implementação, mas ele foi pior que o Opus e extremamente lento; consumiu também o novo limite de 5 horas e 35% do limite semanal, e ainda assim mal chegou perto do nível que o Opus entregava com muito menos tempo e custo
Tire suas próprias conclusões a partir disso, mas parece desperdício de dinheiro
Eles alegam que, depois de combinar os resultados de vários modelos de IA e usar um modelo proprietário próprio para gerar o resultado final, a qualidade fica melhor do que a de um único modelo de backend, mas tenho dúvidas se esse modelo próprio realmente existe e se é suficientemente capaz
Mesmo que a alegação esteja correta, parece algo fácil de implementar fazendo um cliente como o Claude Code gerar o resultado final com um modelo de desempenho parecido com o dos modelos em segundo plano, e o serviço deixa um cheiro suspeito
É isso que acontece se você paga o preço cheio da API e não consegue bancar um subsídio de 10 vezes
Como o próprio site tinha sido feito com o Opus, dá até para dizer que o resultado foi pior que o Opus
Tive a mesma experiência com modelos dos EUA, então talvez esses modelos asiáticos também sejam do tipo Mythos
Estou testando o MCP oficial e queria saber o que outras pessoas usam
Tive conflitos de pacote com o conhecido coplay
Ele deixou passar metade das coisas, e a outra metade era informação desatualizada ou não verificada
O Fugu Ultra parece, na prática, não ser um modelo, mas um sistema que faz roteamento entre vários modelos, algo mais próximo de um harness em nuvem, parecido com o Fusion da OpenRouter
“Em vez de um único modelo gigante, o Fugu é um sistema de orquestração multiagente treinado. É um modelo de linguagem treinado para rotear tarefas para um pool de modelos de base substituíveis e chamar recursivamente instâncias de si mesmo.” - https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/
[1] https://openrouter.ai/openrouter/fusion
A expressão “Mythos-like” está começando a irritar
Usuários comuns não têm como comparar, a não ser olhando benchmarks
Se não houver benchmarks confiáveis, a única semelhança deles com o Mythos é que recebem texto como entrada e produzem texto como saída
Quando sai um modelo novo, eu o testo diretamente na nossa grande base proprietária de software de sistemas e em produtos reais lançados, ou em projetos que talvez sejam lançados um dia
Fica bem claro qual modelo ajuda a trabalhar melhor ou mais rápido, e por enquanto tenho a sorte de contar com orçamento de tokens suficiente para usar o quanto for necessário
Não preciso de benchmarks, avaliações, marketing nem system cards; na web, leio só dicas, práticas de trabalho e notícias de lançamento
Compartilho experiências com colegas, mas todo o resto é ruído
Provavelmente o que faltou foi a cena em que o CEO alerta o mundo dizendo: “nosso modelo é perigoso demais para ser liberado na internet; alguém precisa impedi-lo antes que seja tarde demais”
A lista de investidores é impressionante: https://sakana.ai/company-info/?lang=en
Também apareceu nas manchetes do HN alguns dias atrás, com mais de 100 comentários: https://news.ycombinator.com/item?id=48624782
É difícil acreditar que, de repente, tenham lançado um modelo no nível do Mythos
DeepSeek, Z.ai e Alibaba/Qwen estão nisso há muito mais tempo e, nos últimos 18 meses, vêm lançando modelos com desempenho melhorado de forma constante
É difícil acreditar que empresas novas, sem lançamentos anteriores, tenham colocado de repente no mercado modelos no nível do Mythos
https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
Acho que, antes do fim do ano, veremos uma proibição de LLMs estrangeiros por “preocupações de segurança”
Isso não terá relação com o desempenho real
Mas a Anthropic estabeleceu uma linha de base para sistemas do tipo Mythos, e qualquer coisa que se encaixe nesse critério vagamente definido deve passar a ser tratada como perigosa para o público
Ninguém vai ficar esperando, e não dá para colocar de volta na garrafa o gênio que já saiu
Parece que vivo em outra realidade, em que o Claude é o único que diz coisas inteligentes neste momento
Quase tudo que pessoas escrevem parece alucinação e bobagem performática
Vendo de forma cínica, se o modelo for minimamente bom, fica difícil refutar a alegação de que ele é do nível do Mythos
Afinal, agora não dá mais para usar o Mythos
Pergunto por curiosidade, como alguém que não tinha acesso
Minha primeira impressão é: “sem benchmarks de terceiros, vá se catar”
Pessoalmente, nunca ouvi falar de nenhuma dessas duas empresas
É para simplesmente acreditar que elas estão no mesmo nível dos melhores modelos do mercado?
A Sakana descreve seu modelo como um “Orchestration Model”; então isso quer dizer que, na prática, ele é vários modelos costurados juntos?
Pergunto porque realmente não sei
Claro que não deve ser algo trivial, mas será que construir em cima de técnicas existentes conhecidas exige conhecimento secreto de nível mundial?
Tenho a impressão de que ainda há muitos frutos baixos a explorar, e que tempo e recursos são os fatores limitantes
Parece que eles alegam ter uma estrutura que aplica uma cola dinamicamente, na hora, mais do que uma nova mistura de modelos
A reação da época também pode ser vista aqui: https://news.ycombinator.com/item?id=48624782 (6 dias atrás, 244 pontos, 133 comentários)
Você disse isso na época também?
É importante, sim, mas a atitude está errada
Sou uma pessoa simples: se não houver benchmark em https://arena.ai/leaderboard, considero 100% golpe
Como muitos comentários aqui, também testei o Fugu e alguns outros modelos, e eram modelos bem caros
US$ 20 não foram suficientes para concluir todo o workflow, enquanto no Opus foi possível
Claro que, mesmo no Opus, talvez seja preciso refinar mais o prompt desde o início se você quiser os melhores resultados, mas essa tem sido minha experiência até agora
O próximo teste será com sistemas agentivos, para ver o desempenho