-
O R1 1776 é um modelo open source em que a Perplexity AI fez fine-tuning do modelo de raciocínio DeepSeek-R1 para remover a censura do Partido Comunista Chinês.
-
Seu diferencial é manter as capacidades de matemática/raciocínio enquanto busca fornecer informações precisas e sem viés.
-
Atualmente, o modelo pode ser baixado no Hugging Face.
-
Foi usado um conjunto de avaliação com mais de 1.000 exemplos multilíngues para medir a capacidade de evitar censura (com avaliadores humanos + LLM judge em paralelo).
-
É capaz de responder sem evasivas sobre temas sensíveis, como política, sociedade e direitos humanos na China.
-
Mesmo após o processo de descensura, manteve desempenho equivalente ao modelo base em benchmarks como MATH/GPQA.
7 comentários
Será que até empresas coreanas não vão restringir o uso disso?
Muito bom ^o^
Será que treinaram exatamente da mesma forma, como aparece na documentação da DeepSeek?
Parece que o próprio modelo de raciocínio DeepSeek-R1 é open source.
Eles só divulgam o modelo resultante do treinamento, mas os dados originais não são abertos, então não é "open source". Embora de forma limitada, já é possível fazer treinamento adicional ou modificações sobre um modelo previamente treinado, e o que saiu desta vez é uma versão modificada desse tipo.
Por isso, eu prefiro mais a expressão
open weight.Sempre aparece alguém ainda melhor.