22 pontos por yeorinhieut 2025-02-19 | 7 comentários | Compartilhar no WhatsApp
  • O R1 1776 é um modelo open source em que a Perplexity AI fez fine-tuning do modelo de raciocínio DeepSeek-R1 para remover a censura do Partido Comunista Chinês.

  • Seu diferencial é manter as capacidades de matemática/raciocínio enquanto busca fornecer informações precisas e sem viés.

  • Atualmente, o modelo pode ser baixado no Hugging Face.

  • Foi usado um conjunto de avaliação com mais de 1.000 exemplos multilíngues para medir a capacidade de evitar censura (com avaliadores humanos + LLM judge em paralelo).

  • É capaz de responder sem evasivas sobre temas sensíveis, como política, sociedade e direitos humanos na China.

  • Mesmo após o processo de descensura, manteve desempenho equivalente ao modelo base em benchmarks como MATH/GPQA.

7 comentários

 
wyswyg 2025-02-19

Será que até empresas coreanas não vão restringir o uso disso?

 
carnoxen 2025-02-19

Muito bom ^o^

 
kandk 2025-02-19

Será que treinaram exatamente da mesma forma, como aparece na documentação da DeepSeek?

 
kandk 2025-02-19

Parece que o próprio modelo de raciocínio DeepSeek-R1 é open source.

 
bootno2316 2025-02-20

Eles só divulgam o modelo resultante do treinamento, mas os dados originais não são abertos, então não é "open source". Embora de forma limitada, já é possível fazer treinamento adicional ou modificações sobre um modelo previamente treinado, e o que saiu desta vez é uma versão modificada desse tipo.

 
superego 2025-02-21

Por isso, eu prefiro mais a expressão open weight.

 
dooboo 2025-02-19

Sempre aparece alguém ainda melhor.