- A revolução da IA open source ainda não aconteceu
- Claro, existem modelos de pesos abertos impressionantes, e somos gratos a quem publica os pesos, mas se não é possível reproduzir o modelo, então ele não é verdadeiramente open source
- Imagine no Linux se apenas o binário fosse publicado, sem a base de código. Ou imagine que apenas a base de código fosse publicada, sem o compilador usado para gerar o binário. Essa é exatamente a situação de hoje
- Há várias desvantagens nisso
- Não é possível voltar a contribuir para o projeto
- O projeto não pode se beneficiar do ciclo de feedback do OSS
- É difícil verificar se não há backdoors no modelo (por exemplo, agentes adormecidos)
- Não é possível verificar se os filtros de dados e conteúdo estão alinhados com as políticas da empresa
- Para atualizar o modelo, é preciso depender da empresa
- Um projeto de LLM verdadeiramente open source, em que tudo é público, da base de código ao pipeline de dados, pode gerar muito valor e criatividade, além de melhorar a segurança
- Mas reproduzir os pesos não é algo tão simples quanto compilar código, então não é trivial. É preciso ter capacidade computacional e know-how.
- E revisar contribuições é difícil, porque não dá para saber como elas afetam o desempenho até executar o próximo treinamento
- Mesmo assim, pessoas ou grupos com motivação suficiente podem entender esses detalhes, e embora isso possa parecer bem diferente do OSS tradicional, esses novos desafios são o que torna esse espaço interessante
3 comentários
Verdade,
Portanto, open source agora está virando um mito ou uma lenda urbana. Na prática, dá para dizer que quase não existem modelos open source nesses sites no sentido verdadeiro do termo, isto é, perfeitamente reprodutíveis. A maioria é só jogada de marketing.
Eu entendo, mas... hoje em dia os modelos que estão saindo exigem um poder computacional e um tempo de treinamento difíceis de reproduzir para uma pessoa comum, então não sei muito bem como isso ficaria.
Ainda assim, no caso da divulgação do conjunto de dados, também concordo um pouco.
Comentários do Hacker News