- Mark Zuckerberg, CEO do Facebook, afirma que o modelo de linguagem de grande porte Llama 3, da Meta, é open source, mas na prática não é
- Segundo a definição de open source da Open Source Initiative (OSI), a licença do Llama 3 não atende aos requisitos de open source em vários pontos
- A Meta não é a única empresa a recorrer a esse tipo de engano. Isso é chamado de "openwashing"
- Openwashing é a prática enganosa de apresentar produtos ou serviços que não são realmente abertos como se fossem "abertos"
- O termo foi criado em 2009 pela pesquisadora de políticas de internet Michelle Thorne, inspirada em "greenwashing"
- O openwashing é generalizado no setor de IA. Entre 45 modelos investigados por pesquisadores da Radboud University, os modelos de grandes empresas como Google, Meta e Microsoft não eram realmente open source
Por que as empresas fazem openwashing
- No passado, as empresas evitavam o open source, mas hoje a percepção sobre ele se tornou positiva
- Em 2001, Steve Ballmer declarou que "Linux é um câncer", argumentando que usar software open source obrigaria a transformar todo o restante do software em open source também
- As empresas exploram a imagem positiva do open source sem de fato se comprometer com ele
- Isso ajuda a melhorar a imagem pública e a atrair consumidores que valorizam transparência e abertura
- Algumas empresas usam o openwashing para proteger seus modelos e práticas do escrutínio científico e regulatório, enquanto aproveitam os benefícios do rótulo "aberto"
- Como a Lei de IA da UE concede isenções especiais a modelos "open source", isso se torna um forte incentivo ao openwashing
Falta uma definição clara para IA open source
- A UE ainda não conseguiu definir claramente o que é IA open source, e na verdade ninguém conseguiu fazer isso até agora
- A OSI deve publicar sua definição de IA open source nos próximos dias
- As licenças atuais de openwashing, exceto na visão de seus próprios criadores, entram em conflito com a definição de todos os demais
- Mas nem todas as grandes empresas de IA estão mentindo sobre open source
- Por exemplo, o LLM Granite 3.0, da IBM, é de fato disponibilizado como open source sob a licença Apache 2
- Mesmo que a OSI não seja um governo nem um órgão regulador, por que ainda assim é importante usar corretamente o termo open source?
- A OSI é apenas uma organização sem fins lucrativos que criou diretrizes úteis
- Dan Lorenc, CEO da Chainguard, disse recentemente em uma palestra principal na conferência SOSS, em Atlanta:
- Ninguém pode obrigar os outros a usar a definição da OSI, mas muitas pessoas, especialmente advogados, confiam nela
- Elas confiam no trabalho da OSI e entendem a proteção que as empresas recebem ao usar licenças que atendem aos critérios de open source
- É por isso que essa definição aparece em contratos de compras de grandes empresas no mundo todo
Open source não é apenas uma questão jurídica ou de negócios
- O open source dá aos desenvolvedores liberdade de atuação
- Sem open source, perderíamos o benefício de poder usar código livremente sem precisar conhecer ou se preocupar com todos os detalhes das licenças
- Se fosse necessário verificar a licença de cada trecho de código, os desenvolvedores teriam de passar por revisão jurídica sempre que quisessem usar uma nova biblioteca
- As empresas passariam a ter medo de publicar qualquer coisa na internet se não estivesse claro quais responsabilidades enfrentariam ao divulgar código-fonte
- Lorenc enfatiza que isso não é um problema apenas das grandes empresas, mas um problema compartilhado
- Todos que usam open source seriam afetados
- Projetos inteiros poderiam parar de funcionar, falhas de segurança deixariam de ser corrigidas e a manutenção ficaria muito mais difícil
- É preciso agir em conjunto para preservar e defender a definição de open source. Caso contrário, os advogados voltarão a dominar a situação
- Muitos advogados de propriedade intelectual não querem esse tipo de dor de cabeça
- Licenças de open source de verdade tornam a vida de empresas, programadores e advogados mais fácil
- Introduzir cláusulas como "aberto, exceto para quem pode competir conosco" ou "aberto, exceto para quem pode implantar o código na nuvem" é pedir problema
Openwashing prejudica todo mundo
- No fim, o openwashing vai contaminar o trabalho jurídico, empresarial e de desenvolvimento de todos
- Ironicamente, até as empresas de visão curta que hoje apoiam essa abordagem acabarão sendo prejudicadas
- Isso porque quase todo o trabalho delas, especialmente na área de IA, é baseado em open source
Opinião do GN⁺
- A prática de openwashing, que enfraquece a definição de open source, pode ter efeitos negativos não só na área de IA, mas em toda a indústria de software. Ela restringe a atuação dos desenvolvedores e aumenta os riscos jurídicos para as empresas
- O fato de as empresas quererem apenas aproveitar a imagem positiva do open source é uma postura míope. No longo prazo, isso pode acabar prejudicando as próprias empresas
- Para o avanço da tecnologia de IA, colaboração e compartilhamento baseados no espírito do open source são essenciais. As empresas devem liderar a criação de uma cultura genuinamente open source
- É urgente estabelecer uma definição clara e critérios objetivos para IA open source. A definição de IA open source da OSI deve ser publicada em breve, e empresas, governos e a comunidade de desenvolvedores precisarão cooperar com base nela
- Também são necessárias ações de conscientização voltadas a consumidores e desenvolvedores para prevenir o openwashing. É importante não aceitar automaticamente alegações de "abertura" feitas por empresas, mas examinar cuidadosamente as licenças e práticas reais
2 comentários
Vejo com frequência esse fenômeno de empresas abrirem um projeto como open source, deixarem as correções de bugs iniciais e as melhorias de funcionalidades para a comunidade e, depois que ele se estabiliza, tirarem tudo discretamente de volta para uma licença proprietária.
Tem quem diga que basta fazer um fork, mas no fim a empresa simplesmente se apropria da imagem e do valor de marca que já estavam estabelecidos.
Opiniões do Hacker News
Ao escolher entre dois programas ou modelos de IA, surge um debate entre quem prefere open source e quem não prefere. O objetivo é fazer até programas que não são open source parecerem open source.
Open source foi um compromisso amigável para empresas, mas alguns participantes tinham um senso moral elevado. As pessoas com esse senso moral devem impedir o abuso do open source.
Se isso não puder ser resolvido por meio de marcas registradas, certificação ou licenças, a mensagem deve ser levada à mídia tradicional. O <i>The Register</i> tem conhecimento interno, mas isso precisa se tornar amplamente conhecido pelo público.
Várias empresas criticam o open source enquanto operam seus negócios dependendo de softwares open source como Linux, Java e Debian. A maioria das empresas não sente obrigação de contribuir ou dar suporte.
A OSI está preparando uma definição controversa de open source para IA.
A thirdweb é tecnicamente open source, mas não funciona sem chave de API e verifica limites de chamadas de API no SaaS. Isso desanima equipes que tentam criar uma alternativa realmente open source.
Como resultado de não terem conseguido popularizar conceitos como fair source, pequenas empresas que não são SaaS não conseguem sobreviver com open source.
Open source não tem a ética nem a filosofia do software livre. O software livre é superior ao open source.
No caso de modelos grandes, o custo de treinamento é alto, os artefatos binários são valiosos e podem ser modificados. Se a OSI estabelecer uma definição, seu esforço merece elogios, independentemente de a Meta segui-la ou não.
A OSI precisa reconhecer que, na era dos grandes provedores de nuvem, é necessário haver proteção contra participantes do mercado. São necessárias opções de licença claras para evitar dramas como os de Mongo, Elastic e Redis.
O termo "Open <something>" deve ser protegido para não induzir o público ao erro. É preciso evitar confusões como "OpenAI".
Em alguns casos, é pior retirar a licença depois de aceitar contribuições da comunidade do que usar incorretamente o termo "Open Source". Isso deve ser considerado fraude e gerar responsabilidade civil.
Para modelos de IA, se scripts de treinamento reproduzíveis e os dados não forem compartilhados, o nome "Open Weights" é mais apropriado.