10 pontos por GN⁺ 2024-10-28 | 2 comentários | Compartilhar no WhatsApp
  • Mark Zuckerberg, CEO do Facebook, afirma que o modelo de linguagem de grande porte Llama 3, da Meta, é open source, mas na prática não é
  • Segundo a definição de open source da Open Source Initiative (OSI), a licença do Llama 3 não atende aos requisitos de open source em vários pontos
  • A Meta não é a única empresa a recorrer a esse tipo de engano. Isso é chamado de "openwashing"
    • Openwashing é a prática enganosa de apresentar produtos ou serviços que não são realmente abertos como se fossem "abertos"
    • O termo foi criado em 2009 pela pesquisadora de políticas de internet Michelle Thorne, inspirada em "greenwashing"
  • O openwashing é generalizado no setor de IA. Entre 45 modelos investigados por pesquisadores da Radboud University, os modelos de grandes empresas como Google, Meta e Microsoft não eram realmente open source

Por que as empresas fazem openwashing

  • No passado, as empresas evitavam o open source, mas hoje a percepção sobre ele se tornou positiva
    • Em 2001, Steve Ballmer declarou que "Linux é um câncer", argumentando que usar software open source obrigaria a transformar todo o restante do software em open source também
  • As empresas exploram a imagem positiva do open source sem de fato se comprometer com ele
    • Isso ajuda a melhorar a imagem pública e a atrair consumidores que valorizam transparência e abertura
    • Algumas empresas usam o openwashing para proteger seus modelos e práticas do escrutínio científico e regulatório, enquanto aproveitam os benefícios do rótulo "aberto"
    • Como a Lei de IA da UE concede isenções especiais a modelos "open source", isso se torna um forte incentivo ao openwashing

Falta uma definição clara para IA open source

  • A UE ainda não conseguiu definir claramente o que é IA open source, e na verdade ninguém conseguiu fazer isso até agora
    • A OSI deve publicar sua definição de IA open source nos próximos dias
    • As licenças atuais de openwashing, exceto na visão de seus próprios criadores, entram em conflito com a definição de todos os demais
  • Mas nem todas as grandes empresas de IA estão mentindo sobre open source
    • Por exemplo, o LLM Granite 3.0, da IBM, é de fato disponibilizado como open source sob a licença Apache 2
  • Mesmo que a OSI não seja um governo nem um órgão regulador, por que ainda assim é importante usar corretamente o termo open source?
    • A OSI é apenas uma organização sem fins lucrativos que criou diretrizes úteis
  • Dan Lorenc, CEO da Chainguard, disse recentemente em uma palestra principal na conferência SOSS, em Atlanta:
    • Ninguém pode obrigar os outros a usar a definição da OSI, mas muitas pessoas, especialmente advogados, confiam nela
    • Elas confiam no trabalho da OSI e entendem a proteção que as empresas recebem ao usar licenças que atendem aos critérios de open source
    • É por isso que essa definição aparece em contratos de compras de grandes empresas no mundo todo

Open source não é apenas uma questão jurídica ou de negócios

  • O open source dá aos desenvolvedores liberdade de atuação
    • Sem open source, perderíamos o benefício de poder usar código livremente sem precisar conhecer ou se preocupar com todos os detalhes das licenças
    • Se fosse necessário verificar a licença de cada trecho de código, os desenvolvedores teriam de passar por revisão jurídica sempre que quisessem usar uma nova biblioteca
    • As empresas passariam a ter medo de publicar qualquer coisa na internet se não estivesse claro quais responsabilidades enfrentariam ao divulgar código-fonte
  • Lorenc enfatiza que isso não é um problema apenas das grandes empresas, mas um problema compartilhado
    • Todos que usam open source seriam afetados
    • Projetos inteiros poderiam parar de funcionar, falhas de segurança deixariam de ser corrigidas e a manutenção ficaria muito mais difícil
    • É preciso agir em conjunto para preservar e defender a definição de open source. Caso contrário, os advogados voltarão a dominar a situação
  • Muitos advogados de propriedade intelectual não querem esse tipo de dor de cabeça
    • Licenças de open source de verdade tornam a vida de empresas, programadores e advogados mais fácil
    • Introduzir cláusulas como "aberto, exceto para quem pode competir conosco" ou "aberto, exceto para quem pode implantar o código na nuvem" é pedir problema

Openwashing prejudica todo mundo

  • No fim, o openwashing vai contaminar o trabalho jurídico, empresarial e de desenvolvimento de todos
  • Ironicamente, até as empresas de visão curta que hoje apoiam essa abordagem acabarão sendo prejudicadas
  • Isso porque quase todo o trabalho delas, especialmente na área de IA, é baseado em open source

Opinião do GN⁺

  • A prática de openwashing, que enfraquece a definição de open source, pode ter efeitos negativos não só na área de IA, mas em toda a indústria de software. Ela restringe a atuação dos desenvolvedores e aumenta os riscos jurídicos para as empresas
  • O fato de as empresas quererem apenas aproveitar a imagem positiva do open source é uma postura míope. No longo prazo, isso pode acabar prejudicando as próprias empresas
  • Para o avanço da tecnologia de IA, colaboração e compartilhamento baseados no espírito do open source são essenciais. As empresas devem liderar a criação de uma cultura genuinamente open source
  • É urgente estabelecer uma definição clara e critérios objetivos para IA open source. A definição de IA open source da OSI deve ser publicada em breve, e empresas, governos e a comunidade de desenvolvedores precisarão cooperar com base nela
  • Também são necessárias ações de conscientização voltadas a consumidores e desenvolvedores para prevenir o openwashing. É importante não aceitar automaticamente alegações de "abertura" feitas por empresas, mas examinar cuidadosamente as licenças e práticas reais

2 comentários

 
ndrgrd 2024-10-28

Vejo com frequência esse fenômeno de empresas abrirem um projeto como open source, deixarem as correções de bugs iniciais e as melhorias de funcionalidades para a comunidade e, depois que ele se estabiliza, tirarem tudo discretamente de volta para uma licença proprietária.

Tem quem diga que basta fazer um fork, mas no fim a empresa simplesmente se apropria da imagem e do valor de marca que já estavam estabelecidos.

 
GN⁺ 2024-10-28
Opiniões do Hacker News
  • Ao escolher entre dois programas ou modelos de IA, surge um debate entre quem prefere open source e quem não prefere. O objetivo é fazer até programas que não são open source parecerem open source.

  • Open source foi um compromisso amigável para empresas, mas alguns participantes tinham um senso moral elevado. As pessoas com esse senso moral devem impedir o abuso do open source.

  • Se isso não puder ser resolvido por meio de marcas registradas, certificação ou licenças, a mensagem deve ser levada à mídia tradicional. O <i>The Register</i> tem conhecimento interno, mas isso precisa se tornar amplamente conhecido pelo público.

  • Várias empresas criticam o open source enquanto operam seus negócios dependendo de softwares open source como Linux, Java e Debian. A maioria das empresas não sente obrigação de contribuir ou dar suporte.

  • A OSI está preparando uma definição controversa de open source para IA.

  • A thirdweb é tecnicamente open source, mas não funciona sem chave de API e verifica limites de chamadas de API no SaaS. Isso desanima equipes que tentam criar uma alternativa realmente open source.

  • Como resultado de não terem conseguido popularizar conceitos como fair source, pequenas empresas que não são SaaS não conseguem sobreviver com open source.

  • Open source não tem a ética nem a filosofia do software livre. O software livre é superior ao open source.

  • No caso de modelos grandes, o custo de treinamento é alto, os artefatos binários são valiosos e podem ser modificados. Se a OSI estabelecer uma definição, seu esforço merece elogios, independentemente de a Meta segui-la ou não.

  • A OSI precisa reconhecer que, na era dos grandes provedores de nuvem, é necessário haver proteção contra participantes do mercado. São necessárias opções de licença claras para evitar dramas como os de Mongo, Elastic e Redis.

  • O termo "Open <something>" deve ser protegido para não induzir o público ao erro. É preciso evitar confusões como "OpenAI".

  • Em alguns casos, é pior retirar a licença depois de aceitar contribuições da comunidade do que usar incorretamente o termo "Open Source". Isso deve ser considerado fraude e gerar responsabilidade civil.

  • Para modelos de IA, se scripts de treinamento reproduzíveis e os dados não forem compartilhados, o nome "Open Weights" é mais apropriado.