7 pontos por xguru 2022-11-07 | 3 comentários | Compartilhar no WhatsApp
  • O desenvolvedor e advogado Matthew Butterick processou Microsoft, GitHub e OpenAI
  • Alegando violação de licenças de código aberto e infração aos direitos dos programadores
  • Licenças como GPL, Apache e MIT exigem a atribuição do nome do autor, mas o Copilot ignora isso
    Inclusive quando trechos de código com mais de 150 caracteres são copiados literalmente
  • Alguns programadores apontam isso como "lavagem de código aberto (laundering)"
  • O escritório de advocacia que representa a ação afirmou: "A Microsoft parece estar lucrando com o trabalho de outras pessoas ao ignorar as condições das licenças de código aberto e outros requisitos legais"
  • Separadamente das violações de licença, Butterick também alega que o recurso viola algumas outras coisas
    • Os Terms of Service e as Privacy Policies do GitHub
    • A DMCA 1202, que proíbe a remoção de informações de gestão de direitos autorais
    • A California Consumer Privacy Act

3 comentários

 
botplaysdice 2022-11-08

No fim, parece que isso poderia ser resolvido dividindo os dados de treinamento por licença open source e deixando isso selecionável nas opções do Copilot, não? — e gerando também a indicação de licença corretamente de acordo com isso. Eles já fazem isso? Eu nunca usei o Copilot, então...

É uma questão grande, mas acho que a forma de resolver também parece bem clara.

Isso também dá muito problema quando uma pessoa está programando, né? Às vezes, na empresa, procuram alguém que não tenha lido o código de uma implementação open source de uma especificação XXX (por exemplo, Linux). (Para fazer uma implementação clean room.) Às vezes, se você manda sem pensar um link para código do Linux durante o trabalho, acabam reclamando — "Eu não posso ler esse código!". Em alguns casos, também é complicado quando eu nem lembro se já tinha lido aquele código antes.

Parece que isso vai poder ser resolvido de forma ainda mais clara do que esse tipo de problema que as pessoas enfrentam.

 
ruinnel 2022-11-07

Quando o Copilot foi anunciado..
No começo eu pensei “uau~”, mas alguns dias depois surgiu essa questão relacionada a licenças.
Vi a opinião de que, se fosse usado de forma errada e, sem querer, um monte de código sob licença GPL entrasse no desenvolvimento do código de um produto da empresa, isso poderia se tornar um grande problema... e agora virou realidade.

 
jjpark78 2022-11-07

Ser copiado exatamente assim é meio... complicado. É por isso que a área de Explainable AI é tão discutida... uma IA capaz de explicar por que esse tipo de resultado saiu.

Se o Copilot conseguisse fazer isso, talvez pudesse evitar boa parte da controvérsia adicionando como comentários o código open source que influenciou o resultado.