5 pontos por GN⁺ 2024-07-10 | 1 comentários | Compartilhar no WhatsApp
  • Em novembro de 2022, desenvolvedores entraram com uma ação coletiva contra GitHub, Microsoft e OpenAI
  • Alegaram que o Copilot fornecia trechos de código usando indevidamente software de código aberto hospedado no GitHub
  • A Microsoft é proprietária do GitHub e usa a tecnologia de aprendizado de máquina generativo da OpenAI para operar o Copilot
  • Andamento do processo
    • O processo começou com 22 alegações, mas a maioria foi rejeitada
    • Em decisão recente, 3 alegações foram rejeitadas, incluindo as relacionadas à seção 1202(b) da DMCA
    • As alegações que ainda restam são duas: violação de licenças de código aberto e quebra de contrato
  • Decisão do tribunal
    • Foi entendido que o código fornecido pelo Copilot não é suficientemente semelhante à obra original
    • O tribunal decidiu que o Copilot não removeu informações de gestão de direitos autorais ao fornecer trechos de código
    • A alegação com base na seção 1202(b) da DMCA foi rejeitada por falta de provas
  • Queixas de ambos os lados
    • Os autores afirmam que os réus estão atrasando a entrega de documentos
    • Os réus rebatem dizendo que os autores estão exigindo informações excessivas
    • A OpenAI afirma que o procedimento de solicitação de e-mails não foi realizado corretamente
  • Posição do GitHub
    • "Estamos confiantes de que a IA vai revolucionar a forma como o software é desenvolvido e acreditamos que o Copilot está em conformidade com as leis aplicáveis"
    • "Continuaremos investindo em experiências para desenvolvedores baseadas em IA e inovando com responsabilidade"

Resumo do GN⁺

  • Este artigo trata do andamento do processo de direitos autorais relacionado ao GitHub Copilot
  • A maior parte das alegações de uso indevido de código open source pelo Copilot foi rejeitada
  • Ajuda a entender o impacto da tecnologia de IA no desenvolvimento de software e as questões legais envolvidas
  • Projetos com funcionalidades semelhantes incluem Tabnine e Kite

1 comentários

 
GN⁺ 2024-07-10
Opiniões no Hacker News
  • Há quem diga que o assistente de programação do GitHub faz transformações no código para evitar infração de direitos autorais
  • Há a opinião de que, se um humano transformasse um código protegido por direitos autorais e alegasse que se trata de um código novo, haveria problemas legais
  • Questiona-se como isso seria diferente quando uma máquina faz a mesma coisa
  • Houve a alegação de que o Copilot pode gerar o mesmo código, mas o processo foi rejeitado por falta de provas
  • Alguns desenvolvedores não querem que seu código seja usado no treinamento de LLMs
    • Pode ser necessária uma nova licença
    • Eles podem até parar de contribuir para open source
    • Há preocupação de que a Microsoft possa causar uma debandada em massa no desenvolvimento open source
    • Também podem publicar código inútil para contaminar os dados de treinamento
  • Há reclamações sobre funcionários da Microsoft usarem Slack enquanto impõem o Teams aos outros
  • Há preocupação de que, se MS e OpenAI vencerem, isso possa acabar legalizando o uso de código-fonte vazado para treinar LLMs
  • Há incômodo com a expressão "alguns desenvolvedores enfrentando o poder de Redmond"
    • Há a opinião de que o lado menor nem sempre está certo
  • Há quem diga que o problema é a falta de provas para a alegação de que o Copilot pode gerar o mesmo código
    • Também há a opinião de que um vídeo com captura de tela poderia ter sido usado como prova
  • Há a opinião de que é suspeito a Microsoft usar todo o código dos outros enquanto exclui o próprio código
  • Aponta-se o problema de que os modelos são treinados, em essência, para gerar duplicações
    • Há a opinião de que chamar isso de IA não resolve a questão dos direitos autorais
    • Há a opinião de que o treinamento deveria ser feito com informações legalmente possuídas
  • Há discussão sobre migrar para versões modificadas de licenças FOSS que proíbam treinamento de IA
    • É possível usar non-ai-licenses para evitar inclusão nos dados de treinamento do Copilot
    • Há planos de usar essas licenças no próximo projeto