5 pontos por GN⁺ 2024-05-10 | 1 comentários | Compartilhar no WhatsApp

Reação dos usuários ao anúncio da parceria entre Stack Overflow e OpenAI

  • Alguns usuários estão reagindo negativamente ao anúncio recente da parceria entre Stack Overflow e OpenAI
  • Alguns usuários tentaram excluir seu próprio conteúdo (perguntas e respostas) do Stack Overflow, mas enfrentaram dificuldades porque o site não permite uma exclusão fácil
  • Em resposta, esses usuários decidiram editar suas perguntas ou respostas para “vandalizá-las” como forma de protesto contra a cooperação entre Stack Overflow e OpenAI

Visão geral da parceria entre Stack Overflow e OpenAI

  • Stack Overflow e OpenAI decidiram colaborar por meio de uma nova parceria de API
  • A colaboração tem como objetivo combinar a vasta plataforma de conhecimento do Stack Overflow com os modelos avançados de IA da OpenAI para oferecer isso aos desenvolvedores
  • Usuários da OpenAI poderão usar os dados precisos e verificados do Stack Overflow por meio do acesso à OverflowAPI, permitindo resolver problemas mais rapidamente e focar em tarefas prioritárias
  • Além disso, a OpenAI pretende integrar o conhecimento técnico verificado do Stack Overflow ao ChatGPT para melhorar o acesso dos usuários a informações e código confiáveis

Reação contrária à IA

  • Sites da rede Stack Exchange, incluindo o Stack Overflow, são ferramentas muito úteis para a comunidade, mas alguns usuários não estão nada satisfeitos com o uso de seu conteúdo no treinamento de IA para gerar respostas sem atribuição de fonte
  • Essa é uma reação comum hoje não apenas no Stack Overflow, mas entre criadores de conteúdo em toda a internet
  • A internet está passando por um período de mudança, com queda no tráfego de blogs e nas visualizações de página, aumento nas buscas por respostas usando IA e, para algumas pessoas, redução no uso de mecanismos de busca
  • É um período de tensão em que coexistem a adaptação às novas capacidades do ChatGPT e de outros LLMs (modelos de linguagem de grande porte) e a incerteza sobre o que tudo isso significa para a internet como a conhecemos
  • A reação recente à parceria entre Stack Overflow e OpenAI é apenas um exemplo de como as pessoas estão reagindo negativamente à adoção em larga escala da IA e às mudanças rápidas que isso provoca

O Stack Overflow está bloqueando contas por remoção de conteúdo?

  • Vários usuários publicaram no Twitter e no Hacker News relatando que, após tentarem excluir várias perguntas e respostas que haviam publicado anteriormente no site do Stack Overflow, receberam e-mails de moderadores informando que suas contas foram colocadas em espera por 7 dias ou temporariamente bloqueadas
  • Segundo o e-mail da equipe de moderação do Stack Overflow, excluir ou remover conteúdo que possa ser útil para outras pessoas pode causar transtornos para toda a comunidade, mesmo que esse conteúdo já não seja mais útil para o autor
  • Como o negócio do Stack Overflow e de toda a rede Stack Exchange depende de conteúdo gerado por usuários para manter a utilidade dos sites, é evidente que há razões comerciais para não querer que usuários removam conteúdo em massa
  • A suspensão de contas e o envio de e-mails de advertência pelo Stack Overflow provavelmente não são algo novo. A plataforma deve aplicar essas políticas há muito tempo para se proteger
  • Se os usuários pudessem vandalizar ou excluir grandes volumes de conteúdo com facilidade, isso poderia causar um transtorno significativo à plataforma, portanto proteger o conteúdo é do interesse tanto do Stack Overflow quanto da comunidade
  • Também é bastante provável que esses e-mails sejam automatizados e disparados pelo comportamento do usuário, e entrar em contato diretamente com o Stack Overflow sobre o conteúdo pode ser uma boa medida
  • Até agora, não foi vista uma resposta do Stack Overflow sobre essas suspensões. Também não está claro quantos usuários realmente estão tentando fazer isso, então pode não haver uma grande reação contrária à parceria entre Stack Overflow e OpenAI
  • Como o impulso de avanço da adoção de IA provavelmente não vai desacelerar tão cedo, será interessante observar como tudo isso se desenrola daqui para frente
  • Não se recomenda que os demais usuários do Stack Overflow apaguem seu conteúdo como forma de protesto

Opinião do GN⁺

  • A parceria entre Stack Overflow e OpenAI parece ter potencial para impactar fortemente o avanço da tecnologia de IA e a comunidade de desenvolvedores. No entanto, ainda é um desafio encontrar o equilíbrio entre a proteção da propriedade intelectual de cada desenvolvedor e o uso desse conteúdo como dado de treinamento para IA
  • Os desenvolvedores devem poder compartilhar seu conhecimento e, ao mesmo tempo, receber uma compensação justa por isso. O Stack Overflow parece precisar estabelecer um sistema de compensação adequado para esse fim
  • A confiança na comunidade é muito importante para incentivar os desenvolvedores a compartilhar conhecimento de forma voluntária. Diante deste caso, parece necessário adotar uma abordagem cuidadosa para que a confiança dos desenvolvedores no Stack Overflow não seja prejudicada
  • Por outro lado, o aumento da produtividade no desenvolvimento com o uso de tecnologias de IA, como o ChatGPT, também representa uma grande vantagem para os desenvolvedores. Será preciso buscar formas de maximizar esses benefícios ao mesmo tempo em que se minimizam efeitos colaterais, como questões de privacidade
  • Houve uma controvérsia semelhante sobre direitos autorais em torno do GitHub Copilot. Parece necessário um esforço para encontrar um ponto de consenso aceitável para todos por meio de debate ativo dentro da comunidade de desenvolvedores

1 comentários

 
GN⁺ 2024-05-10
Comentários do Hacker News
  • Problema com a mudança de licença do conteúdo de usuários no StackOverflow:
    • Há cerca de 5 anos, o StackOverflow declarou por engano que todo o conteúdo enviado pelos usuários era disponibilizado sob CC-BY-SA 4.0. O contrato original com os usuários era CC-BY-SA 3.0.
    • Houve confusão entre meados de 2018 e o início de 2019 sobre a licença aplicável a código e a conteúdo não relacionado a código.
    • No início de 2019, os usuários foram solicitados a fazer login novamente e aceitar um novo acordo de licença.
    • Atualmente, o conteúdo anterior a 5 de maio de 2018 está sob CC-BY-SA 3.0, e o posterior sob CC-BY-SA 4.0.
  • Opiniões dos usuários sobre scrapers de IA e o fornecimento de dados ao OpenAI pelo StackOverflow:
    • Alguns usuários não se importam que suas respostas sejam usadas no treinamento de IA. Eles consideram que isso agrega grande valor a ferramentas como o ChatGPT.
    • A parceria com a OpenAI não é o ponto central da questão da exclusão de conteúdo dos usuários. Pela licença, a exclusão de conteúdo nunca foi bem-vista e geralmente é revertida.
    • Por causa da licença CC-BY-SA, mesmo que o StackOverflow não permita, outras pessoas podem copiar o conteúdo, o que torna difícil removê-lo.
    • O usuário pode apagar o nome ou editar informações pessoais, mas não pode remover depois o conteúdo de alta qualidade em si.
  • O problema de empresas com fins lucrativos administrarem produtos "gratuitos":
    • Como precisam gerar lucro, não ficam presas à ética do open source. Os usuários acham que estão contribuindo para open source, mas na prática não é isso.
    • As ações do StackExchange provavelmente são legais, mas os contribuidores não são partes interessadas, e basta manter apenas um nível de contribuidores comercialmente sustentável.
    • No caso de produtos oferecidos gratuitamente, o usuário acaba sendo o produto; se você não sabe como isso é monetizado, em algum momento vai se decepcionar.
  • Necessidade de novas licenças de conteúdo voltadas ao treinamento de IA:
    • Pode surgir uma licença no espírito da GPL, como exigir a divulgação dos pesos da IA quando conteúdo for usado em treinamento comercial de IA.
  • O modelo de venda de datasets do StackOverflow:
    • Desde o começo, o StackOverflow se concentrou mais em construir um dataset para SEO do que em ser centrado no usuário. O acordo com a OpenAI não mudou tanto assim.
    • Com o surgimento dos LLMs, a crise do StackOverflow é inevitável, então é melhor vender para a OpenAI e extrair o máximo possível antes do colapso.
  • A importância da cláusula ShareAlike na licença CC BY-SA:
    • A cláusula que exige distribuir derivados sob a mesma licença é muito ampla e ambígua. A definição de "build upon" pode não ser atraente para muitos usuários.
  • Comparação entre LLMs e StackOverflow em vantagens e desvantagens:
    • Graças aos LLMs, ficou possível evitar o StackOverflow sempre que der. O StackOverflow está cheio de elitismo e de uma toxicidade que prioriza procedimentos em vez de ajuda real.
    • Há reclamações de que LLMs às vezes dão respostas erradas, mas entre as respostas do StackOverflow também há muitas completamente erradas ou sem relação com a pergunta. Além disso, há muitas respostas desatualizadas.
    • O ideal seria combinar a capacidade de redação dos LLMs com a validação feita pelos usuários do StackOverflow. Isso talvez não seja bom para quem só quer ganhar pontos na internet, mas seria o melhor para os usuários.
  • Mensagem automática de alerta do StackOverflow sobre exclusão em massa de conteúdo:
    • Parece existir pelo menos desde 2017 e aparentemente é exibida automaticamente quando uma exclusão em massa é detectada.
    • Como o StackOverflow tem aspectos mais próximos de uma wiki do que de um fórum, dá para entender o motivo dessa política. Não parece ter sido implantada para conter protestos contra a OpenAI.
  • Também há a opinião de que, pessoalmente, quase não se usou o StackOverflow nos últimos 2 anos.