7 pontos por GN⁺ 2024-09-09 | 2 comentários | Compartilhar no WhatsApp
  • No Google Scholar, é fácil encontrar muitos artigos suspeitos que parecem ter sido gerados por modelos GPT de uso geral
  • Esses artigos são produzidos principalmente com aplicações de IA de uso amplo, especialmente o ChatGPT, imitando a redação científica
  • O Google Scholar lista esses artigos suspeitos ao lado de artigos de pesquisa confiáveis e com controle de qualidade
  • A análise de uma amostra de artigos científicos suspeitos gerados por GPT encontrados no Google Scholar mostra que muitos tratam de áreas de aplicação vulneráveis à desinformação digital, como meio ambiente, saúde e computação
  • A crescente possibilidade de manipulação maliciosa de evidências em áreas politicamente muito conflituosas é uma preocupação cada vez maior

Principais achados

Achado 1: 139 artigos suspeitos gerados por GPT aparecem nos resultados de busca do Google Scholar como se fossem artigos comuns. Muitos estão em periódicos não indexados

  • A maioria dos artigos suspeitos estava em periódicos não indexados ou working papers, mas alguns também foram encontrados em periódicos, publicações, conferências e repositórios respeitados
  • Foram identificados ao todo 139 artigos suspeitos de usar de forma enganosa o ChatGPT ou aplicações LLM semelhantes
  • Desses, 19 estavam em periódicos indexados, 89 em periódicos não indexados, 19 eram trabalhos estudantis em bases de dados universitárias e 12 eram working papers, em sua maioria em bases de preprints
  • Artigos sobre meio ambiente e saúde representam cerca de 34% da amostra, e 66% deles foram publicados em periódicos não indexados

Achado 2: artigos suspeitos gerados por GPT são distribuídos online, espalham-se por toda a infraestrutura de comunicação acadêmica e frequentemente existem em várias cópias. Predominam áreas aplicadas com implicações práticas

  • Foram encontrados 27 artigos sobre questões ambientais em 56 URLs de 26 domínios únicos
  • Foram encontrados 20 artigos sobre questões de saúde em 46 URLs de 20 domínios únicos
  • A maioria dos artigos identificados existe em várias cópias e já se espalhou por diversos arquivos, repositórios e redes sociais
  • Removê-los do registro acadêmico será difícil ou impossível

Achado 3: o Google Scholar apresenta, na mesma interface, resultados de bases de citações com controle de qualidade e sem controle de qualidade, permitindo acesso irrestrito a artigos suspeitos gerados por GPT

  • A posição central do Google Scholar na infraestrutura aberta de comunicação acadêmica, somada à falta de padrões, transparência e responsabilização em seus critérios de inclusão, pode ter um impacto grave na confiança pública na ciência
  • Isso aumenta o potencial de abuso do Google Scholar para manipulação de evidências e afetará tentativas de retratar ou remover artigos falsos de suas fontes originais
  • Qualquer solução precisa considerar toda a infraestrutura de comunicação acadêmica e a interação entre diferentes atores, interesses e motivações

Opinião do GN⁺

Esta é uma situação preocupante pelos seguintes motivos:

  1. Artigos gerados por GPT podem sobrecarregar o sistema de comunicação acadêmica e ameaçar a integridade do registro científico. Isso tende a agravar ainda mais o problema já existente das paper mills.

  2. Conteúdos produzidos por IA que parecem cientificamente convincentes podem, na verdade, ter sido gerados de forma enganosa. Isso pode enfraquecer a confiança pública no conhecimento científico e causar sérios riscos sociais.

  3. Os critérios de inclusão do Google Scholar são opacos e carecem de responsabilização. Isso está ligado ao problema de apresentar nos resultados de busca, sem distinção, bases de citações que seguem padrões e bases que não seguem.

  4. Como os artigos falsos se espalham por diferentes plataformas, mesmo que o original seja retratado, é difícil rastreá-los e removê-los. Isso pode gerar impactos negativos duradouros na área de pesquisa em questão.

  5. Muitos artigos gerados por GPT foram encontrados em temas socialmente sensíveis e importantes, como saúde e meio ambiente. Isso pode causar grave confusão na formulação de políticas públicas e abrir espaço para uso político indevido.

Para enfrentar esse problema, é necessário considerar ao mesmo tempo abordagens técnicas, educacionais e institucionais. Por exemplo:

  • oferecer, em mecanismos de busca acadêmicos, opções de filtragem por revisão por pares e critérios semelhantes
  • integrar ferramentas de avaliação à interface e aos crawlers dos mecanismos de busca acadêmicos
  • construir um mecanismo de busca acadêmico gratuito operado em benefício do interesse público, e não por razões comerciais
  • promover iniciativas de educação voltadas a formuladores de políticas, comunicadores científicos, jornalistas e outros públicos

Em termos mais fundamentais, esse problema deve ser abordado dentro de um contexto maior: as falhas do sistema de publicação acadêmica, a cultura do "publish or perish", o monopólio do Google e os conflitos ideológicos em torno do controle da informação. Soluções apenas técnicas não serão suficientes.

2 comentários

 
xguru 2024-09-09

alphaXiv - discutir publicamente artigos do arXiv

Vendo essa plataforma junto com este texto, dá uma sensação de que há alguma conexão

 
GN⁺ 2024-09-09
Comentários do Hacker News
  • Na APS March Meeting, um editor de periódico científico se preocupa mais com revisões geradas por LLM do que com artigos gerados por LLM

    • LLMs são melhores em resumir conteúdo do que em raciocínio lógico longo
    • As revisões não são públicas, o que faz as pessoas sentirem menos vergonha
  • O script em Python dos autores pode ter bugs

    • Se a chave bib não estiver na resposta da API, pode haver inconsistência nas colunas do dataframe
    • É possível remover resultados ruins usando um array de flags, mas isso não é usado no código
  • O GPT pode facilitar a manipulação de artigos científicos, mas humanos já fazem isso bem sem IA

    • Compartilhado um link de vídeo interessante relacionado
  • Seria bom se o método de coleta de dados em artigos sobre LLM fosse mais sofisticado

    • O uso de LLM tem um impacto na ciência e na sociedade muito maior do que apenas revisão de texto
    • O escopo de “revisão” varia de pessoa para pessoa
  • Especialistas da área conseguem distinguir resultados falsos com facilidade

    • Conteúdo sem novidade é mais difícil de distinguir
    • O problema da honestidade dos pesquisadores já existia antes da IA
    • É difícil para não especialistas distinguir a veracidade das informações
  • Em discussões anteriores, artigos suspeitos de usar GPT na verdade foram escritos antes da OpenAI

  • O ChatGPT não entende a verdade

    • Em um projeto de pesquisa relacionado a data lakes, ao usar o ChatGPT houve muitos links falsos e resumos de material de marketing
  • Aprecia-se o fato de a imagem da matéria não ter sido gerada por IA

  • Artigos gerados por GPT podem ter sido escritos por pessoas que não têm o inglês como língua nativa para melhorar o inglês

  • Parece que estamos entrando em tempos sombrios