- Recentemente, ferramentas de IA vêm encontrando erros de cálculo, metodologia e referências em artigos científicos
- No ano passado, foi divulgado um estudo afirmando que utensílios de cozinha de plástico preto continham substâncias químicas causadoras de câncer
- Mas depois foi revelado que, devido a um erro matemático no estudo, a concentração real dessas substâncias era 10 vezes menor que o limite de segurança
- Um modelo de inteligência artificial (IA) conseguiu identificar esse erro em poucos segundos
Projeto de detecção de erros em artigos científicos com IA
Black Spatula Project
- Ferramenta de IA open source que analisou cerca de 500 artigos para detectar erros
- O projeto está sendo coordenado por Joaquin Gulloso, pesquisador independente de IA da Colômbia, com participação de 8 desenvolvedores e centenas de conselheiros
- A lista de erros não foi tornada pública e, quando um erro é encontrado, os pesquisadores são contatados diretamente para incentivar correções
YesNoError
- Projeto iniciado com inspiração no Black Spatula Project
- Liderado pelo fundador e empreendedor de IA Matt Schlicht
- Opera com financiamento por meio de uma criptomoeda própria
- Até agora, concluiu a análise de cerca de 37.000 artigos em dois meses
- Artigos com erros encontrados são marcados no site, mas a maioria ainda não passou por verificação de especialistas
- No longo prazo, planeja verificar os erros em colaboração com o ResearchHub (que recompensa pesquisadores com doutorado usando criptomoeda)
Incentivo ao uso de ferramentas de IA por pesquisadores e periódicos
- Incentivar pesquisadores a usar ferramentas de IA antes de submeter artigos, e periódicos antes de publicá-los, para detectar erros com antecedência
- Espera-se fortalecer a confiabilidade científica ao prevenir erros e fraudes em pesquisa
Reação e preocupações no meio acadêmico
- Especialistas em integridade científica reagiram de forma cautelosamente positiva aos projetos
- A pesquisadora Michèle Nuijten, da Tilburg University, levantou a seguinte preocupação:
- Se a precisão das ferramentas de IA não for claramente validada, apontar erros incorretamente pode causar danos à reputação
- O metacientista forense James Heathers, da Linnaeus University, manifestou apoio da seguinte forma:
- "Retrair um artigo ruim é muito mais difícil do que escrevê-lo"
- A IA pode ser útil para triagem de artigos e para induzir revisões adicionais
Como as ferramentas de IA funcionam
- Uso de grandes modelos de linguagem (LLMs) para detectar erros nos artigos
- As ferramentas extraem informações como tabelas e imagens dos artigos e depois geram instruções complexas (prompts)
- O modelo de IA analisa o artigo várias vezes para buscar diferentes tipos de erro e cruzar os resultados
- Custo de análise por artigo: de US$ 0,15 a alguns dólares, dependendo do tamanho do artigo e da complexidade do prompt
Problema de falsos positivos
- Black Spatula Project → cerca de 10% de falsos positivos
- Todos os erros precisam de verificação por especialistas → a falta de especialistas é o maior gargalo
- YesNoError → ao verificar 100 erros matemáticos em 10.000 artigos, mais de 90% foram confirmados como erros reais
- O YesNoError está trabalhando para reduzir a taxa de falsos positivos e segue incorporando feedback contínuo da academia
Críticas ao problema de falsos positivos
- O pesquisador Nick Brown, da Linnaeus University:
- Encontrou falsos positivos em 14 dos 40 artigos analisados pelo YesNoError → em sua maioria, problemas de redação
- Erros triviais podem gerar uma carga desnecessária para o meio acadêmico
- "A menos que a tecnologia melhore drasticamente, isso vai exigir muito trabalho sem um benefício claro"
Próximos desafios e expectativas para as ferramentas de IA
- O YesNoError planeja introduzir um sistema em que detentores da criptomoeda decidam quais artigos revisar primeiro
- Existe a possibilidade de artigos sobre temas politicamente sensíveis (por exemplo, ciência do clima) se tornarem alvo
- O pesquisador Brown: "Se as ferramentas de IA realmente mostrarem eficácia, grandes mudanças podem ocorrer em áreas específicas da pesquisa"
5 comentários
Artigos de baixa qualidade provavelmente serão filtrados, mas, por outro lado, fico preocupado que até os bons artigos acabem enfrentando barreiras maiores e se tornem, relativamente, menos criativos. Mesmo quando há lacunas lógicas, às vezes é justamente delas que surgem novas ideias, então, pessoalmente, isso não me agrada muito.
A IA também pode errar, então fico curioso sobre como verificar que os pontos apontados pela IA não estão errados.
Com a popularização dos LLMs, estão surgindo mudanças enormes em áreas onde a demanda existia principalmente por causa da assimetria de informação.
Fico pensando em como seria se mandássemos analisar vários textos sagrados da humanidade também, haha
Comentários no Hacker News
Se a IA consegue encontrar erros óbvios em artigos já publicados, ela poderia ser usada como parte do processo de revisão. Os autores poderiam aplicá-la ao próprio trabalho antes da submissão, elevando bastante a qualidade dos artigos
No momento, o site YesNoError contém muitos falsos positivos. Nick Brown, pesquisador da Linnaeus University, afirma que 14 de 40 artigos problemáticos eram falsos positivos
Como no momento tudo está sendo conduzido por IA, as pessoas podem achar que ela está verificando fraude ou lógica falha. Na prática, ela verifica autoconsistência e consistência com os dados de treinamento
Sugestão da ideia de usar IA para mapear o impacto de artigos retratados. Seria possível identificar conclusões de artigos retratados que já não têm sustentação e verificar onde elas aparecem em artigos posteriores
Nossa memória coletiva é curta demais? Já esquecemos os problemas causados por relatórios de bugs gerados por IA?
No projeto Black Spatula, foram apresentados dois exemplos em que erros importantes foram detectados
A ideia é boa, e seria interessante aplicá-la aos relatórios da própria empresa para detectar erros óbvios antes de enviá-los ao chefe
O YesNoError planeja permitir que detentores de criptomoeda decidam quais artigos serão revisados primeiro
Essa ideia é muito ruim. É melhor pular a primeira seção e ler a seção sobre "falsos positivos"
Há muito ceticismo quanto ao valor disso. Já houve tempo desperdiçado respondendo a alegações sem fundamento geradas por "revisões" de IA. Talvez esse tipo de alegação já existisse antes, mas geradores de texto sabem alucinar usando a terminologia certa para convencer pessoas comuns e amadores, o que torna tudo mais irritante de lidar