- O pioneiro servidor de preprints ArXiv.org, fundado em 1991, passará em 1º de julho a ser uma entidade sem fins lucrativos independente da Cornell University
- Com a independência, pretende ampliar a base de doadores e reforçar a equipe técnica, respondendo ao forte aumento no volume de submissões, que chega a 300 mil por ano, e ao problema de artigos ruins gerados por IA (AI slop)
- Nos últimos dois anos, a pressão financeira aumentou com déficits operacionais e um aumento de 50% nas submissões; em 2025, a Cornell forneceu US$ 297 mil para cobrir o déficit e US$ 819 mil em apoio em espécie
- O fundador Paul Ginsparg apontou que universidades têm dificuldade para manter infraestrutura global de pesquisa no longo prazo e afirmou que a independência é essencial para garantir a sustentabilidade
- A medida é semelhante aos casos de independência do bioRxiv e medRxiv, e o ArXiv começa em situação de estabilidade financeira inicial, com recursos garantidos para operar nos próximos anos
Decisão de independência do ArXiv
- O ArXiv.org começou em 1991 como uma plataforma rápida e gratuita de publicação de preprints científicos e foi hospedado pela Cornell University por mais de 20 anos
- A partir de 1º de julho, passará a ser uma organização sem fins lucrativos independente, e a nova entidade está recrutando um novo CEO
- Greg Morrisett, vice-reitor da Cornell Tech, explicou que a independência ajudará a atrair mais doadores e ampliar a infraestrutura técnica
- Neste ano, são esperados mais de 300 mil preprints publicados
- Também são necessários recursos para enfrentar o problema dos artigos ruins escritos por IA (AI slop)
Estrutura financeira e pressão de crescimento
- Desde 2022, as submissões de artigos aumentaram 50%, e o quadro de funcionários foi ampliado para 27 pessoas
- Em 2025, houve um déficit de US$ 297 mil, coberto pela Cornell
- A Cornell também forneceu US$ 819 mil em apoio em espécie
- O custo operacional anual do ArXiv é de cerca de US$ 6,7 milhões
- Mais de 270 instituições pagam anuidade para apoiar o ArXiv
- Algumas instituições pagam até US$ 10 mil por ano
- As instituições-membro têm direito de participação operacional e acesso a dados de uso
- Entre os principais apoiadores estão a Simons Foundation e a Schmidt Sciences, que recentemente financiaram melhorias tecnológicas
Contexto por trás da independência
- Havia também competição por recursos dentro da Cornell Tech, e alguns grupos demonstravam preocupação com a influência excessiva da Cornell
- Morrisett, a liderança do ArXiv e os doadores concluíram que a independência era a melhor forma de diversificar e ampliar o financiamento
- O fundador Paul Ginsparg também recomendou a independência
- Ele observou que universidades não têm experiência suficiente em oferecer infraestrutura global de pesquisa no longo prazo
- A Cornell tinha capacidade limitada de contratar desenvolvedores de software, e o site ainda mantinha uma forma simples
- A Cornell e a Simons prepararam recursos para estabilidade financeira inicial, para que o ArXiv comece sem déficit
- No curto prazo, não há plano de aumentar a taxa de adesão
Reações e preocupações no meio acadêmico
- Alguns cientistas expressaram preocupação com a possibilidade de comercialização e com o salário de US$ 300 mil do novo CEO
- O ArXiv disse não concordar com essas preocupações
- Ginsparg afirmou entender essas preocupações, mas observou que a operação do ArXiv sempre esteve sobre uma base financeira instável
- Ele comparou a situação ao filme de 1914 Perils of Pauline, dizendo que “sempre foi uma situação precária”
Papel do fundador Ginsparg e planos futuros
- Ginsparg continua sendo professor da Cornell e segue participando da operação do ArXiv
- Ele lidera o ArXiv há 35 anos, mas vem reduzindo gradualmente seu papel e considerando a aposentadoria
- Mesmo após o lançamento da nova organização sem fins lucrativos, ajudará na adaptação inicial, mas planeja transferir o comando a um sucessor no longo prazo
Comparação com outros servidores de preprints
- A independência do ArXiv é semelhante ao caso em que bioRxiv e medRxiv se tornaram independentes do Cold Spring Harbor Laboratory e foram transferidos para o openRxiv
- As três plataformas buscam garantir sustentabilidade por meio de uma estrutura independente e sem fins lucrativos
1 comentários
Opiniões no Hacker News
O anúncio recente de que o arXiv passará a rejeitar artigos de revisão e position papers parece um sinal de que a plataforma está ficando cada vez mais voltada a “opiniões”
Originalmente, o arXiv era apenas um serviço de hospedagem de PDFs, com o papel de oferecer o mínimo de confiabilidade para que um artigo pudesse ser citado antes da publicação formal
Mas, com o tempo, especialmente em ML, o próprio arXiv acabou virando uma espécie de local oficial de publicação (venue)
Acho que, quanto maior o poder do arXiv, mais ele se afasta da sua função original. É difícil acreditar que a separação de Cornell seja realmente para melhorar sua função
As falas na declaração oficial e no FAQ (link) soam como o típico “texto para tranquilizar”
À pergunta “Que mudanças positivas os usuários podem esperar?”, a resposta provavelmente é apenas que veremos as mudanças negativas diretamente
Entendo a velocidade do campo de ML, mas o processo de peer review também tem muito valor. Em vez de abandoná-lo por completo, deveríamos reformá-lo
Seria ótimo se plataformas como o arXiv pudessem impulsionar uma reforma mais ampla na academia
Pesquisadores não se deixam enganar, mas o público em geral acredita com facilidade. Ultimamente há tantos documentos assim que fica a dúvida se o sistema de triagem do arXiv está funcionando direito
Houve críticas de que o salário de US$ 300 mil do novo CEO do arXiv seria alto, mas acho que, mesmo para uma entidade sem fins lucrativos, isso é necessário para atrair gente competitiva
A declaração oficial do arXiv pode ser lida aqui
Acho mais importante resolver o problema de indexação (ranking) do arXiv do que o de filtragem
Assim como o Google organizou a web caótica com o PageRank, fico pensando se não seria possível criar um sistema de ranking acadêmico baseado nas relações de citação entre artigos
Não deve ser um bloqueio total, e sim algo voltado a prevenir abuso. Fora isso, um sistema de ranking e tags conduzido pelos usuários parece mais desejável
Espelhar o arXiv não é tecnicamente difícil. O problema é levar os usuários junto
A academia é muito conservadora na adoção de novos sistemas, mas, se o arXiv realmente ficar inutilizável, no fim não haverá alternativa senão migrar para outra plataforma
O arXiv ainda continua sendo um simples repositório de PDFs, mas tem grande potencial para transformar a forma de compartilhar pesquisa
Sair da influência de uma universidade talvez seja até algo positivo. Mas o sucesso vai depender da capacidade da gestão
Sinceramente, não entendo bem por que o arXiv está se separando de Cornell. Não vejo qual “problema” precisaria ser resolvido
Fico pensando se uma instituição como a National Science Foundation (NSF) não poderia operar um site como o arXiv
Pesquisadores verificados poderiam fazer upload livremente, e quem atuasse como revisor poderia ganhar uma pontuação de confiança
O sistema de endorsement do arXiv é uma grande barreira para pesquisadores independentes
Sem e-mail institucional ou conexão com autores já existentes, não dá para publicar em certas áreas (cs.NE)
Se a independência for fortalecida, seria bom que o acesso de pesquisadores sem afiliação também melhorasse
Considerando que Cornell cobra US$ 50 mil por ano de mensalidade, o salário de US$ 300 mil do CEO nem parece tão grande
Vídeo relacionado: link do YouTube