5 pontos por GN⁺ 2026-03-21 | 1 comentários | Compartilhar no WhatsApp
  • O pioneiro servidor de preprints ArXiv.org, fundado em 1991, passará em 1º de julho a ser uma entidade sem fins lucrativos independente da Cornell University
  • Com a independência, pretende ampliar a base de doadores e reforçar a equipe técnica, respondendo ao forte aumento no volume de submissões, que chega a 300 mil por ano, e ao problema de artigos ruins gerados por IA (AI slop)
  • Nos últimos dois anos, a pressão financeira aumentou com déficits operacionais e um aumento de 50% nas submissões; em 2025, a Cornell forneceu US$ 297 mil para cobrir o déficit e US$ 819 mil em apoio em espécie
  • O fundador Paul Ginsparg apontou que universidades têm dificuldade para manter infraestrutura global de pesquisa no longo prazo e afirmou que a independência é essencial para garantir a sustentabilidade
  • A medida é semelhante aos casos de independência do bioRxiv e medRxiv, e o ArXiv começa em situação de estabilidade financeira inicial, com recursos garantidos para operar nos próximos anos

Decisão de independência do ArXiv

  • O ArXiv.org começou em 1991 como uma plataforma rápida e gratuita de publicação de preprints científicos e foi hospedado pela Cornell University por mais de 20 anos
  • A partir de 1º de julho, passará a ser uma organização sem fins lucrativos independente, e a nova entidade está recrutando um novo CEO
  • Greg Morrisett, vice-reitor da Cornell Tech, explicou que a independência ajudará a atrair mais doadores e ampliar a infraestrutura técnica
    • Neste ano, são esperados mais de 300 mil preprints publicados
    • Também são necessários recursos para enfrentar o problema dos artigos ruins escritos por IA (AI slop)

Estrutura financeira e pressão de crescimento

  • Desde 2022, as submissões de artigos aumentaram 50%, e o quadro de funcionários foi ampliado para 27 pessoas
  • Em 2025, houve um déficit de US$ 297 mil, coberto pela Cornell
    • A Cornell também forneceu US$ 819 mil em apoio em espécie
    • O custo operacional anual do ArXiv é de cerca de US$ 6,7 milhões
  • Mais de 270 instituições pagam anuidade para apoiar o ArXiv
    • Algumas instituições pagam até US$ 10 mil por ano
    • As instituições-membro têm direito de participação operacional e acesso a dados de uso
  • Entre os principais apoiadores estão a Simons Foundation e a Schmidt Sciences, que recentemente financiaram melhorias tecnológicas

Contexto por trás da independência

  • Havia também competição por recursos dentro da Cornell Tech, e alguns grupos demonstravam preocupação com a influência excessiva da Cornell
  • Morrisett, a liderança do ArXiv e os doadores concluíram que a independência era a melhor forma de diversificar e ampliar o financiamento
  • O fundador Paul Ginsparg também recomendou a independência
    • Ele observou que universidades não têm experiência suficiente em oferecer infraestrutura global de pesquisa no longo prazo
    • A Cornell tinha capacidade limitada de contratar desenvolvedores de software, e o site ainda mantinha uma forma simples
  • A Cornell e a Simons prepararam recursos para estabilidade financeira inicial, para que o ArXiv comece sem déficit
    • No curto prazo, não há plano de aumentar a taxa de adesão

Reações e preocupações no meio acadêmico

  • Alguns cientistas expressaram preocupação com a possibilidade de comercialização e com o salário de US$ 300 mil do novo CEO
    • O ArXiv disse não concordar com essas preocupações
  • Ginsparg afirmou entender essas preocupações, mas observou que a operação do ArXiv sempre esteve sobre uma base financeira instável
    • Ele comparou a situação ao filme de 1914 Perils of Pauline, dizendo que “sempre foi uma situação precária”

Papel do fundador Ginsparg e planos futuros

  • Ginsparg continua sendo professor da Cornell e segue participando da operação do ArXiv
  • Ele lidera o ArXiv há 35 anos, mas vem reduzindo gradualmente seu papel e considerando a aposentadoria
  • Mesmo após o lançamento da nova organização sem fins lucrativos, ajudará na adaptação inicial, mas planeja transferir o comando a um sucessor no longo prazo

Comparação com outros servidores de preprints

  • A independência do ArXiv é semelhante ao caso em que bioRxiv e medRxiv se tornaram independentes do Cold Spring Harbor Laboratory e foram transferidos para o openRxiv
  • As três plataformas buscam garantir sustentabilidade por meio de uma estrutura independente e sem fins lucrativos

1 comentários

 
GN⁺ 2026-03-21
Opiniões no Hacker News
  • O anúncio recente de que o arXiv passará a rejeitar artigos de revisão e position papers parece um sinal de que a plataforma está ficando cada vez mais voltada a “opiniões”
    Originalmente, o arXiv era apenas um serviço de hospedagem de PDFs, com o papel de oferecer o mínimo de confiabilidade para que um artigo pudesse ser citado antes da publicação formal
    Mas, com o tempo, especialmente em ML, o próprio arXiv acabou virando uma espécie de local oficial de publicação (venue)
    Acho que, quanto maior o poder do arXiv, mais ele se afasta da sua função original. É difícil acreditar que a separação de Cornell seja realmente para melhorar sua função
    As falas na declaração oficial e no FAQ (link) soam como o típico “texto para tranquilizar”
    À pergunta “Que mudanças positivas os usuários podem esperar?”, a resposta provavelmente é apenas que veremos as mudanças negativas diretamente

    • Na física, especialmente na área teórica, já é prática antiga subir um rascunho no arXiv, receber feedback e revisá-lo. Não é um problema só de ML
    • Também penso de forma parecida. Do ponto de vista de quem usa ML, mas não é da área, existe um choque entre quem acredita que só o arXiv já basta e quem ainda acha que apenas a publicação formal em periódico é pesquisa de verdade
      Entendo a velocidade do campo de ML, mas o processo de peer review também tem muito valor. Em vez de abandoná-lo por completo, deveríamos reformá-lo
      Seria ótimo se plataformas como o arXiv pudessem impulsionar uma reforma mais ampla na academia
    • A frase “quanto menos poder o arXiv tiver, melhor ele cumpre sua função” lembra o “princípio do menor poder” (rule of least power) (link da wiki)
    • Tendo passado pelo processo de publicação, a publicação em periódicos tradicionais está cada vez mais cansativa, com taxas altas, UI ruim e revisões sem sentido. Por isso, parece melhor simplesmente publicar no arXiv e encerrar por aí
    • Hoje em dia também aparecem no arXiv artigos fraudulentos na área de saúde e suplementos. Há casos de gente subindo artigos falsos feitos com ChatGPT e promovendo isso como “pesquisa publicada”
      Pesquisadores não se deixam enganar, mas o público em geral acredita com facilidade. Ultimamente há tantos documentos assim que fica a dúvida se o sistema de triagem do arXiv está funcionando direito
  • Houve críticas de que o salário de US$ 300 mil do novo CEO do arXiv seria alto, mas acho que, mesmo para uma entidade sem fins lucrativos, isso é necessário para atrair gente competitiva

    • Fora dos EUA, US$ 300 mil parece um valor absurdamente alto. A estrutura salarial dos EUA é anormalmente elevada
    • Considerando a influência global do arXiv, na verdade parece até baixo. Mas também é preciso levar em conta o nível salarial dos outros funcionários
    • Fora do Vale do Silício, certamente é um valor alto. O arXiv não é uma organização cujo objetivo seja maximizar valor para acionistas, então compensações excessivas são desnecessárias
    • É problemático quando uma organização sem fins lucrativos cria um “cargo confortável” desperdiçando doações. No fim, o arXiv é só uma pasta na nuvem, então é difícil justificar um salário tão alto
    • O CEO não precisa necessariamente ser alguém do nível de um professor titular perto da aposentadoria. É só um repositório de preprints
  • A declaração oficial do arXiv pode ser lida aqui

    • Esse link é mais importante do que a matéria original. O conteúdo da matéria foi escrito com base no anúncio da vaga para CEO
  • Acho mais importante resolver o problema de indexação (ranking) do arXiv do que o de filtragem
    Assim como o Google organizou a web caótica com o PageRank, fico pensando se não seria possível criar um sistema de ranking acadêmico baseado nas relações de citação entre artigos

    • Concordo. Se o arXiv virar um periódico que barra artigos, ele perde sua razão de existir. Ainda assim, com a enxurrada atual de artigos spam gerados por LLM, algum nível mínimo de filtragem é necessário
      Não deve ser um bloqueio total, e sim algo voltado a prevenir abuso. Fora isso, um sistema de ranking e tags conduzido pelos usuários parece mais desejável
    • O próprio PageRank foi originalmente inspirado na bibliometria (bibliometrics), mas o ranking acadêmico atual já está distorcido. Não dá para resolver isso apenas ajustando ranking
    • Como referência relacionada, recomendo readabstracted.com
  • Espelhar o arXiv não é tecnicamente difícil. O problema é levar os usuários junto
    A academia é muito conservadora na adoção de novos sistemas, mas, se o arXiv realmente ficar inutilizável, no fim não haverá alternativa senão migrar para outra plataforma
    O arXiv ainda continua sendo um simples repositório de PDFs, mas tem grande potencial para transformar a forma de compartilhar pesquisa
    Sair da influência de uma universidade talvez seja até algo positivo. Mas o sucesso vai depender da capacidade da gestão

  • Sinceramente, não entendo bem por que o arXiv está se separando de Cornell. Não vejo qual “problema” precisaria ser resolvido

    • O motivo está explicado com clareza na matéria
    • Acho que o problema mencionado no sexto parágrafo realmente precisa ser resolvido
  • Fico pensando se uma instituição como a National Science Foundation (NSF) não poderia operar um site como o arXiv
    Pesquisadores verificados poderiam fazer upload livremente, e quem atuasse como revisor poderia ganhar uma pontuação de confiança

    • Vendo os cortes no financiamento da ciência nos últimos anos, talvez seja até melhor que uma infraestrutura essencial como o arXiv não seja operada diretamente pelo governo
    • Um modelo de operação delegada pelo governo também seria possível, como no caso em que o NIST opera o repositório CVE por meio da MITRE
  • O sistema de endorsement do arXiv é uma grande barreira para pesquisadores independentes
    Sem e-mail institucional ou conexão com autores já existentes, não dá para publicar em certas áreas (cs.NE)
    Se a independência for fortalecida, seria bom que o acesso de pesquisadores sem afiliação também melhorasse

  • Considerando que Cornell cobra US$ 50 mil por ano de mensalidade, o salário de US$ 300 mil do CEO nem parece tão grande

    • Pelos padrões de Nova York, o valor real de US$ 300 mil é baixo
    • Vendo o nível atual das mensalidades universitárias, dá para perceber o quão irreal esse valor se tornou
  • Vídeo relacionado: link do YouTube