2 pontos por GN⁺ 1 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Internet Archive Switzerland foi lançada como uma nova fundação suíça sem fins lucrativos com sede em St. Gallen, expandindo de forma independente a missão de “Universal Access to All Knowledge” no contexto nacional da Suíça
  • As atividades iniciais se concentram na preservação de arquivos em risco ao redor do mundo e na coleta em andamento de fluxos de IA generativa, começando a explorar formas de proteção antes da conferência da UNESCO em Paris, em novembro de 2026
  • A Internet Archive Switzerland conduz o projeto Gen AI Archive em parceria com a School of Computer Science da University of St. Gallen, sob liderança do Prof. Dr. Damian Borth
  • As duas partes pretendem iniciar o arquivamento de modelos de IA, abrindo uma nova fronteira na área de preservação
  • St. Gallen conta com 1.000 anos de tradição em arquivamento e estudos acadêmicos e um forte ambiente acadêmico, reforçando a visão de uma biblioteca digital mundial distribuída e resiliente junto com a Internet Archive, Internet Archive Canada e Internet Archive Europe

Lançamento e atividades iniciais

  • A Internet Archive Switzerland é uma fundação suíça sem fins lucrativos com sede em St. Gallen, que expande de forma independente, no contexto nacional da Suíça, o objetivo de “Universal Access to All Knowledge” apresentado por Brewster Kahle ao criar a Internet Archive há 30 anos
  • As atividades iniciais se concentram na preservação de arquivos em risco em todo o mundo e na coleta em andamento de fluxos de IA generativa
  • Antes da conferência da UNESCO prevista para novembro de 2026 em Paris, a organização entra em uma fase de medidas concretas para encontrar formas de proteger arquivos em risco

Gen AI Archive e preservação de modelos de IA

  • A Internet Archive Switzerland conduz o projeto Gen AI Archive em parceria com a School of Computer Science da University of St. Gallen
  • O projeto é liderado pelo Prof. Dr. Damian Borth
  • As duas partes pretendem iniciar o arquivamento de modelos de IA, o que se torna uma nova fronteira na área de preservação

Base em St. Gallen

  • St. Gallen é uma cidade com 1.000 anos de tradição em arquivamento e estudos acadêmicos, oferecendo uma base adequada para a próxima etapa da preservação digital
  • O forte ambiente acadêmico, incluindo a colaboração com a University of St. Gallen, oferece condições ideais para construir uma instituição de memória do século 21
  • Roman Griesfelder, executive director da Internet Archive Switzerland, afirma que em St. Gallen estabilidade e inovação atuam juntas, com uma compreensão profunda da importância do patrimônio cultural

Visão de uma biblioteca digital mundial distribuída

1 comentários

 
GN⁺ 1 시간 전
Comentários do Hacker News
  • O Internet Archive deveria seguir o modelo que a Usenet usava. A missão é a mesma, mas com propriedade diferente: várias organizações independentes distribuídas pelo mundo fazendo peering entre si, distribuindo para todas as outras o conteúdo que qualquer uma obtenha, sem criar um caminho técnico ou funcionalidade para repassar notificações DMCA e pedidos de remoção
    Pelo que sei, é assim que a pirataria na Usenet funciona. Se você envia material pirateado para um provedor, esse provedor o replica imediatamente para todos os outros provedores pareados, e isso se espalha recursivamente por toda a rede. Se algum provedor recebe uma notificação DMCA, ele apaga o arquivo por obrigação legal, mas não informa os outros provedores, então o arquivo continua disponível. Por isso, remover dados da rede fica muito mais difícil do que adicioná-los

    • Então era só usar BitTorrent
      A segurança pessoal só deve melhorar quando sairmos da “web aberta” e diversificarmos. É preciso multiplicar protocolos e redes com chaves pré-compartilhadas, fazendo com que as chaves sejam geradas juntas offline, para tornar o custo de operar sistemas de vigilância proibitivo
      Quando todo mundo coloca todos os ovos na cesta da web aberta e se reúne na praça pública, é como se uma única bomba pudesse atingir todos
    • Gosto da ideia em teoria, mas a IA hospeda mais de 175 PB de dados. Fico me perguntando quantos outros provedores conseguiriam replicar isso
  • Post de blog relacionado: https://blog.archive.org/2026/05/06/internet-archive-switzer...
    Diz que “o Internet Archive Switzerland se junta a um grupo de organizações com missão compartilhada ao lado do Internet Archive, do Internet Archive Canada e do Internet Archive Europe. Juntas, essas bibliotecas independentes fortalecem a visão comum de uma biblioteca digital global distribuída e resiliente”

    • Eu também estava curioso sobre as outras organizações, mas https://www.internetarchive.eu parece mais um site institucional corporativo do que qualquer outra coisa. Tem imagem hero, propaganda de IA, carrossel de notícias que não rola sem animações lentas, uma enorme seção de “equipe” com fotos de rosto e apresentações entediantes, links para redes sociais, formulário de inscrição em newsletter, e nada de mostrar onde está o arquivo de fato
  • Esse site está penando bastante. Dá uma vontade enorme de ir ver num espelho do archive.org :)
    Isso parece bem separado do Internet Archive dos EUA, e fico curioso sobre o quanto essa separação é real
    Quando trabalhei no Internet Archive Canada em 2024, tecnicamente era uma organização independente e acho que alguns diretores se sobrepunham, mas na prática a operação parecia uma subsidiária. Usávamos o mesmo Slack, o mesmo domínio de e-mail archive.org etc.
    O conselho da IA.ch inclui Brewster e Caslon
    Dadas as ameaças políticas desta década, parece que as várias organizações do Internet Archive deveriam começar a operar de forma mais independente, especialmente em termos de captação de recursos

    • Fico até um pouco surpreso que usem Slack. Por outro lado, uma vantagem seria que isso elimina uma preocupação com disponibilidade
    • Você pode contar mais sobre como foi trabalhar na organização canadense? Parece que houve uma confusão bem grande alguns anos atrás, mas nunca ficou claro o que eles realmente fazem
  • Na seção About Us está escrito: “Somos uma equipe de mudança que acredita que toda ajuda pode criar uma criança e um futuro melhor”
    Achei estranho, então pesquisei essa frase e ela aparece igual em vários sites, o que é ainda mais estranho. Seria algum tipo de texto de template? A seção Contact também parece provisória e malfeita, com endereço no estilo “123 Fifth Avenue, NY”

    • Sinceramente, isso não inspira muita confiança
  • Não consigo encontrar o arquivo de verdade. Antes de chegar à décima frase já mencionam arquivo de IA e colocam alguns links, mas não parece haver nenhum conteúdo realmente preservado

  • O arquivo físico de Sankt Gallen também vale a visita: https://www.stiftsbezirk.ch/de/stiftsbibliothek/

  • Se você está tocando isso e está lendo este texto, o certo é simplesmente fazer a coisa certa e usar seu próprio nome

  • Legal, até a velocidade de carregamento da página está espelhando o Internet Archive

  • Em vez de reclamar da disponibilidade, é melhor criar uma solução
    Afinal, até o tpb dot org ainda consegue existir
    No mínimo, essas pessoas tentaram. Precisamos de uma solução de arquivamento P2P o mais rápido possível, antes que nossa história seja completamente reescrita de novo