O último esforço desesperado do Internet Archive para sobreviver em um momento decisivo
(lunduke.locals.com)- O Internet Archive apresentou sua réplica final no recurso de Hachette v. Internet Archive, mas há avaliações de que a resposta aos pontos centrais foi fraca, o que faz parecer maior a chance de derrota
- No centro do processo estão o Controlled Digital Lending, que empresta arquivos criados a partir da digitalização de livros físicos, e a National Emergency Library, que em 2020 removeu essas limitações
- A decisão de 2023 entendeu que não havia precedente nem princípio jurídico que sustentasse a defesa de uso justo (Fair Use) do Internet Archive, e a peça final do recurso também parece ter dificuldade para reverter isso
- O Internet Archive destaca os direitos digitais das bibliotecas e a questão da propriedade e do empréstimo de e-books, mas o ponto real da decisão está mais próximo de reprodução e distribuição não autorizadas
- Se a decisão anterior for mantida, podem vir pedidos de indenização, remoção de conteúdos com status de copyright incerto, maior vigilância sobre outros projetos de arquivo e o peso de novos recursos
O ponto de partida do processo: Controlled Digital Lending
- O Internet Archive é um serviço que vem arquivando e indexando materiais culturalmente importantes, de páginas da web a artigos de revistas antigas
- Hachette v. Internet Archive é o processo em torno do programa de Controlled Digital Lending (CDL) do Internet Archive
- O CDL funciona escaneando livros físicos, transformando-os em arquivos digitais e depois emprestando-os a usuários da internet
- Em 2020, sob o nome de National Emergency Library, removeu as restrições anteriores de empréstimo digital e passou a permitir downloads ilimitados de cópias digitais de livros
- As editoras apontam dois problemas
- que os livros foram digitalizados e distribuídos sem autorização dos detentores dos direitos autorais
- que houve recebimento de compensação financeira, como doações, ao distribuir gratuitamente materiais protegidos por copyright
A decisão de 2023 e o estágio atual do recurso
- A decisão de 2023 foi desfavorável ao Internet Archive, e o tribunal entendeu sobre a defesa de uso justo que “no case or legal principle supports”
- O Internet Archive recorreu dessa decisão e, em 19 de abril, apresentou sua réplica final no recurso
- O PDF da peça final do recurso foi publicado no Archive.org
- Lunduke considera que, ao ler os documentos públicos, é difícil evitar a conclusão de que o Internet Archive tem grande chance de perder o recurso
A lógica de defesa da peça final e suas fragilidades
- A defesa básica do Internet Archive é que o CDL se enquadra em uso justo, e portanto seria legal
- A peça afirma que “Controlled digital lending is not equivalent to posting an ebook online for anyone to read”
- No entanto, em 2020 a National Emergency Library de fato colocou online um grande acervo de livros para que qualquer pessoa pudesse ler
- Como o próprio Internet Archive divulgou isso em material promocional na época, essa alegação parece difícil de convencer o tribunal
- Outro argumento é que operar um sistema de empréstimo legalmente controlado exige grande investimento, então reconhecer o uso justo não causaria consequências catastróficas aos titulares dos direitos
- Lunduke interpreta isso como a lógica de que “deveria ser permitido porque custa muito dinheiro criar e distribuir cópias digitais sem a permissão dos detentores dos direitos autorais”
- Ele também avalia que os outros argumentos da peça, ao longo de suas 32 páginas, têm pouca relação com o núcleo do processo e da decisão
O enquadramento em direitos das bibliotecas e o ponto real da decisão
- Em uma declaração pública, o fundador do Internet Archive, Brewster Kahle, descreve a questão como uma luta pelos direitos das bibliotecas na era digital
- Ele afirma que bastaria vender e-books às bibliotecas para que elas pudessem possuí-los, preservá-los e emprestá-los para uma pessoa por vez
- Mas essa solução não trata diretamente do cerne do caso, que é a digitalização e distribuição não autorizadas de livros físicos
- O ponto central da decisão real é mais próximo do seguinte entendimento
- o fato de um livro impresso protegido por copyright ter sido adquirido legalmente não cria o direito de fazer cópias sem autorização e distribuí-las no lugar do exemplar impresso
- mesmo que o livro impresso não seja emprestado ao mesmo tempo, não há precedente nem princípio jurídico que sustente essa lógica
- Portanto, a solução de mensagem pública de “vender e-books para bibliotecas” não se conecta diretamente à base central dessa decisão
O debate separado sobre bibliotecas e publicação
- Lunduke entende que alguns pontos levantados pelo Internet Archive merecem reflexão por si só
- O comunicado do Internet Archive sobre o recurso afirma que o modelo de negócio baseado apenas em licenciamento das editoras e sua estratégia judicial limitam a capacidade de empréstimo digital das bibliotecas e perpetuam a desigualdade no acesso ao conhecimento
- Como pontos legítimos de debate, são apresentados os seguintes
- as bibliotecas deveriam poder emprestar edições digitais oficiais?
- editoras, autores e detentores de copyright deveriam ser obrigados a fornecer versões digitais às bibliotecas?
- se uma obra digital emprestada por uma biblioteca for copiada e distribuída além dos direitos concedidos, quem deve ser responsabilizado?
- bibliotecas ou editoras deveriam poder censurar ou modificar obras digitais?
- Campanhas como Battle for Libraries também levantam essas questões
- Ainda assim, essas perguntas devem ser diferenciadas do objeto direto da decisão em Hachette v. Internet Archive
Possíveis efeitos se a decisão for mantida
- Se a decisão anterior for mantida, a situação financeira do Internet Archive pode se tornar instável
- editoras, autores e detentores de copyright cujas obras foram distribuídas poderão buscar indenização por danos
- Também pode ser necessário remover outros conteúdos com status de copyright duvidoso
- são citados como exemplos arquivos de software, vídeo e áudio
- Outros projetos de arquivamento também podem passar a receber vigilância maior, e arquivar e distribuir diferentes tipos de materiais pode se tornar mais arriscado
- O Internet Archive ainda pode tentar recorrer a uma corte superior, mas a avaliação é de que isso talvez não seja fácil
- Não dá para descartar completamente uma vitória no recurso, mas Lunduke considera essa possibilidade baixa
1 comentários
Opiniões no Hacker News
Minha esposa é bibliotecária, e o ponto central que todo mundo aqui está evitando é que os usuários estão migrando para uma preferência por distribuição digital
Mas o uso justo não acompanhou isso, e as bibliotecas acabam gastando uma grande parte do orçamento operacional para “alugar” e-books das editoras. O preço é muito mais alto que o de livros em papel, e o aluguel normalmente permite apenas 4 a 6 empréstimos, depois dos quais é preciso renovar por 2 a 3 vezes o preço de um livro físico. É abertamente predatório
A IA pode ter passado dos limites desta vez, e também acho que talvez ela não deva vencer, mas é um desafio jurídico importante. Mesmo que perca, espero que a opinião pública se mova um pouco na direção de um uso justo de verdade
Como alguém que, quando criança, não tinha condições de ler livros se não os pegasse emprestados na biblioteca, acho decepcionante haver tão pouca discussão sobre isso. É correto dizer que, se fossem propostas hoje, as bibliotecas não poderiam existir, e isso mostra o problema fundamental da legislação
Ela está fazendo algo razoável, valioso e que dificilmente se pode dizer que esteja claramente proibido; então me pergunto por que deveria perder
Para isso, parece necessário que as bibliotecas tenham a doutrina da primeira venda aplicada a e-books, além de mecanismos que legalizem explicitamente a distribuição e o uso não infrator de tecnologias de cópia e conversão digital que tenham usos substanciais não infratores, como no domínio analógico de copiadoras e videocassetes
Mesmo com bibliotecas sendo claramente legais hoje, os titulares de direitos as veem como vendas perdidas e tentam torná-las ilegais tanto quanto possível
Se eu pudesse mudar uma única coisa nos direitos autorais, não seria o prazo, mas o tratamento das obras digitais. Precisamos acabar com essa farsa de que o digital não é comprado, apenas alugado, e de que o direito contratual se sobrepõe a tudo. Se vendas digitais forem tratadas como vendas, a doutrina da primeira venda poderá funcionar, e espero ver tentativas de contorná-la, como as dos fabricantes de impressoras, continuarem ouvindo “não” da SCOTUS
As práticas de empréstimo de e-books são realmente péssimas e predatórias, a ponto de eu não querer comprar e-books a menos que sejam de algumas editoras realmente comprometidas com e-books sem DRM
No caso dos e-books, piratas podem prestar o serviço de biblioteca pública
A National Emergency Library foi claramente um grande erro, e é surpreendente que a IA continue a defendê-la
O problema é que o empréstimo de livros online está longe de ser a parte mais importante do Internet Archive. Mas, ao continuar brigando por isso, ela cria o risco de perder o arquivo inteiro
O Internet Archive se tornou, na prática, o lugar padrão para publicar coisas raras, importantes e valiosas, e, se ele ruir, uma quantidade imensa de história pode desaparecer de repente
A conduta questionada já foi interrompida, e eles também obtiveram uma decisão impedindo sua repetição. Se a Hachette desistir de executar a decisão e as duas partes retirarem os recursos, ninguém perde
Os donos da Hachette veem uma oportunidade de destruir um bem público e estão agindo. O vilão que tenta arruinar algo que você considera valioso não é a IA, é a Hachette
Ele também inclui software para rastrear coleções do Internet Archive e armazená-las em um servidor local
[0] https://archive.org/about/offline-archive
[1] https://github.com/internetarchive/dweb-mirror
Se perder essa luta, cria-se um precedente de que a conversão de formato de cópias de mídia adquiridas legalmente não é protegida por uso justo, o que pode ser desastroso para todos os tipos de esforços de preservação no futuro
Ele é sobre o que a IA chama de Controlled Digital Lending, algo que ela fazia antes da emergência, continuou fazendo depois e ainda faz hoje. A ideia é que, se houver um exemplar físico de um livro, ela possa emprestar uma cópia digital em uma proporção de 1:1
A National Emergency Library, na prática, não era controlada e também “emprestava” digitalmente livros dos quais não tinha exemplares físicos. Mas não há processo sobre essa parte. Provavelmente porque ela foi encerrada e, se as editoras insistissem nisso agora, a opinião pública seria desfavorável. Isso pode ter sido o que desencadeou a ira das editoras, mas acho que um processo contra o Controlled Digital Lending acabaria vindo de qualquer forma
O título é “Um último esforço para se salvar”, e o subtítulo é “As coisas não parecem boas para o arquivista da internet”, mas não diz o que de fato aconteceria com o IA se ele perdesse o processo.
Como no título e no subtítulo, a questão central é se isso é uma ameaça à existência da instituição, mas essa explicação falta, o que é decepcionante. Se aceito as duas premissas de que o IA é importante e de que é provável que perca, isso é a única coisa que me importa.
Encontrei a resposta. Segundo a Wikipedia, em agosto de 2023, oito meses atrás, as duas partes já haviam chegado a um acordo para limitar os custos potenciais a um nível que o IA pudesse arcar, e o tribunal também aprovou o acordo.
Vi isso em outro comentário <https://news.ycombinator.com/item?id=40203627>, quase no fim da thread. Talvez tenha ficado enterrado porque à primeira vista parecia uma parede de texto, mas a informação mais importante está logo no começo.
Espero que a apelação não piore a situação mais do que já está. Parece que em breve voltará a ser um bom momento para doar ao IA. Basta confirmar que o IA sobreviveu, que os autores não têm mais o que levar, e então apoiar as operações regulares e torcer para que não surjam mais ideias de “emergência”.
Isso não é uma ameaça à existência do IA, e o pagamento já foi acordado. A cobertura deste caso é extremamente sensacionalista.
Já há um processo da indústria de editoras musicais que corre o risco de destruir o Great 78 Project, e imagino que a indústria de videogames também esteja preparando seu próprio processo.
Acho o processo musical ainda mais duvidoso. Muitas das gravações digitalizadas foram originalmente publicadas antes de 1928 e, em tese, deveriam estar em domínio público. As editoras argumentam que a proteção autoral continua porque ainda vendem versões modernas dessas gravações, mas, se o IA as obteve de mídias produzidas antes de 1928, não vejo como essa lógica se sustenta. Dito isso, como é um país dominado por empresas, também é possível que o IA acabe levando a pior para agradar aos patrocinadores corporativos.
Como o processo das editoras de livros está perto do fim e houve muito pouco protesto público significativo, veremos mais processos de outros setores que se sintam prejudicados pelo Internet Archive. O que considero inevitável é um processo da indústria de publishers de videogames. Nos últimos dez anos mais ou menos, o Archive.org virou um hub para hospedar ROMs de praticamente todas as plataformas de videogame. O IA, em certa época, removia rapidamente coisas como conjuntos de ROMs do REDUMP, mas com o tempo parece ter passado a aceitar hospedá-las. É difícil entender por que achou que isso era uma boa ideia ou necessário. Jogos retrô já não são mais um hobby de nicho, mas um negócio de bilhões de dólares, e o IA se colocou bem no meio do alvo. Empresas de games estão entre as mais litigiosas do planeta.
O problema ainda maior é que esses arquivos não estão em risco nenhum. Arquivos de jogos lançados comercialmente para plataformas lançadas comercialmente estão literalmente hospedados em 10.000 sites, e esses sites são lucrativos por causa de anúncios; se recebem uma notificação de cease and desist, podem se desmontar rapidamente e ressurgir dez dias depois com outro nome e um layout um pouco diferente. O IA não tem esse luxo.
[1] [2] https://old.reddit.com/r/DataHoarder/comments/1bswhdj/if_the...
Discussão relacionada: https://news.ycombinator.com/item?id=39908676
Independentemente dos méritos jurídicos do caso do Internet Archive ou da negação da Hachette Book Group, pela lógica e pelas declarações públicas da Hachette, parece que o que eles mais gostariam é que as bibliotecas públicas em si desaparecessem e que o uso justo fosse apagado da lei.
Seja qual for a lei, o Internet Archive e outras bibliotecas deveriam poder emprestar uma cópia digital de um livro físico que possuem quando esse livro físico não estiver em uso. Ou seja, o empréstimo digital controlado deveria ser permitido, especialmente no caso de livros que não têm uma edição digital oficial.
O motivo pelo qual a Hachette não quer isso é que deseja continuar cobrando assinaturas de catálogos digitais e extrair o máximo possível de receita das bibliotecas.
Sempre achei frágil o argumento do IA de que os empréstimos ilimitados da National Emergency Library eram uso justo, mas ainda assim é uma pena que esse argumento tenha fracassado, e acho que o precedente criado por esse fracasso é muito pior para a sociedade do que teria sido o precedente caso ele tivesse vencido.
“O ponto central da defesa de uso justo do Internet Archive é que, se você possui um livro impresso protegido por direitos autorais e adquirido legalmente, passa a ter o direito de fazer uma cópia sem permissão e distribuí-la no lugar do livro impresso, desde que não empreste o livro impresso ao mesmo tempo. Mas nenhuma jurisprudência ou princípio jurídico sustenta esse argumento. Todas as autoridades apontam na direção contrária.”
Para começar, não entendo por que isso não seria sustentado. Por que não seria permitido distribuir esse livro digitalmente em uma proporção de 1:1?
Em segundo lugar, este caso não está sendo litigado justamente para criar esse precedente?
Em especial, a alínea (g) é importante. Ela afirma que é ilegal distribuir simultaneamente, várias vezes, uma única cópia permitida por essa lei.
Há algo que me surpreendeu ao ver as pessoas defendendo o IA. Olhando para os fatos e deixando de lado por um momento o bom trabalho que eles fazem em outras áreas, fica claro que o IA não só infringiu a lei como desrespeitou a lei abertamente
Ainda assim, muita gente gosta tanto das outras coisas que o IA faz e não quer que ele desapareça que saiu rapidamente em sua defesa
O IA fez bem em usar sua plataforma para tentar impulsionar uma mudança real e, no processo, assumiu riscos para si mesmo e para sua operação
“Temos a obrigação moral de desobedecer leis injustas” —MLKJ
É muito fácil encontrar coisas como o conjunto completo de ROMs do MAME [1], ROMs de Super Mario Odyssey e Super Mario Wonder [2], a 1ª temporada completa de Hilda da Netflix [3], grandes coleções de jogos de PS4 [4]
Para deixar claro, quase não exigiu esforço. Pesquisei “Internet Archive PS4” no Kagi e encontrei em cerca de 4 segundos; dá para encontrar praticamente qualquer mídia desse jeito
O IA precisa lidar com esse problema. O fato de essas empresas tomarem medidas legais não é uma questão de “se”, mas de “quando”, e é difícil imaginar um futuro em que o IA vença. É um alvo enorme e muito exposto ao público, e as leis relacionadas a arquivamento de dados também têm limites
[1] https://archive.org/details/mame-merged
[2] https://archive.org/download/street-fighter-30th-anniversary...
[3] https://archive.org/details/hilda-season-complete-episodes
[4] https://archive.org/download/CG_Sony_PlayStation_4
Provavelmente havia muitas reações do tipo “eu realmente gosto das outras coisas que o IA faz”, mas lembro que geralmente vinham seguidas de algo como “mas que diabos é essa assunção de risco?”
Eu queria criar um software livre e open source capaz de distribuir grandes datasets
Ele funcionaria como um enxame de torrents, mas o Internet Archive, no papel de “tracker”, decidiria o que cada pessoa armazenaria. Normalmente, o conteúdo mais raro seria armazenado primeiro; se o usuário configurasse “vou doar 2 TB de espaço para o Internet Archive”, o IA baixaria os arquivos que julgasse estar em maior risco de serem perdidos
Outra vantagem é que, mesmo se o IA sair do ar, o público poderia reconstruir parte do dataset a partir desse enxame
Perguntei a algumas organizações de preservação se isso seria útil, mas não houve muito interesse. Infelizmente, agora imagino que muita gente gostaria de doar espaço em disco
Fazendo cada host que afirma ter o arquivo calcular hash(prefix+content), distribuindo k prefixos diferentes para cada cliente e comparando os resultados, seria possível obter prova de que pelo menos certo número de cópias existe
O BitTorrent não oferece esse recurso por padrão
A ideia é coordenar o armazenamento dos pedaços mais raros? O BitTorrent já não prioriza, por padrão, os pedaços menos comuns dentro do enxame?
Muitos clientes suportam baixar torrents a partir de feeds, mas não há sinalização de substituição ou exclusão
No futuro distante, espero que o IA seja distribuído por muitos nós de usuários individuais, mas agora isso parece pouco realista
O que é necessário imediatamente é que 2 a 4 pessoas ou empresas influentes criem espelhos locais. Seria bom se o IA colaborasse na construção deles
Essas organizações de espelho precisam estar distribuídas pelo mundo, em jurisdições diferentes, e refletir as lições negativas aprendidas com o IA. Por exemplo, seria melhor que a parte de oferta de dados juridicamente instável fosse uma entidade jurídica diferente da organização dona do espaço de servidores
Essa resiliência é absolutamente necessária, e é necessária agora. Caso contrário, esta era será chamada no futuro de idade das trevas digital, porque pouca informação terá sobrevivido para escapar dela
Alguém nesta thread estimou cerca de US$ 2 milhões em hardware, US$ 1 milhão para instalações e uma equipe pequena para a implantação inicial, além dos custos de conectividade e manutenção. Dá para estimar US$ 4 milhões iniciais e cerca de US$ 1 milhão por ano. Uma pessoa rica poderia bancar um site; não precisa ser “superbilionária”, basta ter certa folga financeira
Se você se encaixa nesses critérios e é altruísta, ou está procurando um legado duradouro que ajude a humanidade no futuro distante, seria ótimo se usasse parte do seu capital para tornar isso realidade
Há muito sentimento aqui que iguala, sem crítica, “o que é certo” e “a lei”
Quase certamente eles não vão vencer. Até para um leigo como eu, parece que infringiram a lei. Mas isso não significa que a lei seja correta
O motivo para se opor à decisão do IA é que foi uma burrice amarrar a existência contínua do Archive a uma ação de protesto projetada para fracassar
Protestar contra leis injustas é recomendável, mas, se você projeta um protesto que é intrinsecamente impossível de vencer de modo que ele derrube junto uma infraestrutura importante, as pessoas inevitavelmente vão ficar irritadas. Não se deve transformar algo de que as pessoas dependem em dano colateral
Fico curioso sobre qual seria o pior resultado se perdessem na apelação
O Internet Archive poderia fechar as portas ou sofrer um impacto grave em sua capacidade de operação?
Se a indenização legal por violação intencional for de US$ 150 mil por livro, isso dá US$ 19 milhões, excluindo indenizações punitivas. Isso representa a maior parte da receita anual e equivale a alguns anos de lucro líquido: https://apps.irs.gov/pub/epostcard/cor/943242767_202112_990_...
O risco real são os outros processos que este caso pode atrair. Como o Internet Archive fez a mesma coisa com outros 1,4 milhão de livros, se todo mundo entrar na disputa, a responsabilidade potencial pode chegar a bilhões de dólares
Não me surpreenderia se outras indústrias, como a de games, entrassem com processos em seguida
Há mais detalhes neste post: https://old.reddit.com/r/DataHoarder/comments/1bswhdj/if_the...
Discussão relacionada: https://news.ycombinator.com/item?id=39908676