- Um artigo recente da MIT Technology Review apresentou a ideia de comparar LLMs locais com a Wikipédia offline como backup
- Foi feita uma comparação direta entre os principais tamanhos de arquivo de modelos LLM da biblioteca Ollama e a capacidade dos pacotes de Wikipédia offline oferecidos pelo Kiwix
- Arquivos de LLM e dados da Wikipédia têm objetivos, pontos fortes e limitações diferentes, então é difícil fazer uma comparação simples, mas há diferenças interessantes em termos de tamanho
- Alguns LLMs (modelos de 1 a 4 GB) são maiores que a Wikipédia simples em inglês (cerca de 1 GB), e a Wikipédia completa (57 GB) é maior que LLMs grandes (20 a 32 GB)
- Além do tamanho dos arquivos, é preciso considerar fatores práticos como memória e requisitos de CPU, e a escolha pode variar conforme o uso real
Comparação entre LLMs locais e a Wikipédia offline
Introdução e motivação da comparação
- A MIT Technology Review publicou recentemente um artigo intitulado "How to run an LLM on your laptop"
- O artigo destaca que executar um LLM localmente em um ambiente offline permite aproveitar conhecimento mesmo sem conexão
- A analogia de Simon Willison foi marcante: "um LLM offline é como uma versão resumida e incompleta da Wikipédia; em um cenário apocalíptico, ter isso em um USB ajudaria a reinicializar a sociedade"
Comparação de tamanho entre modelos e dados
- Foram comparados vários modelos LLM da biblioteca Ollama com os tamanhos de arquivo dos pacotes de Wikipédia offline oferecidos pelo Kiwix
- Para a comparação, a análise foi limitada a modelos que podem rodar em hardware de consumo comum e a dados da Wikipédia sem imagens
- Os principais resultados da comparação são os seguintes:
- Os menores resumos
- Best of Wikipedia (50 mil principais, resumo): 356.9MB
- Simple English Wikipedia (resumo): 417.5MB
- Modelos LLM representativos (pequenos)
- Qwen 3 0.6B: 523MB
- Deepseek-R1 1.5B: 1.1GB
- Llama 3.2 1B: 1.3GB
- Modelos LLM representativos (médios e grandes)
- Deepseek-R1 8B / Qwen 3 8B: 5.2GB
- Gemma3n e4B: 7.5GB
- Deepseek-R1 14B: 9GB
- Qwen 3 14B: 9.3GB
- A Wikipédia completa
- Wikipedia (completa): 57.18GB
- Os 50 mil principais artigos da Wikipédia ocupam apenas 356.9MB
- O menor LLM (0.6B, Qwen) tem 523MB, portanto é maior que um resumo simples da Wikipédia
- A Wikipédia completa (57.18GB) é muito maior que o maior LLM (20GB)
Limitações da comparação e pontos a considerar
- A comparação direta é difícil: uma enciclopédia (dados) e um LLM (modelo generativo) têm propósitos e estruturas essencialmente diferentes
- O tamanho do arquivo não é o único fator importante: além do tamanho, LLMs exigem muita memória e recursos de CPU durante a execução. A Wikipédia offline é mais fácil de usar em dispositivos modestos
- Utilidade conforme o objetivo real de uso: por exemplo, é possível baixar apenas a área de química, ou usar um LLM otimizado para um hardware específico
- Subjetividade nos critérios de seleção: a escolha dos itens usados na comparação é subjetiva
Conclusão e implicações
- Os 50 mil principais artigos da Wikipédia e o modelo Llama 3.2 3B ficam em um nível semelhante em termos de tamanho de arquivo
- Os menores pacotes da Wikipédia são menores até que o menor LLM, enquanto o arquivo completo da Wikipédia é maior que o maior LLM
- Em ambientes com armazenamento suficiente, também vale considerar baixar e usar tanto LLMs quanto dados da Wikipédia
1 comentários
Comentários do Hacker News
gpgkeycomhttp, o que acabou abrindo uma brecha de segurança.wikipedia_en_all_maxi_2024-01.zim; quero extrair páginas comlibzime integrar com um LLM. O arquivo.zimarmazena páginas em HTML e tem cerca de 100 GB. A razão é que quero associar uma grande lista de jogos armazenada em HD (só títulos, sem categorias separadas) com artigos da Wikipédia para organizá-la por gênero e outras informações. Testando, vi que um LLM (Mistral Small 3.2 quantized) organiza surpreendentemente bem esse caos. Também dá para rodar isso rapidamente a partir de um script personalizado comllama.cpp.