Dicas de busca na internet
(gwern.net)-
Um resumo, do básico às principais dicas, para buscar na internet informações como artigos, páginas da web e livros
-
Um texto escrito por Gwern Branwen*, que considero o melhor entre sites pessoais. Como trouxe apenas uma parte, recomendo fortemente ver o original
[ Busca de artigos ]
-
Sintaxe de busca: operadores booleanos, principais comandos do Google (
"para correspondência exata, hífen para negação/exclusão,site:para buscar em um site específico ) -
Configurar hotkeys para buscas rápidas: AutoHotkey, Quicksilver, XMonad etc.
-
Atalhos do navegador: C-l, C-PgUp/C-PgDwn, C-w, C-t/C-T, M-[1–9]
-
Ao pesquisar no Google Scholar, ver em HTML
-
Dicas para buscar títulos de artigos
→ cortar o título para reduzir os resultados, ou usar AND/OR e -
→ tentar adicionar/remover o ano..
→ usar o intervalo de datas do Google
→ adicionar site:archive.org para buscar no Internet Archive
- Casos difíceis
→ citações reversas (Reverse Citations): ver "related articles" e "cited by" no Google Scholar
→ dissertações/teses: ProQuest
→ busca reversa por imagem: usar Google Images, TinEye, Yandex
- Dicas de busca por domínio
→ Twitter: também aparece no Google, mas se você souber informações adicionais, a busca avançada do Twitter também é excelente (from:, to:, since:, until:, near:, url: ..)
→ tribunais federais dos EUA: precisa criar conta no Pacer. É pago ($0.1/página), mas fica grátis se o total for abaixo de $15. Também existe um espelho público chamado Recap. Há ainda extensão de navegador do Recap
→ biblioteca Wellcome: tem muitas revistas/livros antigos. Como o SEO é péssimo, não aparece bem no Google etc., então vale olhar com atenção
→ revistas antigas: site:pdf-giant.net, e para buscas relacionadas a educação, ERIC ( site:eric.ed.gov )
- Lidando com paywall
→ para livros/artigos, dá para contornar usando Libgen / Sci-Hub. Também é possível fazer busca em texto completo pelo Z-Library
- Quando for impossível conseguir algo com todos os métodos acima, lugares onde você pode pedir ajuda a outras pessoas
→ subreddit: /r/scholar
→ Twitter: #icanhazpdf
→ Wikipedia Resource Request
→ LessWrong HelpDesk
- O que fazer depois de encontrar uma cópia full-text
→ não linkar para hosts não confiáveis: Libgen/Sci-Hub, Nber, Scribed, ResearchGate..
→ no caso de scans, editar & fazer OCR com gscan2pdf
→ adicionar metadados: ExifTool, pdftk
→ se possível, hospedar publicamente e compartilhar o link na Wikipedia/Reddit
→ dica de link de PDF: dá para especificar a página adicionando #page=N ao fim da URL
- Avançado
→ usar Archiver-Bots para arquivar automaticamente o histórico de buscas
→ criar um GCSE (Google Custom Search Engine)
[ Páginas da web ]
-
Se você souber o título, pesquise só pelo título
-
Ao buscar por URL, remova parâmetros desnecessários
-
Na busca do Google, use
site:para limitar por domínio e por data -
Usar buscas além do Google
→ DuckDuckGo: o recurso Bangs permite usar diretamente a busca de sites externos (atualmente suporta mais de 13.000 sites externos)
→ Bing/Yandex também são úteis
- Verificar arquivos: Internet Archive ou o meta-arquivo Memento
→ o IA oferece recurso para verificar URLs do domínio inteiro. Com wayback_machine_downloader (Ruby) dá para baixar tudo
→ antes do fim do Google Reader, o Archive Team fez backup de bastante RSS do Google Reader e hospedou isso no IA (também é possível via WARC; no final há dicas de download & busca)
→ archive.today: um espelho parecido com o IA
→ se nada mais funcionar, também dá para usar o Google Cache
[ Livros digitais ]
-
Livros não estão no Google Scholar. Use a busca do Google.
-
Primeiro tente com
filetype:pdfe depois use Libgen -
O IA também tem muitos livros, mas talvez pelo SEO ruim eles não apareçam bem nas buscas.
"título do livro" site:archive.org
→ se um livro no IA estiver com DRM, é possível usar o plugin De-DRM do Calibre
- O HathiTrust também tem muitos scans de livros
→ não dá para baixar tudo diretamente, mas existe um método alternativo com wget. Isso também pode ser aplicado à Wellcome Library
[ Livros publicados ]
- Procurar livros usados no Google Books ou em find-more-books.com
→ eBay & Amazon não são bons para comprar livros usados. Use apenas para consultar informações
→ AbeBooks, Thrift Books, Better World Books, B&N etc. são bons para compra
- Digitalizar livros: destrutivo vs. não destrutivo, ferramentas de corte, além de dicas de metadados e geração de PDF
- Gwern Branwen é escritor e pesquisador freelancer. Ele mantém o site pessoal https://www.gwern.net/, que é realmente único
Na minha opinião, está no topo entre páginas pessoais/blogs. Sua especialidade é pegar um tema específico, aprofundá-lo minuciosamente, organizar tudo e publicar.
→ "Top 5 livros que as pessoas abandonam no meio", descoberto via GoodReads https://pt.news.hada.io/topic?id=1231
1 comentários
Também recomendo o "Dicas de busca de informações para desenvolvedores", que foi publicado anteriormente. https://pt.news.hada.io/topic?id=2932