35 pontos por xguru 2021-04-26 | 1 comentários | Compartilhar no WhatsApp
  • Um resumo, do básico às principais dicas, para buscar na internet informações como artigos, páginas da web e livros

  • Um texto escrito por Gwern Branwen*, que considero o melhor entre sites pessoais. Como trouxe apenas uma parte, recomendo fortemente ver o original

[ Busca de artigos ]

  • Sintaxe de busca: operadores booleanos, principais comandos do Google (" para correspondência exata, hífen para negação/exclusão, site: para buscar em um site específico )

  • Configurar hotkeys para buscas rápidas: AutoHotkey, Quicksilver, XMonad etc.

  • Atalhos do navegador: C-l, C-PgUp/C-PgDwn, C-w, C-t/C-T, M-[1–9]

  • Ao pesquisar no Google Scholar, ver em HTML

  • Dicas para buscar títulos de artigos

→ cortar o título para reduzir os resultados, ou usar AND/OR e -

→ tentar adicionar/remover o ano..

→ usar o intervalo de datas do Google

→ adicionar site:archive.org para buscar no Internet Archive

  • Casos difíceis

→ citações reversas (Reverse Citations): ver "related articles" e "cited by" no Google Scholar

→ dissertações/teses: ProQuest

→ busca reversa por imagem: usar Google Images, TinEye, Yandex

  • Dicas de busca por domínio

→ Twitter: também aparece no Google, mas se você souber informações adicionais, a busca avançada do Twitter também é excelente (from:, to:, since:, until:, near:, url: ..)

→ tribunais federais dos EUA: precisa criar conta no Pacer. É pago ($0.1/página), mas fica grátis se o total for abaixo de $15. Também existe um espelho público chamado Recap. Há ainda extensão de navegador do Recap

→ biblioteca Wellcome: tem muitas revistas/livros antigos. Como o SEO é péssimo, não aparece bem no Google etc., então vale olhar com atenção

→ revistas antigas: site:pdf-giant.net, e para buscas relacionadas a educação, ERIC ( site:eric.ed.gov )

  • Lidando com paywall

→ para livros/artigos, dá para contornar usando Libgen / Sci-Hub. Também é possível fazer busca em texto completo pelo Z-Library

  • Quando for impossível conseguir algo com todos os métodos acima, lugares onde você pode pedir ajuda a outras pessoas

→ subreddit: /r/scholar

→ Twitter: #icanhazpdf

→ Wikipedia Resource Request

→ LessWrong HelpDesk

  • O que fazer depois de encontrar uma cópia full-text

→ não linkar para hosts não confiáveis: Libgen/Sci-Hub, Nber, Scribed, ResearchGate..

→ no caso de scans, editar & fazer OCR com gscan2pdf

→ adicionar metadados: ExifTool, pdftk

→ se possível, hospedar publicamente e compartilhar o link na Wikipedia/Reddit

→ dica de link de PDF: dá para especificar a página adicionando #page=N ao fim da URL

  • Avançado

→ usar Archiver-Bots para arquivar automaticamente o histórico de buscas

→ criar um GCSE (Google Custom Search Engine)

[ Páginas da web ]

  • Se você souber o título, pesquise só pelo título

  • Ao buscar por URL, remova parâmetros desnecessários

  • Na busca do Google, use site: para limitar por domínio e por data

  • Usar buscas além do Google

→ DuckDuckGo: o recurso Bangs permite usar diretamente a busca de sites externos (atualmente suporta mais de 13.000 sites externos)

→ Bing/Yandex também são úteis

  • Verificar arquivos: Internet Archive ou o meta-arquivo Memento

→ o IA oferece recurso para verificar URLs do domínio inteiro. Com wayback_machine_downloader (Ruby) dá para baixar tudo

→ antes do fim do Google Reader, o Archive Team fez backup de bastante RSS do Google Reader e hospedou isso no IA (também é possível via WARC; no final há dicas de download & busca)

→ archive.today: um espelho parecido com o IA

→ se nada mais funcionar, também dá para usar o Google Cache

[ Livros digitais ]

  • Livros não estão no Google Scholar. Use a busca do Google.

  • Primeiro tente com filetype:pdf e depois use Libgen

  • O IA também tem muitos livros, mas talvez pelo SEO ruim eles não apareçam bem nas buscas. "título do livro" site:archive.org

→ se um livro no IA estiver com DRM, é possível usar o plugin De-DRM do Calibre

  • O HathiTrust também tem muitos scans de livros

→ não dá para baixar tudo diretamente, mas existe um método alternativo com wget. Isso também pode ser aplicado à Wellcome Library

[ Livros publicados ]

  • Procurar livros usados no Google Books ou em find-more-books.com

→ eBay & Amazon não são bons para comprar livros usados. Use apenas para consultar informações

→ AbeBooks, Thrift Books, Better World Books, B&N etc. são bons para compra

  • Digitalizar livros: destrutivo vs. não destrutivo, ferramentas de corte, além de dicas de metadados e geração de PDF
  • Gwern Branwen é escritor e pesquisador freelancer. Ele mantém o site pessoal https://www.gwern.net/, que é realmente único

Na minha opinião, está no topo entre páginas pessoais/blogs. Sua especialidade é pegar um tema específico, aprofundá-lo minuciosamente, organizar tudo e publicar.

→ "Top 5 livros que as pessoas abandonam no meio", descoberto via GoodReads https://pt.news.hada.io/topic?id=1231

1 comentários

 
gguimoon 2021-04-28

Também recomendo o "Dicas de busca de informações para desenvolvedores", que foi publicado anteriormente. https://pt.news.hada.io/topic?id=2932