Hyperscan - biblioteca open source de correspondência de padrões com múltiplas expressões regulares de alto desempenho
(hyperscan.io)Uma API escrita em C que segue a sintaxe de expressões regulares como a do PCRE.
É possível encontrar simultaneamente dezenas de milhares de expressões regulares em fluxos de dados.
Foi aberta como open source depois que a Intel adquiriu a Sensory Networks, empresa desenvolvedora, e é otimizada para CPUs Intel (com suporte aos conjuntos de instruções AVX2 e AVX512).
1 comentários
O Hyperscan também é famoso por ser usado pelo GitHub para verificar se todos os commits contêm, por acaso, algo como GitHub OAuth Token ou chaves SSH.
https://github.blog/2018-10-17-behind-the-scenes-of-github-token-scann…
Para esse uso específico (encontrar ao mesmo tempo uma enorme quantidade de valores), dizem que não há alternativa ao Hyperscan.