3 pontos por GN⁺ 2023-10-05 | 1 comentários | Compartilhar no WhatsApp
  • O texto discute a Graph Mining Library, um projeto que inclui ferramentas desenvolvidas pela equipe de Graph Mining do Google.
  • Essas ferramentas foram projetadas para resolver problemas de mineração de dados e aprendizado de máquina que possuem inerentemente uma estrutura de grafo ou que podem ser formalizados como problemas de grafos.
  • Esta biblioteca inclui algoritmos de clusterização paralela em memória compartilhada capazes de processar grafos com dezenas de bilhões de arestas.
  • Esses algoritmos são baseados em vários artigos de pesquisa, incluindo "Hierarchical Agglomerative Graph Clustering in Poly-Logarithmic Depth", "Scalable community detection via parallel correlation clustering", "Affinity Clustering: Hierarchical Clustering at Scale" e "Distributed Balanced Partitioning via Linear Embedding".
  • São fornecidos links para seções específicas do repositório relacionadas a cada artigo.
  • Em caso de dúvidas ou comentários, os usuários são incentivados a criar issues no repositório.
  • O texto também oferece um guia de início rápido que explica como instalar o Bazel e executar exemplos.

1 comentários

 
GN⁺ 2023-10-05
Comentários do Hacker News
  • Com a ascensão das redes sociais, a mineração de grafos ganhou popularidade há 10 anos.
  • Ela foi popular até que o aprendizado geométrico, uma forma de aprendizado de máquina em grafos e outras estruturas, bem como os modelos de alocação latente de Dirichlet (LMMs), se tornassem mais difundidos.
  • O sistema de banco de dados Arangodb inclui integração com várias bibliotecas de grafos e frameworks de aprendizado de máquina, como NetworkX, DeepGraphLibrary, cuGraph e PyG.
  • Há uma pergunta sobre como a biblioteca é construída usando Bazel, uma ferramenta para automatizar a construção e os testes de software.
  • A biblioteca pode ser integrada com wrappers ou bibliotecas de extensão para incorporar algoritmos de clusterização baseados em grafos.
  • Há uma pergunta sobre a relação entre o Pregel, um sistema de processamento de grafos em larga escala, e a biblioteca.
  • Foi solicitado um esclarecimento sobre possíveis usos e exemplos de aplicação da biblioteca.
  • A biblioteca foi escrita em C, C++ e Starland, e há uma pergunta sobre o que é Starland.
  • Assim como o Basic Linear Algebra Subprograms (BLAS) e o Linear Algebra Package (LAPACK), há vozes pedindo padronização em algoritmos de grafos.
  • Alguns esperavam que a biblioteca pudesse ser usada para mineração estatística de grafos voltada à detecção de anomalias.