-
Linguagem de programação e compilador semelhantes a Python
-
Mesmo pesquisadores sem experiência com CUDA conseguem escrever com facilidade código para GPU de alta eficiência voltado a deep learning
→ já existem implementações de kernel com eficiência cerca de 2x melhor do que implementações em Torch
-
Suporte a Linux e GPUs da NVIDIA (GPUs da AMD e outras CPUs estão em desenvolvimento)
-
O código-base é parecido com o Numba, mas não usa SIMT; executa em paralelo dentro da instância com operações em nível de bloco
-
Arquitetura que converte código Python em Triton-IR e, por meio do Triton Compiler, transforma em LLVM-IR
1 comentários
Artigo do autor original: http://eecs.harvard.edu/~htk/publication/…
(A OpenAI contratou Philippe Tillet e continua apoiando o desenvolvimento.)