MTIA v1: o acelerador de inferência de IA de 1ª geração da Meta
(ai.facebook.com)- GPUs não são ideais para executar o DLRM (modelo de recomendação por deep learning) da Meta
- Por isso, foi desenvolvido o ASIC Meta Training and Inference Accelerator (MTIA), adequado para recomendação
- Ele foi co-projetado tendo em mente os requisitos dos modelos de recomendação da próxima geração e integrado ao PyTorch para construir um sistema de ranking totalmente otimizado
- Processo TSMC de 7 nm, 800 MHz, 102.4 TOPS @ INT8, 51.2 TFLOPS @ FP16, 25W
Ainda não há comentários.