- Há cerca de 10 anos, pesquisadores do Google previram que a demanda por computação de IA ultrapassaria a capacidade da infraestrutura da época
- Ao perceberem que não havia no mercado uma alternativa capaz de atender àquela demanda, começaram a desenvolver um novo tipo de chip, a TPU (Tensor Processing Unit)
Um chip de propósito específico
- Enquanto a CPU funciona como o “cérebro” multifuncional do computador, a TPU é um chip de propósito específico otimizado para IA
- A TPU é um ASIC (application-specific integrated circuit) especializado em operações matemáticas baseadas em matrizes e vetores, necessárias para construir e executar modelos de IA
- Distribuída internamente em 2015, a TPU v1 foi um sucesso imediato em todo o Google e, nos 10 anos seguintes, as TPUs continuaram evoluindo em desempenho e eficiência
Acompanhando o ritmo da inovação em IA
- A evolução das TPUs está intimamente ligada às inovações em machine learning e IA
- A TPU v1 era focada em inferência, mas logo depois o Google desenvolveu o supercomputador de treinamento TPU v2 para tornar o treinamento de modelos mais eficiente
- Depois disso, as TPUs passaram a ser lançadas em ciclos mais rápidos, com grandes saltos em desempenho, eficiência e capacidade de processamento
- Nas gerações mais recentes, a velocidade de processamento de dados é tão alta que até o cabeamento de interconexão entre chips exige cuidados especiais
Compartilhando os benefícios
- No início, o Google não era o único buscando maneiras melhores de desenvolver e executar modelos de IA
- No começo de 2018, o Google Cloud lançou a primeira geração do Cloud TPU para que clientes pudessem acelerar suas próprias cargas de trabalho de treinamento e inferência
- Hoje, equipes de IA bem conhecidas como Anthropic, Midjourney e Salesforce usam intensamente o Cloud TPU
- E toda essa capacidade de processamento ainda é apenas o começo
- No futuro, há planos de transformar o design dos data centers para adaptá-lo melhor aos requisitos das TPUs
- Indo além de um único chip ou de um único pod de TPUs, o Google está construindo uma rede global de data centers repleta de TPUs
- O futuro será de personalização full stack de ponta a ponta, do silício ao concreto (The future is full stack customization all the way, from silicon to concrete)
2 comentários
O TPU realmente foi uma visão de futuro
O Google mostrou isso muito bem no processamento de câmera única do Pixel 2 XL, e agora entrou em sua era de ouro na era dos LLMs
Então, por favor, atualizem a placa Coral Micro Dev.... buááá
O processador de imagem incluído nos primeiros modelos do Pixel, chamado de Visual Core, é baseado na plataforma Monette Hill da Intel.