8 pontos por xguru 2024-08-06 | 2 comentários | Compartilhar no WhatsApp
  • Há cerca de 10 anos, pesquisadores do Google previram que a demanda por computação de IA ultrapassaria a capacidade da infraestrutura da época
  • Ao perceberem que não havia no mercado uma alternativa capaz de atender àquela demanda, começaram a desenvolver um novo tipo de chip, a TPU (Tensor Processing Unit)

Um chip de propósito específico

  • Enquanto a CPU funciona como o “cérebro” multifuncional do computador, a TPU é um chip de propósito específico otimizado para IA
  • A TPU é um ASIC (application-specific integrated circuit) especializado em operações matemáticas baseadas em matrizes e vetores, necessárias para construir e executar modelos de IA
  • Distribuída internamente em 2015, a TPU v1 foi um sucesso imediato em todo o Google e, nos 10 anos seguintes, as TPUs continuaram evoluindo em desempenho e eficiência

Acompanhando o ritmo da inovação em IA

  • A evolução das TPUs está intimamente ligada às inovações em machine learning e IA
  • A TPU v1 era focada em inferência, mas logo depois o Google desenvolveu o supercomputador de treinamento TPU v2 para tornar o treinamento de modelos mais eficiente
  • Depois disso, as TPUs passaram a ser lançadas em ciclos mais rápidos, com grandes saltos em desempenho, eficiência e capacidade de processamento
  • Nas gerações mais recentes, a velocidade de processamento de dados é tão alta que até o cabeamento de interconexão entre chips exige cuidados especiais

Compartilhando os benefícios

  • No início, o Google não era o único buscando maneiras melhores de desenvolver e executar modelos de IA
  • No começo de 2018, o Google Cloud lançou a primeira geração do Cloud TPU para que clientes pudessem acelerar suas próprias cargas de trabalho de treinamento e inferência
  • Hoje, equipes de IA bem conhecidas como Anthropic, Midjourney e Salesforce usam intensamente o Cloud TPU
  • E toda essa capacidade de processamento ainda é apenas o começo
  • No futuro, há planos de transformar o design dos data centers para adaptá-lo melhor aos requisitos das TPUs
  • Indo além de um único chip ou de um único pod de TPUs, o Google está construindo uma rede global de data centers repleta de TPUs
  • O futuro será de personalização full stack de ponta a ponta, do silício ao concreto (The future is full stack customization all the way, from silicon to concrete)

2 comentários

 
ing03201 2024-08-06

O TPU realmente foi uma visão de futuro
O Google mostrou isso muito bem no processamento de câmera única do Pixel 2 XL, e agora entrou em sua era de ouro na era dos LLMs
Então, por favor, atualizem a placa Coral Micro Dev.... buááá

 
ganadist 2024-08-06

O processador de imagem incluído nos primeiros modelos do Pixel, chamado de Visual Core, é baseado na plataforma Monette Hill da Intel.