Expansão da capacidade de IA da Tesla - H100, Dojo D1, D2, HW 4.0, X.AI e provedores de serviços em nuvem

xguru · 2023-07-04T10:47:01+09:00

A Tesla quer se tornar uma das melhores empresas de IA do mundo Claro, ela ainda não apresentou a melhor direção autônoma e também não aparece no universo da IA generativa, mas.. Atualmente, a Tesla possui internamente uma pequena infraestrutura de IA, na escala de 4 mil V100 e 16 mil A100 Microsoft e Meta possuem mais de 100 mil GPUs e estão tentando dobrar esse número A fraca infraestrutura de IA da Tesla se deve em parte ao atraso do chip interno de treinamento D1 Mas agora isso está mudando rapidamente Em apenas 1,5 ano, a Tesla está aumentando sua capacidade de IA em mais de 10 vezes Parte disso é para suas próprias funcionalidades, mas parte é para a X.AI A Tesla projeta seus próprios chips de IA desde 2016 para automóveis e desde 2018 para data centers Até agora não havia conseguido produzir em escala, mas em 2023 está ampliando a produção Essa arquitetura se adapta aos casos de uso únicos da Tesla, mas não é útil para LLMs (foco em redes de imagem) Tesla HW 4.0, chip FSD de 2ª geração O chip que faz inferência de IA dentro dos carros da Tesla é chamado de chip FSD A Tesla acredita que não é necessário um desempenho enorme no carro para atingir direção totalmente autônoma, por isso o desempenho do chip embarcado é bastante limitado Além disso, como a Tesla vende em grande escala, ela tem restrições de custo muito mais rígidas do que Waymo/Cruise Waymo/Cruise usaram GPUs full-size mais de 10 vezes mais caras no desenvolvimento e nos testes iniciais, e estão criando SoCs mais rápidos e mais caros Os chips de 2ª geração estão sendo aplicados aos veículos vendidos desde fevereiro de 2023 A 1ª geração usa o processo de 14nm da Samsung e é composta por 12 Arm Cortex-A72 (2.2Ghz) organizados em 3 clusters quad-core A 2ª geração é composta por 20 Arm Cortex-A72 organizados em 5 clusters quad-core A parte mais importante da 2ª geração são os três núcleos NPU Os 3 núcleos usam 32MiB de SRAM cada para armazenar pesos do modelo e activations A cada ciclo, 256 bytes de dados de activation e 128 bytes de dados de peso são lidos da SRAM para o MAC (Multiply Accumulate Unit) O MAC foi projetado em grade, e cada núcleo NPU tem uma grade 96x96, totalizando 9.216 MACs e permitindo 18.432 operações por ciclo de clock Com a NPU operando a 2.2Ghz, o poder computacional é de 121.641 TOPS (trillion operations per second) O chip FSD de 2ª geração vem com armazenamento NVMe de 256GB e 16GB de Micron DDR6 (14Gbps) sobre um barramento de memória de 128 bits com largura de banda de 224GB/s A taxa de transferência ficou 3,3x maior em relação à 1ª geração O HW 4.0 inclui 2 chips FSD Com o aumento de desempenho da placa HW4, o consumo de energia também aumentou (o dobro do HW3) Apesar do ganho de desempenho do HW4, a Tesla quer oferecer suporte ao FSD no HW3, para que os compradores de FSD entre os usuários existentes de HW3 não precisem fazer retrofit O sistema de infotainment usa GPU/APU da AMD. Ele fica na mesma placa do chip FSD (antes ficava em uma daughterboard separada) A plataforma HW4 suporta 12 câmeras. 1 é para redundância e 11 são usadas de fato Antes, o hub de câmera frontal usava 3 câmeras de baixa resolução de 1,2 megapixel, mas a nova plataforma usa 2 câmeras de 5 megapixels Atualmente, a Tesla não usa sensores além de LIDAR e câmeras Antes usava radar, mas ele foi removido a partir do meio da geração Com isso, reduziu bastante o custo de fabricação dos veículos, e a empresa acredita ser possível viabilizar veículos autônomos usando apenas câmeras, seguindo em otimização nessa direção Claro, a Tesla já disse que, se houver um radar viável, ele será integrado ao sistema de câmeras Está previsto que a plataforma HW4 venha equipada com um radar próprio chamado Phoenix O objetivo do Phoenix é combinar o sistema de radar e o sistema de câmeras para usar mais dados e criar veículos mais seguros O radar Phoenix usa o espectro de 76-77Ghz É um sistema de radar automotivo não pulsado com suporte a três modos de detecção Diferenciação dos modelos de IA da Tesla A Tesla pretende produzir modelos fundamentais de IA para operar robôs e carros autônomos Como ambos precisam reconhecer o ambiente ao redor e navegar nesse ambiente, o mesmo tipo de modelo de IA pode ser aplicado aos dois A inferência desse modelo exige baixo consumo de energia e baixa latência, então as restrições de hardware limitam bastante o tamanho máximo dos modelos que a Tesla pode oferecer Entre todas as empresas, a Tesla possui o maior conjunto de dados utilizável especificamente para redes neurais de deep learning Cada carro na estrada captura dados usando sensores e imagens, e, multiplicado pelo número de veículos elétricos da Tesla nas ruas, isso gera um conjunto de dados gigantesco A Tesla chama essa coleta de dados de "Fleet Scale Auto Labeling" Cada veículo elétrico da Tesla coleta clipes de log de 45 a 60 segundos de dados densos de sensores, como vídeo, dados de IMU interna (unidade de medição inercial), GPS e quilometragem, e os envia aos servidores de treinamento da Tesla A Tesla usa apenas uma fração extremamente pequena dos dados que coleta A Tesla é conhecida por treinar excessivamente seus modelos para alcançar a maior precisão possível dentro de um dado tamanho de modelo, por causa das restrições de inferência

(semianalysis.com)

9 pontos por xguru 2023-07-04 | 3 comentários | Compartilhar no WhatsApp

A Tesla quer se tornar uma das melhores empresas de IA do mundo
Claro, ela ainda não apresentou a melhor direção autônoma e também não aparece no universo da IA generativa, mas..
Atualmente, a Tesla possui internamente uma pequena infraestrutura de IA, na escala de 4 mil V100 e 16 mil A100
- Microsoft e Meta possuem mais de 100 mil GPUs e estão tentando dobrar esse número
A fraca infraestrutura de IA da Tesla se deve em parte ao atraso do chip interno de treinamento D1
Mas agora isso está mudando rapidamente
Em apenas 1,5 ano, a Tesla está aumentando sua capacidade de IA em mais de 10 vezes
Parte disso é para suas próprias funcionalidades, mas parte é para a X.AI
A Tesla projeta seus próprios chips de IA desde 2016 para automóveis e desde 2018 para data centers
Até agora não havia conseguido produzir em escala, mas em 2023 está ampliando a produção
Essa arquitetura se adapta aos casos de uso únicos da Tesla, mas não é útil para LLMs (foco em redes de imagem)

Tesla HW 4.0, chip FSD de 2ª geração

O chip que faz inferência de IA dentro dos carros da Tesla é chamado de chip FSD
A Tesla acredita que não é necessário um desempenho enorme no carro para atingir direção totalmente autônoma, por isso o desempenho do chip embarcado é bastante limitado
Além disso, como a Tesla vende em grande escala, ela tem restrições de custo muito mais rígidas do que Waymo/Cruise
Waymo/Cruise usaram GPUs full-size mais de 10 vezes mais caras no desenvolvimento e nos testes iniciais, e estão criando SoCs mais rápidos e mais caros
Os chips de 2ª geração estão sendo aplicados aos veículos vendidos desde fevereiro de 2023
A 1ª geração usa o processo de 14nm da Samsung e é composta por 12 Arm Cortex-A72 (2.2Ghz) organizados em 3 clusters quad-core
A 2ª geração é composta por 20 Arm Cortex-A72 organizados em 5 clusters quad-core
A parte mais importante da 2ª geração são os três núcleos NPU
- Os 3 núcleos usam 32MiB de SRAM cada para armazenar pesos do modelo e activations
- A cada ciclo, 256 bytes de dados de activation e 128 bytes de dados de peso são lidos da SRAM para o MAC (Multiply Accumulate Unit)
- O MAC foi projetado em grade, e cada núcleo NPU tem uma grade 96x96, totalizando 9.216 MACs e permitindo 18.432 operações por ciclo de clock
- Com a NPU operando a 2.2Ghz, o poder computacional é de 121.641 TOPS (trillion operations per second)
O chip FSD de 2ª geração vem com armazenamento NVMe de 256GB e 16GB de Micron DDR6 (14Gbps) sobre um barramento de memória de 128 bits com largura de banda de 224GB/s
- A taxa de transferência ficou 3,3x maior em relação à 1ª geração
O HW 4.0 inclui 2 chips FSD
Com o aumento de desempenho da placa HW4, o consumo de energia também aumentou (o dobro do HW3)
Apesar do ganho de desempenho do HW4, a Tesla quer oferecer suporte ao FSD no HW3, para que os compradores de FSD entre os usuários existentes de HW3 não precisem fazer retrofit
O sistema de infotainment usa GPU/APU da AMD. Ele fica na mesma placa do chip FSD (antes ficava em uma daughterboard separada)
A plataforma HW4 suporta 12 câmeras. 1 é para redundância e 11 são usadas de fato
- Antes, o hub de câmera frontal usava 3 câmeras de baixa resolução de 1,2 megapixel, mas a nova plataforma usa 2 câmeras de 5 megapixels
Atualmente, a Tesla não usa sensores além de LIDAR e câmeras
Antes usava radar, mas ele foi removido a partir do meio da geração
- Com isso, reduziu bastante o custo de fabricação dos veículos, e a empresa acredita ser possível viabilizar veículos autônomos usando apenas câmeras, seguindo em otimização nessa direção
- Claro, a Tesla já disse que, se houver um radar viável, ele será integrado ao sistema de câmeras
Está previsto que a plataforma HW4 venha equipada com um radar próprio chamado Phoenix
- O objetivo do Phoenix é combinar o sistema de radar e o sistema de câmeras para usar mais dados e criar veículos mais seguros
- O radar Phoenix usa o espectro de 76-77Ghz
- É um sistema de radar automotivo não pulsado com suporte a três modos de detecção

Diferenciação dos modelos de IA da Tesla

A Tesla pretende produzir modelos fundamentais de IA para operar robôs e carros autônomos
Como ambos precisam reconhecer o ambiente ao redor e navegar nesse ambiente, o mesmo tipo de modelo de IA pode ser aplicado aos dois
A inferência desse modelo exige baixo consumo de energia e baixa latência, então as restrições de hardware limitam bastante o tamanho máximo dos modelos que a Tesla pode oferecer
Entre todas as empresas, a Tesla possui o maior conjunto de dados utilizável especificamente para redes neurais de deep learning
Cada carro na estrada captura dados usando sensores e imagens, e, multiplicado pelo número de veículos elétricos da Tesla nas ruas, isso gera um conjunto de dados gigantesco
A Tesla chama essa coleta de dados de "Fleet Scale Auto Labeling"
Cada veículo elétrico da Tesla coleta clipes de log de 45 a 60 segundos de dados densos de sensores, como vídeo, dados de IMU interna (unidade de medição inercial), GPS e quilometragem, e os envia aos servidores de treinamento da Tesla
A Tesla usa apenas uma fração extremamente pequena dos dados que coleta
- A Tesla é conhecida por treinar excessivamente seus modelos para alcançar a maior precisão possível dentro de um dado tamanho de modelo, por causa das restrições de inferência

3 comentários

wkwnqlw 2023-07-05

A Tesla já oferece seu software de direção autônoma em Beta há 2 anos. A partir da próxima versão, está previsto que ele seja lançado oficialmente.
A primeira versão era muito limitada, mas está aumentando o número de pessoas que dizem que o software atualmente em serviço já superou o nível de motoristas comuns. Atualmente, o software de direção autônoma da Tesla (FSD) tem uma taxa de acidentes cerca de 3 vezes menor do que a de humanos.

bbongcol 2023-07-04

Parece haver um erro de digitação em "1832 operações por ciclo de clock". No texto original, consta 18.432 operações.

xguru 2023-07-04

Como é um artigo pago, não dá para ver a parte de trás, mas a parte inicial já é interessante o bastante para eu trazer aqui.

Expansão da capacidade de IA da Tesla - H100, Dojo D1, D2, HW 4.0, X.AI e provedores de serviços em nuvem

Tesla HW 4.0, chip FSD de 2ª geração

Diferenciação dos modelos de IA da Tesla

Leituras relacionadas

3 comentários