9 pontos por xguru 2023-07-04 | 3 comentários | Compartilhar no WhatsApp
  • A Tesla quer se tornar uma das melhores empresas de IA do mundo
  • Claro, ela ainda não apresentou a melhor direção autônoma e também não aparece no universo da IA generativa, mas..
  • Atualmente, a Tesla possui internamente uma pequena infraestrutura de IA, na escala de 4 mil V100 e 16 mil A100
    • Microsoft e Meta possuem mais de 100 mil GPUs e estão tentando dobrar esse número
  • A fraca infraestrutura de IA da Tesla se deve em parte ao atraso do chip interno de treinamento D1
  • Mas agora isso está mudando rapidamente
  • Em apenas 1,5 ano, a Tesla está aumentando sua capacidade de IA em mais de 10 vezes
  • Parte disso é para suas próprias funcionalidades, mas parte é para a X.AI
  • A Tesla projeta seus próprios chips de IA desde 2016 para automóveis e desde 2018 para data centers
  • Até agora não havia conseguido produzir em escala, mas em 2023 está ampliando a produção
  • Essa arquitetura se adapta aos casos de uso únicos da Tesla, mas não é útil para LLMs (foco em redes de imagem)

Tesla HW 4.0, chip FSD de 2ª geração

  • O chip que faz inferência de IA dentro dos carros da Tesla é chamado de chip FSD
  • A Tesla acredita que não é necessário um desempenho enorme no carro para atingir direção totalmente autônoma, por isso o desempenho do chip embarcado é bastante limitado
  • Além disso, como a Tesla vende em grande escala, ela tem restrições de custo muito mais rígidas do que Waymo/Cruise
  • Waymo/Cruise usaram GPUs full-size mais de 10 vezes mais caras no desenvolvimento e nos testes iniciais, e estão criando SoCs mais rápidos e mais caros
  • Os chips de 2ª geração estão sendo aplicados aos veículos vendidos desde fevereiro de 2023
  • A 1ª geração usa o processo de 14nm da Samsung e é composta por 12 Arm Cortex-A72 (2.2Ghz) organizados em 3 clusters quad-core
  • A 2ª geração é composta por 20 Arm Cortex-A72 organizados em 5 clusters quad-core
  • A parte mais importante da 2ª geração são os três núcleos NPU
    • Os 3 núcleos usam 32MiB de SRAM cada para armazenar pesos do modelo e activations
    • A cada ciclo, 256 bytes de dados de activation e 128 bytes de dados de peso são lidos da SRAM para o MAC (Multiply Accumulate Unit)
    • O MAC foi projetado em grade, e cada núcleo NPU tem uma grade 96x96, totalizando 9.216 MACs e permitindo 18.432 operações por ciclo de clock
    • Com a NPU operando a 2.2Ghz, o poder computacional é de 121.641 TOPS (trillion operations per second)
  • O chip FSD de 2ª geração vem com armazenamento NVMe de 256GB e 16GB de Micron DDR6 (14Gbps) sobre um barramento de memória de 128 bits com largura de banda de 224GB/s
    • A taxa de transferência ficou 3,3x maior em relação à 1ª geração
  • O HW 4.0 inclui 2 chips FSD
  • Com o aumento de desempenho da placa HW4, o consumo de energia também aumentou (o dobro do HW3)
  • Apesar do ganho de desempenho do HW4, a Tesla quer oferecer suporte ao FSD no HW3, para que os compradores de FSD entre os usuários existentes de HW3 não precisem fazer retrofit
  • O sistema de infotainment usa GPU/APU da AMD. Ele fica na mesma placa do chip FSD (antes ficava em uma daughterboard separada)
  • A plataforma HW4 suporta 12 câmeras. 1 é para redundância e 11 são usadas de fato
    • Antes, o hub de câmera frontal usava 3 câmeras de baixa resolução de 1,2 megapixel, mas a nova plataforma usa 2 câmeras de 5 megapixels
  • Atualmente, a Tesla não usa sensores além de LIDAR e câmeras
  • Antes usava radar, mas ele foi removido a partir do meio da geração
    • Com isso, reduziu bastante o custo de fabricação dos veículos, e a empresa acredita ser possível viabilizar veículos autônomos usando apenas câmeras, seguindo em otimização nessa direção
    • Claro, a Tesla já disse que, se houver um radar viável, ele será integrado ao sistema de câmeras
  • Está previsto que a plataforma HW4 venha equipada com um radar próprio chamado Phoenix
    • O objetivo do Phoenix é combinar o sistema de radar e o sistema de câmeras para usar mais dados e criar veículos mais seguros
    • O radar Phoenix usa o espectro de 76-77Ghz
    • É um sistema de radar automotivo não pulsado com suporte a três modos de detecção

Diferenciação dos modelos de IA da Tesla

  • A Tesla pretende produzir modelos fundamentais de IA para operar robôs e carros autônomos
  • Como ambos precisam reconhecer o ambiente ao redor e navegar nesse ambiente, o mesmo tipo de modelo de IA pode ser aplicado aos dois
  • A inferência desse modelo exige baixo consumo de energia e baixa latência, então as restrições de hardware limitam bastante o tamanho máximo dos modelos que a Tesla pode oferecer
  • Entre todas as empresas, a Tesla possui o maior conjunto de dados utilizável especificamente para redes neurais de deep learning
  • Cada carro na estrada captura dados usando sensores e imagens, e, multiplicado pelo número de veículos elétricos da Tesla nas ruas, isso gera um conjunto de dados gigantesco
  • A Tesla chama essa coleta de dados de "Fleet Scale Auto Labeling"
  • Cada veículo elétrico da Tesla coleta clipes de log de 45 a 60 segundos de dados densos de sensores, como vídeo, dados de IMU interna (unidade de medição inercial), GPS e quilometragem, e os envia aos servidores de treinamento da Tesla
  • A Tesla usa apenas uma fração extremamente pequena dos dados que coleta
    • A Tesla é conhecida por treinar excessivamente seus modelos para alcançar a maior precisão possível dentro de um dado tamanho de modelo, por causa das restrições de inferência

3 comentários

 
wkwnqlw 2023-07-05

A Tesla já oferece seu software de direção autônoma em Beta há 2 anos. A partir da próxima versão, está previsto que ele seja lançado oficialmente.
A primeira versão era muito limitada, mas está aumentando o número de pessoas que dizem que o software atualmente em serviço já superou o nível de motoristas comuns. Atualmente, o software de direção autônoma da Tesla (FSD) tem uma taxa de acidentes cerca de 3 vezes menor do que a de humanos.

 
bbongcol 2023-07-04

Parece haver um erro de digitação em "1832 operações por ciclo de clock". No texto original, consta 18.432 operações.

 
xguru 2023-07-04

Como é um artigo pago, não dá para ver a parte de trás, mas a parte inicial já é interessante o bastante para eu trazer aqui.