A IA aprende a “magia negra” do projeto de RFIC
(spectrum.ieee.org)- RFIC é a base de tecnologias sem fio como 5G, radar automotivo e comunicação via satélite, mas continua sendo um problema difícil e centrado em trabalho manual porque precisa conciliar eletromagnetismo, calor e confiabilidade de encapsulamento ao mesmo tempo
- Pesquisadores de Princeton, sem partir de templates de projeto humanos, combinaram aprendizado por reforço e projeto inverso para explorar desde o zero a arquitetura, a topologia do circuito, os parâmetros dos dispositivos e as interfaces eletromagnéticas
- Um emulador baseado em IA prevê, em milissegundos, os parâmetros de espalhamento de estruturas eletromagnéticas 2D arbitrárias, reduzindo bastante as iterações de minutos ou horas exigidas por solucionadores eletromagnéticos tradicionais
- Em 2023, num amplificador de potência de onda milimétrica de 30~100GHz, obteve a melhor combinação de largura de banda, potência de saída e eficiência entre os amplificadores de potência em silício da época; em 2024, também passou a gerar estruturas de IC multiport em escala de minutos
- A IA também pode criar circuitos que não funcionam, então a validação ainda exige supervisão humana; para avançar rumo a modelos gerais, será necessário um ecossistema aberto para compartilhar dados de projeto de RFIC e analógico hoje presos por NDA
Por que o projeto de RFIC continua sendo “magia negra”
- RFIC é o circuito central que permite que dispositivos transmitam e recebam informações sem fio, e os avanços em carros autônomos, comunicação quântica, 6G e comunicação via satélite também dependem de chips de RF mais avançados
- O projeto de CPU e GPU já se aproximou de uma ciência padronizada, mas o projeto de RF ainda tem forte caráter de técnica manual, aprendida com longa experiência
- O projeto de RFIC lida com várias áreas da física ao mesmo tempo
- As equações de Maxwell governam como os campos eletromagnéticos interagem com componentes ativos e passivos
- A termodinâmica determina como o calor é gerado e removido durante a operação
- Expansão e contração térmica estão ligadas à capacidade do chip e do encapsulamento de suportarem variações de temperatura com estabilidade
- Como todas essas restrições físicas precisam ser consideradas em conjunto, o espaço de projeto é enorme, e muitas vezes surge um trade-off em que melhorar uma métrica de desempenho piora outra
Fluxo tradicional de projeto de RFIC e seus gargalos
- Para projetar um amplificador de potência de 28GHz para handsets 5G em onda milimétrica, primeiro é preciso definir a arquitetura e a topologia do circuito
- A arquitetura de RFIC funciona como a planta de uma casa, definindo os componentes necessários e os caminhos do sinal
- Em amplificadores de potência, o número de estágios de amplificação é um fator importante
- A maior parte da área de um RFIC é ocupada não por transistores, mas por componentes passivos e estruturas eletromagnéticas, como indutores e linhas de transmissão
- Sinais 5G operam em 28GHz e 39GHz, comunicações via satélite em 26.5~40GHz ou mais, e radar automotivo em 77GHz; nesses altos níveis de frequência, o RFIC gerencia a energia do sinal por meio de estruturas eletromagnéticas sofisticadas
- Se o caminho do sinal não se ajustar corretamente ao próximo componente, surge um problema de casamento de impedância, em que a energia não segue adiante e é refletida para trás
- Engenheiros projetam pequenas estruturas de transição entre componentes para reduzir a reflexão
- Essas estruturas podem ser usadas não só para transmissão de sinal, mas também para divisão, combinação e distribuição por múltiplos caminhos
- Se as especificações não forem atendidas, é preciso revisar a topologia ou a arquitetura e repetir as simulações; um novo projeto de chip pode consumir anos e dezenas a centenas de milhões de dólares
Uma abordagem de projeto com IA além dos templates
- Pesquisas anteriores usaram machine learning para otimizar templates de circuito, mas ainda dependiam de bibliotecas de projetos existentes criadas por humanos
- O objetivo dos pesquisadores de Princeton era fazer com que o algoritmo definisse, desde o zero e sem topologias pré-fabricadas, todos os parâmetros da arquitetura, dos circuitos constituintes e das estruturas passivas eletromagnéticas
- Esse método parte de um ponto diferente das otimizações tradicionais
- A abordagem tradicional ajusta parâmetros como tamanho de transistores e geometria de componentes passivos dentro de estruturas criadas por humanos
- A nova abordagem cria combinações candidatas de circuitos a partir de um ponto quase vazio, mapeia os trade-offs de desempenho e explora o espaço de projeto
- Como o AlphaGo Zero, a abordagem desenvolve estratégias de projeto por exploração e avaliação próprias, em vez de seguir exemplos humanos
- O algoritmo aprende o codesign entre circuito, eletromagnetismo e a interface entre ambos, com o objetivo de fazer projeto end-to-end de RFIC
Combinação de aprendizado por reforço e projeto inverso
- A primeira etapa é um framework de aprendizado por reforço, que define a arquitetura ideal do sistema, a topologia do circuito, os parâmetros dos dispositivos e as características das interfaces eletromagnéticas
- O agente de aprendizado por reforço, como um computador aprendendo um jogo, testa várias combinações, observa a relação entre ações e pontuações e busca circuitos melhores
- O treinamento leva de alguns dias até uma semana
- Depois do treinamento, o circuito pode ser projetado muito rapidamente
- A segunda etapa é o projeto inverso, que busca estruturas eletromagnéticas físicas capazes de produzir os parâmetros de espalhamento desejados
- Os parâmetros de espalhamento medem se o sinal, ao entrar num componente, segue adiante ou é refletido para trás
- É semelhante a encontrar arcos ou estruturas de apoio para criar um espaço desejado em engenharia estrutural
- No projeto inverso de RFIC, é preciso ajustar simultaneamente a operação do circuito e a resposta eletromagnética de interconexões e componentes passivos, o que é difícil de resolver apenas com busca manual iterativa
O emulador de IA que reduziu as iterações do projeto eletromagnético
- Os pesquisadores substituíram o simulador de circuito de RF por um emulador baseado em IA
- Esse modelo recebe como entrada uma estrutura 2D arbitrária e prevê os parâmetros de espalhamento sem calcular diretamente as equações de Maxwell
- Tarefas que antes levavam minutos ou horas em solucionadores eletromagnéticos tradicionais passam a levar milissegundos
- O emulador foi construído com base em redes neurais convolucionais, fortes em processamento de imagens
- As imagens das estruturas contêm informações espaciais capazes de prever o desempenho eletromagnético
- Os pesquisadores treinaram o modelo com muitas estruturas aleatórias em pixels rotuladas com parâmetros de espalhamento
- Ao combinar projeto inverso com aprendizado por reforço e o emulador de IA, eles montaram um end-to-end AI designer e o aplicaram ao projeto de amplificadores de potência
Resultados de arquitetura de RF diferentes dos humanos
- A prova de conceito divulgada em 2023 teve como alvo amplificadores de potência na faixa de onda milimétrica de 30~100GHz
- Essa faixa cobre a maior parte das frequências relevantes de 5G e radar
- O projeto final apresentou, entre os amplificadores de potência em silício da época, a melhor combinação de wide bandwidth, output power e efficiency, mantendo ainda record efficiency
- Os caminhos eletromagnéticos gerados pareciam padrões aleatórios ou QR codes, em vez das estruturas regulares e simétricas que humanos costumam considerar
- O resultado mostra que não há garantia de que os templates historicamente usados estejam perto do ideal para os objetivos modernos de projeto
- Depois disso, os pesquisadores expandiram o modelo para estruturas com muitos portos de entrada e saída
- Com 2 portos há 4 parâmetros de espalhamento; com 4 portos, 16, e a complexidade cresce rapidamente
- No estudo de 2024 sobre multiport integrated circuits, mostraram que o algoritmo de IA também consegue lidar com estruturas multiport
- Antes, simulações eletromagnéticas multiport exigiam dias ou semanas, mas esse modelo evolui novas estruturas em escala de minutos
- Ao combinar o framework de aprendizado por reforço com projeto inverso, eles mostraram um fluxo que vai da especificação até o fabrication-ready layout, aplicado a amplificadores de baixo ruído, subterahertz e amplificadores de potência broadband
Projeto de IA interpretável
- Como testes e depuração de RFIC podem levar tanto tempo quanto o próprio projeto, ou ser ainda mais difíceis, engenheiros preferem estruturas interpretáveis que possam entender e corrigir quando algo dá errado
- Os pesquisadores aplicaram diffusion models, usados em IA de geração de imagem, à geração de estruturas de RFIC
- Em vez de prompts de texto, usam parâmetros de espalhamento como entrada e geram como saída a estrutura eletromagnética do RFIC
- Incluíram um dial de frequência espacial na entrada para permitir que o projetista controle a forma da estrutura resultante
- Baixa frequência espacial: forma clássica e interpretável
- Frequência espacial intermediária: estrutura semelhante a um labirinto
- Alta frequência espacial: estrutura pixelada ou próxima de uma forma aleatória
- Todo o processo, do prompt à saída, leva cerca de 6 minutos, e pode gerar uma estrutura correspondente sempre que os parâmetros de espalhamento forem fisicamente realizáveis sob as equações de Maxwell
Limitações restantes e o desafio dos dados
- A abordagem de projeto baseada em IA atraiu o interesse da comunidade de RF e começou a inverter o fluxo tradicional de projeto bottom-up
- Ainda restam perguntas em aberto
- Até que ponto o método pode generalizar
- Se consegue manter alto desempenho de forma consistente
- Se pode otimizar globalmente todos os trade-offs possíveis
- Se pode inventar, além de RFIC, outros circuitos que nunca foram criados por humanos
- A IA pode sofrer hallucination e gerar circuitos ruins que não funcionam, então a validação continua exigindo supervisão humana
- Para criar um foundational model geral, será necessário um grande volume de dados para aprender as leis que governam o eletromagnetismo e o funcionamento dos circuitos
- O ImageNet é um exemplo de como 14 milhões de imagens diversas e rotuladas por humanos permitiram a generalização de modelos de reconhecimento de imagem
- RFIC e projeto analógico também precisam de dados com escala e diversidade semelhantes
- Muitos desses dados já existem nas simulações de empresas e laboratórios no mundo todo, mas a maior parte está presa atrás de NDAs
- A Natcast operava o programa de P&D do U.S. CHIPS and Science Act e poderia ter fortalecido infraestrutura compartilhada e inovação para tecnologias de próxima geração em comunicação sem fio, sensoriamento e defesa, mas a organização e os programas relacionados a machine learning e RFIC foram encerrados
- Se a área de RFIC ampliar a colaboração entre pesquisadores de IA e projetistas de chips e criar um ecossistema aberto, poderá aproveitar melhor o potencial do projeto de IC baseado em IA
1 comentários
Comentários do Hacker News
Isso me lembra as antigas buscas com algoritmos genéticos. O método de tentar e verificar pode ser bem poderoso, especialmente se for possível inserir a orientação de um agente no meio do processo
https://en.wikipedia.org/wiki/Evolved_antenna
Como ponto de partida: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Fico pensando se a expectativa comum de que uma teoria verdadeira deve ser, de algum modo, bela e elegante vai sobreviver ao próximo século. E se os fenômenos naturais reais forem, na verdade, mais bem descritos por um monte de equações terrivelmente bagunçadas, que só máquinas conseguem manipular e inferir? Seria bem triste
A piada de que físicos assumem uma “vaca perfeitamente esférica” está nesse contexto; e, na verdade, o ponto central do ensaio “A eficácia irracional da matemática” é bem próximo disso. A ideia é que é irracionalmente surpreendente que aproximações matemáticas descrevam o mundo tão bem
A navalha de Occam é uma heurística útil, mas também nos enviesar em favor de explicações mais simples
Um ótimo uso para design com IA é a poluição de patentes. Gerar em massa, com IA, variações de projetos e publicá-las em um site, para depois, quando uma patente surgir, usar as partes sobrepostas para invalidá-la ou ao menos restringir seu escopo. A generalização de uma patente é limitada pelo estado da técnica
Depois, ele ganhou alguma atenção ao explicar sua lógica em um evento TEDx local [1], e lembro que comentaristas jurídicos ficaram pouco impressionados, dizendo que juízes rotineiramente distinguem diferenças muito mais sutis do que isso. Ainda assim, foi uma tentativa simpática
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
https://www.the-independent.com/tech/music-copyright-algorit...
É um pouco frustrante. A IA pode fazer muita coisa, mas estão sempre misturando LLMs com Monte Carlo, algoritmos genéticos, sistemas especialistas e outras mágicas estatísticas de machine learning tradicional, juntando de forma agressiva atividades de machine learning já estabelecidas e moralmente neutras com preocupações sobre LLMs e Stable Diffusion
E talvez essa seja mesmo a intenção
Quando você quer dizer que houve um grande avanço em alguma coisa, conectar isso ao entendimento popular-científico de que a ficção científica prevê conquistas humanas é uma estratégia de baixo esforço e alto impacto. Se a prioridade número 1 é empolgar as pessoas, não se trata de comunicar com precisão
A frase “humanos nem sequer imaginariam isso” parece exagerada. Ainda assim, parece totalmente plausível que algoritmos de aprendizado de máquina possam chegar, por meio de busca por força bruta, a projetos de chips que ninguém tentou antes, e que alguns deles possam ser úteis para nós. É algo bastante razoável para um computador fazer
Uma coisa que dá para tirar do artigo é que, para produzir esse avanço, foi preciso abandonar os blocos básicos comprovados do projeto de chips. Fico pensando se o mesmo vale para programação comum. Será que inovações surpreendentes em codificação por IA estão, na verdade, sendo bloqueadas por Rust e Python? Deveríamos simplesmente deixar as ferramentas de IA programarem no nível mais baixo possível?
Isso me lembrou este texto antigo: https://www.damninteresting.com/on-the-origin-of-circuits/
Uma daquelas pequenas joias encontradas na internet
Em outro comentário aqui perto surgiu a questão da robustez de projetos cultivados em laboratório, e a parte mais interessante do texto da Damn Interesting também foi o fato de o programa evoluído não poder ser separado do único FPGA físico usado no treinamento. Este modelo de aprendizado de RFIC usa um simulador, então me pergunto se as características do hardware físico em que o simulador roda ficam suficientemente isoladas do treinamento para que os projetos se comportem de forma parecida ao rodar o simulador em hardwares diferentes
A pergunta mais óbvia é se um projeto evoluído no simulador tem alguma esperança de funcionar como esperado em hardware físico real. Minha intuição sobre essa última é que não, mas ainda parece uma pesquisa interessante, e muitas vezes penso que entender direito o que realmente aconteceu no FPGA talvez seja um pré-requisito para lidar de verdade com aprendizado por reforço
Fico feliz que você tenha postado esse texto; se tiver outros favoritos relacionados a essa área, eu gostaria de ver
A maior questão é quão robusto é esse projeto
O artigo mostra que as medições do dispositivo real batem bem com as previsões, mas não encontrei uma parte no texto que trate disso explicitamente. Além disso, alguns dos sistemas apresentados incluem sub-blocos projetados de forma tradicional, então eles podem estar assumindo parte do trabalho
Talvez eu esteja sendo enviesado porque parece estar vindo atrás do meu emprego, ou talvez queiram que pensemos assim
Acho que o que vence de verdade são ideias simples que aguentam variações de fabricação e ambiente e limitações de modelo. Coisas como realimentação ou simetria. Mas o que aparece aqui é quase o oposto disso. Já fiz otimização cega de parâmetros de circuitos algumas vezes e, no fim, tudo fazia perfeito sentido quando eu percebia alguma ideia simples que tinha deixado passar, como “aqui precisa de simetria” ou “aqui precisa de mais largura de banda”. Então fico me perguntando se, ajustando apenas alguns pixels dessa estrutura, algo mais simples não acabaria aparecendo
E, obrigatoriamente, é preciso mencionar as “antenas evoluídas”
Segundo o texto, o papel da IA é substituir o simulador eletromagnético no processo de otimização para estimar o comportamento da estrutura, e isso seria várias ordens de grandeza mais rápido que a simulação
Parece plausível, mas, para acreditar nisso, eu gostaria de ver a diferença entre as estimativas da IA e medições reais para geometrias bem diferentes das usadas no treinamento da IA. Também seria preciso ver exatamente com qual simulador a velocidade do modelo de IA foi comparada
Em campos eletromagnéticos e circuitos eletrônicos, há várias abordagens de simulação que trocam precisão por velocidade. Por isso, não tenho certeza de que a inferência por IA necessariamente leve muito menos tempo do que uma simulação de baixa precisão mais rápida. Essa simulação também poderia ser mais precisa e confiável do que a estimativa da IA
Como você já falou disso, acrescento algo sobre “perceber uma ideia bastante simples”: acho que uma das grandes vantagens desse tipo de projeto auxiliado por computador é a “innovization”[1]. É um termo meio estranho, mas a ideia central é que esses sistemas levam a uma compreensão mais profunda de um determinado processo. Quando você vivencia isso na prática, é uma sensação bem divertida
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
Os métodos descritos neste artigo não são novos. Cientistas já projetavam há décadas, com algoritmos genéticos, antenas que ninguém entendia, mas que funcionavam bem
Não é algo tão mágico assim. Como o artigo diz, o projeto de RFIC vai muito além da engenharia de RF comum, depende fortemente do conhecimento e da experiência do projetista e é quase magia negra, com ajuda de ferramentas de modelagem e projeto que, algumas décadas atrás, seriam nível supercomputador
O que a IA pode fazer é explorar todos os resultados possíveis em largura primeiro e então escolher o de melhor desempenho. É diferente de uma pessoa dizendo “este caminho parece bom, vamos investigar mais”