A IA aprende a “magia negra” do projeto de RFIC

(spectrum.ieee.org)

1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp

RFIC é a base de tecnologias sem fio como 5G, radar automotivo e comunicação via satélite, mas continua sendo um problema difícil e centrado em trabalho manual porque precisa conciliar eletromagnetismo, calor e confiabilidade de encapsulamento ao mesmo tempo
Pesquisadores de Princeton, sem partir de templates de projeto humanos, combinaram aprendizado por reforço e projeto inverso para explorar desde o zero a arquitetura, a topologia do circuito, os parâmetros dos dispositivos e as interfaces eletromagnéticas
Um emulador baseado em IA prevê, em milissegundos, os parâmetros de espalhamento de estruturas eletromagnéticas 2D arbitrárias, reduzindo bastante as iterações de minutos ou horas exigidas por solucionadores eletromagnéticos tradicionais
Em 2023, num amplificador de potência de onda milimétrica de 30~100GHz, obteve a melhor combinação de largura de banda, potência de saída e eficiência entre os amplificadores de potência em silício da época; em 2024, também passou a gerar estruturas de IC multiport em escala de minutos
A IA também pode criar circuitos que não funcionam, então a validação ainda exige supervisão humana; para avançar rumo a modelos gerais, será necessário um ecossistema aberto para compartilhar dados de projeto de RFIC e analógico hoje presos por NDA

Por que o projeto de RFIC continua sendo “magia negra”

RFIC é o circuito central que permite que dispositivos transmitam e recebam informações sem fio, e os avanços em carros autônomos, comunicação quântica, 6G e comunicação via satélite também dependem de chips de RF mais avançados
O projeto de CPU e GPU já se aproximou de uma ciência padronizada, mas o projeto de RF ainda tem forte caráter de técnica manual, aprendida com longa experiência
O projeto de RFIC lida com várias áreas da física ao mesmo tempo
- As equações de Maxwell governam como os campos eletromagnéticos interagem com componentes ativos e passivos
- A termodinâmica determina como o calor é gerado e removido durante a operação
- Expansão e contração térmica estão ligadas à capacidade do chip e do encapsulamento de suportarem variações de temperatura com estabilidade
Como todas essas restrições físicas precisam ser consideradas em conjunto, o espaço de projeto é enorme, e muitas vezes surge um trade-off em que melhorar uma métrica de desempenho piora outra

Fluxo tradicional de projeto de RFIC e seus gargalos

Para projetar um amplificador de potência de 28GHz para handsets 5G em onda milimétrica, primeiro é preciso definir a arquitetura e a topologia do circuito
A arquitetura de RFIC funciona como a planta de uma casa, definindo os componentes necessários e os caminhos do sinal
- Em amplificadores de potência, o número de estágios de amplificação é um fator importante
- A maior parte da área de um RFIC é ocupada não por transistores, mas por componentes passivos e estruturas eletromagnéticas, como indutores e linhas de transmissão
Sinais 5G operam em 28GHz e 39GHz, comunicações via satélite em 26.5~40GHz ou mais, e radar automotivo em 77GHz; nesses altos níveis de frequência, o RFIC gerencia a energia do sinal por meio de estruturas eletromagnéticas sofisticadas
Se o caminho do sinal não se ajustar corretamente ao próximo componente, surge um problema de casamento de impedância, em que a energia não segue adiante e é refletida para trás
- Engenheiros projetam pequenas estruturas de transição entre componentes para reduzir a reflexão
- Essas estruturas podem ser usadas não só para transmissão de sinal, mas também para divisão, combinação e distribuição por múltiplos caminhos
Se as especificações não forem atendidas, é preciso revisar a topologia ou a arquitetura e repetir as simulações; um novo projeto de chip pode consumir anos e dezenas a centenas de milhões de dólares

Uma abordagem de projeto com IA além dos templates

Pesquisas anteriores usaram machine learning para otimizar templates de circuito, mas ainda dependiam de bibliotecas de projetos existentes criadas por humanos
O objetivo dos pesquisadores de Princeton era fazer com que o algoritmo definisse, desde o zero e sem topologias pré-fabricadas, todos os parâmetros da arquitetura, dos circuitos constituintes e das estruturas passivas eletromagnéticas
Esse método parte de um ponto diferente das otimizações tradicionais
- A abordagem tradicional ajusta parâmetros como tamanho de transistores e geometria de componentes passivos dentro de estruturas criadas por humanos
- A nova abordagem cria combinações candidatas de circuitos a partir de um ponto quase vazio, mapeia os trade-offs de desempenho e explora o espaço de projeto
Como o AlphaGo Zero, a abordagem desenvolve estratégias de projeto por exploração e avaliação próprias, em vez de seguir exemplos humanos
O algoritmo aprende o codesign entre circuito, eletromagnetismo e a interface entre ambos, com o objetivo de fazer projeto end-to-end de RFIC

Combinação de aprendizado por reforço e projeto inverso

A primeira etapa é um framework de aprendizado por reforço, que define a arquitetura ideal do sistema, a topologia do circuito, os parâmetros dos dispositivos e as características das interfaces eletromagnéticas
O agente de aprendizado por reforço, como um computador aprendendo um jogo, testa várias combinações, observa a relação entre ações e pontuações e busca circuitos melhores
- O treinamento leva de alguns dias até uma semana
- Depois do treinamento, o circuito pode ser projetado muito rapidamente
A segunda etapa é o projeto inverso, que busca estruturas eletromagnéticas físicas capazes de produzir os parâmetros de espalhamento desejados
- Os parâmetros de espalhamento medem se o sinal, ao entrar num componente, segue adiante ou é refletido para trás
- É semelhante a encontrar arcos ou estruturas de apoio para criar um espaço desejado em engenharia estrutural
No projeto inverso de RFIC, é preciso ajustar simultaneamente a operação do circuito e a resposta eletromagnética de interconexões e componentes passivos, o que é difícil de resolver apenas com busca manual iterativa

O emulador de IA que reduziu as iterações do projeto eletromagnético

Os pesquisadores substituíram o simulador de circuito de RF por um emulador baseado em IA
Esse modelo recebe como entrada uma estrutura 2D arbitrária e prevê os parâmetros de espalhamento sem calcular diretamente as equações de Maxwell
- Tarefas que antes levavam minutos ou horas em solucionadores eletromagnéticos tradicionais passam a levar milissegundos
O emulador foi construído com base em redes neurais convolucionais, fortes em processamento de imagens
- As imagens das estruturas contêm informações espaciais capazes de prever o desempenho eletromagnético
- Os pesquisadores treinaram o modelo com muitas estruturas aleatórias em pixels rotuladas com parâmetros de espalhamento
Ao combinar projeto inverso com aprendizado por reforço e o emulador de IA, eles montaram um end-to-end AI designer e o aplicaram ao projeto de amplificadores de potência

Resultados de arquitetura de RF diferentes dos humanos

A prova de conceito divulgada em 2023 teve como alvo amplificadores de potência na faixa de onda milimétrica de 30~100GHz
- Essa faixa cobre a maior parte das frequências relevantes de 5G e radar
- O projeto final apresentou, entre os amplificadores de potência em silício da época, a melhor combinação de wide bandwidth, output power e efficiency, mantendo ainda record efficiency
Os caminhos eletromagnéticos gerados pareciam padrões aleatórios ou QR codes, em vez das estruturas regulares e simétricas que humanos costumam considerar
O resultado mostra que não há garantia de que os templates historicamente usados estejam perto do ideal para os objetivos modernos de projeto
Depois disso, os pesquisadores expandiram o modelo para estruturas com muitos portos de entrada e saída
- Com 2 portos há 4 parâmetros de espalhamento; com 4 portos, 16, e a complexidade cresce rapidamente
- No estudo de 2024 sobre multiport integrated circuits, mostraram que o algoritmo de IA também consegue lidar com estruturas multiport
- Antes, simulações eletromagnéticas multiport exigiam dias ou semanas, mas esse modelo evolui novas estruturas em escala de minutos
Ao combinar o framework de aprendizado por reforço com projeto inverso, eles mostraram um fluxo que vai da especificação até o fabrication-ready layout, aplicado a amplificadores de baixo ruído, subterahertz e amplificadores de potência broadband

Projeto de IA interpretável

Como testes e depuração de RFIC podem levar tanto tempo quanto o próprio projeto, ou ser ainda mais difíceis, engenheiros preferem estruturas interpretáveis que possam entender e corrigir quando algo dá errado
Os pesquisadores aplicaram diffusion models, usados em IA de geração de imagem, à geração de estruturas de RFIC
Em vez de prompts de texto, usam parâmetros de espalhamento como entrada e geram como saída a estrutura eletromagnética do RFIC
Incluíram um dial de frequência espacial na entrada para permitir que o projetista controle a forma da estrutura resultante
- Baixa frequência espacial: forma clássica e interpretável
- Frequência espacial intermediária: estrutura semelhante a um labirinto
- Alta frequência espacial: estrutura pixelada ou próxima de uma forma aleatória
Todo o processo, do prompt à saída, leva cerca de 6 minutos, e pode gerar uma estrutura correspondente sempre que os parâmetros de espalhamento forem fisicamente realizáveis sob as equações de Maxwell

Limitações restantes e o desafio dos dados

A abordagem de projeto baseada em IA atraiu o interesse da comunidade de RF e começou a inverter o fluxo tradicional de projeto bottom-up
Ainda restam perguntas em aberto
- Até que ponto o método pode generalizar
- Se consegue manter alto desempenho de forma consistente
- Se pode otimizar globalmente todos os trade-offs possíveis
- Se pode inventar, além de RFIC, outros circuitos que nunca foram criados por humanos
A IA pode sofrer hallucination e gerar circuitos ruins que não funcionam, então a validação continua exigindo supervisão humana
Para criar um foundational model geral, será necessário um grande volume de dados para aprender as leis que governam o eletromagnetismo e o funcionamento dos circuitos
- O ImageNet é um exemplo de como 14 milhões de imagens diversas e rotuladas por humanos permitiram a generalização de modelos de reconhecimento de imagem
- RFIC e projeto analógico também precisam de dados com escala e diversidade semelhantes
Muitos desses dados já existem nas simulações de empresas e laboratórios no mundo todo, mas a maior parte está presa atrás de NDAs
A Natcast operava o programa de P&D do U.S. CHIPS and Science Act e poderia ter fortalecido infraestrutura compartilhada e inovação para tecnologias de próxima geração em comunicação sem fio, sensoriamento e defesa, mas a organização e os programas relacionados a machine learning e RFIC foram encerrados
Se a área de RFIC ampliar a colaboração entre pesquisadores de IA e projetistas de chips e criar um ecossistema aberto, poderá aproveitar melhor o potencial do projeto de IC baseado em IA

1 comentários

GN⁺ 4 시간 전

Comentários do Hacker News

Isso me lembra as antigas buscas com algoritmos genéticos. O método de tentar e verificar pode ser bem poderoso, especialmente se for possível inserir a orientação de um agente no meio do processo
https://en.wikipedia.org/wiki/Evolved_antenna
- Eu ia dizer algo parecido. Lembro de uma história sobre criar, com algoritmo genético, um oscilador com o menor número possível de componentes; no fim, ele conseguiu funcionar com um único fio, surpreendendo todo mundo. Ou seja, na prática era uma antena captando RF ruidosa nas proximidades
- Tem isto também: https://en.wikipedia.org/wiki/Evolvable_hardware
  Como ponto de partida: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Fico pensando se a expectativa comum de que uma teoria verdadeira deve ser, de algum modo, bela e elegante vai sobreviver ao próximo século. E se os fenômenos naturais reais forem, na verdade, mais bem descritos por um monte de equações terrivelmente bagunçadas, que só máquinas conseguem manipular e inferir? Seria bem triste
- Acho a expressão “expectativa comum” um pouco exagerada. A maioria das pessoas entende teorias científicas como aproximações. F=ma só vale dentro do escopo da mecânica newtoniana, e cada termo vem com inúmeras ressalvas, então medições reais são sempre apenas aproximações
  A piada de que físicos assumem uma “vaca perfeitamente esférica” está nesse contexto; e, na verdade, o ponto central do ensaio “A eficácia irracional da matemática” é bem próximo disso. A ideia é que é irracionalmente surpreendente que aproximações matemáticas descrevam o mundo tão bem
- Penso nisso com frequência ao olhar para a medicina e para o corpo humano. Queremos acreditar que o corpo é uma máquina milagrosamente bem lubrificada, mas na prática muitas vezes ele parece mais uma bolsa bagunçada que mal se mantém unida
- Também tenho pensado muito nisso ultimamente, especialmente ao ver a quantidade crescente de provas verificáveis por máquina que são difíceis de entender
  A navalha de Occam é uma heurística útil, mas também nos enviesar em favor de explicações mais simples
- Eu acharia realmente incrível, na verdade. No nível mais baixo, já sabemos que tudo é uma nuvem de probabilidades. Há beleza e conforto também no fato de que nada pode ser determinado para sempre
- Acho que “expectativa comum” não capta o ponto. Não é que a teoria fundamental precise ser simples ou elegante, mas sim que, se você tiver de escolher entre uma teoria mais complexa e uma mais simples, em geral a teoria mais simples é a escolha mais correta. As equações da física quântica também são bem feias
Um ótimo uso para design com IA é a poluição de patentes. Gerar em massa, com IA, variações de projetos e publicá-las em um site, para depois, quando uma patente surgir, usar as partes sobrepostas para invalidá-la ou ao menos restringir seu escopo. A generalização de uma patente é limitada pelo estado da técnica
- Isso me lembra a resposta performática que o advogado Damien Riehl apresentou na época da decisão de infração envolvendo Sam Smith, em 2019/2020. Com o programador Noah Rubin, ele alegou ter gerado por algoritmo todas as melodias possíveis dentro de um determinado espaço de combinações, em formato MIDI, e as publicado sob licença CC-0 [0]
  Depois, ele ganhou alguma atenção ao explicar sua lógica em um evento TEDx local [1], e lembro que comentaristas jurídicos ficaram pouco impressionados, dizendo que juízes rotineiramente distinguem diferenças muito mais sutis do que isso. Ainda assim, foi uma tentativa simpática
  [0] https://allthemusic.info/
  [1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
  https://www.the-independent.com/tech/music-copyright-algorit...
É um pouco frustrante. A IA pode fazer muita coisa, mas estão sempre misturando LLMs com Monte Carlo, algoritmos genéticos, sistemas especialistas e outras mágicas estatísticas de machine learning tradicional, juntando de forma agressiva atividades de machine learning já estabelecidas e moralmente neutras com preocupações sobre LLMs e Stable Diffusion
E talvez essa seja mesmo a intenção
- O problema é que as pessoas dizem que a IA pode fazer algo como se estivessem insinuando que um LLM consegue fazer aquilo. Assim, parece que um LLM puro consegue fazer quase tudo. No sentido oposto, também dizem que a IA jamais conseguirá fazer X porque LLMs, por padrão, não são bons em certa tarefa. O termo IA ficou tão ambíguo que perdeu utilidade
- Queria poder agitar uma varinha mágica e eliminar a própria palavra IA. Ela não tem significado real. Pode se referir a qualquer coisa, dos personagens adversários em Mario Kart até Stable Diffusion
- “IA” é um termo amaldiçoado por conotações legais de ficção científica. Por isso é poderoso como termo de marketing. Muita gente conhece IA de ficção científica, e a crença de que “alguma mídia previu alguma tecnologia” é bem difundida para X como Star Trek, O Guia do Mochileiro das Galáxias e Arthur C. Clarke, e Y como internet, celulares e VR
  Quando você quer dizer que houve um grande avanço em alguma coisa, conectar isso ao entendimento popular-científico de que a ficção científica prevê conquistas humanas é uma estratégia de baixo esforço e alto impacto. Se a prioridade número 1 é empolgar as pessoas, não se trata de comunicar com precisão
- Por isso venho praticando chamar machine learning tradicional de ML e modelos de linguagem de grande escala de LLM. Tento não usar mais a palavra IA sempre que possível. Ela é ambígua demais. Mesmo ao falar de IA de jogos, tento usar a sigla do tipo de algoritmo que essa IA parece usar. Muitas vezes digo fluxograma, embora eu não tenha certeza se o funcionamento interno realmente é um fluxograma
- Assim como, durante o inverno da IA, as áreas mais bem-sucedidas de machine learning se distanciaram desse termo, agora que virou um verão da IA, provavelmente veremos essas áreas voltando a adotá-lo; talvez isso já esteja acontecendo
A frase “humanos nem sequer imaginariam isso” parece exagerada. Ainda assim, parece totalmente plausível que algoritmos de aprendizado de máquina possam chegar, por meio de busca por força bruta, a projetos de chips que ninguém tentou antes, e que alguns deles possam ser úteis para nós. É algo bastante razoável para um computador fazer
- É baboseira de marketing. Primeiro, é como provar uma negativa: não dá para provar que humanos não poderiam imaginar aquilo. Em segundo lugar, humanos já imaginaram muitas coisas esquisitas
- Parece um bolo em camadas de aprendizado de máquina com farelos de força bruta por cima
Uma coisa que dá para tirar do artigo é que, para produzir esse avanço, foi preciso abandonar os blocos básicos comprovados do projeto de chips. Fico pensando se o mesmo vale para programação comum. Será que inovações surpreendentes em codificação por IA estão, na verdade, sendo bloqueadas por Rust e Python? Deveríamos simplesmente deixar as ferramentas de IA programarem no nível mais baixo possível?
- Pergunta interessante, mas parece ter implicações bem preocupantes para portabilidade
Isso me lembrou este texto antigo: https://www.damninteresting.com/on-the-origin-of-circuits/
Uma daquelas pequenas joias encontradas na internet
- Eu também ia postar isso. Foi realmente chocante quando li pela primeira vez, então fico feliz em ver que outras pessoas também apreciam
  Em outro comentário aqui perto surgiu a questão da robustez de projetos cultivados em laboratório, e a parte mais interessante do texto da Damn Interesting também foi o fato de o programa evoluído não poder ser separado do único FPGA físico usado no treinamento. Este modelo de aprendizado de RFIC usa um simulador, então me pergunto se as características do hardware físico em que o simulador roda ficam suficientemente isoladas do treinamento para que os projetos se comportem de forma parecida ao rodar o simulador em hardwares diferentes
  A pergunta mais óbvia é se um projeto evoluído no simulador tem alguma esperança de funcionar como esperado em hardware físico real. Minha intuição sobre essa última é que não, mas ainda parece uma pesquisa interessante, e muitas vezes penso que entender direito o que realmente aconteceu no FPGA talvez seja um pré-requisito para lidar de verdade com aprendizado por reforço
  Fico feliz que você tenha postado esse texto; se tiver outros favoritos relacionados a essa área, eu gostaria de ver
- Também é um exemplo de uma espécie que se tornou tão especializada e otimizada que já não consegue mais se adaptar. Também é um exemplo de POSIWID
A maior questão é quão robusto é esse projeto
O artigo mostra que as medições do dispositivo real batem bem com as previsões, mas não encontrei uma parte no texto que trate disso explicitamente. Além disso, alguns dos sistemas apresentados incluem sub-blocos projetados de forma tradicional, então eles podem estar assumindo parte do trabalho
Talvez eu esteja sendo enviesado porque parece estar vindo atrás do meu emprego, ou talvez queiram que pensemos assim
Acho que o que vence de verdade são ideias simples que aguentam variações de fabricação e ambiente e limitações de modelo. Coisas como realimentação ou simetria. Mas o que aparece aqui é quase o oposto disso. Já fiz otimização cega de parâmetros de circuitos algumas vezes e, no fim, tudo fazia perfeito sentido quando eu percebia alguma ideia simples que tinha deixado passar, como “aqui precisa de simetria” ou “aqui precisa de mais largura de banda”. Então fico me perguntando se, ajustando apenas alguns pixels dessa estrutura, algo mais simples não acabaria aparecendo
E, obrigatoriamente, é preciso mencionar as “antenas evoluídas”
- É exatamente isso que me incomoda neste artigo e em alguns artigos parecidos do passado. Eles não contêm evidências da alegação de que IA seja útil no projeto
  Segundo o texto, o papel da IA é substituir o simulador eletromagnético no processo de otimização para estimar o comportamento da estrutura, e isso seria várias ordens de grandeza mais rápido que a simulação
  Parece plausível, mas, para acreditar nisso, eu gostaria de ver a diferença entre as estimativas da IA e medições reais para geometrias bem diferentes das usadas no treinamento da IA. Também seria preciso ver exatamente com qual simulador a velocidade do modelo de IA foi comparada
  Em campos eletromagnéticos e circuitos eletrônicos, há várias abordagens de simulação que trocam precisão por velocidade. Por isso, não tenho certeza de que a inferência por IA necessariamente leve muito menos tempo do que uma simulação de baixa precisão mais rápida. Essa simulação também poderia ser mais precisa e confiável do que a estimativa da IA
- Eu também vim mencionar as antenas evoluídas
  Como você já falou disso, acrescento algo sobre “perceber uma ideia bastante simples”: acho que uma das grandes vantagens desse tipo de projeto auxiliado por computador é a “innovization”[1]. É um termo meio estranho, mas a ideia central é que esses sistemas levam a uma compreensão mais profunda de um determinado processo. Quando você vivencia isso na prática, é uma sensação bem divertida
  [1]: https://dl.acm.org/doi/10.1145/1143997.1144266
- É só um artigo lixo exagerado
Os métodos descritos neste artigo não são novos. Cientistas já projetavam há décadas, com algoritmos genéticos, antenas que ninguém entendia, mas que funcionavam bem
Não é algo tão mágico assim. Como o artigo diz, o projeto de RFIC vai muito além da engenharia de RF comum, depende fortemente do conhecimento e da experiência do projetista e é quase magia negra, com ajuda de ferramentas de modelagem e projeto que, algumas décadas atrás, seriam nível supercomputador
O que a IA pode fazer é explorar todos os resultados possíveis em largura primeiro e então escolher o de melhor desempenho. É diferente de uma pessoa dizendo “este caminho parece bom, vamos investigar mais”
- Algo precisa ser mágico para ser interessante ou útil?

A IA aprende a “magia negra” do projeto de RFIC

Por que o projeto de RFIC continua sendo “magia negra”

Fluxo tradicional de projeto de RFIC e seus gargalos

Uma abordagem de projeto com IA além dos templates

Combinação de aprendizado por reforço e projeto inverso

O emulador de IA que reduziu as iterações do projeto eletromagnético

Resultados de arquitetura de RF diferentes dos humanos

Projeto de IA interpretável

Limitações restantes e o desafio dos dados

Leituras relacionadas

1 comentários

Comentários do Hacker News