3 pontos por groro 5 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp

Título: É possível um cenário em que a IA desenvolva 100% do firmware de MCU para eletrodomésticos?

Original: Samsung Tech Blog - https://techblog.samsung.com/blog/article/90

  • A Samsung Electronics aplicou “Harness Engineering” ao desenvolvimento de firmware de MCU para um eletrodoméstico (coifa) para verificar se um agente de IA conseguiria criar 100% do firmware sem intervenção humana na codificação, repetindo autonomamente o ciclo de planejamento-implementação-validação

  • Aqui, “harness” não significa tornar o modelo mais inteligente, mas projetar o ambiente de trabalho (informações necessárias, proibições, loop de autovalidação, estrutura de pastas, especificações, padrões de codificação, build/linter) para que a IA produza os resultados pretendidos. O papel do desenvolvedor passa de “autor de código” para “projetista de especificações e harness”

  • O princípio central é: “uma especificação que a IA não consegue verificar é uma especificação inexistente”. Requisitos não documentados não podem servir nem como critério de implementação nem de validação, portanto equivalem a “requisitos inexistentes” (por exemplo, se não for informado se o fluxo de ar deve ser Low-Mid-High ou On-Off, a IA decide arbitrariamente). O ponto de partida é a “engenharia de especificações”, que sistematiza especificações legadas e o “conhecimento tácito” dos desenvolvedores em um formato utilizável pela IA

  • As especificações antes dispersas foram reorganizadas em torno da pasta docs/. O comportamento do produto fica em behavior/, a justificativa de design em design/, e as informações de configuração e inicialização de hardware em hardware/; especificações de comunicação, máquinas de estado e protocolos de comunicação também foram organizados em suas respectivas pastas. Somando a isso AGENTS.md, com regras de trabalho para a IA, e ARCHITECTURE.md, que define a estrutura em camadas e regras de dependência, a base do harness foi concluída. Como resultado, a documentação atua como uma “fonte única da verdade” (Single Source of Truth)

  • Além dos três tipos de harness — especificação/implementação/validação —, foram fornecidas como “skills” a especificação de MCU exclusiva da Samsung, instruções de uso do depurador de MCU e um USB Switch que liga e desliga fisicamente a alimentação de 220V. O escopo de implementação é controlado por SDD/TDD/BDD, e é preciso passar pelos quality gates de Build/Test/Lint para avançar à etapa seguinte

  • O loop AUTOPILOT começa a partir de código Zero-Base e repete autonomamente planejamento-implementação-validação. Nesse processo, separa-se o “agente que gera” do “agente que avalia/valida”, evitando situações em que a IA avalie seus próprios resultados de forma benevolente

  • O desafio mais difícil é construir um ambiente em que a IA consiga verificar diretamente os resultados no “MCU real”. O ambiente de validação é composto pelo Codex AI no PC + depurador de MCU baseado em JTAG + USB Switch para controle de energia, com o Codex AI controlando o depurador e o switch. O depurador lê e escreve diretamente o estado do MCU, e o USB Switch liga e desliga a alimentação de 220V, permitindo que a IA reinicialize o conjunto sozinha mesmo em estados irrecuperáveis

  • Foram fornecidos à IA a especificação do produto, informações de protocolo e pacotes, datasheet do MCU, instruções de uso do depurador, código-fonte e estrutura de variáveis, além do método para ligar/desligar a energia. A IA analisa a especificação e, por “vontade autônoma”, deriva cenários de teste; em seguida, injeta entradas de tecla no conjunto real via depurador (Memory Write) e lê os valores de estado como variáveis (Memory Read) para determinar por conta própria o Pass/Fail de cada cenário. Ou seja, a validação automática autônoma se estabelece quando os três elementos — “cenário de operação + Memory Write + Memory Read” — funcionam de forma integrada

  • Resultado: nas 5 execuções, o desenvolvimento foi concluído autonomamente sem intervenção humana (cerca de 4,5 a 5,5 horas por execução), com aproximadamente 95% de completude nas operações básicas. Os cerca de 5% restantes ocorreram principalmente em HAL (UART, Timer, WatchDog, Clock etc., áreas de validação de HW real) e puderam ser complementados com 1 a 4 horas de depuração por uma pessoa

  • Foi confirmada a possibilidade de reduzir o período de desenvolvimento em média de 50% a 70%. No entanto, trata-se de uma estimativa de IA baseada no tempo puro de desenvolvimento, excluindo aprovação/revisão/release, e os desafios para adoção ampla são o investimento inicial e a definição de critérios de validação perfeitos o suficiente para que humanos não precisem revisar o código

Ainda não há comentários.

Ainda não há comentários.