O Fara-7B, desenvolvido pela Microsoft Research, é um agente de IA compacto com 7 bilhões de parâmetros, capaz de executar diretamente tarefas no computador, como navegação na web, preenchimento de formulários e reservas. No benchmark WebVoyager, alcançou uma taxa de sucesso de 73,5%, superando o GPT-4o (65,1%) e o UI-TARS (66,4%). O modelo roda no PC do usuário sem depender da nuvem, protegendo a privacidade dos dados, e adota uma abordagem de 'soberania de pixels', processando cliques do mouse, entrada por teclado e rolagem apenas com capturas de tela, de forma eficiente (média de 16 etapas para concluir uma tarefa).
O princípio de funcionamento está no fato de ter sido treinado com dados gerados e comprimidos a partir de 145 mil trajetórias sintéticas de tarefas por meio do sistema Magentic-One, além de rodar rapidamente na NPU dos Copilot+ PCs. Entre os recursos de segurança, ele exige aprovação do usuário em 'Critical Points', e suas ações podem ser rastreadas e interrompidas com o Magentic-UI. Foi disponibilizado sob licença MIT no Hugging Face e no Microsoft Foundry.
Também mostrou ótimo desempenho em outros benchmarks (Online-Mind2Web 34,1%, DeepShop 26,2% etc.), mas limitações como queda de precisão em tarefas complexas e problemas de alucinação foram apontadas. A Microsoft o avalia como uma 'prova de conceito', e a abertura do código deve ampliar o ecossistema de desenvolvedores.
Conclusão: O Fara-7B demonstra o potencial dos modelos pequenos e é um caso importante que inaugura a era dos assistentes pessoais de IA com menor dependência da nuvem. No futuro, espera-se uma evolução mais segura e inteligente com aprendizado por reforço.
1 comentários
Os modelos pequenos são muito sensíveis a prompts, então é difícil usá-los com facilidade... a única saída é fazer testes repetitivos?