Aprenda IA com Excel
- Aprenda como a IA funciona por meio de um LLM real implementado no Excel
- Implementação do Forward Pass do GPT-2 usando apenas funções do Excel, sem chamadas a APIs externas
- O objetivo é mostrar que, se você consegue entender planilhas, consegue entender IA
- Lição 1: Entendendo o GPT com Excel
- Lição 2: Byte Pair Encoding e tokenização
- Extra: uma análise detalhada da implementação em Excel (voltada para quem já entende Transformers)
- Está em formato XLSB (Excel Binary), então é possível baixar e executar (funciona em Mac/Windows, mas Windows é recomendado)
- Limitações da implementação
- Modelo GPT-2 pequeno completo (124M de parâmetros), incluindo os estágios de BPE, atenção multi-head e perceptron multicamadas
- Apenas inferência/forward pass (sem treinamento)
- O contexto é limitado a 10 tokens de comprimento
- Limite de 10 caracteres por palavra
- Só é possível gerar saída com temperatura zero
FAQ
- Sobre o Google Sheets: este projeto começou no Google Sheets, mas o modelo completo ficou grande demais e foi migrado para o Excel. Ainda estão explorando formas de fazê-lo funcionar no Google Sheets, mas é provável que ele não se encaixe tão bem em um único arquivo quanto no Excel.
- Por que não dá para conversar como no ChatGPT: além do contexto muito curto, faltam instruction tuning e aprendizado por reforço com feedback humano (RLHF) para transformá-lo em um chatbot conversacional.
- Origem do nome: o nome "Spreadsheets-are-all-you-need" é uma referência ao famoso artigo "Attention Is All You Need", que apresentou pela primeira vez a arquitetura de aprendizado de máquina Transformer.
Opinião do GN⁺
- Este projeto contribui para tornar IA e aprendizado de máquina mais acessíveis. Ao usar uma ferramenta familiar como o Excel para ajudar a entender uma tecnologia complexa, ele oferece a não especialistas a oportunidade de aprender os princípios básicos da IA.
- A implementação via Excel é útil para compreender visualmente como modelos reais de IA funcionam, mas não é usada no desenvolvimento real de IA. Portanto, aprender IA dessa forma não significa se tornar um desenvolvedor profissional de IA.
- Ferramentas educacionais como esta podem aumentar o interesse do público em geral por IA e contribuir para a democratização da tecnologia. No entanto, para construir sistemas reais de IA, são necessárias ferramentas e frameworks mais especializados.
- Projetos semelhantes com fins educacionais incluem o Machine Learning Crash Course, do Google, e o curso de Machine Learning do professor Andrew Ng na Coursera. Esses cursos combinam teoria e prática para oferecer um aprendizado mais aprofundado.
- Ao adotar essa tecnologia, é preciso entender que ela exige uma abordagem diferente do desenvolvimento de modelos reais de IA. Este projeto é focado em fins educacionais, e em projetos reais de desenvolvimento de IA é comum usar frameworks especializados como TensorFlow e PyTorch.
2 comentários
Comentários do Hacker News
Saudação e agradecimento do criador
Ensino de redes neurais com planilhas
Explicando redes neurais com planilhas
Compartilhamento do link da planilha
Pergunta sobre a necessidade de RLHF
Admiração pela forma como o GPT-2 foi implementado em uma planilha
Possibilidade de implementar GPT-3 ou GPT-4 em planilhas
Um ótimo projeto para ajudar a entender LLMs
Compartilhamento de casos de resolução de PDE no Excel
Empresa de IA com bancos de investimento como clientes