Oito funcionários do Google inventam a IA moderna: a história interna
- O artigo científico "Attention Is All You Need", escrito na primavera de 2017, tem oito autores.
- Todos eram pesquisadores do Google, e Noam Shazeer, o colaborador mais experiente, ficou surpreso ao ver seu nome listado em primeiro lugar.
- Os autores decidiram 'destruir' a prática de classificar as contribuições por ordem de importância, colocaram um asterisco ao lado de todos os nomes e adicionaram a nota de rodapé "a ordem de listagem é aleatória".
O início da transformação
- Esse artigo avançou a tecnologia de redes neurais no campo da IA, transformando-a em sistemas digitais poderosos que parecem produto de uma inteligência alienígena.
- Essa arquitetura é usada como ingrediente secreto em produtos de IA como ChatGPT, Dall-E e Midjourney.
- O artigo está prestes a completar sete anos desde sua publicação e conquistou status lendário.
A arquitetura da transformação: o transformer
- A história do transformer começa com o quarto autor, Jakob Uszkoreit.
- Com base em sua ideia de self-attention, Uszkoreit concebeu uma nova abordagem.
- Essa rede consegue traduzir palavras consultando quais partes de uma frase deve referenciar, o que ajuda o sistema a gerar boas traduções.
Colaboração e inovação
- Uszkoreit acreditava que um modelo de self-attention poderia ser mais rápido e eficaz do que redes neurais recorrentes.
- A ideia evoluiu por meio da colaboração com outros pesquisadores, como Illia Polosukhin e Ashish Vaswani.
- Eles escreveram um documento de design chamado "Transformers: Iterative Self-Attention and Processing for Various Tasks".
Publicação do artigo e impacto
- A equipe de pesquisa usou o modelo transformer para fazer tradução de idiomas e mediu seu desempenho com o benchmark BLEU.
- O novo modelo superou os concorrentes, e a versão maior, Big, obteve uma pontuação BLEU que bateu o recorde anterior.
- O artigo foi submetido pouco antes do prazo final, e o Google rapidamente registrou uma patente provisória para esse trabalho.
Reação do Google e mudanças
- Dentro do Google, esse trabalho foi visto apenas como mais um projeto interessante de IA, e a empresa começou a integrar transformers em seus produtos a partir de 2018.
- No entanto, essa mudança parece tímida em comparação com o salto radical da OpenAI e com a integração ousada, pela Microsoft, de sistemas baseados em transformer em sua linha de produtos.
Os autores que deixaram o Google
- Todos os autores deixaram o Google e estão trabalhando de várias formas com base no sistema que criaram.
- Muitos deles saíram da empresa e migraram para novas startups de IA.
A opinião do GN⁺
- Este artigo oferece uma visão interessante sobre o avanço da tecnologia de IA ao explicar em detalhes o nascimento e o desenvolvimento do modelo transformer, que desempenhou um papel importante na área.
- O modelo transformer é hoje a tecnologia central do processamento de linguagem por IA e uma invenção importante que serve de base para IAs conversacionais como o ChatGPT.
- O artigo mostra como o ambiente interno de pesquisa inovadora do Google tornou possível um avanço tecnológico de grande impacto.
- No entanto, o fato de o Google ter adotado uma abordagem um tanto conservadora para comercializar essa tecnologia oferece uma lição importante sobre a velocidade da inovação e a estratégia das empresas.
- Empresas ou desenvolvedores que adotarem essa tecnologia devem considerar a complexidade e os requisitos de recursos do modelo transformer, mas os benefícios que podem ser obtidos são muito grandes.
1 comentários
Comentários do Hacker News
Discussão sobre o modelo de atenção:
Attention) não era algo novo, mas houve pesquisas mostrando que ele era suficiente para prever a próxima sequência de palavras em certos contextos.Recordação do auge do Google:
Conversa sobre a história da IA:
Comparação entre Google e OpenAI:
Menção à colaboração entre funcionários do Google:
Crítica à estratégia de IA do Google:
Documentos internos do Google sobre a história da IA:
Atenção à diversidade dos autores:
Apoio a departamentos de P&D: