8 pontos por GN⁺ 2024-07-17 | Ainda não há comentários. | Compartilhar no WhatsApp

Estamos na terceira era de ouro da IA. Nas duas eras de ouro anteriores (décadas de 1950–1960 e 1980), houve frustração por causa das limitações tecnológicas. No entanto, a tecnologia de IA atual está superando as expectativas. Em especial, o Transformer, introduzido em 2017, começou como um modelo de tradução automática, mas hoje está impactando praticamente todas as áreas. É considerado um conhecimento essencial para o engenheiro moderno. O primeiro objetivo deste documento é oferecer aos engenheiros o caminho mais curto para entender Transformers.

O que este documento oferece

  • Guia conciso: fornece informações suficientes para aprender sobre Transformers.
  • Exemplos práticos de código Python: ajuda na compreensão ao fornecer exemplos de código Python que o leitor pode executar por conta própria.
  • Materiais de referência para exploração adicional: apresenta várias opções de documentação para facilitar o acesso do leitor.

Sumário

  • Part 1: Redes neurais: apresenta os conceitos básicos de redes neurais.
  • Part 2: Redes neurais recorrentes (RNNs): explora RNNs, incluindo LSTM e GRU.
  • Part 3: Processamento de Linguagem Natural (NLP) e mecanismos de atenção: fornece os princípios básicos de NLP, incluindo tradução automática e mecanismos de atenção.
  • Part 4: Transformer: explica o modelo Transformer.
  • Apêndice: conhecimentos básicos: fornece o conhecimento mínimo de Python e matemática necessário para entender Transformers.

FAQ

  • Quem pode usar este documento livremente?
    • Professores ou alunos vinculados a instituições de ensino podem usar livremente este documento e as figuras. Este documento e as figuras podem ser usados em conferências e aulas não comerciais, desde que o link deste site e os direitos autorais sejam informados. Caso contrário, entre em contato.
  • Pode ser usado em conteúdo comercial?
    • Compartilhamento de receita: o conteúdo pode ser usado após a celebração de um contrato de compartilhamento de receita. De acordo com esse contrato, 20% das vendas geradas com o uso deste conteúdo devem ser compartilhadas.
    • Compra integral: em casos muito raros, são considerados pedidos para compra integral dos direitos sobre todo o conteúdo. O custo da compra integral é de €10,000,000.
  • Por que o autor não abre mão dos direitos autorais deste documento nem usa uma licença Creative Commons?
    • Entre em contato caso tenha dúvidas sobre manter os direitos autorais. Ao enviar um e-mail, é necessário fornecer pelo menos dois endereços de redes sociais (por exemplo, LinkedIn, Twitter). Após o incidente do backdoor do XZ, contatos anônimos não são aceitos.

Exceções

Instituições de ensino podem usar livremente este documento.

Resumo do GN⁺

  • Este documento é um guia conciso que fornece o conhecimento básico necessário para entender o modelo Transformer.
  • Destaca-se por ajudar o leitor a aprender por conta própria com exemplos práticos de código Python e diversos materiais de referência.
  • O modelo Transformer é o núcleo da tecnologia moderna de IA, e entendê-lo é muito importante para engenheiros.
  • Este documento pode ser usado livremente por instituições de ensino, e o uso comercial exige autorização do detentor dos direitos autorais.
  • É um material útil para quem deseja explorar outras tecnologias ou projetos relacionados a Transformers.

Ainda não há comentários.

Ainda não há comentários.