Pesquisadores do MIT demonstram técnica de exploração de conhecimento em modelos de linguagem de grande porte
- Foi descoberto que modelos de linguagem de grande porte usam um mecanismo simples para recuperar conhecimento armazenado ao responder aos prompts dos usuários.
- Os pesquisadores podem aproveitar esse mecanismo simples para identificar o que o modelo sabe sobre diversos temas e corrigir informações armazenadas incorretamente.
A complexidade dos modelos de linguagem de grande porte
- Modelos de linguagem de grande porte são usados em várias áreas, como suporte ao cliente, geração de código e tradução de idiomas, mas seu funcionamento ainda não é totalmente compreendido.
- Pesquisadores do MIT e de outras instituições estudaram o mecanismo pelo qual esses enormes modelos de aprendizado de máquina recuperam conhecimento armazenado.
O mecanismo simples de recuperação de conhecimento
- A pesquisa mostrou que modelos de linguagem de grande porte frequentemente usam uma função linear simples para recuperar e decodificar fatos armazenados.
- O modelo usa a mesma função de decodificação para tipos semelhantes de fatos.
- Uma função linear é uma equação que representa uma relação em linha reta entre duas variáveis.
Explorando o que o modelo sabe
- Ao identificar funções lineares para diferentes fatos, os pesquisadores exploraram o que o modelo sabe sobre novos temas e verificaram onde esse conhecimento está armazenado dentro do modelo.
- Usando a técnica desenvolvida e as funções simples estimadas, eles descobriram que o modelo muitas vezes armazena a informação correta mesmo quando fornece respostas erradas.
Visualizando o conhecimento do modelo
- Os pesquisadores usaram as funções para determinar o que o modelo realmente acredita ser verdade sobre diferentes temas.
- Por exemplo, começando com o prompt "Bill Bradley was a" e usando funções de decodificação para "plays sports" e "attended university", eles verificaram se o modelo sabia que o senador Bradley era jogador de basquete e ex-aluno da Universidade de Princeton.
- Usando essa técnica de exploração, criaram uma grade chamada "lentes de atributos" para visualizar onde as informações sobre relações específicas ficam armazenadas nas várias camadas do transformador.
Opinião do GN⁺
- Esta pesquisa eleva em um nível a compreensão de como modelos de linguagem de grande porte armazenam e recuperam conhecimento factual.
- Os resultados sugerem a possibilidade de usar esse conhecimento para corrigir informações e evitar erros em chatbots de IA, reduzindo a tendência de os modelos fornecerem dados incorretos.
- Se aplicada, essa tecnologia pode contribuir para aumentar a confiabilidade da IA e ajudar a melhorar a experiência do usuário.
- No entanto, como nem todos os fatos são codificados linearmente, são necessárias pesquisas adicionais para verificar se essa técnica pode ser aplicada a todos os tipos de recuperação de conhecimento.
- Projetos de código aberto com funções semelhantes incluem o BERT, do Google, e a série GPT, da OpenAI, que também contribuem para entender o funcionamento dos modelos de linguagem de grande porte.
- Ao introduzir novas tecnologias, é preciso considerar o equilíbrio entre a complexidade do modelo e sua interpretabilidade, e um dos benefícios dessa técnica pode ser o aumento da precisão e da confiabilidade do modelo.
1 comentários
Comentários no Hacker News
Este trabalho impressionante destaca alguns dos maiores problemas atuais na área de IA
A estrutura da linguagem torna o Word2Vec possível
MementoAjuda a entender o que significa o fato de os fatos serem armazenados como funções lineares
Curiosidade sobre o tipo de função usado para codificar conhecimento de programação
Considera isso semelhante ao que os vetores de relação fazem no Word2Vec
Os LLMs parecem ser um bom mecanismo de compressão
Isso lembra o exemplo de embedding "King - Man + Woman = Queen"
É difícil entender como um "arquivo CSV/banco de dados/modelo" com 7 bilhões de "parâmetros" pode fornecer um LLM/GPT interativo com tanto conhecimento sobre quase qualquer tópico
f32Gosta do fato de este artigo ser interessante e de ter feito experimentos para validar essas ideias
A possibilidade de separar a parte de raciocínio da parte de informação