A causa da mensagem de erro do ChatGPT 3.5
- Os modelos GPT da OpenAI geram "tokens" com vários caracteres em vez de caracteres individuais.
- Esse método de saída por tokens melhora o desempenho e a precisão do modelo.
- Existem três tokens:
richTextPanel, source e loadpath, e eles podem ser trocados entre si.
- O token
loadpath é usado como nome de opção em arquivos de configuração XML em 80,4 mil arquivos no GitHub.
- É possível que o token
loadpath tenha passado a existir de forma independente por causa do erro de digitação em "R a lative".
- A OpenAI pode ter decidido excluir arquivos XML dos dados de treinamento depois de gerar a lista de tokens, o que provavelmente fez com que quase não houvesse uso de dados de treinamento para o token
loadpath.
- Como resultado, o modelo não foi treinado para entender o uso do token
useRalativeImagePath e acaba gerando um token inválido.
Uso para envenenamento de dados?
- Pode valer a pena colocar essa expressão em um documento para atrapalhar tentativas de resumir o conteúdo com GPT-3.5.
Leitura adicional
- Há publicações úteis para pesquisar mais sobre esse tema.
Opinião do GN⁺
- O ponto mais importante deste texto é entender por que os modelos GPT produzem erros com certos tokens.
- Essas informações ajudam a compreender como modelos de inteligência artificial funcionam e quais são suas limitações.
- Além disso, o texto oferece um caso interessante sobre envenenamento de dados e sobre como explorar vulnerabilidades de modelos de inteligência artificial.
1 comentários
Opiniões do Hacker News
Explicação sobre tokens com glitch
Método de verificação linguística na Holanda durante a Segunda Guerra Mundial
Scheveningenpara distinguir se alguém era alemão ou não.Explicação sobre o processo de geração de tokens em LLMs
useRalativeImagePathe por isso emite tokens inválidos não corresponde à forma como os LLMs geram tokens.Análise das possíveis causas de tokens com glitch
Outra perspectiva sobre a saída do modelo
useRalativeImagePath, o modelo pode entrar numa espiral de geração aleatória ou tentar manter um texto coerente.Impacto futuro nos dados de treinamento de LLMs
Relato de falha no GPT-4
Reflexão sobre a qualidade dos dados de entrada
Sugestão de usar uma frase para atrapalhar resumos feitos pelo GPT-3.5
Confusão em torno das palavras
RTCatcheredirectToRouteRTCatcheredirectToRoutepoderiam ser confundidos como se fossem a mesma palavra.RTCatch, com pedido de mais informações a respeito.