Hackeando modelos de IA de linguagem natural
(arxiv.org)-
De acordo com um artigo publicado em conjunto por Google, Harvard, Stanford, OpenAI e Apple, foi possível extrair dados específicos usados no treinamento apenas fazendo perguntas a grandes modelos de linguagem.
-
Um ataque contra o GPT-2 conseguiu extrair com altíssima precisão manchetes de notícias e informações pessoais, como endereços residenciais.
-
Não é apenas o GPT-2: outros modelos de linguagem também podem ser vulneráveis a esse tipo de ataque, por isso é preciso ter ainda mais cuidado no pré-processamento dos dados de treinamento
Ainda não há comentários.