Anúncio do projeto Purple Llama
- Purple Llama é um projeto que oferece ferramentas e avaliações abertas de confiança e segurança para ajudar desenvolvedores a implantar modelos de IA generativa com responsabilidade.
- CyberSec Eval é um conjunto de benchmarks de avaliação de segurança cibernética para LLMs, e o Llama Guard é um classificador de segurança para filtragem de entrada/saída com implantação simples.
- Em colaboração com AI Alliance, AMD, AWS, Google Cloud, Hugging Face, IBM, Intel, Lightning AI, Microsoft, MLCommons, NVIDIA, Scale AI e outros, a iniciativa pretende disponibilizar essas ferramentas para a comunidade open source.
Nova inovação em IA generativa
- A IA generativa é uma tecnologia inovadora que torna possíveis IA conversacional, geração de imagens realistas e resumo de documentos em larga escala.
- Os modelos Llama já foram baixados mais de 100 milhões de vezes, e essas inovações têm sido lideradas por modelos abertos.
- A colaboração em segurança é importante para que desenvolvedores construam confiança e possam realizar pesquisas e contribuições responsáveis em IA.
O primeiro passo do projeto Purple Llama
- Segurança cibernética e segurança de prompts em LLMs são atualmente áreas importantes para a segurança da IA generativa.
- Os benchmarks de avaliação de segurança cibernética foram construídos com base em diretrizes e padrões do setor, como CWE e MITRE ATT&CK, em colaboração com especialistas em segurança.
- O Llama Guard oferece um modelo publicamente disponível para ajudar desenvolvedores a se protegerem contra saídas perigosas.
A importância da equipe Purple
- Só é possível mitigar os desafios da IA generativa adotando tanto uma postura de ataque (red team) quanto de defesa (blue team).
- A equipe Purple é uma abordagem colaborativa que inclui as responsabilidades tanto do red team quanto do blue team, e esse mesmo espírito se aplica à IA generativa.
Esforço em direção a um ecossistema aberto
- A Meta tem como base de seus esforços em IA a pesquisa exploratória, a ciência aberta e a colaboração entre organizações, e há uma oportunidade importante de construir um ecossistema aberto.
- A empresa pretende promover confiança e segurança abertas em parceria com muitos colaboradores, como AI Alliance, AMD, Anyscale e AWS.
Caminhos futuros
- A empresa pretende realizar um workshop na NeurIPs 2023 para compartilhar essas ferramentas e oferecer uma análise técnica aprofundada.
- Diretrizes de segurança e boas práticas exigem uma conversa contínua, e a comunidade é convidada a opinar.
Opinião do GN⁺
- O ponto mais importante deste artigo é que a Meta anunciou o projeto Purple Llama para apoiar o uso seguro e responsável de novas tecnologias de IA generativa.
- O projeto tem como objetivo ajudar desenvolvedores a implantar IA generativa com segurança, incluindo ferramentas de avaliação de segurança cibernética e um modelo de filtragem de entrada/saída.
- Espera-se que esses esforços contribuam para impulsionar o avanço da tecnologia de IA, construir confiança na comunidade de desenvolvedores e fortalecer o ecossistema open source.
1 comentários
Opinião do Hacker News