19 pontos por GN⁺ 2024-08-28 | 1 comentários | Compartilhar no WhatsApp
  • A Anthropic divulgou os prompts de sistema de seus modelos mais recentes (Claude 3 Opus, Claude 3.5 Sonnet, Claude 3 Haiku)
    • O prompt de sistema é a instrução inicial que define as características básicas e as diretrizes de comportamento do modelo
  • Todos os fornecedores de IA generativa usam prompts de sistema para evitar que seus modelos tenham comportamentos inadequados
  • A Anthropic enfatiza transparência e ética e pretende atualizar regularmente seus prompts de sistema

Prompts de sistema dos modelos Claude: https://docs.anthropic.com/en/release-notes/system-prompts

  • Os modelos Claude não podem abrir URLs, links ou vídeos
  • Reconhecimento facial é proibido, e o modelo deve sempre agir como se não pudesse reconhecer rostos
  • O Claude 3 Opus tem uma personalidade de grande curiosidade intelectual e gosta de discutir diversos temas com humanos
  • Em temas controversos, deve responder de forma justa e objetiva
  • Ao iniciar uma resposta, é instruído a não usar palavras como "certainly" ou "absolutely"

A importância dos prompts de sistema

  • A divulgação dos prompts de sistema pela Anthropic também pressiona concorrentes
  • O prompt de sistema do GPT-4o só pode ser exposto por meio de ataques de prompt injection
  • O esforço de transparência da Anthropic promove o uso ético de modelos de IA

Resumo do GN⁺

  • A divulgação dos prompts de sistema pela Anthropic destaca a transparência e a ética nos modelos de IA
  • Ao deixar claras as características e limitações dos modelos Claude, aumenta a confiança dos usuários
  • Também pressiona os concorrentes a considerarem divulgar seus prompts de sistema
  • O TechCrunch Disrupt 2024 é um evento importante para líderes de startups e de venture capital

1 comentários

 
GN⁺ 2024-08-28
Comentários do Hacker News
  • Claude reconhece oficialmente o fenômeno de "alucinação"

    • Quando recebe perguntas sobre temas muito raros, Claude informa ao usuário que tenta ser preciso, mas pode alucinar
    • Ao mencionar artigos, papers ou livros específicos, informa que não pode acessar buscas ou bases de dados e recomenda verificar as citações
  • Claude é muito bom

    • Recentemente configurei um "gerador automático de scripts", que funciona enviando repetidamente scripts em Python e resultados de testes para o GPT-4 ou o Claude
    • Só passa a funcionar direito depois de 10 a 20 iterações
    • Claude entrega resultados muito melhores que o GPT-4
    • O GPT-4 tende a mudar o objetivo ou repetir saídas incorretas
    • Claude fornece saídas boas de forma consistente
  • É impressionante viver numa era em que podemos dar instruções a sistemas de computador por texto

  • Claude tenta evitar expressões positivas desnecessárias, mas na prática ainda as usa

    • Tenta evitar expressões como "Certainly!", "Of course!", "Absolutely!", mas ainda assim as usa
    • Tenta evitar respostas que começam com "I’m sorry" ou "I apologize", mas ainda assim as usa
  • É possível eliminar as alucinações dos LLMs

    • Espero que a próxima geração de modelos não alucine sobre fatos importantes
    • Quero LLMs como a Wikipedia
    • Escrevi um artigo sobre como analisar e resolver o problema das alucinações
  • É preciso uma função para excluir parte do conteúdo da conversa ou dividi-la em duas partes

    • Isso pode ser um hack simples para melhorar desempenho e precisão em conversas longas
  • Claude, por padrão, não faz reconhecimento facial

    • Ao compartilhar imagens, ele não reconhece rostos humanos e pede ao usuário que diga quem é
    • Ele discute com base nas informações fornecidas pelo usuário, mas não identifica pessoas por reconhecimento facial
  • O grande problema do Claude é que ele consome créditos rápido demais

    • Resolve cerca de metade do problema e então os créditos acabam
    • É frustrante que os créditos de IA acabem com apenas algumas perguntas
    • Por causa disso, cancelei a assinatura
  • Gosto do jeito direto com que Claude responde

    • Não usa expressões positivas desnecessárias