Anthropic lança o Claude 2.1

(anthropic.com)

2 pontos por GN⁺ 2023-11-22 | 1 comentários | Compartilhar no WhatsApp

O Claude 2.1 está disponível via API e oferece a experiência de chat no claude.ai.
Entre os destaques estão a janela de contexto de 200K tokens, a redução de alucinações do modelo, prompts de sistema e o novo recurso beta de uso de ferramentas.
Está prevista uma atualização na política de preços para melhorar a eficiência de custos dos clientes.

Janela de contexto de 200K

Os usuários do Claude vêm pedindo uma janela de contexto maior e saídas mais precisas ao trabalhar com documentos longos.
Com 200.000 tokens, é possível fornecer ao Claude cerca de 150.000 palavras ou mais de 500 páginas de material.
O Claude pode interagir com grandes volumes de conteúdo ou dados e executar várias tarefas, como resumo, perguntas e respostas, previsão de tendências e comparação entre múltiplos documentos.

Taxa de alucinação reduzida pela metade

O Claude 2.1 reduz pela metade a taxa de afirmações falsas para melhorar a honestidade.
As empresas podem criar aplicações de IA e colocá-las em operação com mais confiança e confiabilidade.
O Claude 2.1 mostra melhorias em compreensão e capacidade de resumo, especialmente em documentos longos e complexos que exigem precisão.

API Tool Use

Foi adicionado o novo recurso beta "Tool Use", que pode ser integrado aos processos, produtos e APIs já existentes dos usuários.
O Claude pode orquestrar funções ou APIs definidas por desenvolvedores, pesquisar fontes na web e buscar informações em bases de conhecimento privadas.
O Tool Use ainda está em estágio inicial de desenvolvimento, e recursos para desenvolvedores e diretrizes de prompt estão sendo construídos.

Experiência do desenvolvedor

A experiência do console para desenvolvedores usuários da API do Claude foi simplificada, facilitando o teste de novos prompts.
Com o novo produto Workbench, os desenvolvedores podem iterar prompts e acessar configurações do modelo para otimizar o comportamento do Claude.
Foram introduzidos prompts de sistema, permitindo que os usuários forneçam instruções personalizadas ao Claude.

Opinião do GN⁺

Os recursos mais importantes do Claude 2.1 são a janela de contexto de 200K tokens e a redução da taxa de alucinação, o que permite aos usuários processar documentos e dados maiores e obter resultados mais confiáveis.
Esses recursos mostram o avanço da tecnologia de IA e têm potencial para transformar o trabalho de empresas e desenvolvedores ao oferecer ferramentas mais eficientes e precisas.
O texto traz informações interessantes sobre as tendências mais recentes em tecnologia de IA e as novas ferramentas disponíveis para desenvolvedores, tornando-se um conteúdo atraente para pessoas interessadas em tecnologia.

1 comentários

GN⁺ 2023-11-22

Comentários do Hacker News

O lado agridoce do contexto de 200k: É lamentável que a taxa de erro aumente drasticamente de 70k para 195k. Mas a redução de erros na parte intermediária merece elogios.
Insatisfação com o uso limitado do modelo: O Claude não recusa pouco como o título afirma. A Anthropic está censurando demais o modelo, o que o torna difícil de usar. O usuário deve decidir a ferramenta; a ferramenta não deve decidir o usuário.
Apontamento de inconsistência entre título e conteúdo: A "redução de recusas" mencionada no anúncio não condiz com o conteúdo real. Isso sugere que o Claude 2.1 ficou mais propenso a recusar do que a fornecer informações incorretas.
Ineficiência para programação: É 10 vezes pior que o GPT-4. Ao pedir uma função simples de sincronização de banco de dados, ele forneceu muito pseudocódigo em vez de código real.
Impressão negativa do modelo: O modelo da Anthropic foi treinado em excesso para recusar a maioria dos pedidos, então conversar com o Claude não é agradável.
Caso de recusa por perspectiva ideológica: Surgiu uma situação humorística quando ele recusou um pedido de lista de vocabulário para falar como um altruísta eficaz.
Decepção com o Claude 2: No começo havia expectativa, mas ele foi considerado muito inferior ao GPT-4; mesmo com uma janela de contexto grande, isso não adianta se a qualidade da resposta é ruim.
Problema de acessibilidade no uso da API: Havia interesse em usar a API, mas a falta de resposta foi decepcionante. Falta interesse como plataforma para desenvolvedores.
Dificuldade de acesso à API: Não houve resposta aos pedidos feitos pelo site da Anthropic ou via Bedrock, então o acesso à API parece inviável como negócio.
Interesse na introdução de system prompts: Chama atenção a introdução de system prompts, que permitem ao usuário fornecer instruções personalizadas ao Claude para melhorar o desempenho. Há expectativa quanto à facilidade de uso e abuso.
Uso de teste do Claude e escolha pela OpenAI: Ainda não é usado em produção, mas é incluído regularmente em testes ao desenvolver novos recursos com LLMs. A OpenAI obteve certificações mais rápido e chegou antes ao mercado, e sua API é melhor, mais confiável e mais barata. Mas, com a inclusão do Claude no AWS Bedrock, coisas que antes eram impossíveis passaram a ser possíveis.

Anthropic lança o Claude 2.1

Janela de contexto de 200K

Taxa de alucinação reduzida pela metade

API Tool Use

Experiência do desenvolvedor

Opinião do GN⁺

Leituras relacionadas

1 comentários

Comentários do Hacker News