DeepEval - Testes unitários para LLMs

xguru · 2023-08-19T10:03:01+09:00

A filosofia básica é ser o "Pytest para LLMs" Para a transição para produção, oferece uma forma no estilo Python de executar avaliações offline para pipelines de LLM Permite escrever testes para aplicações de LLM (como RAG) da mesma forma que se escrevem testes unitários em Python Por meio de assert_llm_output, avalia respostas com métricas como entailment / exact / bertscore Também é possível definir métricas personalizadas e modificar métricas existentes

(github.com/mr-gpt)

4 pontos por xguru 2023-08-19 | Ainda não há comentários. | Compartilhar no WhatsApp

A filosofia básica é ser o "Pytest para LLMs"
Para a transição para produção, oferece uma forma no estilo Python de executar avaliações offline para pipelines de LLM
Permite escrever testes para aplicações de LLM (como RAG) da mesma forma que se escrevem testes unitários em Python
Por meio de assert_llm_output, avalia respostas com métricas como entailment / exact / bertscore
Também é possível definir métricas personalizadas e modificar métricas existentes

DeepEval - Testes unitários para LLMs

Leituras relacionadas

Ainda não há comentários.