Prompt Evaluations: Anthropic's Official Course · Lesson 8

Custom LLM Judge: Multi-Metric Scoring

Writing a custom llm_eval() function scoring on multiple metrics (conciseness, accuracy, tone 1-5). get_assert() for PromptFoo. Prefill <json> for reliable JSON output. Comparing basic vs better vs best summarization prompt.

30 min read3 questions in quizReady prompt includedIn progress

В этом уроке вы узнаете продвинутые техники работы с ИИ, которые позволят вам значительно ускорить работу. Разберём реальные кейсы, готовые промпты и типичные ошибки. Этот материал доступен подписчикам курса...

Практические задания, квизы и сертификат по завершении курса ждут вас после активации подписки.

🔒

Full lesson access

Custom LLM Judge: Multi-Metric Scoring is part of paid content. Start your 7-day free trial now.

$9/mo·

No credit card required for the trial. Cancel anytime. View plans →