Оценка промптов: официальный курс Anthropic · Урок 4
Code-Graded Classification Evals
Оценка промпта для мультикатегорийной классификации. Set-based grading для нескольких правильных категорий. Improved prompt с few-shot примерами: от 85% до 100% accuracy.