Оценка промптов: официальный курс Anthropic · Урок 6
PromptFoo: кастомные code-graders
Написание Python get_assert() функции для PromptFoo. Подсчёт точного числа упоминаний слова в тексте. Сравнение Haiku vs Sonnet на одном eval. GradingResult словарь: pass, score, reason.