Оценка промптов: официальный курс Anthropic · Урок 7
Model-Graded Evals: LLM как судья
Когда нужны model-graded evals. Встроенный llm-rubric в PromptFoo. Оценка school assistant prompt: отклоняет ли он нерелевантные вопросы? Грейдинг на апологетичность. Сравнение трёх версий промпта.