Продвинутая инженерия промптов · Урок 12
Оценка промптов: LLM-as-judge и тест-харнессы
Паттерн LLM-as-judge, дизайн рубрики, pairwise-сравнение, авто-харнессы (PromptFoo), регрессионное тестирование промптов.
Паттерн LLM-as-judge, дизайн рубрики, pairwise-сравнение, авто-харнессы (PromptFoo), регрессионное тестирование промптов.