Оценка промптов: официальный курс Anthropic · Урок 2

Workbench Evals: быстрое прототипирование

Anthropic Workbench для ручного тестирования промптов. Запуск eval по нескольким test case, сравнение версий промпта (v1 vs v2), человеческая оценка по шкале 1-5.

30 мин чтения3 вопроса в квизеГотовый промпт включёнВ работе

Практическое задание

Что сделать после урока

Откройте Anthropic Workbench. Создайте промпт с двумя переменными. Добавьте 3 тест-кейса, оцените результаты (1-5), улучшите промпт и сравните версии через Add Comparison.

Проверка задания

Откройте Anthropic Workbench. Создайте промпт с двумя переменными. Добавьте 3 тест-кейса, оцените результаты (1-5), улучшите промпт и сравните версии через Add Comparison.

Ваш ответ

Готовый промпт

Шаблон под задачу урока

Скопируйте и адаптируйте под свой контекст. Текст в треугольных скобках — то, что нужно заменить.

You are a skilled programmer translating code to Python.

<source_code>
{{SOURCE_CODE}}
</source_code>

Source language: {{SOURCE_LANGUAGE}}

Translate to Python. Format:

<python_code>
[translation here]
</python_code>

Only output the <python_code> tags, no preamble or explanation.

Песочница промптов

Prompt

Типичные ошибки

На чём чаще всего спотыкаются

Оценивают только один тест-кейс — нерепрезентативно.
Не версионируют промпты — забывают, что именно изменили.

Сообщить об ошибке

Workbench Evals: быстрое прототипирование

Проверка задания

Песочница промптов

Квиз — 3 вопроса

Обсуждение

Anthropic Workbench

Промпт с переменными

Процесс итерации

Проблемы первой версии промпта