AI-агенты: от архитектуры до продакшна · Урок 7
Оценка агентов
Trajectory eval, tool-use eval, final output eval, LLM-as-judge. Фреймворки ragas и самописные оценщики.
Trajectory eval, tool-use eval, final output eval, LLM-as-judge. Фреймворки ragas и самописные оценщики.