Fine-tuning в OpenAI: от данных до DPO · Урок 4
Дистилляция моделей: gpt-4o → gpt-4o-mini
Дистилляция использует store=True в Chat Completions для захвата выходов большой модели, затем fine-tuning меньшей модели на этих данных — снижение стоимости и латентности без потери точности.