DeepSeek, Qwen, Mistral и open-source модели · Урок 1
Карта open-weight моделей
DeepSeek, Qwen, Mistral, Llama — кто на чём силён и как это понимать.
Зачем open weights
Open-weight модель — это модель, веса которой можно скачать и запустить локально или в своём облаке. Это даёт:
- Полную приватность.
- Контроль стоимости.
- Возможность fine-tune под свои задачи.
- Независимость от API-провайдера.
Главные семейства
- DeepSeek — сильный reasoning, доступные API. R1 / V3 / V3-base. Особенно хорош в коде и математике.
- Qwen (Alibaba) — мультиязычность, vision, coding. Многие версии в open weights.
- Mistral / Mixtral — европейские модели, хорошие compromise по производительности и качеству.
- Llama (Meta) — старая «база» open-source, продолжает развиваться.
- Gemma (Google) — лёгкие модели, удобны для локального запуска.
- Phi (Microsoft) — маленькие, для CPU/мобильных сценариев.
Принцип выбора
Если вы запускаете локально — смотрите на свой GPU и память. Если через API — смотрите на цену и качество на ваших задачах. Не доверяйте бенчмаркам как окончательной правде — всегда тест на своих сценариях.
Практическое задание
Что сделать после урока
Откройте OpenRouter / Ollama. Запустите один и тот же промпт на DeepSeek, Qwen и Mistral. Зафиксируйте, кто лучше под вашу задачу.
Готовый промпт
Шаблон под задачу урока
Скопируйте и адаптируйте под свой контекст. Текст в треугольных скобках — то, что нужно заменить.
Помоги выбрать open-weight модель. Задача: <…> Где запускаю (локально / API / облако): <…> Доступная память GPU: <…> Ограничения: <…> Дай рекомендацию из DeepSeek / Qwen / Mistral / Llama / Gemma с обоснованием.
Типичные ошибки
На чём чаще всего спотыкаются
- Выбирают по бенчмаркам, не тестируя на своих задачах.
- Запускают огромную модель на маленьком GPU — получают тормоза.
- Игнорируют лицензию open weights (есть ограничения).
Лайфхаки
Что работает, но в гайдах не пишут
- Quantized-версии (Q4/Q5) часто почти не теряют качество и сильно экономят память.
- OpenRouter — быстрый способ протестировать модели до выбора.
- Сохраняйте «эталонный набор задач» для регулярного re-теста.
Когда использовать
Приватность, контроль стоимости, fine-tune под нишу.
Когда не использовать
Когда вам нужно максимально качество и приватность не важна — флагманы пока сильнее.
Официальные источники
Квиз — 2 вопроса
1.Зачем нужны open-weight модели?
2.DeepSeek известен прежде всего:
Отвечено: 0 из 2