Что такое большая языковая модель
Разбираем, что такое LLM, как она «думает» и почему её ответы — это статистика, а не знание.
Что такое LLM
Большая языковая модель (LLM) — это программа, обученная предсказывать следующее слово в тексте. Если показать модели миллиарды страниц текста, она научится статистически продолжать любую фразу. На этом простом механизме построены ChatGPT, Claude, Gemini и десятки других ассистентов.
Что важно понимать с самого начала
- Модель не знает фактов. Она знает статистические паттерны языка. Если в обучающих данных правильный ответ встречался часто — он, скорее всего, всплывёт. Если редко — модель уверенно сочинит правдоподобный, но ложный ответ. Это называется галлюцинацией.
- Модель не помнит ваши прошлые разговоры по умолчанию. Каждый чат — это новое окно контекста. То, что вы написали в начале разговора, остаётся в нём; новый чат стартует с нуля.
- У модели есть «дата отсечения». Она обучалась на данных до какого-то момента. Свежие события (новости, релизы) она не знает, пока не дать ей поиск или вы сами не вставите контекст.
Откуда берётся «умность»
Модель не «понимает» в человеческом смысле. Она хороша там, где задача сводится к комбинаторике языка: переписать, обобщить, классифицировать, продолжить. Чем сильнее задача связана с устойчивыми паттернами в тексте (письмо, код, законы, документация) — тем лучше результат.
В задачах, где нужна точная свежая информация или независимая верификация фактов, нужны дополнительные инструменты: поиск, RAG, tool use, человеческое ревью.
Возьмите задачу из своей рутины, которая занимает 30+ минут. Опишите её одним предложением. Попробуйте дать её ChatGPT/Claude и сравните результат с вашим эталоном.
Скопируйте и адаптируйте под свой контекст. Текст в треугольных скобках — то, что нужно заменить.
Ты — мой ассистент. У меня есть задача, которую я делаю часто. Прежде чем выполнять её, задай 3-5 уточняющих вопросов, чтобы не выдумывать факты. Если данных не хватает — скажи об этом. Задача: <вставьте описание>
- Думают, что модель «знает» — на самом деле она достраивает статистически.
- Не указывают аудиторию и формат — получают универсальный, безликий ответ.
- Принимают первый ответ как окончательный, хотя промпт можно улучшать.
- Если ответ неуверенный, попросите модель явно перечислить, чего она НЕ знает.
- Просите модель сначала задать уточняющие вопросы, прежде чем отвечать.
- Для важных задач — попросите ответить от лица скептика, который ищет дыры.
Любая задача с языком: переписать, объяснить, собрать список, превратить заметки в письмо, придумать варианты, ответить на типовой вопрос.
Когда нужны проверяемые факты в реальном времени и нет инструмента поиска. Когда от ответа зависит юридическое/медицинское решение без человеческой проверки.