11 тыс подписчиков

Узнайте 5 терминов, связанных с ИИ, и вы станете на 90% компетентнее других людей.

2 дня назад2 дня назад

6 мин

Изучите основные принципы работы искусственного интеллекта, не запутавшись в деталях. Откровенно говоря… Многие, когда рассуждают об ИИ, либо звучат так, будто зубрят определения из учебника, либо теряются, услышав слова вроде «LLM» или «нейронные сети». Но вам не нужно попадать ни в одну из этих крайностей. Я считаю, что достаточно разобраться в 5 ключевых понятиях — и тогда вы будете лучше разбираться в теме, чем большинство людей, независимо от того, работаете вы в технологиях, бизнесе, образовании или просто интересуетесь, куда движется мир. Начнём. Первое, что важно запомнить: модели ИИ не читают слова и даже не читают буквы. Они читают токены. Что такое токен? Представьте, что вы читаете книгу, но воспринимаете не каждое слово целиком, а фрагменты текста. Иногда это полноценное слово («кошка»), иногда — часть слова («не» или «ться»), иногда — знак препинания. Вот этот фрагмент и есть токен. Например, фраза «Я люблю пиццу» разбивается на 3 токена: «Я», «люблю», «пиццу». Почему это

Оглавление

1. Токены
2. Контекстное окно
3. Температура

Изучите основные принципы работы искусственного интеллекта, не запутавшись в деталях.

Откровенно говоря…

Многие, когда рассуждают об ИИ, либо звучат так, будто зубрят определения из учебника, либо теряются, услышав слова вроде «LLM» или «нейронные сети».

Но вам не нужно попадать ни в одну из этих крайностей.

Я считаю, что достаточно разобраться в 5 ключевых понятиях — и тогда вы будете лучше разбираться в теме, чем большинство людей, независимо от того, работаете вы в технологиях, бизнесе, образовании или просто интересуетесь, куда движется мир.

Начнём.

1. Токены

Первое, что важно запомнить: модели ИИ не читают слова и даже не читают буквы. Они читают токены.

Что такое токен?

Представьте, что вы читаете книгу, но воспринимаете не каждое слово целиком, а фрагменты текста. Иногда это полноценное слово («кошка»), иногда — часть слова («не» или «ться»), иногда — знак препинания. Вот этот фрагмент и есть токен.

Например, фраза «Я люблю пиццу» разбивается на 3 токена: «Я», «люблю», «пиццу».

Почему это важно?

Любой ИИ-сервис (ChatGPT, Claude, Gemini) «подсчитывает» токены «за кулисами». Чем больше токенов вы отправляете в сообщении, тем больше данных обрабатывает модель — а значит, тем дороже обходится работа.

Когда говорят о «контекстном окне» модели, имеют в виду, сколько токенов модель может удержать в памяти одновременно. Старые модели справлялись с 4 000 токенами, новые — с более чем миллионом.

Именно поэтому ИИ иногда «забывает» начало долгой беседы: когда разговор заполняет контекстное окно, самые старые токены просто отбрасываются — как если бы оперативная память компьютера переполнилась и он начал тормозить.

Токены — это «атомы» языка ИИ. Поняв это, вы начнёте лучше понимать, почему одни запросы работают, а другие — нет, почему ИИ «теряет нить» в длинных чатах и почему тарифы API считают в тысячах токенов.

2. Контекстное окно

Теперь представьте, что вы общаетесь с человеком, который помнит только последние X минут разговора. Всё, что было раньше, для него стёрто. Это и есть контекстное окно.

Оно определяет, какой объём текста (в токенах) модель может «увидеть» и учесть за один раз. Сюда входит всё: ваши инструкции, история диалога, прикреплённые документы и ответы самой модели.

Можно сравнить это со школьной доской: размер доски — это размер контекстного окна. Вы можете писать на ней что угодно, но как только доска заполнится, придётся стереть старое, чтобы вписать новое.

Любопытная деталь:

Маленькое окно (например, 4 тыс. токенов) означает, что ИИ обрабатывает текст небольшими кусочками. Если дать ему длинный документ, он «увидит» его фрагментами.
Большое окно (например, 200 тыс. токенов) позволяет вставить целую книгу и задавать вопросы по её содержанию.

Вот почему все оживились, когда Claude анонсировал окно в 200 000 токенов, а Gemini — в 1 млн. Это кардинально меняет, как можно работать с моделью.

Практический вывод:
Если вы, например, резюмируете объёмный документ или анализируете данные, помните: ИИ может «забывать» части беседы. Это не баг — просто «доска» заполнилась.

3. Температура

Ещё один важный параметр — температура. Он определяет, насколько случайным или предсказуемым будет ответ ИИ, когда вы просите его что-то написать.

Низкая температура (близка к 0): ИИ выбирает самые вероятные, ожидаемые слова. Результат получается последовательным, точным — но немного скучным. Как коллега, который шлёт одинаковые шаблонные письма.
Высокая температура (близка к 1 или выше): ИИ рискует, подбирает неожиданные слова, нестандартные обороты. Иногда результат гениальный, иногда — нет.

Пример: попросите ИИ завершить фразу «Кошка сидела на…»

При низкой температуре: «коврике» или «полу» — предсказуемо и надёжно.
При высокой температуре: «философской дилемме» или «рушащейся империи вторника» — креативно, но вряд ли подойдёт для юридического документа.

Незаписанное правило:

Для фактических задач (резюмирование, программирование, извлечение данных) используйте низкую температуру. ИИ должен быть точным.
Для творческих задач (художественная проза, мозговой штурм, рекламные тексты) повышайте температуру — вам нужны неожиданные решения.

В потребительских приложениях вроде ChatGPT этот параметр обычно «зафиксирован» на золотой середине. Но если вы работаете с API или инструментами для разработчиков, теперь вы знаете, как его использовать.

4. Галлюцинации

Многие слышали термин «галлюцинации» ИИ, но не все понимают, в чём их суть — а именно это самое важное.

«Галлюцинации» ИИ — это ситуации, когда модель выдаёт неверную информацию с абсолютной уверенностью, будто это непреложная правда. Например, вы спрашиваете про книгу, а ИИ уверенно называет автора, год издания и пересказывает сюжет… хотя такой книги не существует.

Почему так происходит?

Ключевой момент, который часто упускают: языковые модели ИИ — не базы данных. Они не «ищут» факты, а угадывают, какое слово или фраза вероятнее всего пойдут дальше, опираясь на закономерности, которые «выучили» во время обучения. Это как очень продвинутое автодополнение в текстовом редакторе.

Когда ИИ чего-то не знает, он не говорит «я не знаю» — вместо этого генерирует правдоподобный ответ. Проблема не в том, что ИИ ошибается (все инструменты иногда ошибаются), а в том, что он ошибается с той же уверенностью, с какой говорит правду.

Практический вывод: никогда не доверяйте ИИ безоговорочно — особенно когда речь идёт о фактах, статистике, медицинских или юридических советах. Там ошибка может иметь серьёзные последствия. Используйте ИИ как отправную точку, а потом всегда проверяйте информацию.

5. RAG

Теперь о RAG (Retrieval-Augmented Generation, «генерация с поиском») — ещё одна недопонятая, но важная концепция.

Обычная ИИ-модель обучена на данных до определённого момента времени. Она не знает:

внутренние документы вашей компании;
свежие события, произошедшие на прошлой неделе;
тот PDF-файл, который вы только что загрузили.

Как тогда работают сервисы вроде «Чат с PDF»? Благодаря RAG.

Принцип прост:

Вы загружаете документ.
Система разбивает его на фрагменты.
Эти фрагменты сохраняются в базу данных, которая «понимает» смысл текста (а не просто ищет ключевые слова).
Когда вы задаёте вопрос, система сначала находит подходящие фрагменты, а потом передаёт их ИИ вместе с вопросом: «Вот контекст — ответь, опираясь на него».

Почему это важно? RAG — основа большинства полезных ИИ-продуктов последних двух лет:

чат-ботов техподдержки, которые «знают» политику компании;
ассистентов, отвечающих на вопросы по юридическим документам;
инструментов для резюмирования научных статей.

Понимая RAG, вы видите, что ИИ не «учит» ваши данные — он просто проводит умный поиск и передаёт результаты языковой модели. Сама модель остаётся той же, меняется только контекст.

В ближайшие годы разница между теми, кто просто пользуется ИИ, и теми, кто понимает, как он работает, будет только расти.

Вам не нужно быть инженером — достаточно базового понимания:

Понимание токенов поможет вам писать более качественные подсказки
Понимание контекстных окон поможет вам понять, почему ИИ иногда «путается».
Понимание температуры поможет вам понять, какие настройки выбрать для разных задач.
Понимание галлюцинаций убережёт от слепого доверия.
А понимание RAG прояснит, как ИИ «работает» с вашими данными.

Освоив эти пять концепций, вы будете разбираться в ИИ лучше 90% пользователей — и сможете использовать технологии куда эффективнее.

Гаджеты и электроника

5,73 млн интересуются