Найти в Дзене
Ты думаешь, что TikTok показывает тебе видео случайно?
Нет. За каждым роликом в твоей ленте стоит запрос к базе данных. Кто-то написал SQL — и алгоритм решил, что именно ты должен посмотреть это видео сейчас. Не завтра. Не через час. Сейчас. Это не магия. Это данные. Большинство людей думают о SQL примерно так: «ну, там строки, столбцы, что-то вроде Excel». Это как думать, что самолёт — это просто большая птица. На самом деле SQL — это язык, на котором написаны решения. Какой товар показать тебе первым на маркетплейсе. Какой матч подобрать в онлайн-игре...
2 недели назад
Почему твой Word тупит, а Google находит всё за 0.2 секунды — это одна и та же история
Серьёзно. За обеими вещами стоит один и тот же принцип. И когда ты его поймёшь — куча «магии» вокруг тебя перестанет быть магией. Поехали. Вот тебе первый инсайт, который учебник прячет за сухим определением. С точки зрения информатики текст — это последовательность знаков некоторого алфавита. Не смысл, не слова, не предложения. Знаки. Символы. Биты. Когда ты пишешь сообщение в Telegram — компьютер не «читает» его. Он хранит набор чисел. Каждой букве, каждому символу, каждому знаку препинания соответствует конкретный двоичный код...
2 недели назад
Запрос внутри запроса: как работает логика, которая стоит за любым умным алгоритмом
Ты когда-нибудь задумывался, как Spotify понимает, что тебе надо поставить именно эту песню — ту, которую ты сам ещё не знал, что хочешь услышать? Или как маркетплейс за долю секунды находит товары, которые купили люди с похожей историей заказов? Там не магия. Там подзапрос. Обычный SQL-запрос — это как спросить у базы данных: «Дай мне всех пользователей из Москвы». Прямо и понятно. Но реальные задачи устроены иначе. Алгоритм рекомендаций не спрашивает «дай всех», он спрашивает: «Дай мне тех пользователей,...
2 недели назад
Ты удалял данные без WHERE? Поздравляю — ты только что уничтожил базу 💀
Каждый раз, когда ты что-то покупаешь на Wildberries, ставишь лайк в VK или переводишь деньги через СБП — кто-то пишет в базу данных. Не «сохраняет файл». Не «обновляет таблицу в Excel». Именно пишет. Командой. В реальном времени. Без права на ошибку. И за этим стоят три команды, которые на первый взгляд кажутся скучными — INSERT, UPDATE, DELETE. На второй взгляд — это инструменты, которыми управляют миллиардами строк данных каждый день. Представь: ты заходишь в онлайн-игру, выбираешь матч, нажимаешь «Найти игру»...
2 недели назад
Как TikTok знает, что ты хочешь посмотреть дальше — и при чём тут JOIN
Открываешь TikTok. Первые три видео — точно в тему. Четвёртое — вообще идеально. Как? Нет никакой магии. Есть база данных, в которой хранится информация о тебе, о видео, о том, что ты досмотрел, что лайкнул, на чём завис на три секунды дольше обычного. И есть запрос, который в реальном времени соединяет всё это вместе и вытаскивает именно то, что с высокой вероятностью удержит тебя ещё на пять минут. Этот запрос называется JOIN. Представь маркетплейс вроде Wildberries или Ozon. Там миллионы товаров, десятки миллионов пользователей, сотни миллионов заказов...
3 недели назад
FULL OUTER JOIN: как запрос из пяти слов открывает дыры в данных, которые никто не замечает
Представь: ты аналитик в стартапе. Тебе говорят — «Сравни базу пользователей с базой заказов». Ты киваешь, идёшь к базе данных и через пять минут понимаешь, что реальность устроена неудобно. Часть пользователей никогда ничего не заказывала. Часть заказов висит без привязки к реальному человеку — призраки в системе. И вот тут обычный JOIN тебя подводит. Он покажет только тех, у кого всё сошлось. Аккуратно. Чисто. Неправдиво. Стандартный INNER JOIN — это как алгоритм рекомендаций в стриминге, который показывает только то, что точно зайдёт...
3 недели назад
Почему Spotify знает, что ты захочешь послушать завтра — и при чём тут LEFT JOIN
Когда TikTok решает, какое видео показать тебе следующим, — это не магия и не «ИИ» в том смысле, в каком его любят пиарить. В основе — запрос к базе данных. Конкретный, хирургически точный запрос, который за миллисекунды собирает из разных таблиц информацию о тебе, твоих интересах, времени суток и ещё паре сотен параметров. И в этом запросе, почти наверняка, есть JOIN. Представь, что у маркетплейса есть список всех зарегистрированных пользователей. И отдельно — список заказов. Логика подсказывает: соедини их и получи картину...
3 недели назад
Почему один запрос к базе данных решает, что ты увидишь следующим
Каждый раз, когда алгоритм подсовывает тебе именно тот ролик, от которого ты не можешь оторваться — где-то в дата-центре отрабатывает запрос. Не магия, не нейросеть-телепат. SQL-запрос, который за миллисекунды сопоставляет твою историю просмотров, время суток, геолокацию и поведение миллионов похожих на тебя пользователей. И в центре этого запроса — конструкция, которую ты только что изучил: INNER JOIN. Представь: у Spotify есть таблица пользователей и таблица прослушиваний. Миллиарды строк в каждой...
3 недели назад
Зачем тебе логика, если есть GPT? Спойлер: чтобы написать свой
Ты наверняка слышал про «логические задачи» в школе. Обычно это звучит как: «Вася живет левее Пети, но правее того, кто носит шапку». И первое желание — закрыть учебник. Скука смертная, да? Но давай честно: за этой «детской» задачкой скрывается тот же принцип, на котором работают твои любимые игры, алгоритмы ТикТока и даже искусственный интеллект. Если ты думаешь, что информатика — это просто зубрежка определений, то ты упускаешь главное. Это тренировка твоего мозга, чтобы он не плавал в мире, где за тебя всё решают алгоритмы...
3 недели назад
HAVING: одна строчка кода, которая делает из данных — выводы
Там не сидит редактор и не листает вручную миллионы прослушиваний. Там работает запрос. Примерно такой: возьми всех пользователей, посчитай, сколько раз они слушали каждый жанр, и оставь только тех, у кого перевес в сторону инди-рока выше определённого порога. Вот это — HAVING в действии. Представь: у тебя есть таблица с миллионом заказов маркетплейса. Ты хочешь найти клиентов, которые реально тратят деньги — скажем, больше 50 000 рублей суммарно. Не тех, кто купил один раз носки. А тех, на кого стоит тратить бюджет на удержание...
3 недели назад
Почему TikTok знает тебя лучше, чем ты сам — и при чём здесь GROUP BY
Каждый раз, когда ты открываешь ленту, алгоритм за долю секунды обрабатывает миллионы сигналов: что ты досмотрел, что промотал, на чём завис. Это не магия машинного обучения в вакууме — это запросы к базе данных, которые группируют, считают и сортируют поведение пользователей. И в самом центре этой механики — оператор, который большинство новичков считают скучным: GROUP BY. Представь: ты аналитик стартапа. Продукт вырос, данные есть, но инвестор задаёт простой вопрос: «Из каких городов у нас больше всего активных пользователей?» У тебя — таблица с миллионом строк...
3 недели назад
Одна функция — миллионы рублей. Как SQL считает деньги за тебя
Когда стриминг подбирает тебе плейлист под настроение — где-то в базе данных выполняется запрос. Он считает, сколько раз ты переслушал трек, вычисляет среднее время прослушивания, находит пользователей с похожим поведением. Всё это — агрегатные функции. Несколько строк SQL, и алгоритм «знает» тебя лучше, чем ты думаешь. Представь: у маркетплейса миллион заказов в базе. Каждый — отдельная строка. Без агрегации это просто шум. Но стоит добавить одну функцию — и шум превращается в сигнал: SELECT SUM(amount) AS total_revenue FROM orders; Один запрос...
1 месяц назад