45 подписчиков

Как экономить деньги на логах — и почему это важно не только бухгалтерии

ВчераВчера

11 мин

Вы нажали «Оплатить» — и за кулисами уже записалось сотни мелких событий. Хранить их стоит денег. Хранить без правил — рискованно. А в эпоху ИИ эти же следы всё чаще становятся ещё и топливом для «умных» функций. Про это — в другой раз. Сейчас — про деньги, слепоту и здравый смысл.

Когда обычный человек слышит слово «логи», обычно представляет что-то далёкое: технари смотрят в чёрный экран,

Когда обычный человек слышит слово «логи», обычно представляет что-то далёкое: технари смотрят в чёрный экран, бухгалтерия считает копейки, а пользователю до этого нет дела.

На самом деле логи — это дневник работы сервиса. Каждое нажатие кнопки, каждая попытка входа, каждая ошибка — всё это где-то записывается. Как видеокамера в магазине: вы её не замечаете, пока не нужно понять, кто что сломал или куда делся товар.

Я много лет работаю с backend-системами — теми самыми «внутренностями» приложений, которые не видны на экране. И могу сказать: логи — одна из самых недооценённых статей расходов в IT. Не потому что они всегда огромные. А потому что растут незаметно — как счёт за воду, если кран капает по ночам.

Что такое логи — без айтишного жаргона

Представьте тетрадь, куда записывают всё, что происходит в сервисе:

«10:03 — пользователь нажал „Зарегистрироваться“»
«10:03 — отправили запрос в базу данных»
«10:03 — внешний сервис ответил: ок»
«10:04 — ошибка: код не пришёл»

Это и есть логи. Не магия. Обычные записи о том, что система делала и что пошло не так.

Зачем они нужны:

разобраться в сбое — почему у вас не прошла оплата;
проверить безопасность — не было ли подозрительных входов;
выполнить требования — банки и регуляторы часто требуют хранить историю операций;
понять, как люди пользуются сервисом — где застревают, что бросают.

Без логов команда слепая. С ними — но если хранить всё подряд бездумно, компания платит за склад, куда сваливают каждую бумажку «на всякий случай».

За каждой кнопкой — невидимые расходы

Когда вы нажимаете кнопку в приложении, вы видите только экран. А за кулисами включается цепочка:

сервер обработал запрос;
база данных что-то записала;
другой сервис ответил;
система сохранила запись о том, что произошло.

Каждый шаг — это ресурсы: процессор, память, место на диске, трафик между серверами. В облаке (когда программы крутятся не на своём компьютере, а на арендованных мощностях) за всё это платят помесячно.

Логи — особенно коварная статья. Потому что:

Они копятся постоянно.

Каждый день — миллионы строк. Даже если сервис «просто работает».

Их жалко удалять.

Вдруг пригодятся для расследования? Вдруг придёт проверка? Вдруг завтра сломается?

Их не видно пользователю.

Никто не жалуется: «У вас дорогие логи». Жалуются: «Не работает оплата». А логи при этом жрут бюджет в тишине.

Получается парадокс: чем успешнее сервис (больше пользователей, больше операций), тем больше логов — и тем выше счёт за инфраструктуру.

Как логи съедают деньги — на бытовом примере

Аналогия.

У вас дома есть коробка, куда вы складываете все чеки, квитанции, показания счётчиков и случайные бумажки. «Вдруг пригодится».

Первый месяц — одна коробка.

Через год — комната.

Через три года — вам нужен отдельный склад, охрана, система поиска, потому что найти один чек за 2023 год — отдельный квест.

Логи в IT — то же самое. Только склад арендуют у облачного провайдера (компании, которая сдаёт серверы и хранилища в аренду). И платят не за коробку, а за каждый гигабайт и каждый день хранения.

Если писать всё подряд, в максимальной детализации, и хранить вечно — счёт растёт. Не обязательно сразу. Часто через полгода-год кто-то в компании спрашивает: «Почему расходы на инфраструктуру выросли на 40%? Мы же ничего нового не запускали».

Запускали. Просто не новую кнопку — а новые записи о каждом нажатии на старые.

Почему «хранить всё» — плохая стратегия

Звучит безопасно: пусть будет, лишним не будет.

На практике:

Слишком много шума.

Когда всё записано, найти нужное — как искать иголку в стоге сена. Команда тратит часы не на починку, а на просмотр бессмысленных строк.

Слишком много денег.

Хранение в «горячем» доступе (когда данные можно открыть за секунды) стоит дорого. Хранение «на всякий случай десять лет» — ещё дороже.

Риски с личными данными.

В логах часто случайно оказываются телефоны, email, фрагменты платёжных данных. Чем больше храните — тем больше ответственности. Утечка логов — это тоже утечка данных.

Логи — это не только «записи для починки». Это история того, что делали пользователи: когда заходили, что нажимали, где застряли, что пошло не так.

Без логов система не просто слепая — она не помнит, как с ней жили вчера.

А современные ИИ-системы как раз учатся на таких следах: на текстах, кликах, ошибках, типичных путях, обезличенных или не очень. Чем больше вы храните «на всякий случай» и чем хаотичнее с этим обращаетесь, тем выше не только счёт за диск, но и цена ошибки с данными.

Про то, как ИИ учится на пользовательских данных, что из этого следует обычному человеку и где проходит грань «удобно» и «жутковато» — это уже отдельная большая тема. Но к логам она примыкает напрямую: дневник сервиса одновременно и инструмент для починки, и потенциальный сырьевой склад для обучения.

Разумная стратегия — не «всё или ничего», а осознанный выбор: что писать, как долго хранить, где искать, что можно удалить.

Как экономят на логах — простым языком

Вот подходы, которые используют зрелые команды. Без технических деталей — суть.

1. Писать не всё подряд, а то, что реально нужно

Не каждый чих системы заслуживает вечной записи. Важные события — да: вход, оплата, ошибка, отказ внешнего сервиса. Технический шум — нет или в урезанном виде.

Как разница между камерой, которая пишет 24/7 в 4K, и камерой, которая включается при движении. Второй хватает для безопасности — и диск не лопается.

2. Хранить по-разному: свежее — близко, старое — далеко

Свежие логи нужны часто: «что случилось час назад?». Им — быстрый, но более дорогой доступ.

Старые нужны редко: «что было три месяца назад?». Их можно переносить в более дешёвое хранилище — как архив в подвале, а не на рабочем столе.

3. Уметь искать без «перелопачивания всего склада»

Если для расследования нужно каждый раз «скачать всё за месяц» — это и долго, и дорого. Нормальная система позволяет спросить: «покажи все ошибки оплаты за вчера» — и не платить за просмотр лишнего.

4. Автоматически удалять то, что по закону и здравому смыслу не нужно

Не всё надо хранить вечно. Где-то достаточно 90 дней. Где-то — год. Где-то по требованию регулятора — дольше, но структурированно, а не свалкой.

5. Считать стоимость до того, как счёт удивит бухгалтерию

Зрелая команда знает примерно: сколько логов пишем в день, сколько стоит хранение, что будет через полгода при росте пользователей. Не идеально до копейки — но без сюрпризов.

6. Разделять «для починки» и «для аналитики / ИИ»

Не всё, что полезно для расследования сбоя, нужно хранить годами в полном виде.

Не всё, что может пригодиться для «умных» функций, должно попадать в общую свалку логов без правил.

Зрелая команда думает отдельно:

что нужно, чтобы быстро чинить;
что нужно, чтобы понимать поведение сервиса;
что можно обезличить, сжать или удалить;
а что вообще не стоит собирать.

Это не паранойя. Это гигиена в мире, где данные — и расход, и топливо для ИИ.

Почему это важно не только бухгалтерии

Можно подумать: ну сэкономили на логах, бухгалтерия порадовалась, при чём тут я как пользователь?

При том, что деньги компании — это не абстракция. Они влияют на всё:

На скорость починки.

Если логи устроены разумно — команда быстрее находит причину сбоя. Вы меньше ждёте, когда заработает оплата или регистрация.

На цены и подписки.

Инфраструктура — часть себестоимости сервиса. Неэффективные расходы никуда не исчезают. Они возвращаются в комиссии, подписках, рекламе или в том, что сервис хуже инвестирует в нормальные фичи.

На выживаемость продукта.

Стартап, который сжигает бюджет на «храним всё вечно в самом дорогом месте», может не дожить до прибыли. Сервис закроется — и кнопка перестанет работать вовсе, а не на пять минут.

На безопасность ваших данных.

Парадокс: безлумное копирование всего подряд не делает вас безопаснее. Иногда наоборот — больше данных, больше рисков, больше хаоса при утечке.

На качество поддержки.

Когда поддержка говорит «мы видим вашу попытку входа в 14:32» — это логи. Когда они не могут ничего найти, потому что в свале из миллиардов строк невозможно разобраться — это тоже логи. Только плохо организованные.

Слепая система — и система, которая «помнит слишком много»

Долгое время про логи говорили в одной плоскости: нет записей — не починишь.

Это правда. Без логов команда гадает. Поддержка отвечает шаблонами. Разработчик смотрит в потолок. Вы ждёте.

Но сейчас добавилась вторая плоскость.

Современные сервисы всё чаще используют ИИ: подсказки, поиск, автоматические ответы, рекомендации, «умная» поддержка, генерация текстов. А ИИ, упрощая до предела, учится на данных — в том числе на том, что люди делали в сервисе.

Где-то это обезличенная статистика: «80% пользователей застревают на этом шаге».

Где-то — более чувствительные вещи, если компания плохо продумала границы.

Отсюда парадокс, который важно понимать:

Мало логов — плохо. Сервис слепой, чинить трудно, расследовать невозможно.

Слишком много логов без правил — тоже плохо. Дорого, рискованно, иногда избыточно.

То есть разумная работа с логами — это не только экономия для бухгалтерии. Это ещё и вопрос: что именно вы храните, зачем, как долго и кто потом может это использовать — хоть для починки, хоть для аналитики, хоть для обучения модели.

Я специально не углубляюсь здесь в тему ИИ: она заслуживает отдельной статьи. Там и про «на чём учится нейросеть», и про то, почему фраза «мы не храним ваши данные» не всегда значит то, что вы думаете, и про то, чем бесплатный «умный» сервис часто платит на самом деле.

Но байт такой: логи — это память сервиса. А память в эпоху ИИ стала не только технической, но и этической. И чем больше компания пишет «на всякий случай», не думая — тем выше шанс, что однажды эта память ударит по кошельку, по репутации или по доверию пользователей.

Что я вынес из работы с audit-логами

В одном из проектов мы строили систему аудит-логов — записей о важных действиях: кто что изменил, кто куда заходил, что произошло с чувствительными операциями. Требования жёсткие: хранить, находить, показывать при проверках.

Задача была не просто «сделать, чтобы работало», а сделать так, чтобы не разориться на хранении.

Мы не стали писать каждую мелочь в самое дорогое место. Разделили потоки: что нужно видеть сразу, что можно положить в дешёвое хранилище, что можно агрегировать (сжимать в сводки вместо тысяч одинаковых строк). Подключили инструменты, где платишь не за «всё сразу», а за реальный поиск и реальное хранение.

Результат для бизнеса: нормальная прозрачность без бесконечного счёта. Для команды: когда что-то ломается — можно найти ответ, не разворачивая архив размером с небольшой город.

Это не героизм. Это гигиена. Как мыть руки перед едой — скучно, но от этого зависит здоровье всей системы.

Признаки, что в компании с логами бардак

Вы снаружи это не увидите напрямую. Но косвенные признаки бывают:

сбои «чинят» долго, хотя «вчера всё работало»;
поддержка не может сказать, что произошло с вашей операцией;
сервис растёт, а «технические работы» и деградации участились;
компания экономит на видимом (поддержка, интерфейс), но не говорит про внутреннюю инфраструктуру;
после сбоя слышите: «данные за тот период не сохранились» или «логи уже удалились».
сервис хвастается «ИИ внутри», но никто не может внятно объяснить, на каких данных он учится;
в политике конфиденциальности общие слова, а в логах по факту хранится слишком много личного;
после утечки говорят «это были только технические логи» — а в них оказались телефоны, адреса, фрагменты переписки.

Обратная сторона — когда всё работает незаметно: быстро чинят, могут объяснить, сервис стабилен при росте. За этим часто стоит не «волшебный программист», а нормально устроенная кухня — в том числе с логами.

Что может сделать обычный человек

Не много, но полезно понимать:

Если сервис часто ломается и долго чинят — проблема может быть не в «плохих разработчиках», а в том, что компания не видит свою систему изнутри.

Если бесплатный сервис внезапно урезает функции — возможно, росли расходы на инфраструктуру, в том числе на хранение данных.

Если после сбоя просят «скриншот и точное время» — это не отмазка. Это попытка найти вашу строчку в дневнике системы. Чем точнее время — тем быстрее поиск.

Если компания хвастается «у нас всё в облаке» — спросите себя: а кто платит за это облако? Пользователь, инвестор, или сервис пока живёт за счёт скидок и надежды?

Итог

Логи — это не скучная статья для бухгалтерии. Это память сервиса. Без неё система слепая. С плохо устроенной — дорогая и тоже слепая, только ещё и с долгами.

Экономить на логах — не значит «ничего не писать». Значит:

писать нужное, а не всё;
хранить разумно, а не вечно в самом дорогом месте;
уметь быстро находить, а не копать свалу;
считать заранее, а не удивляться счёту через год.

За каждой кнопкой в приложении стоят не только программисты. Стоят серверы, трафик, место на диске и те самые записи о том, что произошло, когда вы нажали. От того, насколько разумно компания с этим обращается, зависит и её бюджет, и то, как быстро вам помогут, когда что-то пойдёт не так.

А в эпоху ИИ к этому добавляется ещё один слой: данные пользователей всё чаще становятся не только историей для починки, но и материалом для обучения. Где проходит грань между «сервис стал удобнее» и «сервис слишком много о нас знает» — разберём отдельно.

Если эта тема вам откликается — напишите в комментариях. Если наберётся интерес, сделаю следующую статью: «На чём учится ИИ в вашем приложении — и почему это касается не только айтишников».

А вы задумывались, что «бесплатный» и «умный» сервис может платить вашими данными? Или пока считаете, что это «просто кнопка»? Напишите — от этого зависит, стоит ли браться за продолжение.