4 подписчика

Как сохранять приватность

4 марта4 мар

19 мин

За свою недолгую жизнь я редко задумывался о концепции «приватности». В конце концов нашим миром правят корпорации, все данные где-то там в "облаках", а ты всего лишь винтик в системе, которой о тебе уже всё известно, ведь рекламным алгоритмам это нужно, чтобы привести компании к достижению квартальных OKR. Антиутопия, хех? Тем не менее, однажды я задумался — доколе? Не поймите меня неправильно - я ценю удобство! Да, Google, Яндекс, Apple, Microsoft (и что уж там, многие другие) владеют нашими данными, но они же дают нам столько всего! Это же так удобно! Вот открыл я свой Apple MacBook, а на приложении "Почта" уже красный кружок с циферкой. За кликом по иконке скрывалось письмо от коллеги, которое пришло мне на Яндекс.Почту. Письмо было заранее прочитано как минимум двумя ИИ — YandexGPT и Apple Intelligence. Первый это сделал чтобы сгенерировать мне "краткое содержание", а второй — чтобы корректно определить это письмо в одну из ИИ-категорий: В письме была ссылка на папку в Google Driv

Оглавление

Да это абсурд
Как бежать?
Довольно теории, переходим к практике

За свою недолгую жизнь я редко задумывался о концепции «приватности».

В конце концов нашим миром правят корпорации, все данные где-то там в "облаках", а ты всего лишь винтик в системе, которой о тебе уже всё известно, ведь рекламным алгоритмам это нужно, чтобы привести компании к достижению квартальных OKR.

Антиутопия, хех?

Тем не менее, однажды я задумался — доколе?

Не поймите меня неправильно - я ценю удобство! Да, Google, Яндекс, Apple, Microsoft (и что уж там, многие другие) владеют нашими данными, но они же дают нам столько всего!

Телефоны, планшеты и компьютеры, с помощью которых мы получаем доступу к необъятному океану информации, готовому поглотить нас целиком.
Приложения и сайты, в которых мы ведём все наши дела и следим за различными аспектами наших жизней.

Да это абсурд

Это же так удобно! Вот открыл я свой Apple MacBook, а на приложении "Почта" уже красный кружок с циферкой. За кликом по иконке скрывалось письмо от коллеги, которое пришло мне на Яндекс.Почту. Письмо было заранее прочитано как минимум двумя ИИ — YandexGPT и Apple Intelligence. Первый это сделал чтобы сгенерировать мне "краткое содержание", а второй — чтобы корректно определить это письмо в одну из ИИ-категорий:

В письме была ссылка на папку в Google Drive, в которой лежат дизайны к проекту, над которым я вот-вот начну работать.

Хотя кого я обманываю… Уже давно никто не хранит макеты в файлах, ведь у нас есть Figma! Ещё один облачный сервис, который не позволит Вам и чихнуть без подключения к интернету.

О чём это я… А, да, дизайны. Я открываю их в "облаке", запускаю свой верный VS Code, в котором я только что ~~временно~~ закончил настраивать свою экосистему из расширений, и начинаю работу. Первым делом — открыть Todoist и декомпозировать то, что мне нужно сделать в ближайшее время. Конечно я бы мог использовать мой облачный Notion для управления задачами, но там я веду проектную документацию, и список срочных задач меня будет только раздражать и отвлекать.

Если во время работы мне понадобится что-то загуглить, я непременно отвлекусь, ведь в топе выдачи будет ссылка на Reddit, который увлечёт меня почитать о чём нибудь бесполезном, но ООООЧЕНЬ интересном (нет).

Если я воспротивлюсь Гуглу и пойду искать что-то в Яндекс, Директ невероятно быстро узнает меня, и предложит купить ту замечательную дрель, к которой я только недавно приценивался на Яндекс.Маркете.

Но, пожалуй, хватит об этом. Не то чтобы у меня закончились примеры, ведь есть ещё всеми любимые социальные сети — Facebook, Instagram (Meta признана экстремистской организацией на территории РФ), VK, Snapchat. Видео-сервисы — YouTube, TikTok. Онлайн-кинотеатры — Disney+, Netflix, Amazon Prime. И много, много ещё всякого, что вы и так знаете.

Вот эта постоянная постоянная потребность быть подключенным к интернету, необоснованная привязанность к сервисам, которые раз за разом подтверждают свою неблагонадёжность и серые бизнес-практики, просто утомляет. И после многих лет, я утомился настолько, что решил бежать от всего "бигтеха". Но куда? И как?

Как бежать?

Сперва я решил составить плоский список всего, что мне нужно.

Обычно я отдыхаю за просмотром фильмов или сериалов. Учитывая количество онлайн-кинотеатров и тот факт, что контент размазан по ним, страшно становится даже при мысли о том, сколько раз придется вводить данные карты, номер телефона, адрес и сдавать мазок на Ковид (или что-там просит Дисней+ сейчас).

Книги и аудиокниги тоже уважаю. Особенно нравится слушать книги во время продолжительных поездок на велосипеде; только за этот год я прослушал 6 книг Дюны и 10 книг из серии "Хроники Амбера", а так же всего Ведьмака.

Что дальше? А, обычные книги.
Да, читать бумажные книги очень приятно, но сколько же они занимают места, уффф… Серии "Сага о Тёмном эльфе" достаточно, чтобы занять целую полку (36 книг). А журнальчики, небольшие рукописи или интернет-издания? Какое-то время назад я решил, что буду их печатать и читать в метро. Читать я их так и не начал, но место они занимают, конечно достаточно.

Программирование занимает огромную часть моей жизни — это моя профессия, моё хобби и то, к чему я возвращаюсь снова и снова в течение последних 10–15 лет. На то, как с моими данными обращаются на моей работе, я, к сожалению, значительно повлиять не могу. Однако для персональных проектов и подработки на стороне я полностью контролирую «как», «где» и «что» было/будет сделано.

В процессе написания кода я, естественно, использую IDE, где-то храню код и версионирую его. Свой прогресс я отслеживаю как посредством документации, так и банальным перетаскиванием карточек из колонки в колонку (так называемый «Канбан»). Вероятнее всего данный раздел — это то, о чём я могу сказать больше всего. Уж простите.

А теперь - блиц!

Музыка - слушаю, но редко. На данный момент в моём плейлисте 65 песен (+2 за время написания этого поста).
Документы/счета/платёжки - приходят физически и электронно, раскладываются по папкам (в том числе физическим).
ChatGPT - не фанат, но иногда хочется узнать что-то, что неудобно было бы спрашивать у живого человека ("сколько весит нос?").
Умный дом - после переезда в трёхэтажный шикарный дом озаботился умными лампочками, камерами, сенсорами и т.п. Умный дом теперь это необходимость!
Пароли - головная боль, если честно. Сколько же паролей я забыл за все эти годы использования интернета. Сколько раз использовал один и тот же при регистрации…
Тренировки - главная рекомендация для любого, кто занимается спортом, это документируй прогресс. К сожалению, последние 10 лет я этого не делал, что, кажется, и было причиной отсутствия видимого результата. Сейчас я, хочется верить, поумнел и тщательно веду расписание, список упражнений и рабочие веса/повторения.
Фотографии и видео - в эпоху социальных сетей - как без этого обойтись? Особенно, когда не хочешь делиться с посторонними.

Довольно теории, переходим к практике

Ни для кого не секрет, что около-максимальная безопасность и приватность ваших данных достигается, если данные никогда не покидают ваш компьютер/телефон/планшет.

Поэтому первый, и будем честны, самый скучный и эффективный способ — хранить всё локально.
Достаточно всего лишь создать несколько папок на рабочем столе:

Фильмы
Сериалы
Книги
Музыка
…

Захотелось посмотреть фильм в дороге — подключил телефон/планшет кабелем к компьютеру и перекинул. Захотелось почитать? Большинство читалок и так работают только с локальными файлами, которые надо предварительно загрузить, чтобы читать.

Всё, что угодно, можно решить с помощью файловой системы. И многие решают! Но не стоит забывать о возможных проблемах:

Резервное копирование и восстановление может не быть первым приоритетом для медиа-библиотеки (т.к. торренты никуда не денутся ещё долгое время), однако для фото, видео, заметок и т.п. это крайне необходимо. Я сейчас страдаю от того, что не могу найти одно очень старое фото, которое, вероятнее всего, существовало только в одном экземпляре, на компьютере, который давно был сдан в переработку.

Естественным желанием является иметь быстрый доступ к хранимой информации. Никто не хочет открывать "Новая заметка 27", после того как не нашёл нужно в "Новая заметка 26". Для всего нужна какая-то система:

- Книги можно хранить как "Автор / Серия / Книга"
- Сериалы организуются в "Название сериала / Сезон / Серия"
- Для тренировок скорей всего достаточно одного файла с таблицей "| День | Упражнение | 1 | 2 | 3 | 4 |"
- и так далее
У естественно-организованного человека не возникнет особых проблем с этим, как и не возникнет вопроса "Какую книгу в жанре Х мне прочитать следующей?". Неорганизованным же - сочувствуем.

"Социальный аспект" и удобство. У меня есть жена, что если она хочет посмотреть что-то, что есть у меня на компьютере? Я могу дать ей весь компьютер, могу "скинуть на флешку", а могу заманить её в совместный просмотр, который буду паузить каждые несколько минут, потому что мне есть что сказать о сцене/диалоге/пейзаже. Да-да, мы так посмотрели обе Дюны — ушло более 3х часов на фильм, потому что я рассказывал всё, что подчерпнул из недавно прослушанных книг.

Даже если не брать во внимание жену — помимо того, что нужно использовать некую систему хранения контента, её же нужно и реплицировать на столько устройств, сколько вы используете. Да, мой ноутбук — моя крепость, но он не всегда со мной. А премис всего, что я тут написал — я не хочу использовать "облака", чтобы мои данные были сразу везде.

Я зашёл в тупик… Только бы… Что, если я создам своё приватное облако?!

Да, вы правильно поняли, следующий шаг после «хранения» всего локально, это «хостинг» всего локально!

Я начал всего лишь с одной Raspberry Pi 4, а спустя полтора года мой "домашний дата центр" превратился в NAS + 2 Raspberry Pi + 1 б/у Dell Tower + 1 полноценный компьютер в GPU и всем таким. В недавней ревизии (версия 3.0), у моего домашнего облака появилось своё собственное облако с критической инфраструктурой, которая теперь живёт в доме у моего коллеги.

Для старта, могу уверенно сказать, это не нужно. Выбирать стоит в зависимости от свободного времени и желания "ковыряться" с этим. Тут главное не накручивать себя - добиться 99.9999% SLA, ISO27001 сертификации и минимального углеродного следа можно, но стоит ли оно того?

По опыту меня и моих коллег, если начать с недорогого Synology NAS и нескольких OpenSource решений, уже можно достичь медленного, стабильного, но, самое главное в текущем контексте, абсолютно приватного облака для себя, а то и для всей семьи.

Мой NAS сейчас является главным хранилищем – все сервисы хранят пользовательские файлы на нём. Про резервные копии я тоже не забыл – Synology предоставляет утилиту Hyper Backup, которая шифрует содержимое и загружает один большой блоб в Object Storage на Яндекс.Облаке. Хочется, конечно, контролировать хранение своих резервных копий самому, но если я куплю ещё 1–2 NAS (вместе с дисками) чисто под это дело – функционально я ничего не получу, а стоимость покроет 10–20 лет платы за "Ледяное" хранилище в любом S3. Компромиссы, без них никуда.

Для хранения сразу всей библиотеки развлечений я могу смело рекомендовать Jellyfin. Книги, музыка, фильмы и сериалы – всё здесь, всё доступно и работает практически “из коробки”. Опыт максимально схож с Netflix или любым другим онлайн-кинотеатром:

Постеры, трейлеры, описание, рейтинг фильмов и сериалов
Учётные записи для всей членов семьи, с сохранением прогресса просмотра (чтобы не вспоминать "на какой серии остановился").
Доступно вообще везде - телефоны, планшеты, даже телевизоры! - через приложения (например нативное) или просто в браузере.
Бесплатно (в отличии от Plex) и без отслеживания использования (хотя я всё равно запретил все исходящие соединения контейнеру).

Сразу добивочная - для аудиокниг и подкастов рекомендую AudioBookShelf. Как и с Jellyfin - очень легко мигрировать с локального хранилища - оба сервиса работают "поверх" ваших файлов, и просто пытаются найти мета-данные, чтобы отобразить всё "дорого-богато". Персональные учетные записи, прогресс прослушивания, подборки и т.д. так же реализованы в AudioBookShelf.

Для любителей подкастов – не обязательно заводить аккаунт в Яндекс.Музыке, Spotify или Apple. Как правило эти платформы ничего не хранят, а просто являются “дистрибьюторами”. AudiobookShelf выполняет и эту роль – достаточно добавить ссылки на своих любимых авторов, и новые эпизоды будут скачиваться автоматически. Немного нарциссично, но единственный подкаст, который я слушаю – это мой.

К слову, приложение для Android доступно для скачивания, а вот для iOS оно в бета-тесте, приглашения в который закончились. Однако, я нашел приложение plappa, не собирающее никакой персональной информации, созданное студентом-разработчиком, бесплатное. Бесплатная рекомендация!

Фото и Видео хранилище, как будто бы, является самым распространённым запросом. Оно и понятно - от закрывания носа цветочком, до цензурирования лица новорожденных - многие люди не желают, чтобы их воспоминания, счастливые и личные моменты, а иногда и дурные привычки, становились достижением “непонятно кого”. Лично я не считаю, что какая-нибудь команда разработчиков прямо сейчас сидит в офисе Google и смотрит мои фото со студенческих лет. Однако, я более чем уверен, что эти фото будут использоваться для чего-то, что сделает Google ещё богаче. Я вам говорю - как только я увижу, что Gemini сгенерировал на чьём-то лице прыщик, отдалённо похожий на любой из тех, которые были у меня в юношестве - я буду сильно негодовать.

Я выбрал Immich, кстати. Приложения под все платформы, возможность загрузить все свои фото и не платить за iCloud/Google Drive/Dropbox, распознавание лиц, поиск по тому, что на фото, используя локальные ML-модели, и многое другое. Максимально напоминает фотогалерею на iPhone, даже создаёт локальные "воспоминания", которые можно просматривать как сторис в Instagram (сервис признан экстремистским на территории Российской Федерации).

Никогда особо не вел заметки централизованно. Если надо было что-то записать – делал это в “ближайшем” приложении. Чаще всего это был чат с самим собой в Telegram. Как-то я даже приобрел годовую подписку на Bear, который, к слову, оставил только положительные впечатления.

Увидел однажды видео про Obsidian, влюбился с первого взгляда – абсолютно всё хранится локально, богатая экосистема плагинов, быстрый и удобный. Один минус – чтобы заметки синхронизировались между устройствами, нужно сделать несколько прыжков через обруч. Да, подписка на Obsidian Sync недорогая, и все заметки будут защищены сквозным шифрованием, но опять же – это еще одна компания, которой надо передать данные своей карточки, платежный адрес, номер телефона и т.п.

В какой-то момент я осознал, что я могу синхронизировать мои заметки туда же, где я селф-хощщу всё прочее. Спасибо MinIO за бесплатное S3-совместимое решение, которое теперь живёт у меня на сервере и где хранятся все мои заметки со всех моих устройств.

Да, я слышал, что Obsidian Sync – “незабываемый опыт”, что она работает “незаметно” и “невероятно быстро”, но пока не возникало ситуации, когда моё “на коленке” решение меня подвело или расстроило.

К слову, Obsidian – это не только заметки, благодаря развитой экосистеме плагинов – здесь можно как вести свой список дел, так и устроить полноценный менеджмент проектов. Посему, легко догадаться, что на моём рабочем ноутбуке тоже установлен Obsidian (с недавнего времени они стали бесплатными для коммерческого пользования), в котором я работаю ежедневно. Вспоминая дни, когда я пользовался Todoist для списка дел – бррр, не скучаю вообще.

Отвлекусь на минутку, чтобы отметить – я попробовал много всего в погоне за своей мечтой о приватности, и со многими приложениями/инструментами приключилось так, что я теперь даже не хочу пользоваться “корпоративным” аналогом. Сколько бы Apple intelligence не было в Яблочных приложениях – мой “второй мозг” в Obsidian гораздо мощнее и роднее.

Плавный переход к теме LLM

Да, последние несколько лет эта тема на пике популярности.

Как вы могли догадаться, желания отдать бездушной машине всю информацию, которой я владею, у меня нет. А вот людей, злоупотребляющих подобным, вокруг меня хватает. Один из коллег оцифровал все свои медицинские записи за всю свою жизнь и загрузил в несколько LLM чисто чтобы сравнить – кто лучше поставит ему диагноз. Интересно – как скоро вся реклама, которую он видит, превратится в рекламу хиропрактиков и БАДов.

К счастью, и для нас, параноиков, существует решение. Время от времени большие компании кидают нам кость, в виде "не самой лучшей", но достаточно способной LLM. И спасибо людям из Ollama за невероятно простое для использования приложение, которое, однако, не составит конкуренции какому-нибудь ChatGPT… В отличии от OpenWebUI!

Для меня это стало весьма интересным экспериментом, результатами которого я вполне доволен. На том же кластере, где у меня крутится всё, крутится же связка из Ollama + OpenWebUI (как подобается с отключеным доступом в/из Интернет). Модельки крутятся локально, работает всё, естественно, не мгновенно, но я и не настолько искушённый пользователь, чтобы плакаться по этому поводу.

Недавнее обновление DeepSeek-R1, к слову, приятно порадовало. При относительно небольших требования к вычислительным мощностям, результатом я крайне удовлетворён.

Ну а вишенкой на торте являются расширенные функции OpenWebUI. Я ещё не всё пощупал, но возможность собрать уникальные "базы знаний", и делать так чтобы выбранная LLM опиралась на них при "размышениях", мне очень нравится. Понадобилось чем-то воспользоваться - выкачиваешь всю документацию, создаёшь "знание" и можно просто спрашивать локальную LLM как этим пользоваться.

Тот факт, что Ollama доступна мне во внутренней сети, также позволил интегрировать её в Obsidian, используя плагин Local GPT от Павла Франкова. Я не использую LLM для генерации текстов (разве что это не по работе, хех), но оно отлично справляется если надо поправить орфографию и пунктуацию, кратко изложить текст заметки и т.п. Я настолько преисполнился, что на рабочем компьютере у меня так же есть Ollama. В целом хочется достичь некого единообразия между домашним и рабочим окружением, с фокусом на комфорт и индивидуальную продуктивность, конечно же.

Ещё год назад я активно использовал IDE от Jetbrains, купив выгодный (на тот момент) пакет из всех продуктов заплатив всего лишь 100$ за год использования. Я и сейчас считаю, что один конкретный продукт - DataGrip - незаменим, и ничто даже близко не подошло к такому уровню качества и функциональности. Что не отвечало моим требованиям к функциональности, так это встроенный в IDE контроль версий. Не смотря на то, что я человек, который старается создать для себя что-то отдалённо напоминающее панель управления космического корабля, мой опыт использования встроенного VCS не был позитивным. Поэтому последние 5-6 лет я платил за GitKraken, а до этого пользовался SourceTree.

Сейчас же я превратился в полноценного красноглазика!
Всё моё дев-окружение накатывается декларативно с использованием darwin-nix, так что я контролирую всё, что установлено в моей системе. Для написания кода я полностью переключился на связку Tmux + NeoVim, а гитом управляю с помощью lazygit.

Вы спросите - "Сколько же ты времени потратил на обучение и настройку всего этого?", а я отвечу "Да". Зато шанс, что я установлю что-то вредоносное из маркетплейса VSCode, буквально нулевой. Если не зарываться, а устанавливать только то, что нужно и то, чем пользуешься чаще чем раз в год, а ещё лучше - по диагонали прочитать код плагина, который собираешься использовать - ощущение безопасности и приватности не покинет в ближайшее время.

Примерим ИХ шкуру

Перечитывая всё, что я тут написал, появляется ощущение что сервисы, технологии и устройства от больших компаний окружают нас повсеместно. А за всем этим стоят корпорации, которые в конце концов поработят нас окончательно.

А кто-то пытался побывать в их шкуре? Может они не настолько злые, как принято считать?

Проведём мысленный эксперимент! Я - компания! (представим)

Я разработал приложение, в котором пользователь должен отмечать факт того, что он покушал. В конце дня количество приёмов пищи высылается бабуле пользователя, чтобы та была довольна. Предположим (пока что), что это бесплатное приложение.

Какой минимальный набор данных мы собираем?

Имя пользователя - у бабули же может быть несколько внуков, как она поймёт какой из них сколько раз покушал?
Имя бабули - согласно статистике, у каждого человека в среднем 2 бабули. Нам же надо понимать кому отсылать отчёт.
Часовой пояс - пользователь же кушает по своему времени, а нам надо знать когда наступает этот загадочный "конец дня".

Что мы можем вывести, зная эти данные?

Количество бабуль у каждого пользователя.
Количество внуков у каждой бабули.
Количество и имена братьев и сестёр пользователя (предположительно двоюродных), по принципу "если твои бабушки, это мои бабушки тоже - мы точно родня".
Распорядок дня пользователя, ведь зная часовой пояс и время приёма пищи легко вычислить что это было - завтра, обед или ужин.
А из распорядка можно предположить и профессию:охранник кушает по ночам;
блоггер завтракает после полудня;
студент обедает после четвёртой пары;
и тп.

Дальше хуже - включаем воображение

С какими родственниками пользователь живёт под одной крыше (если у братьев/сестёр приблизительно совпадают завтраки/ужины)
С какими родственниками пользователь поддерживает отношения (периодически совпадает время приёмов пищи с братьями/сёстрами)
Религия (ведь в большинстве случаем посты и празднества унифицированы по всему миру)
Дни рождения / значимые даты (много приёмов пищи в один конкретный день в году)
Сдвиг времени приёма пищи может свидетельстовать о том, что пользователь путешествует в другую страну.
И многое, многое другое.

А ведь целью моего приложения никогда не было собирать эти данные! Однако, мне достаточно знать всего 3 параметра, чтобы составить столько предположений. И моё предположение всё ещё бесплатное, а что это значит? Реклама!

Абсолютное большинство бесплатных приложений и сервисов выживают за счёт рекламы. В данном эксперименте я не хочу пользоваться поставщиком рекламы, потому что тогда придётся в явном виде просить разрешение пользователя на передачу его данных третьим лицам. Давайте будем сами выбирать и показывать рекламу!

Зная имя и религию, можем предположить пол - бум! Реклама грузовиков для мальчиков и рюшечек для девочек!
Зная с кем пользователь живёт, его профессию и часовой пояс - бах! Ипотека под небольшой процент!
Приближается день рождения родственника пользователя - пы-пыщь! Реклама маркетплейса, на котором можно приобрести подарок!
…

Чувствуете, чувствуете? Как же легко продать персональные данные, если они у вас есть.

-------------------------------

И этот пример невероятно прост и банален. Рекламные бизнесы, такие как есть у Google или Яндекс, не создают подобных приложений и не придумывают многоходовочки, чтобы вытянуть пользовательские данные, обработать, сгруппировать и, основываясь на них, впарить пользователю рекламу.

Очень часто, этим данные им приносят на блюдечке разработчики вот таких бесплатных приложений, которые просто хотят немного денег с барского стола.
Достаточно вспомнить что недавно случилось с Firefox. Если они прогнулись, то как более маленькие и простенькие сервисы могу устоять?

Резюмируя

Невозможно защититься от всего, как и невозможно сохранить свои персональные данные в секрете.
Я не стал упоминать то, что помимо использования ваших данных компаниями, они могут быть украдены у компаний. Это уже следующий круг ада, в котором может произойти что-то хуже, чем «не релевантная реклама» в поисковике.

Но я продолжу стоять на своём - к этому нужно стремиться!

Я продолжу блокировать все домены телеметрии/рекламы, которые пытается достучаться какое-либо из моих устройств.
Я не буду отдавать свои данные каждому, кто просит.Если выбора нет, я укажу "одноразовую" почту (например Proton Mail и его "алиасы") и псевдоним.
Я не буду пользоваться сервисом, который просит право "передавать личные данные пользователя третьим лицам".

Ведь если что-то знают двое, то знает и свинья.