Статьи
2 прочтения · 1 день назад
Будущее за углом: как с нейросетями упростить решение бытовых проблем
"Будущее уже здесь - оно просто неравномерно распределено" (Уильям Гибсон). Технологии развиваются с невероятной скоростью, и что еще вчера казалось фантастикой, сегодня уже доступно. Одним из самых ярких примеров является развитие нейросетей, способных отвечать на самые сложные вопросы и в кратчайшие сроки дать алгоритм действий в экстренной ситуации. Мой знакомый случайно продиктовал мошенникам код смс и фактически передал доступ к личному кабинету. А теперь оцените, что посоветовали нейросети, если аккумулировать их результаты, можно получить исчерпывающий перечень действий...
2 прочтения · 2 недели назад
Визуализация ошибок, как навигатор к скрытым проблемам модели
Визуализация — это язык, который позволяет нам видеть данные и понимать их смысл. Простой и эффективный способ диагностики результатов работы модели на различных объектах заключается в анализе разницы между прогнозами и целями. Он может показать, что в некоторых группах поведение модели имеет особенности, например, склонность к завышению или занижению прогнозов. Для демонстрации того, как строится такая визуализация загрузим набор данных: Разобьем датасет на две группы для обучения и оценки: Теперь...
3 недели назад
Особенности работы с LLM нейросетями в части исправления ошибок в ответах
После релиза ChatGPT сверхпопулярным направлением стало создание промтов. Появилось много "экспертов", каждый из которых пытается предложить рецепт подходящего запроса. Пройдусь по одному из трендов - это расхожие фразы, которые призваны устранить логические и фактологические ошибки в ответах. Спросим у 4 нейросетей ChatGPT, GigaChat, Алиса Про,Gemini одно и то же, а потом попробуем скорректировать ошибки. Запрос такой: можно ли методом compare в pandas сравнивать датафреймы с разным количеством строк...
1 прочтение · 2 месяца назад
Систематизация сценария с dvc пайплайнами
В этой статье я расскажу, как систематизировать ваш сценарий, сделать код и данные воспроизводимыми с dvc пайплайнами. Сначала проведем предварительную работу. Настроим конфигурацию dvc и укажем путь к удаленному хранилищу версий данных: Можно добавить файл в dvc: А после по подсказке добавляем файлы в Git и убедимся, что dvc стал отслеживать данные: Это общие методы работы с dvc, о которых я рассказывал ранее. С пайплайнами работа происходит немного по-другому. Вы разбиваете скрипт на логические...
11 прочтений · 3 месяца назад
Приемы воздействия первых 5 минут на примере интервью Путина Карлсону
Президент России как очень опытный политик и разведчик в ходе своих интервью использует техники влияния на собеседника, которые не мешает взять на вооружение каждому. Персонификация Начало беседы с популярным американским журналистом Такером Карлсоном он построил неординарно - с экскурса в историю нашей страны. Однако перед погружением в архивные сведения Владимир Путин применил прием сближения - "знания о персоне собеседника". Так, он отметил, что как историк по образованию Такер Карлсон заинтересуется сказанным...
27 прочтений · 4 месяца назад
Учимся эффективно формулировать мысли на примере разрыва между субъектом и действием
"Ключ к большому успеху часто заключается в одной важной мысли". Нагрузка предложения второстепенными деталями всегда осложняет восприятие, но зачастую это становится еще большей проблемой. Например, если "обстоятельства" располагаются между субъектом и действием. Вот пример названия свежей статьи от 06.02.2024 - "Из-за обстрела Бутово в ЛНР со стороны ВСУ загорелась АЗС, повреждена пекарня" "со стороны ВСУ" следовало поместить левее, иначе кажется, что эта фраза относится к месту, где загорелась АЗС...
39 прочтений · 4 месяца назад
Получение доступов к 3 лучшим бесплатным чат-ботам ChatGPT, GigaChat, YaGPT 2
ChatGPT Заходим на сайт с использованием VPN, Затем нажимаем "sign up": Вводим адрес электронной почты: Немного о себе: Далее система может запросить подтверждение номера телефона, для чего потребуется нероссийская симкарта. Однако, если войти через имеющийся аккаунт в Google, может прокатить без такой проверки. Для последующей работы используйте VPN. VPN Удобно выделить отдельный браузер для работы с ChatGPT и специальное VPN расширение к нему. Хорошим вариантом будет Planet VPN либо Free VPN...
15 прочтений · 4 месяца назад
Динамическая загрузка модулей в Python и как она спасает при работе с pyspark
"Приобретение знаний - это как путешествие в неизведанные земли: чем больше вы исследуете, тем больше открытий вы делаете". Библиотека importlib в Python предоставляет инструменты для динамической загрузки модулей. То есть она будет происходить не на этапе анализа кода интерпретатором, а во время выполнения программы. Это полезно, когда некоторые модули не известны до старта программы, например, как при работе с pyspark до инициализации переменных окружения с нужными путями. Импорт модуля Самый простой способ динамически загрузить модуль - использовать функцию import_module...
13 прочтений · 4 месяца назад
Темная сторона телефона как поглотителя времени и советы по борьбе с искушением отвлечься
"Теряя время, мы теряем нечто более ценное, чем золото" (Леон Блайз). В настоящее время телефон можно применять как с пользой, так и для развлечения. Второй случай является намного более распространенным. При этом многие осознают пагубность привычки, но не могут ей сопротивляться....
25 прочтений · 6 месяцев назад
Создание списков, ссылок и якорей с Markdown
Для задания списков из нескольких уровней нужно создавать их с новой строки и предварять символами табуляции. При этом каждый очередной элемент не должен отступать от соседнего более чем на один символ табуляции: Если поставить после второго уровня еще один символ табуляции, то "второй_уровень_1" и "третий_уровень_1" не будут относиться к списку: Из этого следует, если список имеет заданные уровни, которые должны располагаться друг под другом и где-то один уровень будет пропущен, то структура может...
61 прочтение · 7 месяцев назад
DBSCAN для кластеризации и обнаружения аномалий
Рассмотрим один из передовых методов кластеризации - DBSCAN. Для многих исследователей эффективность метода зачастую компенсируется сложностью его настройки, из-за чего предпочтение отдается другим алгоритмам. Давайте внесем ясность в вопрос и упростим использование DBSCAN. Основные параметры алгоритма, которые меняются от задачи к задаче: Они определяют 3 вида точек: Далее формируются отдельные кластера для каждой группы достижимых на расстоянии eps ядерных точек (возможно, одной). Граничным точкам...
29 прочтений · 7 месяцев назад
OSINT по справочнику Linux
Расскажу, как правильно использовать справочник Linux, чтобы получить полное и быстрое понимание возможностей командной строки. Этот навык очень важен для любого разработчика и аналитика, которые вынуждены писать код на серверах компаний и пользоваться терминалом Linux. whatis Краткое описание инструкции можно найти посредством вызова команды whatis: whatis grep help Для сжатого описания основных возможностей многие команды поддерживают вывод справки с параметром --help: grep --help info Выводит...
Видео