Найти в Дзене
Связь уровня стат.значимости (α), мощности эксперимента, ошибок I и II рода в A/B-тестах
Например мы, планируем A/B-тест для нового функционала в мобильном приложении. Перед запуском нужно определить параметры эксперимента. Допустим, мы для себя решили что: Что это значит на практике и какую вероятность ошибки мы закладываем?...
1 неделю назад
Доверительный интервал оценок клиентов
Допустим ваша компания проводит опросы своих клиентов каждый месяц. И в итоге получает среднюю оценку своей работы — MOS (Mean Opinion Score). Наша задача: узнать доверительный интервал полученной средней оценки в каждом месяце. Дано: файлик с оценками клиентов. Колонки: Далее открываем Jupyter notebook, пишем: # Импорт библиотек import numpy as np import pandas as pd import plotly.graph_objects as go # Читаем данные df = pd.read_excel('mos_data.xlsx') df.info() # Удаляем ячейки без оценки df = df[df['points']...
2 недели назад
Продакт-менеджер Петя и потерянные данные
Жили-были продакт-менеджер Петя и бизнес-аналитик Катя. Петя вечно торопился: бегал с мита на мит, сыпал идеями и требовал дашборды «на вчера». А Катя ему приговаривала: — Петя, не спеши. Петя, сначала ТЗ напиши, да таску в Jira закинь. Но Петя не слушал. Однажды он торопился представить отчёт стейкхолдерам и запросил дашборд. Открыл Superset — графики кривые, метрики нулевые, KPI не считаются. Петя побледнел, замер и упал лицом в клавиатуру. Испугалась Катя, побежала к bi-аналитику: — Срочно нужны...
1 месяц назад
В айти добро 😀
Закоммитил код на гите — Баги выявил на мите. Мержить в мастер я не смог, И релизный вышел срок! Я люблю свои дашборды, Запущу пайплайны бодро, Фильтры все расставлю чётко, Покажу начальству ловко! Я учу свои модели, Запущу в продакшн смело...
2 месяца назад
Отгадай загадку
Когда меня двое, мы едины в одном. Я поддерживаю твою жизнь и я же её медленно разрушаю. Ты найдёшь меня даже опустившись на самое дно. В мире только двое впереди меня. Что это❓ 🤓 За всю жизнь ты сделаешь нас миллионы. Говорят что за каждым из нас следует другой такой же. 🤴🏻У короля он всего один. О чём идёт речь❓ Бывает испанский — им ломали упрямых. Бывает итальянский как в море. А есть тот, что на службе, в походе. Я несусь быстро, но ты не чувствуешь моего движения. Я скрываю всё от глаз и храню тайны пока не придёт время раскрыть их...
2 месяца назад
Kandinsky, Fusionbrain, API и халявные фоточки
Ещё один способ получить картинки у себя на локальном компьютере без водяных знаков. Для этого нам нужно зарегистрироваться на fusionbrain.ai. В личном кабинете можно генерировать фотографии и видео с помощью интерфейса сервиса. А можно воспользоваться API и запускать python-код в своём любимом Jupyter Notebook. Для этого нам понадобится API-ключи. Их можно получить в разделе, как нестранно, API. Заходим в раздел, жмём «Добавить ключ» и получаем API key и Secret key. Потом ответственно сохраняем эти ключи...
2 месяца назад
Пошаговая инструкция по запуску Telegram-бота на сервере Ubuntu
База данных будет в SQLite, можно также сделать и на PostgreSQL, имя базы данных: mybot.db. Обновление пакетов: sudo apt update && sudo apt upgrade -y Установка Python 3 и pip sudo apt install python3 python3-pip python3-venv -y В этой команде: ⚠ Рекомендуется создать отдельного пользователя для бота sudo adduser telegrambot sudo su - telegrambot "sudo adduser telegrambot" — создаёт нового пользователя с именем telegrambot. Во время выполнения команды система попросит ввести пароль для нового пользователя и (по желанию) заполнить дополнительные сведения (имя, телефон и т...
3 месяца назад
Подсчёт сессий пользователей на сайте через SQL
Частая задача подсчёта количества сессий пользователей сайта. Решаем на SQL, пишем в Jupyter Notebook... import pandas as pd import numpy as np import random import sqlite3 from datetime import datetime, timedelta # Настройки генерации num_users = 10 # Количество уникальных пользователей events_per_user = 20 # Среднее количество событий на пользователя start_date = datetime(2024, 1, 1) end_date = datetime(2024, 12, 31) # Генерация данных data = [] for user_id in range(1, num_users + 1): ···# Случайное количество событий для пользователя (от 10 до 100) ···num_events = random...
3 месяца назад
SQL: ROW_NUMBER(), RANK(), DENSE_RANK()
При запросах к БД через SQL часто бывает нужно ранжировать строки таблицы по какому-либо значению и потом, например применять фильтр. Для этого очень удобно использовать функции с окнами: ROW_NUMBER(), RANK(), DENSE_RANK(). Как использовать смотрим в Jupyter Notebook на тестовой БД SQLite. Открываем ноутбук, пишем: import pandas as pd import sqlite3 from contextlib import contextmanager from IPython.display import display data = pd.DataFrame({ 'student': ['Жек Воробьёв', 'Жек Воробьёв', 'Жек Воробьёв',...
3 месяца назад
Заповеди SQL. Премудрость №2
1. Никогда не пиши SQL-запрос без псевдонимов (alias.col_name) или без полного наименования таблицы (table_name.col_name). Это приведёт к ошибкам и сделает код не читаемым. Пример с псевдонимами (alias): SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.id = t2.id Пример с полными наименованиями таблиц: SELECT * FROM table1 LEFT JOIN table2 ON table1.id = table2.id 2. Не используй RIGHT JOIN, вместо него пиши LEFT JOIN. FULL JOIN есть не во всех базах данных, но его можно эмулировать: SELECT * FROM table1 LEFT JOIN table2 ON table1...
3 месяца назад
Генерим фоточки в Google colab халявно
Ещё одно решение для тех кому нужны изображения и желательно без водяных знаков. Каждый может создавать уникальные изображения из текста и одного исходного изображения. Без дорогих видеокарт и сложных программ с помощью Google colab и нескольких строк кода. Открываем Google Colab. Предварительно авторизовавшись в Google. В появившемся окне жмём синюю кнопку «Создать блокнот». После чего появится интерфейс блокнота для написания python-кода. Пишем код в разных ячейках. Чтобы добавить новую ячейку в меню сверху есть кнопка «+ Код»...
4 месяца назад