Найти в Дзене
Семплирование в API Яндекс.Метрики
Семплирование (sampling) — это статистический метод, при котором отчёт строится не по всем данным, а по выборке из этих данных. Например: У вас 1 000 000 визитов за квартал. Метрика берёт 100 000 визитов (10%), считает показатели и умножает результат на 10. Есть нюанс: при семплировании отчёт становится приближённым. Для A/B-тестов, финотчётности или анализа редких событий это может быть критично. API Яндекс.Метрики позволяет явно задавать уровень выборки через параметр accuracy. Также при упрощении запросов уровень семплирования снижается...
3 недели назад
Как выгружать статистику из Яндекс.Метрики по скачиванию конкретного файла
Если на сайте есть какой-либо файл, например анкета в формате PDF для заполнения, и требуется узнать как часто скачивают этот файл, то можно воспользоваться отчётом в кабинете Яндекс.Метрики, который называется «Загрузки файлов». Но этот отчёт может не отобразить все данные из-за семплирования, особенно, если таких скачивания мало. Тогда вооружаемся ноутбуком Jupyter, API Яндекса и пишем Python-код. import locale # Для корректного отображения русских символов в консоли import os # Работа с файловой системой import pandas as pd # Библиотека для работы с таблицами import plotly...
3 недели назад
Генерация речи из текста разными голосами на Python: гайд по edge-tts + librosa
Как сгенерировать речь по тексту и желательно бесплатно? Без API-ключей. С возможностью «накрутить» мультяшные, монструозные или роботизированные интонации на разных языках. Ранее решал задачу по переводу записи звонка в текст. А теперь обратная задача. И вот готовый код для запуска в Google Colab. ⚠ Код работает в Google Colab или любом Jupyter-окружении. !pip install -q edge-tts librosa soundfile numpy import asyncio import edge_tts import librosa import soundfile as sf from IPython.display import...
1 месяц назад
Ошибка множественного A/B-теста. Поправка Бонферрони
Провели множественный A/B-тест (три варианта: A, B, C), где каждое сравнение сделано с уровнем значимости (вероятностью ошибки I рода) α = 0.05 (5%). Какая результирующая ошибка всего теста? Для одного теста (A vs B) ошибка 5% означает, что если на самом деле различий нет, то мы всё равно с вероятностью 5% ошибочно решим, что они есть. В тесте 3 парных сравнений: A vs B, A vs C, B vs C. Если тесты независимы, то вероятность не совершить ошибку в одном сравнении: 1 − 0.05 = 0.95. Для трёх независимых тестов: 1 − (1 − α)ᵐ Для 3 тестов: 1 − (1 − α)³ P(нет ошибок) = 0...
2 месяца назад
Словарь A/B-тестировщика: Что значит «прокрасился тест» и при чём тут светофор?
В большинстве систем аналитики результаты тестов подсвечиваются цветами. Это визуальный язык, который помогает быстро принять решение. Означает статистически значимый положительный результат. Действие — внедряем! Гипотеза подтвердилась, новая версия работает лучше. Означает статистически значимый отрицательный результат. Действие — откатываем / не внедряем. Изменение вредит продукту. Нужно проводить ревью и разбираться, почему так вышло. Означает, что статистической значимости нет. Разница между группами есть, но она настолько мала, что может быть случайным шумом...
2 месяца назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала