В данной статье будет разобрано 3 варианта расчета среднего значения в зависимости от методики вычисления. Рассматриваемый датасет представляет собой 2 таблицы: Facts и Calendar. Таблицы соединены связью многие к одному, соответственно.
Calendar содержит столбец с датами с 01.01.2024 по 10.01.2024. Таблица фактов представляется собой вот такое наполнение:
Как можно заменить, за 4 число отсутствует значение в столбце doc_sum. Кроме того, нет записи за 6 января. Попробуем с учетом этих вводных рассчитать среднее значение по doc_sum за весь период. Отобразим в визуальном элементе "Таблица" наши данные. Дату возьмем из Calendar, doc_sum - из Facts. Для удобства отображения пустых значений поставим галочку "Показать элементы без данных" для столбца doc_sum.
Попробуем "в лоб" рассчитать среднее значение по столбцу doc_sum. Общая сумма по столбцу = 50:
Среднее значение (простой расчет) = AVERAGE(Facts[doc_sum])
Как можем увидеть, в данном случае пустые значение по doc_sum проигнорированы: 50/8 = 6,25.
Давайте, будем считать, что пустые строки в таблице Facts = 0. Учтем, это в формуле и пересчитаем.
Среднее значение (если пусто, то 0) =
AVERAGEX(Facts; if(ISBLANK([doc_sum]);0;[doc_sum]))
Данный шаг уточнил наш расчет. Но мы видим, что данные за 6 января не учтены, и PBI считает только за 9 дней.
Попробуем изменить алгоритм расчета, чтобы в зачет попадали все дни в выбранном периоде, даже, если по ним отсутствуют данные в таблице Facts.
Среднее значение (за все дни) =
DIVIDE(SUM(Facts[doc_sum]);count('Calendar'[Date]))
Теперь мы получили результат среднее значение за все 10 дней, но правильный ли он? Ответ на этот вопрос может дать только техническое задание, по которому определяется методика. А пока, все средние, которые мы посчитали являются правильными и ошибочными одновременно.
Если понравилась данная статья, ставьте лайки и подписывайтесь, чтобы другие тоже смогли увидеть данный материал. По теме Power BI читайте и другие статьи на канале.