72 подписчика

Фальсифицируемость гипотез

30 апреля30 апр

5 мин

Ниже представлен подробный разбор концепции «фальсифицируемость гипотез» (falsifiability) как краеугольного камня аналитической методологии, применённой в рассмотренных отчётах. Понятие фальсифицируемости было введено философом науки Карлом Поппером как критерий демаркации между научным знанием и ненаучными (метафизическими) утверждениями. Согласно Попперу, теория или гипотеза является научной не тогда, когда её можно подтвердить (верифицировать) бесчисленным множеством примеров, а тогда, когда существуют принципиально мыслимые наблюдения или эксперименты, способные её опровергнуть. Ключевой момент: подтверждение гипотезы всегда носит временный и неполный характер (сколько бы лебедей мы ни увидели белыми, это не доказывает, что все лебеди белы), тогда как единственное противоречащее наблюдение (чёрный лебедь) необратимо опровергает её. Следовательно, научный метод — это не поиск подтверждений, а систематическое выдвижение смелых гипотез и столь же систематические попытки их уничтожит

Оглавление

Дополнительный материал к статье:
1. Происхождение и философская основа
2. Операционализация в аналитической практике

Дополнительный материал к статье:

Два вектора истины: сравнительный анализ методологий диагностики инцидентов производительности в PostgreSQL

Postgres DBA30 апреля

1. Происхождение и философская основа

Понятие фальсифицируемости было введено философом науки Карлом Поппером как критерий демаркации между научным знанием и ненаучными (метафизическими) утверждениями. Согласно Попперу, теория или гипотеза является научной не тогда, когда её можно подтвердить (верифицировать) бесчисленным множеством примеров, а тогда, когда существуют принципиально мыслимые наблюдения или эксперименты, способные её опровергнуть.

Ключевой момент: подтверждение гипотезы всегда носит временный и неполный характер (сколько бы лебедей мы ни увидели белыми, это не доказывает, что все лебеди белы), тогда как единственное противоречащее наблюдение (чёрный лебедь) необратимо опровергает её. Следовательно, научный метод — это не поиск подтверждений, а систематическое выдвижение смелых гипотез и столь же систематические попытки их уничтожить через критические проверки.

В контексте диагностики производительности этот принцип трансформируется в практическое правило: каждая гипотеза о причине инцидента должна формулироваться вместе с чётким описанием условий, при которых она будет признана ложной. Без этого гипотеза не имеет права на существование в аналитическом отчёте.

2. Операционализация в аналитической практике

Фальсифицируемость в диагностике СУБД — это не абстрактная философская категория, а жёсткая инженерная дисциплина, реализуемая через конкретные процедуры:

Определение предсказания. Гипотеза обязана содержать в себе конкретное, измеримое следствие. «Вероятно, проблема в дисках» — нефальсифицируемо, потому что не указывает, какое именно значение метрики мы ожидаем увидеть. Правильная формулировка: «Если проблема в дисках, задержка ввода-вывода (await) должна превышать N миллисекунд, а очередь запросов (aqu_sz) должна быть стабильно больше нуля».
Указание опровергающего эксперимента. До начала сбора данных аналитик должен ответить на вопрос: «Что я должен увидеть, чтобы отказаться от этой гипотезы?» Если ответа нет, гипотеза не проверяется и, следовательно, не может считаться обоснованной.
Примат негативного результата. В методологии расследований отчётов отрицательный результат проверки (гипотеза не подтвердилась) ценится выше положительного, потому что он безвозвратно сужает пространство возможных причин. Подтверждение же всегда оставляет вероятность, что истинная причина лежит глубже.

3. Реализация в Кейсе А («CPU-инцидент»)

В первом отчёте фальсифицируемость выступает главным двигателем расследования. Исходная, наиболее «очевидная» гипотеза могла бы звучать так: «Рост времени выполнения запросов вызван проблемами дисковой подсистемы, поскольку доминируют ожидания ввода-вывода DataFileRead».

Однако аналитик не принимает её, а немедленно формулирует фальсифицирующий критерий:

Если проблема в дисках, то метрики задержек (await) и очередей (aqu_sz) должны показывать аномальные значения.
Проверка показывает, что дисковая подсистема функционирует в нормативных пределах. Это — то самое опровергающее наблюдение, которое фальсифицирует «дисковую» гипотезу.

Далее выдвигается новая гипотеза: «Причина — исчерпание CPU на фоне неоптимальных запросов». Она также подвергается попытке фальсификации через статистический аппарат:

Фальсифицирующий критерий: Тренд простоя CPU должен показывать устойчивое падение, а операционная скорость СУБД — сильную отрицательную корреляцию с IOPS при нормальных дисковых метриках.
Эти предсказания подтверждаются, но, что важнее, гипотеза остаётся нефальсифицированной — то есть она выдерживает попытку опровержения.

Таким образом, вся логика Кейса А — это последовательное применение принципа фальсификации: не искать доказательств правоты, а пытаться разрушить каждую версию, оставляя лишь ту, которую разрушить не удалось.

4. Реализация в Кейсе Б («Аномалия утилизации диска»)

Второй отчёт демонстрирует фальсифицируемость в формате многослойной итеративной проверки. На каждом этапе автор формулирует гипотезу, определяет, какие данные могли бы её опровергнуть, и только после исключения альтернатив повышает статус уверенности.

Этап 1 (Конфигурация и нагрузка). Гипотеза: «Деградация вызвана изменением конфигурации». Опровергается прямым сравнением параметров — конфигурация идентична. Гипотеза фальсифицирована и исключена.
Этап 2 (Эффективность кеша). Гипотеза: «Неизменная конфигурация стала недостаточной для возросшей нагрузки». Фальсифицирующий критерий: если это не так, Hit Ratio не должен показывать значимого падения. Полученные данные (Hit Ratio обрушился с 95.16% до 86.31%) не опровергают гипотезу, а согласуются с ней, поэтому она переходит в статус «Подтверждено».
Этап 3 (События ожидания). Гипотеза: «Рост I/O вызван именно физическим чтением с диска, а не блокировками или сетью». Фальсифицирующий критерий: если бы доминировали другие события ожидания (например, LWLock или ClientRead), гипотеза была бы опровергнута. Данные показывают доминирование DataFileRead и взрывной рост BufferIo — гипотеза выдерживает проверку.
Этап 4 (Планы запросов). Альтернативная гипотеза: «Замедление вызвано деоптимизацией планов». Фальсифицируется сравнением: 12 из 13 планов идентичны — гипотеза о деоптимизации опровергнута. Тем самым расчищается поле для окончательного вывода.

Вся структура Кейса Б — это каскад фальсификаций. Каждый новый слой данных служит не для подтверждения желаемого вывода, а для попытки опровергнуть текущую рабочую гипотезу. Только то, что устояло после всех попыток опровержения, попадает в итоговый отчёт с высоким статусом достоверности.

5. Практические следствия для диагностики

Применение принципа фальсифицируемости в анализе производительности даёт три критически важных эффекта:

Защита от «ловушки подтверждения». Аналитик, который ищет только подтверждения своей первоначальной догадке, неизбежно найдёт их в любой сложной системе. Фальсификационный подход заставляет активно искать противоречия, что радикально снижает риск принять желаемое за действительное.
Эффективное сужение диагностического пространства. Каждая успешно опровергнутая гипотеза безвозвратно убирает целый класс причин из рассмотрения, экономя время и ресурсы.
Воспроизводимость и проверяемость выводов. Отчёт, построенный на фальсифицируемых гипотезах, может быть независимо проверен другим специалистом — достаточно повторить указанные проверки. Это превращает диагностику из искусства избранных в инженерную дисциплину.

Таким образом, фальсифицируемость в представленных работах — это не теоретическое украшение, а работающий механизм, который превращает расследование инцидента из гадания на метриках в строгую, воспроизводимую и доказательную процедуру.