Найти тему
imaginary

Теорема Байеса "на пальцах"

Допустим у нас есть два признака. Например, форма предмета и его цвет. Пусть форма может быть прямоугольной и квадратной, а цвет чёрным и белым. Далее это нигде не используется, просто для примера, что признаки могут встретиться в любом сочетании, а зависимые они или независимые это изначально непонятно, да и не важно.

Назовём первый признак А, а второй Б.

Выбор одного из вариантов каждого признака будем обозначать единицей и нулём. Будем считать, что для каждого признака есть только два варианта.

Допустим, далее, что у нас есть N предметов, которые обладают этими признаками в разных комбинациях.

а б в г

А | 1 1 0 0

Б | 0 1 0 1

Строчные буквы в этой таблице будут обозначать количество, прописные наличие признака. Например, количество предметов, у которых признак А=1 и одновременно признак Б=0 мы обозначили за "а".

Всего предметов, как договаривались, а+б+в+г=N

Вероятность найти признак А во всей выборке: Р(А)=(а+б)/N. Аналогично вероятность найти признак Б во всей выборке: Р(Б)=(б+г)/N.

Вероятность найти признак А при том условии, что Б=1: Р(А|Б)=б/(б+г). Аналогично, вероятность найти признак Б при том условии, что А=1: Р(Б|А)= б/(а+б)

Отсюда видно, что Р(А|Б)*Р(Б)=Р(Б|А)*Р(А)=P(A,Б)=б/N