Вторые браки, модель без памяти и скрытых параметров (nabbla)
Старый парадокс: есть 2 запечатанных конверта с деньгами. В одном денег вдвое больше, чем в другом. Один из конвертов дают вам и спрашивают: хотите поменяться? Вы размышляете согласно теории вероятности: если у меня было X, то с вероятностью 50% станет 2X, и с вероятностью 50% станет X/2. Математическое ожидание 2X*0,5+X/2*0,5=1,25X, т.е НАДО МЕНЯТЬСЯ! Но это ж бред, обмен шила на мыло.
Вот что бывает, когда не строишь модель происходящего...
Приведём простейший контрпример на вот это, покажем "мир из одинаковых мужчин и женщин" (никто не является изначально "дефектным", неспособным на крепкие отношения, что "выявляется" первым разводом), которые к тому же не "портятся" от разводов (из-за чего последующие браки оказываются сразу же обречены), но тем не менее, обозначенные там величины, 45% вероятность развода в первом браке и 75% вероятность развода вообще (без учёта, какой это брак по счёту) достигаются.
Сначала объясним парадокс. Он появляется только когда мы считаем сумму в конверте НЕОГРАНИЧЕННОЙ. Если мы сразу же предположим: там может быть от 10 до 100 000 рублей (больше туда просто не влезет, а вот набить бумаги для солидности могли), парадокс "испаряется". Предельно упростим задачу: там всего 1 бумажка лежит в каждом конверте. То ли 100 рублей в одном и 200 в другом, то ли 1000 в одном и 2000 в другом. И теперь, взяв первый конверт, мы будем понимать, что случилось одно из 4 событий:
- у нас 100 рублей, а во втором конверте 200 рублей, p=25%,
- у нас 200 рублей, а во втором конверте 100 рублей, p=25%,
- у нас 1000 рублей, во втором конверте 2000 рублей, p=25%,
- у нас 2000 рублей, во втором конверте 1000 рублей, p=25%.
можем получить математическое ожидание доставшихся нам денег: 100*0,25+200*0,25+1000*0,25+2000*0,25 = 825 рублей.
А теперь думаем, что произойдёт, если мы решим поменять конверт:
- поменяли 100 на 200, p=25%,
- поменяли 200 на 100, p=25%,
- поменяли 1000 на 2000, p=25%,
- поменяли 2000 на 1000, p=25%.
Математическое ожидание доставшихся нам денег после обмена - кто бы мог подумать - НЕ ИЗМЕНИЛОСЬ.
И так будет происходить при любом КОНЕЧНОМ предположении насчёт того, какие суммы нас ждут в конвертах. Пусть там будет любая сумма от 1 до ТРИЛЛИОНА рублей - парадокс исчерпан. Та же история с методом Мартингейла (повышать ставку в казино вдвое и уходить как только твоя ставка сыграла, что окупит все предыдущие проигрыши - так всегда будешь оставаться в плюсе. В предположении своей изначально бесконечной платёжеспособности... Как только ставишь себе "потолок" - выигрыш внезапно уходит в казино...)
Всё это было сказано для того, чтобы показать наиболее надёжный способ обращения с теорией вероятности - построить модель происходящего и уже по ней НАПРЯМУЮ всё посчитать. Я не утверждаю, что Байесовские формулы неверны, лишь то, как легко, применяя их, заплутать в трёх соснах. А с подобными моделями всё делается абсолютно в лоб. Начинаем с исходной позиции и делаем ветвление, что вообще у нас может происходить. Затем вводим "наблюдателя" (измерителя), который из этого получит какие-то статистические данные и посмотрим, как они соотносятся с параметрами модели.
А теперь обсудим браки и разводы.
Максимально упростим ситуацию, просто для того, чтобы вычисления были обозримыми. Возьмём просто ЧЕЛОВЕКА, который вступает в брак и разводится. Смотрим только, в какой по счёту брак он вступает, т.е оставим в стороне особенности подсчёта статистики, "первый брак - если и у жениха, и у невесты это первый брак?".
Скажем, в первый брак человек вступает в 20 лет. Не будем смотреть по годам, а то и по месяцам, всё разобьём на отрезки по 10 лет. Смотрим, что с человеком произошло к 30 лет. Пусть с вероятностью p человек разводится. И на следующем промежутке, от 30 до 40 лет - снова вступает в брак. И к 40 лет снова, с той же вероятностью p разводится. Даже если первый раз (с 20 до 30 лет) он не развёлся, то теперь, в промежутке от 30 до 40 лет, он с вероятностью p разведётся.
И затем тот же кульбит производим на промежутке 40..50 лет: человек опять вступает в брак (если был в разводе) и с вероятностью p к 50 годам разводится, независимо от того, какой это брак по счёту. И наконец, после 50 лет игру считаем "завершённой" - кто был в браке, остаётся в браке, кто был разведён - остаётся разведён.
Посчитаем, к чему приходит человек согласно этой модели.
К 30 годам:
- с вероятностью p разведён после 1го брака,
- с вероятностью (1-p) состоит первом браке.
К 40 годам:
- с вероятностью p2 разведён после 2го брака,
- с вероятностью p(1-p) состоит во втором браке,
- с вероятностью (1-p)p разведён после 1го брака,
- с вероятностью (1-p)2 состоит в первом браке.
Наконец, к 50 годам:
- с вероятностью p3 разведён после 3го брака,
- с вероятностью p2(1-p) состоит в третьем браке,
- с вероятностью 2p2(1-p) разведён после 2го брака,
- с вероятностью 2p(1-p)2 состоит во 2м браке,
- с вероятностью (1-p)2p разведён после 1го брака,
- с вероятностью (1-p)3 состоит в 1м браке.
Попытаемся понять, а что нам измерят ЗАГСы?
Через них проходят люди разных возрастов, и при каждом разводе указывается, какой это брак по счёту. Сделаем очередное приближение, что у нас нет особых ям в демографии (то есть, 30-летних, 40-летних и 50-летних у нас примерно одинаковое количество), и, наконец, сможем выразить данные ЗАГСа через параметр p нашей модели.
1/3 людей посчитаем "от 20 до 30 лет", ОНИ ВСЕ (согласно нашей модели) будут вступать в брак, но лишь доля p из них обратится в ЗАГС с заявлением о разводе, их ЗАГС запишет в разводящихся первый раз.
Ещё 1/3 людей считаем "от 30 до 40 лет". Лишь те, кто развелись "на прошлом этапе", будут здесь вступать в брак, доля таковых: p. И также лишь доля p из всех "от 30 до 40 лет" обратится в ЗАГС с заявлением о разводе. Долю p из обратившихся запишут как разводящихся второй раз, и (1-p) - как разводящиеся первый раз.
Наконец, оставшиеся 1/3 людей - "от 40 до 50 лет". Лишь доля p из них обратится в ЗАГС, как для вступления в брак, так и для развода. Долю p2 запишут как разводящиеся третий раз, 2p(1-p) как разводящиеся второй раз и (1-p)2 как разводящиеся первый раз.
Всего ЗАГС насчитает 1/3+(1/3)p+(1/3)p вступающих в брак = (1+2p)/3 в определённый временнОй промежуток. Забавный результат: чем выше вероятность развода - тем больше В ЦЕЛОМ происходит свадеб.
Далее, ЗАГС насчитает (1/3)p+(1/3)p(1-p)+(1/3)p(1-p)2 = p(3-3p+p2)/3 разводящихся после первого брака за то же самое время.
И наконец, он насчитает (1/3)p+(1/3)p+(1/3)p = p разводящихся вообще за это время.
Доля всех разводов по отношению к свадьбам: 3p/(1+2p).
Доля первых разводов по отношению к свадьбам: p(3-3p+p2)/(1+2p).
Изобразим это на графике:
Небольшая проверка "на вшивость":
- при вероятности развода 0 очевидно получаем нули.
- вблизи нуля оба графика практически сливаются (касательная совпадает), поскольку количество вторых-третьих браков становится очень малО. Наклон равен 3, поскольку мы рассматриваем отрезок в 30 лет жизни каждого человека.
- при вероятности развода 100% за 10 лет, отношение всех разводов ко всем свадьбам становится равным 1, а отношение ПЕРВЫХ разводов ко всем свадьбам: 1/3.
Смотрим p=0,5. Получаем 75% для ВСЕХ браков и 43,75% для ПЕРВЫХ.
Величины ОЧЕНЬ ПОХОЖИ на то, что приведено в том посте!
Но, как ни странно, какой-то ужасающей, бомбической ситуации мы не видим. Это вообще модель без памяти, т.е поведение людей не зависит от их предыстории. Не важно, какой брак по счёту, а вероятность развестись за 10 лет - одна и та же! И это модель без скрытых параметров, когда каждому человеку приписывалась бы какая-то характеристика, условно, насколько они уживаются в браке, и которая "не написана на лице". И то, и другое в реальной жизни, безусловно присутствует. Но вывести это из тех двух величин, которые были взяты за исходные данные (45% и 75%) - НЕВОЗМОЖНО. Предыдущий оратор умудрился вывести вероятность развода 99.55% для второго и последующего брака. В моей же модели ничего и близко похожего не наблюдается. По 50% вероятность прожить без развода каждые следующие 10 лет. Если принять такую модель за рабочую гипотезу, то и пожелание получается диаметрально противоположным - "когда женитесь, не смотрите, какой это по счёту брак, в данной модели это ни на что не влияет!"