green_fr: (Default)
green_fr ([personal profile] green_fr) wrote2007-08-18 11:38 am
Entry tags:

Занимательная математика

Купили очередную игрушку с кубиками, начал считать вероятности, просто как-то не получается.
Кидаем один кубик - всё просто, вероятность у каждой грани 1/6.
Кидаем два кубика - тоже просто, вероятность выкинуть в сумме число n равна (n-1)/36 для n<=7 и (13-n)/36 для n>=7. Т.е. такая крышка треугольная.
А в этой игрушке нужно кидать пару кубиков до тех пор, пока не выпадет 4 разные значения. Т.е. если выпадает уже выпавшая в этом туре сумма, мы перебрасываем кубики.
Задача: пересчитать вероятности всех возможных сумм от 2 до 12.
Провёл час с ручкой и бумажкой - быстро и красиво не получается. Сел написал на VBA метод Monte-Carlo - цифры вылезли, но удовлетворения не принесли. Особенно, если учесть грядущую смену работы именно что с программиста на статистика...

[identity profile] green-fr.livejournal.com 2007-08-18 03:14 pm (UTC)(link)
1. Ты кинул два кубика. Выпало (в сумме) 8.
2. Ты опять кинул два кубика. Если сумма та же, что в первый раз, перекидываешь, пока не выпадет что-то иное, скажем 4.
3. Повторяешь процедуру до тех пор, пока не наберёшь 4 отличных друг от друга числа (8, 4 из моего примера и, скажем, 2 и 7).
4. Полученное в первых трёх пунктах я и называю "четырьмя суммами пар кубиков", это составляет единичный эксперимент. Соответственно, вопрос в вероятности выпадения каждого из чисел от 2 до 12 в таком эксперименте.

[identity profile] mihhon.livejournal.com 2007-08-18 03:54 pm (UTC)(link)
по идее по теореме Бернулли это будет такое же распределение, что и распределение суммы 2-х кубиков :)

[identity profile] mihhon.livejournal.com 2007-08-18 05:17 pm (UTC)(link)
дискретная случайная величина X, принимающая значения х1..хn с вероятностью р1..pn. { 2..12 с вероятностью (n-1)/36 для n<=7 и (13-n)/36 для n>=7 }

пронумеруем неким образом х1..хn, проведём независимые испытания
1) вероятноять выпадения х1 равна р1
2) вероятноять выпадения х2 равна р2 (если выпадает х1 - игнорируем)
3) вероятноять выпадения х3 равна р3 (если выпадает х1 или х2 - игнорируем)
4) вероятноять выпадения х4 равна р4 (если выпадает х1, х2 или х3 - игнорируем)
...
m) ...

так как пронумеровали произвольно, то это справедливо для любых значений случайной величины => итоговая случайная величина (вероятность появления х1..хn до первых m различных) распределена так же , как и X

[identity profile] kalvado.livejournal.com 2007-08-18 05:51 pm (UTC)(link)
2 varianta, a i b, veroyatnosti 1/3 i 2/3
v 2 popytkah:
aa -ignore 1/9
ab - 2/9
ba- 2/9
bb - ignore 4/9
itogo a - polovina, b - polovina

[identity profile] mihhon.livejournal.com 2007-08-18 06:25 pm (UTC)(link)
1) неправильная схема испытаний
аа - на этом испытание не заканчивается, событие ещё не наступило (событие наступает тогда, когда будет получено b )

полная группа событий должна выглядеть так:

аааa...b
aaab
aab
ab
ba
bba
bbba
bbbb...a

2) это вырожденный случай - и a и b появляются с вероятностью 1 :) выбираем 2 числа из 2-х => оба с вероятностью 1 в выборке

[identity profile] mihhon.livejournal.com 2007-08-18 06:30 pm (UTC)(link)
итого: в данном случае может быть только a или b с соответствующими вероятностями 1/3 и 2/3

[identity profile] kalvado.livejournal.com 2007-08-18 09:40 pm (UTC)(link)
1. не в кассу.
по моему достаточно очевидно, что раз оказавшись на ветке дерева и выбросив повтор мы окажемся на идентичной ветке с ровно теми же вероятностями конечных ситуаций; и повторами можно просто пренебречь.
другими словами, для набора а, b, c ситуации один бросок-а и 5 бросков а(аааа) можно рассматривать как идентичные в смысле относительного распределения вероятностей конечного исхода
как написать грамотное док-во я не знаю, но по-моему идея ясна

2. хорошо, рассмотрим а b c , 0.5, 0.25, 0.25
у меня для 2 испытаний получается вероятность 4:3:3; при этом вырождения нет.

[identity profile] kalvado.livejournal.com 2007-08-18 10:20 pm (UTC)(link)
nu nepravda moya... 10:7:7, no vse ravno "a" sil'no zadavleno..

[identity profile] mihhon.livejournal.com 2007-08-18 11:09 pm (UTC)(link)
повторами нельзя пренебречь ...

вот полный перебор, 4:3:3 не получается, моё решение тоже неверное ...

ab 0.125
aab 0.03125
aaab 0.0078125
aaaab 0.001953125
aaaaab 4.8828125E-4
aaaaaab 1.220703125E-4
aaaaaaab 3.0517578125E-5
ac 0.0625
aac 0.015625
aaac 0.00390625
aaaac 9.765625E-4
aaaaac 2.44140625E-4
aaaaaac 6.103515625E-5
aaaaaaac 1.52587890625E-5
ba 0.125
bba 0.0625
bbba 0.03125
bbbba 0.015625
bbbbba 0.0078125
bbbbbba 0.00390625
bbbbbbba 0.001953125
bc 0.125
bbc 0.0625
bbbc 0.03125
bbbbc 0.015625
bbbbbc 0.0078125
bbbbbbc 0.00390625
bbbbbbbc 0.001953125
ca 0.0625
cca 0.015625
ccca 0.00390625
cccca 9.765625E-4
ccccca 2.44140625E-4
cccccca 6.103515625E-5
ccccccca 1.52587890625E-5
cb 0.125
ccb 0.03125
cccb 0.0078125
ccccb 0.001953125
cccccb 4.8828125E-4
ccccccb 1.220703125E-4
cccccccb 3.0517578125E-5
check_sum=0.996063232421875
a:0.25: result=0.58135986328125
b:0.5: result=0.82940673828125
c:0.25: result=0.58135986328125

если увеличить количество повторений, то получится:
check_sum=1.0
a:0.25: result=0.5833333333333334
b:0.5: result=0.8333333333333333
c:0.25: result=0.5833333333333333

кстати, события {будет А, будет Б, будет С} не образуют полную группу, сумма их вероятностей не равна 1.

[identity profile] kalvado.livejournal.com 2007-08-18 11:27 pm (UTC)(link)
ну 10:7:7 как раз получается, я поправился
ето пренебрегая повторами - честным расписыванием вероятностей
надо просто учитывать что эффективные вероятности последуюших событий меняются..
если выпало "б" то во втором а:ц=1:1, а если а - то б:ц=2:1
в брут форсе кстати учесть легко... писал бы на чем нормальном - переделал бы, а так .. спагетти-код получился, не разобраться

[identity profile] mihhon.livejournal.com 2007-08-18 11:41 pm (UTC)(link)
хохо, дошло, я нашёл аналитическое решение - эти хвосты - суммы бесконечных геометрических прогрессий => далее тривиально :)

[identity profile] kalvado.livejournal.com 2007-08-18 11:42 pm (UTC)(link)
осталось код написать!

[identity profile] mihhon.livejournal.com 2007-08-19 12:02 am (UTC)(link)
я проверил для
2 из 3-х: а b c , 0.5, 0.25, 0.25
2 из 4-х: а b c d, 1/6, 2/6, 2/6, 1/6

сходится


только вот для случая, когда выбираешь больше, чем 2, похоже надо ещё учитывать размещения ... +бесконечного+ числа элементов

типа
ababab...c
aaabbb...c
aabbab...c



[identity profile] kalvado.livejournal.com 2007-08-19 12:29 am (UTC)(link)
предложение, которое пока у меня сработало:
во втором круге после выпадения "а" все вероятности остальных результатов домножаются на 1/(1-а); после выпадения "аб" - в третем круге 1/(1-а)(1-б)
никаких прогрессий, тупой перебор.
для случая 0.5, 0.25,0.25:
после выпадения А(0.5), вероятности б и ц будут 0.25/(1-0.5)=0.5
после выпадения Б(0.25) - а'=0.5/(1-0.25)=2/3, ц'=0.25/(1-0.25)=1/3
т.е. вероятность
АБ=АЦ в полном раскладе (включая все повторы) 0.5*0.5=1/4
БА(=ЦА)=0.25*2/3=1/6,
БЦ=ЦБ=0.25*1/3=1/12

вот и фсе, осталось расписать на случай 4 элементов из 11...

[identity profile] mihhon.livejournal.com 2007-08-19 11:05 am (UTC)(link)
вот аналитическое решение:



программа даёт те же результаты для предыдущих примеров:

check_sum=0.9995112419128418
a:0.25: result=0.5830888748168945
b:0.5: result=0.8328447341918945
c:0.25: result=0.5830888748168945

Зелёный, проверь, у тебя то же самое через монтекарло получилось?

4 из 11:

check_sum=0.9999991075274337
2:0.027777777777777776: result=0.13082540553267935
3:0.05555555555555555: result=0.24893756434728012
4:0.08333333333333333: result=0.353921116535629
5:0.1111111111111111: result=0.4456963584380095
6:0.1388888888888889: result=0.5246803714082363
7:0.16666666666666666: result=0.5918747975860624
8:0.1388888888888889: result=0.5246803714082362
9:0.1111111111111111: result=0.4456963584380088
10:0.08333333333333333: result=0.3539211165356294
11:0.05555555555555555: result=0.24893756434727982
12:0.027777777777777776: result=0.13082540553267938

[identity profile] mihhon.livejournal.com 2007-08-19 11:25 am (UTC)(link)
да, там где суммы - суммы по всем подмножествам I :) забыл написать

[identity profile] mihhon.livejournal.com 2007-08-19 04:56 pm (UTC)(link)
Pl - суммировать все такие суммы, куда входит l={l, ik}={l, i, j, z}

[identity profile] green-fr.livejournal.com 2007-08-20 07:42 am (UTC)(link)
Примерно такие числа, да...
Я просто надеялся, что там есть какой-то такой финт ушами, сделав который мы можем сказать "очевидно данная сумма равняется..."

[identity profile] green-fr.livejournal.com 2007-08-20 07:31 am (UTC)(link)
Я на этом же остановился: вероятность корректируется в зависимости от выпавшего, потом сумма по всем вариантам первого элемента. Заткнулся достаточно быстро, ничего там не сворачивается, не сходится. Т.е. можно аккуратно всё выписать и досчитать, но это как-то грустно получается.

[identity profile] green-fr.livejournal.com 2007-08-20 07:21 am (UTC)(link)
Я знаю только теорему Бернулли про скорость истечения жидкости :-) Но на пальцах (да и экспериментально) видно, что вероятность "популярных" сумм (типа 6, 7, 8) должна упасть (они не могут выпадать чаще чем раз в 4 броска), за счёт чего вероятность редких сумм слегка возрастает.

[identity profile] bgmt.livejournal.com 2007-08-18 09:12 pm (UTC)(link)
Последние две фразы так же неясны, как и раньше - потому что один вопрос, это
вероятность выпадения каждого из чисел от 2 до 12 не "в таком эксперименте", а в эксперименте по п.1, а про полный эксперимент 1-3 вопрос не в этой вероятности, а в том, как её использовать, чтобы ЛИБО найти вероятность, что время ожидания (число бросков) до успеха равно t, ЛИБО найти вероятность каждой последовательности четырёх разных чисел, ЛИБО какой-то её функции, и чего ты хочешь, ты так и не сказал.

На второй вопрос мне отвечать прямо сейчас лень, время ожидания всегда несколько муторно, да и не ясно, чего ты хочешь.

Первый вопрос элементарен. Два кубика независимы. Вероятность каждого результата от 1 до 6 для каждого кубика 1/6. Всего комбинаций 36. Из них каждая сумма получается следующим образом:
2=1+1 1 комбинация, вероятность 1/36
3=1+2=2+1 2
4=1+3=2+2=3+1 3
5=1+4=2+3=3+2=4+1 4
6=1+5=2+4=3+3=4+2=5+1 5
7=1+6=2+5=3+4=4+3=5+2=6+1 6
8=2+6=3+5=4+4=5+3=6+2 5
9=3+6=4+5=5+4=6+3 4
10=4+6=5+5=6+4 3
11=5+6=6+5 2
12=6+6 1

На второй вопрос (если он про время ожидания!), кажется мне, проще всего ответить построением дерева решений, и я не думаю, что можно короче.

[identity profile] green-fr.livejournal.com 2007-08-20 07:25 am (UTC)(link)
Я как-то даже не видел всех описанных тобой вероятностей. Меня интересует самый простой (с моей, видимо, точки зрения) вариант: если я поставил на эту клеточку (рулетка), то раз во сколько бросков она в среднем будет выпадать? Учитывая специфику эксперимента, можно переформулировать: с какой вероятностью заданное число будет присутствовать в выпавшей четвёрке сумм?

А дерево решений там получается какое-то монструозное... Т.е. как считать понятно, но хотелось бы чего-нибудь более элегантного.

[identity profile] bgmt.livejournal.com 2007-08-20 10:20 am (UTC)(link)
за 4 броска с неповторяющимися числами 1 выпадает:
с вероятностью 1/36 в первом броске
с вероятностью 5/36 х 1/36 во втором (5/36 это вероятность что в первом не было 1)
с вероятностью (5/36)^2 х 1/36 в третьем
(5/36)^3 х 1/36 в четвертом

вероятность других чисел считай сам.

[identity profile] bgmt.livejournal.com 2007-08-20 10:28 am (UTC)(link)
я тут забыл про сумму, считал один кубик, но это оченрь легко исправить. Сделай сам! (Впрочем, при беглом просмотре комментов у меня впечатление, что тебе уже сделали).

[identity profile] green-fr.livejournal.com 2007-08-20 11:22 am (UTC)(link)
Спасибо за помощь :-) Вопрос был не "как считать", а "как бы это красиво посчитать".
А так - не 5/36*1/36, а 35/36*скорректированную вероятность. Скорректированную, потому что выкинуть во втором круге 1-1 уже не 1/36, потому что кандидатов уже не 36, а 36 - вес того, кто выпал в первом туре. Т.е. если в первом броске выпало 7, то вероятность выпадения 1-1 во втором туре равна 1/30. Таким образом даже проще разбить твои 35/36 на кусочки, соответствующие разным скорректированным вероятностям:
2/36 (в первом туре выпало 3) * 1/34 (коррекция вероятности 1-1) + 3/36 (выпало 4) * 1/33 + ...
Всё понятно, непонятно, как это довести до такого вида, где можно было бы посчитать вероятность в уме. Не уверен, что существует такой вид, но ведь очень хочется верить...