Замечательный класс игр, в которых нужно уметь вовремя остановиться.
Простейший пример: кидаем кубик. Максимум N=6 раз. В любой момент можно остановиться — последнее выпавшее число будет нашим результатом. Возвращаться к когда-то выпавшим числам нельзя. Вопрос: когда выгодно останавливаться, а когда — продолжать кидать кубик? В этом случае ответ простой — просчитывается по индукции с конца:
1. N=1. Очевидно, от нас вообще ничего не зависит. Ожидание результата = 3,5.
2. N=2. Если выпадет меньше 3,5 — выгодно кинуть ещё раз (см. результат п.1), иначе (выпало 4, 5 или 6) выгодно оставить (среднее значение 5). Ожидание результата = 1/2 * 5 + 1/2 * 3,5 = 4,25.
И так далее.
Задача чуть посложнее — колода из N=100 карточек, на каждой написано какое-то число. Перед вами открывают карточки одна за одной. В любой момент можно остановиться, задача — остановиться в тот момент, когда вам показывают самое большое в колоде число.
Впервые эту задачку решил некто John Elton (с таким именем нагуглить человека невозможно). Служа в армии во время войны во Вьетнаме, он спорил с товарищами, что угадает самое большое из сотни чисел. Найденный им алгоритм позволялобирать боевых товарищей указывать максимальное число примерно в трети случаев.
Сначала простой вариант, дающий правильный ответ в четверти случаев:
— смотрим первую половину колоды, запоминаем самое большое встреченное число;
— смотрим вторую половину колоды, говорим «стоп», как только видим число больше запомненного;
Очевидно, что алгоритм даёт правильный ответ как минимум в четверти случаев — когда самое большое число находится во второй половине колоды (1/2), а следующее за ним — в первой (ещё 1/2).
Оптимальный алгоритм состоит лишь в замене половины колоды на 1/e.
Задача не такая уж и теоретическая — при условии наличия объективного сравнения, её можно увидеть в процессе найма на работу (с обеих сторон), поиске квартиры и т.п.
Частный случай (N=2) — парадокс с двумя конвертами. Авторы повторили понравившееся мне объяснение парадокса (загадываем число, если в конверте больше — оставляем, меньше — меняем), только вместо знаний о бюджете устроителей лотереи они зачем-то приплели распределение Гаусса.
Совсем сложная (нет решения до сих пор) задача — подбрасывание монетки. Точно так же, как и раньше нужно сказать «стоп», задача — оптимизировать процент выпавших орлов.
Простейший пример: кидаем кубик. Максимум N=6 раз. В любой момент можно остановиться — последнее выпавшее число будет нашим результатом. Возвращаться к когда-то выпавшим числам нельзя. Вопрос: когда выгодно останавливаться, а когда — продолжать кидать кубик? В этом случае ответ простой — просчитывается по индукции с конца:
1. N=1. Очевидно, от нас вообще ничего не зависит. Ожидание результата = 3,5.
2. N=2. Если выпадет меньше 3,5 — выгодно кинуть ещё раз (см. результат п.1), иначе (выпало 4, 5 или 6) выгодно оставить (среднее значение 5). Ожидание результата = 1/2 * 5 + 1/2 * 3,5 = 4,25.
И так далее.
Задача чуть посложнее — колода из N=100 карточек, на каждой написано какое-то число. Перед вами открывают карточки одна за одной. В любой момент можно остановиться, задача — остановиться в тот момент, когда вам показывают самое большое в колоде число.
Впервые эту задачку решил некто John Elton (с таким именем нагуглить человека невозможно). Служа в армии во время войны во Вьетнаме, он спорил с товарищами, что угадает самое большое из сотни чисел. Найденный им алгоритм позволял
Сначала простой вариант, дающий правильный ответ в четверти случаев:
— смотрим первую половину колоды, запоминаем самое большое встреченное число;
— смотрим вторую половину колоды, говорим «стоп», как только видим число больше запомненного;
Очевидно, что алгоритм даёт правильный ответ как минимум в четверти случаев — когда самое большое число находится во второй половине колоды (1/2), а следующее за ним — в первой (ещё 1/2).
Оптимальный алгоритм состоит лишь в замене половины колоды на 1/e.
Задача не такая уж и теоретическая — при условии наличия объективного сравнения, её можно увидеть в процессе найма на работу (с обеих сторон), поиске квартиры и т.п.
Частный случай (N=2) — парадокс с двумя конвертами. Авторы повторили понравившееся мне объяснение парадокса (загадываем число, если в конверте больше — оставляем, меньше — меняем), только вместо знаний о бюджете устроителей лотереи они зачем-то приплели распределение Гаусса.
Совсем сложная (нет решения до сих пор) задача — подбрасывание монетки. Точно так же, как и раньше нужно сказать «стоп», задача — оптимизировать процент выпавших орлов.
no subject
no subject
Date: 2009-08-04 01:12 pm (UTC)И вариант для экономии времени, когда нужно выбрать не самого-самого, а хотя бы из первой десятки.
Но в любом случае, первым пришедшим на собеседование везёт как в том анекдоте, когда работодатель берёт половину пучки присланных ему CV и выкидывает в корзину со словами «лузеры нам не нужны».
no subject
Date: 2009-08-04 01:17 pm (UTC)no subject
Date: 2009-08-04 01:22 pm (UTC)no subject
Date: 2009-08-04 01:27 pm (UTC)no subject
Date: 2009-08-04 01:34 pm (UTC)no subject
Date: 2009-08-04 01:28 pm (UTC)no subject
Date: 2009-08-04 01:38 pm (UTC)Последний раз вообще смешно было, когда я из отдела в отдел переходил, все уже давно обо всём договорились, но протокол требует разговора с отделом кадров. И вот мы полтора часа занимались подобными вопросами, было нестерпимо скучно и мне, и интервьюировавшей меня девушке. Смысл процедуры я не понял до сих пор…
no subject
Date: 2009-08-04 01:57 pm (UTC)no subject
Date: 2009-08-04 01:57 pm (UTC)no subject
Date: 2009-08-04 02:35 pm (UTC)Википедия по твоему названию, правда, только Березовского (http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%B5%D0%B7%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9,_%D0%91%D0%BE%D1%80%D0%B8%D1%81_%D0%90%D0%B1%D1%80%D0%B0%D0%BC%D0%BE%D0%B2%D0%B8%D1%87) находит :-Р
no subject
Date: 2009-08-04 02:45 pm (UTC)http://www.hse.ru/data/562/291/1235/gt_pset.pdf
Задача 9.16
no subject
Date: 2009-08-04 02:55 pm (UTC)no subject
Date: 2009-08-04 02:43 pm (UTC)Кстати, с таким названием ее тоже невозможно нагуглить :)
no subject
Date: 2009-08-04 02:58 pm (UTC)no subject
no subject
Date: 2009-08-04 04:10 pm (UTC)Они говорят, что до какого-то момента, очевидно, нужно останавливаться, как только выпало больше орлов, чем решек. но с какого-то момента нужно иметь минимум на два орла больше, потом на три и т.д. Вопрос в нахождении закона этих критических чисел.
no subject
Date: 2009-08-04 04:28 pm (UTC)А можно ссылку? Мне все-таки непонятно, почему 50% через какое-то время перестает быть stopping rule.
no subject
Date: 2009-08-05 07:53 am (UTC)Я предполагаю, что это как-то связано с постепенным снижением стоимости каждого броска. n-й бросок влияет на результат в пределах 1/n.
С другой стороны, учитывая независимость бросков, я вообще не понимаю, откуда может взяться пороговое значение.
Авторы, впрочем, так и говорят, что задача - гроб :-)
no subject
Date: 2009-08-05 07:17 pm (UTC)Понял в чем моя ошибка. Я предполагал, что при достижении 0.5 нужно останавливаться (поскольку 0.5 - мат ожидание бесконечного продолжения игры), а это не так.
no subject
Date: 2009-08-05 10:03 pm (UTC)no subject
Date: 2009-08-05 10:35 pm (UTC)Кажется уже даже доказано, что вероятность окончания игры равна 1 (не уверен). И поэтому, в любой момент математическое ожидание выигрыша строго больше чем 0.5 (разве что в случае глобального невезения оно возможно асимптотически приблизится к 0.5). Например, перед первым ходом мат ожидание выигрыша строго больше 0.75 (если орел, то игра прекращается, если решка, то продолжаем с мат ожиданием выигрыша больше 0.5)
no subject
Date: 2009-08-06 06:52 am (UTC)no subject
Date: 2009-08-04 04:39 pm (UTC)no subject
Date: 2009-08-04 04:36 pm (UTC)Ну как бы не особо выгода по сравнению с "кину ковырнадцать раз, и будь что будет"
no subject
Date: 2009-08-05 07:55 am (UTC)no subject
Date: 2009-08-05 12:46 pm (UTC)Аккуратно считаю, и получаю условие 2к-н<0..
Поскольку коэффициент 2, а не 1/3 и не 3/2...
no subject
Date: 2009-08-04 04:02 pm (UTC)no subject
Date: 2009-08-04 04:22 pm (UTC)no subject
Date: 2009-08-06 06:02 am (UTC)Задачки интересные - ничего не понял.
Спасибо за ссылки :)
no subject
Date: 2009-08-06 06:54 am (UTC)Скажи, где именно ты застрял? С кубиком всё понятно?
no subject
Date: 2009-08-06 07:17 am (UTC)Хороший повод пропылесосить за шкафом :)
На работе условные вероятности - вообще враг.
вызываем API, проверяем возвращаемое значение, ловим эксепшен.
проверяем условия и никаких вероятностей!
все время ДОЛЖНЫ (MUST) знать куда и при каких условиях нам идти и кому об этом сообщить. и так до тех пор пока не откажет железо. что тоже вполне нормальное условие - ни о чем думать больше не надо...
no subject
Date: 2009-08-07 12:35 pm (UTC)А решение на пальцах может выглядить так:
вероятность успеха в первом выборе - 1/3. Соответственно вероятность того что выигрыш оставшихся вариантах("в другой части") - 2/3.
Ведущий своим действием сокращает кол-во варантов "в другой части", но суммарная вероятность найти там приз остается (потому что она определена на шаге 1 - до действий ведущего).
Т.к. теперь "другая часть" это одна штука - следует немедленно выбрать ее :)
no subject
Date: 2009-08-07 12:56 pm (UTC)