Поиск стратегии и принцип минимакса
Vložit
- čas přidán 19. 06. 2024
- Решаем задачу из теории игр на поиск наилучшей стратегии, убеждаемся в том, что предложенная игра не является безобидной для одного из игроков, поскольку у другого есть заведомо выигрышная стратегия, и подходим к формулировке принципа минимакса.
Благодарим вас за интерес к нашей работе!
Получить доступ к дополненным материалам и поддержать нас можно в нашем телеграм-канале: t.me/getaclass_channel/525
или сервисе Boosty:
boosty.to/getaclass
Новосибирский Государственный Университет
www.nsu.ru/
Вспомнилось: "Играя в покер, Штирлиц всегда был абсолютно спокоен, лицо его ничего не выражало и только пульсирующая жилка на шее показывала всем, что он блефует" :-) СПАСИБО!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 🙂
Спасибо, особенно за рукотворный макет! Никогда не думал, что на кривой поверхности могут лежать прямые линии. Но с натянутыми нитками не поспоришь :)
Башню на Шаболовке видел когда-нибудь? Она имеет форму гиперболоида, а состоит из прямых балок, если ничего не путаю.
@@RomaPervak
Вероятно, да.
Спасибо нашим профессорам за подачу знаний, круче и вкуснее, чем лучшие кулинарные блюда.
минимакс так называется, скорее всего потому, что для первого игрока это точка максимума "выигрыша" (по сути минимума проигрыша, потому что он проиграет палюбасу), а для второго это точка минимума выигрыша. то есть эта точка одновременно минимум для одного и максимум для другого.
Надеюсь, я несложно обьяснил
Спасибо за прекрасную иллюстрацию сложных вещей!
Вообще, в школе учительница математики научила рассматривать любой процесс или функцию между двух пределов.
Получается, следуя таким размышлениям, что «в среднем» в пределе справедливо лишь для бесконечного числа сверки монет. И еще - раз у нас два игрока, две стороны, то для каждого будет своя функция, описывающая стратегию, - вы это наглядно показали, - и, стало быть, получается, что решением задачи поиска оптимальной стратегии будет точка пересечения графиков их функций… вернее, единственным решением будет эта точка - точка минимакса.
КАк книгу прочитал. Большое спасибо.
Лучше один раз увидеть.
Практически любую теорию можно визуализировать. Что характерно, примеров таких визуализаций полно на индийских и пакистанских каналах.
Спасибо!!! 👍👍👍
Огромное спасибо за шикарный ролик!
Это довольно удивительное совпадение что в этой игре даже зная идеальную стратегию другого игрока ты не можешь сделать вообще ничего чтобы хотя бы как-то изменить его средний ожидаемый выигрыш. Обычно игры с неполной информацией работают не так.
А как они обычно работают? В покере можно наблюдать примерно то же самое. Конечно, там всё намного сложнее, но все же элемент случайного выбора играет там большую роль. Там говорят примерно так: "здесь игрок должен иногда блефовать", "в этой ситуации часто надо рейзить". Эти "иногда" и "часто" как раз означают условный бросок кубика при выборе варианта действия. И по сути только от точности этой вероятности зависит результат на длинной дистанции, а от руки соперника почти не зависит
Минимакс, и брат его Максимин, известный до Неймана и Неша как Цугцванг.
Нет бы наукой заниматься, они все в игры играют.
Пссс, парень. Теория игр - раздел математики. А математика наука. Индукцию сам проведёшь?
😂
Очень интересно, спасибо. Но ничего не понял :)
для прошаренных. на что надо изменить +1 и +9 чтобы 0,8 превратилось, скажем, в 0,55? и какой будет % орлов и решек у второго?
А, ну если заранее знать, что при совпадении орлов первый получает завышенное от среднего вознаграждение, то второму логично будет испортить ему игру, не используя орлов в принципе и пользуясь преимуществом усреднения. Это понимает любой ребёнок.
Благодарим вас за интерес к нашей работе!
Получить доступ к дополненным материалам и поддержать нас можно в нашем телеграм-канале: t.me/getaclass_channel/525
или сервисе Boosty:
boosty.to/getaclass
Матпривет из СПб =) посмотрите ролик Савватеева что раньше выпадает ОО или ОР. Играют по следующим правилам: за каждый бросок монеты игрок платит 1р. Если выпадает ОР, игроку выплачивают выигрыш 5р. Новому участнику предлагают, "чтобы было интереснее", выплачивать 5р за ОО, а не за ОР. Нужно ли соглашаться на игру? Оказывается, матожидание ОР = 4 и игрок остаётся в плюсе. А матожидание ОО = 6 и игрок проигрывает.
Неееееет. Только не саватеев 😣
тут как я понял надо "внимательно читать условия договора", а именно - участвует ли каждый бросок в одной паре, или в двух смежных (кроме первого и последнего)? В случае одинаковых граней конечно будет больше совпадений с учётом смежных пар.
@@Mikhail_Zaitsev на сколько я понял, считается не парами, а именно последовательностью выпадения одной монеты, пока не встретится выигрышная комбинация. После этого игра начинается заново.
@@user-ke8yx5he1c Увы, но при всей его неадекватности математик он отличный :)
Звучит как абсурд
Нажал из-за редкого пятака на превьюшке..)
Я это учил в теории принятия решений, и соображений нет. Есть только то, что помню с лекций.
я тоже много чего учил в вузе, но немного помню, а именно - всё то, что не забыл. Но мы всё-таки молодцы, что много чего учили, да?😂
@@Mikhail_Zaitsevдавно смотрел видео про теорию игр. Была такая же задача на примере танка и вертолёта и было три стратегии.
Вроде простая задача, но понять было очень сложно.
Даже не представлю, как теорию игр применять к реальной жизни, особенно если стратегий и игроков десятки.
@@harut8905
это ещё что! А вот я однажды... - Так, нет, это не то... Помнится, значит, было дело: ... - а, нет, об этом в другой раз.
А я, как собака Павлова, нутром понял неравномерность шансов и отдал предпочтение второму. А там, понимашь, цельнай хипербалоит. Срам-то какой.
минимакс -- известная (если не лезть в гуглить в яндексах а порыться в советской ещё памяти) западная научная технологическая концепция стратегии
МАКСИМУМ ЭФФЕКТА ПРИ МИНИМУМЕ ЗАТРАТ
А где точка максимина?
Это и называется равновесием Нэша, или я что-то путаю? 😵💭
Там все много сложнее, конечно, но в примитивном случае это оно.
Игроки 1 и 2 выигрывают деньги у оппонента?
Или у какого-то внешнего источника денег?
Естественно друг у друга, иначе откуда тут вообще могут взяться отрицательные суммы?
@@sergeysharov350 это не было ясно проговорено.
Я сразу подумал что оба игрока могут договориться на "выигрыш +9", и за пределами поля поделить выигрыш
МиниМакс - наверно называется, потому что для одного это минимум, для другого это максимум.
Почему называется ролик поиск стратегии? Стратегия же не меняется - это максимизация выигранных очков. Не правильно ли будет назвать ролик - поиск тактики по увеличению шансов выигрыша? )
Если бы выигрыш первого распределялся не 9 / 1, а как 9.9999 / 0,0001 все равно бы оптимальное распределение для него было бы 70 на 30 ?
Любопытно, интересно, поучительно. Но досмотрела и дослушала до конца с трудом - не могу слушать хриплые голоса.