А учится ИИ по той же схеме, что и игровые автоматы в покере - есть конечный и сравнительно маленький набор ситуаций в конце игры, от них идет ветвление в обратном ко времени порядке. Каждый ход ИИ просто сравнивает шансы свести текущую ситуацию к одному из вариантов окончания партии.
Ажиотаж вокруг Го связан именно с тем, что в противовес шахматам количество возможных ситуаций в Го возрастает с каждым ходом, число конечных вариантов более гугола, а пытающийся свести всё к узкому числу якобы выигрышных комбинаций игрок заведомо проиграет даже любителю.
Если в покере внезапно добавить еще одну комбинацию или масть (что проще еще одной комбинации) или наделить ладью, скажем, свойством каждые 2 хода ходить как слон, ИИ поломается.
Не более чем профессиональный игрок, у которого правила забиты в подкорку и переориентироваться на другую игру который обычно просто не может(не напомните процент чемпионов более чем в одной игре?). В случае с машиной вопрос сводится опять же к самообучению на протяжении исторически ничтожного количества времени.
Есть второй вариант обучения ИИ - часто применяется в файтингах. ИИ пытается исполнять комбинации и варианты реакций на действие противника, которые раньше увидел у игрока, но в стандартной БД тактик такой нет, и если применение такого приема привело к победе в раунде, то добавляется в БД.
Сказанное мною будет для тебя дикими и непонятным, но у любого профессионального игрока в Шахматы, Го, Сёги и т д на каждую сыгранную в матче игру приходится сотни и тысячи внематчевых "с самим собой". Разница только в том, что там где машина способна играть(в том числе и параллельно) сотни и тысячи полноценных матчей человеческий игрок упирается в диктуемое биохимией время и вынужден обходиться рассмотрением уже сыгранных кем то ситуаций.
Сообщение отредактировал DIMFIRE: 26 May 2017 - 7:06