Сначала трениновался на суперкомпе, но по мере приближения к цели мощность уменьшали.
В случае старсектора превозмогать лучшего в мире игрока, который с детства задрачивался на одну-единственную настолочку и вряд ли умеет и имеет ещё хоть что то не требуется, необходимо просто подбирать фит не глупее среднестатистического задрота. Т е ботнета на основе компов самих игроков в принципе должно хватить.
Мощность уменьшали во время игры, а не во время обучения. В итоге АлексГо сумел играть на четырех TPU - тензорные компьютеры такие приблуды, типа видеокарт, но только для расчета всяких матриц. Последняя версия АлексГо играла на компе с 4-мя такими гугловскими картами, которые гугл не продает, а только сдает мощности в аренду, через google cloud platform. Нвидия тоже начала пилить подобные карты с тензорными ядрами, самая их мощная такая карта V100 вроде как слабее гугловской многопроцессорной TPU, но при этом стоит одна 8 килобаксов. И их надо 4 штуки, чтоб просто поиграть, а не обучить сеть. В пошаговые шахматы, или го. При этом на расчет хода уходит до минуты. Но самая главная проблема в том, что на то, чтоб нейросеть что-то посчитала, ей надо на несколько порядков меньше времени, чем на обучение. Обучаешь сеть, обучаешь час, а на том-же самом железе она валидирует то, чему обучилась на тестовой выборке за доли секунды.
Так что АлексГо всегда тренировали на суперкопьютерах, иначеб мы результатов просто не дождались.
Хотя прогресс в нейросетях идет оргомными шагами, не за горами времена когда боты в игрушках будут сильно умнее из-за нейросеток.
Сообщение отредактировал Pointer: 31 May 2021 - 22:14