AlphaZero самостоятельно учится играть в игры на высочайшем уровне

В свoeй рaбoтe, oпубликoвaннoй в журнaлe Science, учeныe oписывaют свoю нoвую систeму и oбъясняют, пoчeму считaют, зачем она представляет собой большой шаг в направлении развития будущих систем ИИ. Все прошло более 20 лет с тех пор, как суперЭВМ Deep Blue победил чемпиона мира по шахматам Гари Каспарова и показал миру, точь в точь далеко продвинулись вычисления в сфере ИИ. С тех пор компьютеры становились полно умнее и сегодня побеждают людей в таких играх, на правах шахматы, сёги и го. Однако каждая из подобных программ настраивалась с заранее обдуманным намерением, чтобы стать мастером в отдельной игре. В своей новой работе ученые описали человек искусственного интеллекта, который не только хорош в нескольких играх, да и обучается этому совершенствованию самостоятельно. AlphaZero: новый умелец

Новая система под названием AlphaZero представляет лицом систему обучения с подкреплением, то есть обучается, во много раз играя в игру и учась на своем опыте. Сие, разумеется, очень похоже на процесс обучения людей. Задается коренной набор правил и компьютер играет в игру —   сам с лицом. Ему даже партнеры не нужны. Он играет сам по себе с собой много раз, отмечая хорошие и победные ходы. Со временем некто становится все лучше и лучше, превосходит не как людей, но и другие системы ИИ, разработанные угоду кому) настольных игр. Данная система также использовала технология поиска «древа поиска Монте-Карло». Совмещение двух технологий позволило системе напрактиковаться совершенствованию в игре. Следующим шагом станут популярные видеоигры. Словно касается производительности ИИ, то в го, например, AlphaZero обыграл легендарного AlphaGo ранее через 30 часов. Как думаете, когда достаточно взрыв искусственного интеллекта?

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *