Суть разработки
Новая система получила название Unsupervised Reinforcement and Auxiliary Learning agent, или Unreal. Она основана на DeepMind, в которую был добавлен алгоритм, имитирующий процесс мечтания.
Системе предложили сыграть в игру Labyrinth, которая часто использовалась в качестве стандартного теста. Unreal прошла игру в десять раз быстрее, чем любые другие системы, созданные ранее. После этого система сыграла в 57 старых игр Atari и также продемонстрировала высокие результаты. В отдельных играх она набрала 3000 очков, тогда как предшественницы новой системы не получали ничего.
В процессе прохождения Unreal «мечтала» — воспроизводила прошлые попытки и уделяла особое внимание моментам, которые принесли очки. Точно так же мечтают люди – они анализируют позитивный и негативный опыт.
Основная цель создания DeepMind – решение фундаментальных задач, к примеру, оптимизация энергопотребления на планете. «Мечтающий» алгоритм позволит серьезно продвинуться в этом плане.
Смотрите также: Google показала, что умеют нейросети