Аннотация:
В работе описывается мультиагентная система для управления микроклиматом и энергопотреблением здания в которой агенты действуют на основе мультиагентного обучения с подкреплением. Из различных вариантов мультиагентного обучения с подкреплением в работе рассмотрен вариант марковской игры с общим множеством состояний для всех агентов и вариант с раздельным множеством состояний. В работе приводится сравнение результатов, полученных с помощью различных алгоритмов обучения с подкреплением и различных вариантов мультиагентного обучения, по значению суммарного энергопотребления для отопления и охлаждения помещений здания в течение суток. Установлено, что вариант марковской игры позволяет получить чуть лучшие результаты по сравнению с одноагентным обучением, а наименее привлекательным с точки зрения энергосбережения оказался вариант с раздельным множеством состояний.