Аннотация:
Рассматривается класс управляемых нелинейных объектов, динамика которых определена системой ОДУ с частично неизвестной правой частью и аддитивным управлением. Ставится задача онлайн оптимизации, заключающаяся в нахождении робастной реализуемой стратегии отслеживания желаемой траектории вектора состояния с известными ограничениями на переменные состояния при условии, что эти переменные и их производные по времени наблюдаются. Для ее решения объединяются две ключевые идеи: (1) применение метода инерционного зеркального спуска (ЗС) как нетривиального обобщения метода проекции градиента, и (2) развитие метода интегрального скользящего режима для систем управления с непрерывным временем. Основные результаты включают доказательство того, что «желаемый режим» — нестационарный аналог поверхности скольжения, обеспечивающий ЗС, — может быть достигнут с самого начала процесса управления, а также получение явной верхней границы дефекта функции стоимости (ошибки слежения).