Эллипсоидальные аппроксимации трубок достижимости управляемых систем при неопределённости
Ушаков В. Н. Успенский А.А." Токманцев Т. Б. К вопросу стабильности в дифференциальных играх. Труды Института математики и механики УрО РАН, pages 155−177. 2004. Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения. Известия АН СССР. Техническая кибернетика, (4):29−3G, 1980. Ушаков В. Н. Процедуры построения стабильных мостов в дифференциальных играх… Читать ещё >
Содержание
Решение задачи управления по принципу обратной связи является центральной в математической теории управления, особенно для систем, функционирующих в условиях неопределённости, конфликта и недостатка информации [30,31,60,86]. Основным стимулом для возникновения соответствующей математической теории явились прикладные задачи управления движением, автоматики, робототехники и.т.д. В настоящее время подобные задачи возникают в моделях управления транспортными потоками, при изучении квантовых процессов, управления энергосистемами, а также в других моделях высоких технологий. Важную роль в решении подобных задач является сведение их к проблеме достижимости для линейных и нелинейных систем.
Настоящая диссертация посвящена задаче оценивания областей достижимости и попя тных областей разрешимости для линейных систем при неопределённости с управлением II форме обратной связи. Построение трубок решений, описывающих эволюцию областей достижимости управляемых систем в прямом и попятном времени, является одним из основных подходов к решению задач синтеза управления и гарантированного оценивания для таких систем. Использование метода динамического программирования, развитого Р. Беллманом [23| и Р. Айзексом [22], в том числе, для систем с неопределённостью, позволяет находить области достижимости как множества уровня функции цены для соответствующей задачи оптимизации. Такая функция цепы является решением уравнения в частных производных типа Гамильтона-Якоби-Беллмана-Айзекса (ШВ1). Но в общем случае эта функция цены нередко оказываются не всюду гладкой. Понятия обобщённых решений, таких как вязкостные решения П. Л. Лпонса и М. Г. Крендалла [77], а также минимаксные решения А. И. Субботина [65) позволили существенно расширить область применимости данного подхода, однако нахождение таких решений трсбуюч значительно вычислительной нагрузки. В тоже время, для линейных систем с выпуклыми ограничениями, обобщённые решения не обязательны, так как функции цены выпуклы и следовательно всюду дифференцируемы по любому направлению. Их можно точно описать при помощи теории двойственности выпуклого анализа. Использование множеств уровня функций цены, их подробное описание и возможность их вычисления позволили разработать эффективные методы описания их сечений в виде трубок достижимости как многозначных функций. Далее последовала теория аппроксимаций выпуклозначных функций при помощи эллипосидальных трубок (см. А. Б. Куржанский -[4,8−10,12,13,15,41,80]).
В данной диссертации рассматривается теория аппроксимаций для трубок достижимости при неопределённости. Такие точные трубки в прямом времени имеют самостоятельное значение. В обратном же времени они совпадают по своим основным свойствам с понятиями альтернированного интеграла Л. С. Поптрягина и моста Н. Н. Красовского. Упомянутый альтернированный интеграл был введён в работах [3,59] при геометрических ограничениях на управление и неопределённость. Дальнейший вклад в изучение свойств данного интеграла внесли М. С. Никольский, Е. Ф. Мищенко, А. П. Пономарев, Е. С. Половинкин, Н. Х. Розов [53]. (Следует заметить, что предложенные методы вычисления этого интеграла приводят к значительным вычислительным трудностям, связанным с необходимостью искать выпуклые оболочки надграфиков разностей опорных функций в многомерном пространстве. Последнее особенно касается систем высокой размерности.). Описание мостов Н. Н. Красовского дано в работах |30,31,69−72,79].
Аппарат эллипсоидального исчисления, разработанный в работах A.B. Куржанского и его соавторов, позволяет искать трубки достижимости при неопределённости в задаче с непрерывной коррекцией в виде «тугих» внешних и внутренних эллипсоидов («касающихся» изнутри вдоль «хороших» кривых, определяемых фундаментальной. матрицей линейной системы). Подход к вычислениям более трудных внутренних эллипсоидальных оценок трубок с параметрами, являющимися решением обыкновенных дифференциальных уравнений описан в работах [4,8,9,12,13,15,41,80,87]. Этот поход рассматривался при некоторых условиях невырожденности. Заметим, однако, что поскольку в конструкцию таких тугих эллипсоидальных оценок заложено предположение о равенстве разности опорных функции вдоль направлений касания внутренних оценок и альтернированного множества достижимости, они склонны вырождаться в те моменты, когда данное предположение перестаёт выполняться. Последнее особенно актуально для систем большой размерности при малой размерности управления. Метод регуляризации эллипсоидальных аппроксимаций путем перемешивания нескольких эллипсоидальных оценок, предложенный в работе [82], позволяет преодолеть указанные сложности, в частности и для систем высоких размерностей (п ^ 500). Диссертация же посвящена альтернативному метод}' регуляризации, основанному па видоизменении структуры самого альтернированного интеграла, для которого получаются невырождающиеся тугие эллипсоидальные аппроксимации.
Цель работы состоит в поиске способа видоизменения (регуляризации) структуры классического альтернированного множества достижимости таким образом, который бы допускал выбор регуляризирующих параметров в процессе численного построения эллипсоидальных аппроксимаций и обеспечивал их продолжаемость, а также в построении оценок, связывающих видоизменённое множество достижимости с исходным.
Основные результаты работы.
1. Введены операции квадратичного суммирования и вычитания центрально-симметричных компактов. Исследованы свойства этих операции и получены оценки, связывающие операции квадратичного суммирования и вычитания с алгебраической суммой и геометрической разностью. В частности получены асимптотические оценки квадратичной суммы через алгебраическую сумму для центрально-симметричного компакта и эллипсоида.
2. С использованием новых операции введено понятие квадратично-регуляризованного альтернированного множества достижимости, доказана теорема о его существовании и единственности. Построены схемы внутренних и внешних тугих эллипсоидальных оценок с адаптивной регуляризацией для квадратпчно-регуляризированных альтернирован! патрубок достижимости. Построены оценки квадратичного альтернированного множества через «обычные» альтернированные множества. Предложена схема комбинирования оценок для разных направлении.
3. Построены алгоритмы проецирования на статические и динамические (обусловленные фундаментальной матрицей системы) подпространства. Построены эллипсоидальные оценки квадратично-регуляризировапного альтернированного множества достижимости к моменту и его границы.
4. Введены операции-суммирования и р-вычитания центрально-симметричных компактов как обобщённые варианты квадратичной суммы и разности. Исследованы свойства обобщённых операций и получены оценки, связывающенпе результаты применения данных операций для разных значений степени р.
Научная новизна работы. Полученные результаты являются новыми. В работе рассмотрено не изучавшееся ранее квадратичио-регулярпзированное альтернированное множество достижимости, а также операции операции квадратичного суммирования и вычитания множеств и их обобщения на случай произвольного р > 1. Для регуляризироваиного множества достижимости получены оценки, связывающие его с исходным классическим множеством. Эллипсоидальные оценки с адаптивным выбором регуляризирующих параметров решают проблему вырождения оценок, представленных в [9] и являются их обобщением.
Теоретическая и практическая ценность работы. Работа носит в основном теоретический характер. Квадратично-регуляризованпоый интеграл, а также квадратичные операции суммирования и вычитания могут представлять интерес для дальнейших исследований. Полученные во второй главе схемы адаптивной регуляризации позволяют перейти к практически реализуемым численным алгоритмам и таким образом решать задачу до конца.
Методы исследования. Квадратично-регулярпзпрованный интеграл, который возникает при замене алгебраической суммы множеств квадратичной суммой исследовался в работе с точки зрения решения эволюционных уравнений в виде интегральных воронок. При этом, как и при исследовании свойств квадратичной суммы и разности, использовались элементы выпуклого и многозначного анализа. Кроме того, в диссертации использован аппарат эллипсоидального исчисления [10| а также теории обыкновенных дифференциальных уравнении и экстремальных задач.
Апробация работы. Результаты работы были представлены в виде докладов на научно-исследовательских семинарах кафедры системного анализа факультета ВМиК МГУ (рук. Кур-жаиский A.B.), отдела динамических систем ИММ УрО РАН (рук. Ушаков В.Н.), а также на международной конференции студентов и аспирантов по фундаментальным паукам «Ломопосов-2013» (Москва, МГУ, апрель 2013 г.)
Публикации. По теме диссертации опубликовано 2 работы.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и библиографии. Общий объем диссертации 104 страниц. Библиография включает 87 наименований.