Методы аппроксимации в стохастических задачах управления и оценка качества субоптимальных алгоритмов

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Предложенный автором метод аппроксимации задачи управления марковской задачей охватывает обширный класс задач управления и в случае практического использования существенно упрощает задачу построения алгоритма управления. Указана связь между понятием «осторорожности» как свойством оптимальной стохастической системы с понятием робастности в теории управления детерминированными системами. Полученные… Читать ещё >

Содержание

0. 1. Разработка алгоритма управления и классические методы аппроксимации
0. 2. Актуальность тематики, цель и новизна результатов работы
0. 3. Основные виды упрощений задачи стохастического управления

Глава 1. Оптимальное управление стохастическим объектом

1. 1. Детерминированное управление
1. 2. Метод динамического программирования
1. 3. Задача управления марковским объектом
1. 4. Примеры марковских задач управления
1. 5. Задача управления по неполным’данным
1. 6. Общая задача управления по неполным данным

Методы аппроксимации в стохастических задачах управления и оценка качества субоптимальных алгоритмов (реферат, курсовая, диплом, контрольная)

9.1. Постановка задачи аппроксимации.133.

9.2. Оценка потерь от аппроксимации.135.

9.3. Дифференцируемые переходные вероятности.138.

9.4. Пример из практики — случайный процесс с конечным числом состояний.140.

9.5. Пример из практики — процесс, близкий к диффузионному .141.

9.6. Стохастическое уравнение чувствительности для непрерывного времени.143.

9.7.

Заключение

144.

ОСНОВНЫЕ ВЫВОДЫ РАБОТЫ. РЕКОМЕНДАЦИИ ПО ИСПОЛЬЗОВАНИЮ НАУЧНЫХ ВЫВОДОВ.

В диссертации разработаны новые концепции исследования точности и создания субоптимальных алгоритмов управления для стохастического объекта. Совокупность полученных в работе результатов можно считать новым научным направлением в теории управления стохастическими системами.

Подход к построению алгоритмов управления, предложенный автором работы, позволяет более эффективно использовать метод статистических испытаний, а нередко и вовсе отказаться от емких численных методов, что может существенно снизить затраты и сократить как сроки разработки алгоритма так и сроки" всего проекта системы управления.

Разработанная автором диссертации теория чувствительности в задачах стохастического управления позволяет не только проводить анализ влияния стохастических факторов на выходную координату объекта управления, но и содержит математический аппарат для получения критериальных неравенств, оценивающих качество аппроксимации математической модели в задаче стохастического управления.

Автором предложено критериальное неравенство, позволяющее применять детерминированный прогноз в задаче стохастического управления с прогнозатором, что позволяет существенно снизить вычислительные затраты при управлении в темпе с функционированием управляемого объекта.

Установлена связь полученных некоторых критериальных неравенств с ^" —критерием Р. Фишера.

Указана связь между понятием «осторорожности» как свойством оптимальной стохастической системы с понятием робастности в теории управления детерминированными системами.

Полученные в диссертации новые результаты изложены в виде методик, направленных на практическое использование.

Все полученные результаты иллюстрируются практическими примерами.

На примере промышленного алгоритма коррекции кислородно-конверторной выплавки стали показано использование всего арсенала методов, представленных в работе.

Полученные результаты могут эффективно использоваться в разработках алгоритмов управления для объектов, существенно подверженными стохастическими воздействиями.

К таким объектам относятся производства с интенсивным ведением технологического процесса (ряд производств в черной металлургии, процессы легирования при выращивании монокристаллов, процессы в вакуумных дуговых печах при выплавке слитков из титановых сплавов и т. д.), задачи управления движущимися объектами при измерениях из космоса и Т.д.

10.8.

Заключение

Разработан субоптимальный алгоритм коррекции кослородно-конверторной плавки. Для его разработки привлечен весь арсенал методов, предложенных в предыдущих главах данной работы. Алгоритм внедрен на ряде металлургических комбинатов.

Показать весь текст

Список литературы

Андреев Н.И. Метод получения оценок числовых характеристик случайных величин, Автоматика и телемеханика, № 8, 1985, с.47−50.
Аоки М. Оптимизация стохастических систем, «Наука», 1971.
Бар Шалом Я., Ци Э. Концепции и методы стохастического управления, в кн. «Фильтрация и стохастическое управление в динамических системах», под ред. Леонидеса К. Т. Мир", 1980.
Беккенбах Э., Беллман Р. Неравенства, «Мир», 1965.
Беллман Р. Динамическое программирование, ИЛ, 1960.
Беседин A.A., Цыганков В. А. Субоптимальный алгоритм оптимизации статистического объекта в условиях помех, Известия АН СССР, «Техническая кибернетика», № 5, 1975, с.32−37.
Болтянский В.Г. Оптимальное управление дискретными системами, М., «Наука», 1973.
Бокс Дж., Дженкинс Г. Анализ временных рядов, вып. 1,2. М., «Мир», 1974.
Борзенко И.М. Адаптация, прогнозирование и выбор решений в алгоритмах управления технологическими объектами. «Атом Энерго-издат», 1984.
Борзенко И.М., Петров А. Г. Математические методы для решения задач контроля и управления, «Машиностроение», 1973.
Бородюк В.П., Лецкий Э. К. Статистическое описание промышленных объектов, М., «Энергия», 1971.
Бубнов Ю.В., Фетисов В. Н., Шалашова В. П. Оценка величины смещения прогноза выходных координат технологического процесса. Идентификация и управление технологическими процессами. Сб. научных тр. ЦНИИКА, «Энергоиздат», 1982, с.22−24.
Вальд А. (Wald A.) Statistical decision function, J. Wiley, New-York, 1950. (Русский перевод: Статистические решающие функции, в сб. «Позиционные игры», «Наука», 1967, р.300−322.
Вальд А., Волфовиц Дж. (Wald A., Wolfowitz J.) Bayes solutions of sequential decision problems, Ann. Math. Statist. 21, № 1,1950, p.82−99.
Вапник В.H. Восстановление зависимостей по эмпирическим данным, М., «Наука», 1979.
Вапник В.Н., Червоненкис А. Я. Теория распознавания образов, Статистические проблемыобучения, М., «Наука», 1974.
Витушкин А.Г. Оценка сложности задачи табулирования, М., Физматгиз, 1959.
Вонхем В.М.(Wonham W.M.) On the separation theorem of stochastic control, SIAM J. Control, 1968, v.6, № 2, p. 312−326.
Ворчик В.Г., Фетисов В.H., Штейнберг Ш.Е Идентификация стохастической замкнутой системы, Автоматика и телемеханика, № 7, 1973, с.41−45.
Гихман И.И., Скороход A.B. Теория случайных процессов, Том 1, «Наука», М, 1971.
Глушков В.М. Введение в АСУ, Киев, «Техника», 1974.
Гусак П.П. Верхняя оценка среднеквадратического критерия качества фильтрации в квазилинейных моделях с неполной информацией, Автоматика и Телемеханика, № 4, 1981, с.70−76.
Городецкий В.И., Захарин Ф. М., Розенвассер E.H., Юсупов P.M. Методы теории чувствительности в автоматическом управлении, «Энергия», 1971.
Гутер П.С., Кудрявцев Л. Д., Левитан Б. М. Элементы теории функций (под ред. Ульянова П.Л.), «Физмат», 1963.
Дарховский B.C. Локально-оптимальная стабилизация при неполной информации, Автоматика и телемеханика, 1997, № 4, с.144−154.
Дашевский M.Jl. Приближенный анализ точности нестационарных нелинейных систем методом семиинвариантов, Автоматика и телемеханика, № 11, 1967, с.62−78.
Дашевский М.Л. Техническая реализация моментно-семиинвариантного метода анализа случайных процессов, Автоматика и телемеханика, № 10, 1976, с.59−62.
Дашевский М.Л., Липцер Р. Ш. Применение условных семиинвариантов в задачах нелинейной фильтрации марковских процессов, Автоматика и телемеханика, № 6, 1967.
Джакобс О., Патчелл И.(Jacobs O.L.R., Patcheil I.W.) Caution and probing in Stochastic Control1.t.J.Control, 1972, vol.16, № 1, p.189−199.
Дынкин Е.Б., Юшкевич A.A. Управляемые марковские процессы и их приложения, М., «Наука», 1975.
Ермольев Ю.М. Методы стохастического программирования, М., «Наука», 1976.
Живоглядов В.П. Автоматические системы с накоплением информации, Фрунзе, «Илим», 1966.
Ивахтенко А.Г., Лапа В. Г. Предсказания случайных процессов, «Наукова Думка», Киев, 1971.
Казаков И.Е. Статистическая теория систем управления в пространстве состояний, «Наука», 1975.
Казаков И.Е., Мальчиков C.B. Анализ стохастических систем в пространстве состояний, «Наука», 1983.37. Калман P.E. (Kaiman R.E.)
A new approach to linear filtering and prediction problems, J. Basic Engeneer., 82D, № 1, 1960, p.35−44.
Кашьяп P.Л., Pao А. Построение динамических стохастических моделей по экспериментальным данным, М., «Наука», 1983.
Коган М.М., Неймарк Ю. И. Адаптивное локально-оптимальное управление, Автоматика и телемеханика, 1987, № 8, 126−136.
Корнблюм Р.Дж., Трайбус М. (Kornblum R.J., Tribus M.) 1. The use of Bayesian inference in the Design of an
Endpoint control system for the Basic Oxygen Steel Furnace, IEEE transactions on system science and cybernetics, 1970, vol. 6, N.Y., p.339−347.
Колмогоров A.H. О некоторых ассимптотических характеристиках вполне ограниченных метрических пространств, ДАН 108, 2, 1956.
Красовский А.А. Некоторые актуальные проблемы науки управления, Известия РАН, Теория и системы управления, 1996, № 6.
Красовский А.А., Бурков В. Н., Шендрик B.C. Универсальные алгоритмы оптимального управления непрерывными процессами, М., «Наука», 1977.
Ли Р. Оптимальные оценки, определение характеристик и управление, «Наука», М., 1966.
Липцер Р.Ш., Ширяев А. Н. Статистика случайных процессов, «Наука», 1974.
Люстерник Л.А., Соболев В. И. Элементы функционального анализа, «Наука», 1965.
Мансур Э. (Mansour Eslami) Theory of sensitivity in dynamic systems. An introduction. Berlin, Springer Verlag, 1995.
Мера P.К., Уэллс K.X. (Mehra R.К., Wells C.H.) Dynamic modeling and estimation of carbon in a basicoxygen furnace «11-ht joint Automat. Control Conf.», Atlanta, Cal., 1970, N.Y., p.7−18.
Немировский А.С., Юдин Д. Б. Сложность задач и эффективность методов оптимизации, М, «Наука», 197 9.
Норкин К.Б. Приложение теории среднеквадратических приближений к линейным самонастраивающимся моделям, Автоматика и телемеханика, т.26, № 7, 1965, с.23−28.
Острем К., Виттенмарк Б. Системы управления с ЭВМ, М., «Мир», 1987.
Первозванский А.А., Гайцгори В. Г. Декомпозиция, агрегирование и приближенная оптимизация, М., «Наука», 1979.
Перельман И. И. Оперативная идентификация объектов управления, «Энергоиздат», 1982.
Петров А.Г., Стукова JI.C., Фетисов В. Н., Хасин A.B. Простой алгоритм коррекции кислородно-конвертерной плавки, Проектирование математического и программного обеспечения АСУ ТП, Сб. научн. тр. ЦНИИКА, «Энергоиздат», 1981.
Поляк Б.Т. Введение в оптимизацию, «Наука», 1983.
Поляк Б.Т., Щербаков П. С. Вероятностный подход к робастной устойчивости систем с запаздыванием, Автоматика и Телемеханика, № 12, 1996.
Пропой А.И. О принципе максимума для дискретных систем управления, Автоматика и телемеханика, т.26, № 7, 1965.
Прохоров Ю.В. Одна экстремальная задача теории вероятностей, Теория вероятностей и ее применения, 1959, 4, № 2, 211−214.
Пугачев B.C. Теория случайных функций, Физматгиз, 1960.
Пугачев B.C. Приближенное исследование стохастических систем методом нормализации, Автоматика и телемеханика, № 5, 1974.
Пугачев B.C. Условно оптимальная фильтрация и экстраполяция непрерывных процессов, Автоматика и телемеханика, № 2, 1984 .
Райбман Н.С. Идентификация объектов управления (обзор), Автоматика и телемеханика, № 6, 1979.
Райбман Н.С., Чадеев В. М. Построение моделей процессов производства, М, «Энергия», 1975.
Распопов Б.М. Влияние отклонения начального состояния управляемой системы от расчетного на эффективность оптимизации, Автоматика и телемеханика, № 3, 1972.
Распопов Б.М. Оценка эффективности управления по упрощенной модели объекта, Фрунзе, «Илим», 1976.
Рубинович Е. Я. Обобщенная линейно-квадратичная стохастическая задача управления по неполным данным,
Автоматика и телемеханика, 1997, № 7.
Сарагович В.Г. Теория адаптивных систем, М., «Наука», 1976.
Саридис Дж. Самоорганизующиеся стохастические системы управления, «Наука», 1980.
Симарзин В.В., Борзенко И. М., Рабинович Е. А., Серебрянский А. Я. Субоптимальные алгоритмы управления процессом каталитического крекинга, «Вопросы промышленной кибернетики».(Труды ЦНИИКА), № 5, 1978.
Соболь И.М. Численные методы Монте-Карло, «Наука», 1973.
Соляник А.И., Черноусько Ф. Л. Приближенный метод синтеза оптимального управления системой, подверженной случайным возмущениям, ПММ, т.36, вып.5, 1972.
Соренсон Г. Обзор методов фильтрации и стохастического управления в динамических системах, в кн. «Фильтрация и стохастическое управление в динамических системах», под ред. Леонидеса К. Т., «Мир», 1980.
Стратонович Р.Л. Условные марковские процессы иих применение к теории оптимального управления, Изд-во МГУ, 1966.
Тихомиров В.М. Некоторые вопросы теории приближений, Изд-во МГУ, 1976.
Тихонов А.Н., Арсенин В. Я. Методы решения некорректных задач, М., «Наука», 1974.
Фельдбаум A.A. Основы теории оптимальных автоматических систем, «Наука», 1966.
Фетисов В.Н. К задаче управления объектом с неизвестнымпараметром, Автоматика и телемеханика, № 8, 1973, с.64−67.
Фетисов В.Н. Неравенство к методу Монте-Карло, Теория вероятностей и ее прим., т.19, № 1, 1974, с.224−226.
Фетисов В.Н. Оценка длины выборки при решении экстремальных задач методом Монте-Карло. Журн. Вычисл. матем. и матем. физики, т.16, № 1, 1976, 256−262.
Фетисов В.Н. Вопросы управления промышленными объектами при наличии ошибок идентификации, Автореферат диссертации насоискание ученой степени кандидата технических наук, АН СССР, Институт Проблем Управления, 1979.
Фетисов В.Н. Марковская аппроксимация случайной последовательности в задачах оптимального управления, Известия АН СССР, Техническая кибернетика, № 1, 1979, с.37−43.
Фетисов В.Н. Теория чувствительности в задачах стохастического управления, тезисы докл., 6-е Всесоюзное Совещание по теории инвариантности, теории чувствительности и их применениям, Москва, 1982, с.114−115.
Фетисов В.Н. Аппроксимация распределения вероятностей ошибки идентификации в задаче управления объектом с неизвестным параметром. Идентификация и управление технологическими процессами. Сб. научных тр. ЦНИИКА, «Энергоиздат», 1982, с.8−10.
Фетисов В.Н. Аппроксимация случайного процесса процессом авторегрессии в задачах стохастического управления, Автоматика и телемеханика, № 4, 1983, с.94−98.
Фетисов В.Н. Проблема аппроксимации случайных процессов марковским в задаче оптимального управления. В кн. Тезисы докл. 9-го Всесоюзного Совещания по проблемам управления. Ереван, М., 1983, 103−104.
Фетисов В.Н. Сравнительная оценка качества управления с адаптацией и без адаптации, в кн. Тезисы докл. Всесоюзной конф. «Теория адаптивных систем и ее применения». М.-Л., 1984, с. 280.
Фетисов В.Н. К задаче аппроксимации управляемого процесса марковским, Известия АН СССР, Техническая кибернетика,№ 6, 1984, с.184−188.
Фетисов В.Н. О двух подходах к задаче выбора математической модели стохастического объекта, в сб. «Математическое моделирование в АСУ ТП», Тр. ЦНИИКА, М. 1991, с.31−40.
Фетисов В. Н. Применение метода скользящего среднего для одного класса задач прогноза и управления, «Интегрированные
АСУ», Тр ЦНИИКА, М. 1992, с.55−58.
Фетисов В.Н. Методы аппроксимации стохастических моделей в задачах управления технологическими процессами, Приборыи системы управления, 1994, № 6, 15−17.
Фетисов В.Н., Щегляева Т. А., Штейнберг Ш. Е. Влияние ошибок идентификации на алгоритм оптимального управления процессом легирования полупроводниковых материалов, Приборы и системы управления, № 2, 1975, с. 1112.
Фетисов В.Н., Штейнберг Ш. Е. Построение алгоритмов управления технологическими процессами при неточных результатах идентификации, Вопросы промышленной кибернетики (Тр. ЦНИИКА), «Энергия», вып. 36, 1973, 64−67.
Фетисов В.Н., Штейнберг Ш. Е. Управление одним классом технологических процессов при неточных результатах идентификации, Вопросы промышленной кибернетики (тр. ЦНИИКА), вып. 37, 1973, с.35−37.
См. также: Бубнов Ю. В., Фетисов В. Н., Шалашова В. П.-
Бузник И.П., Ермаков В. А., Ицкович В. П., Фетисов В. Н. Чернова Т.Н./
Ворчик В.Г., Фетисов В. Н., Штейнберг Ш.Е-
Петров А. Г., Стукова J1.C., Фетисов В. Н., Хасин A.B.)
Фишер P.A. Статистические методы для исследователей, М., «Госстатиздат», 1958.95. Флеминг У. (Fleming W.H.)
Stochastic control for small noise intensitiers, SIAM J. Control, vol.9, № 3,1971.96. Хазен Э.М.
Методы оптимальных статистических решений и задачи оптимального управления, Сов. радио, 1968.97. Хальд А.
Математическая статистика с техническими приложениями, М, 1956.
Хасин A.B. Вероятностная оценка погрешности метода Монте-Карло, применяемого для решения экстремальных задач, Вопросы промышленной кибернетики (Тр. ЦНИИКА), вып. 59, 1979.
Хасьминский Р.З. Устойчивость систем дифференциальных уравнений при случайных возмущениях их параметров, М. «Физматгиз», 1969.
Ховард P.A. Динамическое программирование и марковские процессы, «Сов. радио», 1964.
Худсон Д. Статистика для физиков, «Мир», 1967.
Цыбаков А.Б. Оценки точности метода минимизации эмпирического риска, Проблемы передачи информации, т. 17, № 1, 1981, с.50−61.
Цыпкин Я.3. Адаптация и обучение в автоматических системах, М., «Наука», 1968.
Цыпкин Я.З. Адаптивные алгоритмы оптимизации при априорной неопределенности, Автоматика и телемеханика, 1979,№ 6,с.94−108.
Цыпкин Я.З. Синтез робастно оптимальных систем управления объектами в условиях ограниченной неопределенности, Автоматика и телемеханика, 1992, № 9, 139−159.
Цыпкин Я.З. Новые подходы к теории управления, Вестник РАН, 1992, № 3, с.112−114.
Цыпкин Я.З. Информационная теория идентификации, М., «Наука», 1995.
Черноусько Ф.Л. Некоторые задачи оптимального управления с мальм параметром, ПММ, 1968, т.32, № 1.
Черноусько Ф. Л. Колмановский В.Б. Оптимальное управление при случайных возмушениях, М., «Наука», 1978.
Шеннон К.Э. Работы по теории информации и кибернетики (сб. статей), М., Изд. иностр. лит., 1963.
Шибата P. (Shibata R.) Asymptotically efficient selection of the order of the model for estimating parameters of the linead process.- Ann. Statistics, vol. 8, № 1, 1980, p. 147
Ширяев А.Н. Некоторые новые результаты в теории управляемых случайных процессов, Trans. Fourth Prague Confer. on Inform. Theory etc., Prague, 1967.
Штейнберг Ш. Е. Идентификация в системах управления, «Энергоатомиздат», 1987.
Юдин Д.Б. Задачи и методы стохастического программирования, Сов. радио, 1979.
Ядыкин И.Б. Адаптируемость регулятора и двухуровневые алгоритмы настройки параметров адаптивных систем управления, Автоматика и телемеханика, № 5,1983.
Yaz Е., Yildizbayrak N. Robustness of feedback-stabilized systems in the presence of non-linear and random perturbations, Int. J. Contr., vol. 41, 1985, p.345−353.
Yaz E. Deterministic and stochastic robustness measures for discrete systems, IEEE Trans. Automat. Contr., vol. 33, № 10, 1988, p. 952−955.

Заполнить форму текущей работой