Методы аппроксимации в стохастических задачах управления и оценка качества субоптимальных алгоритмов
Диссертация
Предложенный автором метод аппроксимации задачи управления марковской задачей охватывает обширный класс задач управления и в случае практического использования существенно упрощает задачу построения алгоритма управления. Указана связь между понятием «осторорожности» как свойством оптимальной стохастической системы с понятием робастности в теории управления детерминированными системами. Полученные… Читать ещё >
Содержание
- 0. 1. Разработка алгоритма управления и классические методы аппроксимации
- 0. 2. Актуальность тематики, цель и новизна результатов работы
- 0. 3. Основные виды упрощений задачи стохастического управления
- 1. 1. Детерминированное управление
- 1. 2. Метод динамического программирования
- 1. 3. Задача управления марковским объектом
- 1. 4. Примеры марковских задач управления
- 1. 5. Задача управления по неполным’данным
- 1. 6. Общая задача управления по неполным данным
Список литературы
- Андреев Н.И. Метод получения оценок числовых характеристик случайных величин, Автоматика и телемеханика, № 8, 1985, с.47−50.
- Аоки М. Оптимизация стохастических систем, «Наука», 1971.
- Бар Шалом Я., Ци Э. Концепции и методы стохастического управления, в кн. «Фильтрация и стохастическое управление в динамических системах», под ред. Леонидеса К. Т. Мир", 1980.
- Беккенбах Э., Беллман Р. Неравенства, «Мир», 1965.
- Беллман Р. Динамическое программирование, ИЛ, 1960.
- Беседин A.A., Цыганков В. А. Субоптимальный алгоритм оптимизации статистического объекта в условиях помех, Известия АН СССР, «Техническая кибернетика», № 5, 1975, с.32−37.
- Болтянский В.Г. Оптимальное управление дискретными системами, М., «Наука», 1973.
- Бокс Дж., Дженкинс Г. Анализ временных рядов, вып. 1,2. М., «Мир», 1974.
- Борзенко И.М. Адаптация, прогнозирование и выбор решений в алгоритмах управления технологическими объектами. «Атом Энерго-издат», 1984.
- Борзенко И.М., Петров А. Г. Математические методы для решения задач контроля и управления, «Машиностроение», 1973.
- Бородюк В.П., Лецкий Э. К. Статистическое описание промышленных объектов, М., «Энергия», 1971.
- Бубнов Ю.В., Фетисов В. Н., Шалашова В. П. Оценка величины смещения прогноза выходных координат технологического процесса. Идентификация и управление технологическими процессами. Сб. научных тр. ЦНИИКА, «Энергоиздат», 1982, с.22−24.
- Вальд А. (Wald A.) Statistical decision function, J. Wiley, New-York, 1950. (Русский перевод: Статистические решающие функции, в сб. «Позиционные игры», «Наука», 1967, р.300−322.
- Вальд А., Волфовиц Дж. (Wald A., Wolfowitz J.) Bayes solutions of sequential decision problems, Ann. Math. Statist. 21, № 1,1950, p.82−99.
- Вапник В.H. Восстановление зависимостей по эмпирическим данным, М., «Наука», 1979.
- Вапник В.Н., Червоненкис А. Я. Теория распознавания образов, Статистические проблемыобучения, М., «Наука», 1974.
- Витушкин А.Г. Оценка сложности задачи табулирования, М., Физматгиз, 1959.
- Вонхем В.М.(Wonham W.M.) On the separation theorem of stochastic control, SIAM J. Control, 1968, v.6, № 2, p. 312−326.
- Ворчик В.Г., Фетисов В.H., Штейнберг Ш.Е Идентификация стохастической замкнутой системы, Автоматика и телемеханика, № 7, 1973, с.41−45.
- Гихман И.И., Скороход A.B. Теория случайных процессов, Том 1, «Наука», М, 1971.
- Глушков В.М. Введение в АСУ, Киев, «Техника», 1974.
- Гусак П.П. Верхняя оценка среднеквадратического критерия качества фильтрации в квазилинейных моделях с неполной информацией, Автоматика и Телемеханика, № 4, 1981, с.70−76.
- Городецкий В.И., Захарин Ф. М., Розенвассер E.H., Юсупов P.M. Методы теории чувствительности в автоматическом управлении, «Энергия», 1971.
- Гутер П.С., Кудрявцев Л. Д., Левитан Б. М. Элементы теории функций (под ред. Ульянова П.Л.), «Физмат», 1963.
- Дарховский B.C. Локально-оптимальная стабилизация при неполной информации, Автоматика и телемеханика, 1997, № 4, с.144−154.
- Дашевский M.Jl. Приближенный анализ точности нестационарных нелинейных систем методом семиинвариантов, Автоматика и телемеханика, № 11, 1967, с.62−78.
- Дашевский М.Л. Техническая реализация моментно-семиинвариантного метода анализа случайных процессов, Автоматика и телемеханика, № 10, 1976, с.59−62.
- Дашевский М.Л., Липцер Р. Ш. Применение условных семиинвариантов в задачах нелинейной фильтрации марковских процессов, Автоматика и телемеханика, № 6, 1967.
- Джакобс О., Патчелл И.(Jacobs O.L.R., Patcheil I.W.) Caution and probing in Stochastic Control1.t.J.Control, 1972, vol.16, № 1, p.189−199.
- Дынкин Е.Б., Юшкевич A.A. Управляемые марковские процессы и их приложения, М., «Наука», 1975.
- Ермольев Ю.М. Методы стохастического программирования, М., «Наука», 1976.
- Живоглядов В.П. Автоматические системы с накоплением информации, Фрунзе, «Илим», 1966.
- Ивахтенко А.Г., Лапа В. Г. Предсказания случайных процессов, «Наукова Думка», Киев, 1971.
- Казаков И.Е. Статистическая теория систем управления в пространстве состояний, «Наука», 1975.
- Казаков И.Е., Мальчиков C.B. Анализ стохастических систем в пространстве состояний, «Наука», 1983.37. Калман P.E. (Kaiman R.E.)
- A new approach to linear filtering and prediction problems, J. Basic Engeneer., 82D, № 1, 1960, p.35−44.
- Кашьяп P.Л., Pao А. Построение динамических стохастических моделей по экспериментальным данным, М., «Наука», 1983.
- Коган М.М., Неймарк Ю. И. Адаптивное локально-оптимальное управление, Автоматика и телемеханика, 1987, № 8, 126−136.
- Корнблюм Р.Дж., Трайбус М. (Kornblum R.J., Tribus M.) 1. The use of Bayesian inference in the Design of an
- Endpoint control system for the Basic Oxygen Steel Furnace, IEEE transactions on system science and cybernetics, 1970, vol. 6, N.Y., p.339−347.
- Колмогоров A.H. О некоторых ассимптотических характеристиках вполне ограниченных метрических пространств, ДАН 108, 2, 1956.
- Красовский А.А. Некоторые актуальные проблемы науки управления, Известия РАН, Теория и системы управления, 1996, № 6.
- Красовский А.А., Бурков В. Н., Шендрик B.C. Универсальные алгоритмы оптимального управления непрерывными процессами, М., «Наука», 1977.
- Ли Р. Оптимальные оценки, определение характеристик и управление, «Наука», М., 1966.
- Липцер Р.Ш., Ширяев А. Н. Статистика случайных процессов, «Наука», 1974.
- Люстерник Л.А., Соболев В. И. Элементы функционального анализа, «Наука», 1965.
- Мансур Э. (Mansour Eslami) Theory of sensitivity in dynamic systems. An introduction. Berlin, Springer Verlag, 1995.
- Мера P.К., Уэллс K.X. (Mehra R.К., Wells C.H.) Dynamic modeling and estimation of carbon in a basicoxygen furnace «11-ht joint Automat. Control Conf.», Atlanta, Cal., 1970, N.Y., p.7−18.
- Немировский А.С., Юдин Д. Б. Сложность задач и эффективность методов оптимизации, М, «Наука», 197 9.
- Норкин К.Б. Приложение теории среднеквадратических приближений к линейным самонастраивающимся моделям, Автоматика и телемеханика, т.26, № 7, 1965, с.23−28.
- Острем К., Виттенмарк Б. Системы управления с ЭВМ, М., «Мир», 1987.
- Первозванский А.А., Гайцгори В. Г. Декомпозиция, агрегирование и приближенная оптимизация, М., «Наука», 1979.
- Перельман И. И. Оперативная идентификация объектов управления, «Энергоиздат», 1982.
- Петров А.Г., Стукова JI.C., Фетисов В. Н., Хасин A.B. Простой алгоритм коррекции кислородно-конвертерной плавки, Проектирование математического и программного обеспечения АСУ ТП, Сб. научн. тр. ЦНИИКА, «Энергоиздат», 1981.
- Поляк Б.Т. Введение в оптимизацию, «Наука», 1983.
- Поляк Б.Т., Щербаков П. С. Вероятностный подход к робастной устойчивости систем с запаздыванием, Автоматика и Телемеханика, № 12, 1996.
- Пропой А.И. О принципе максимума для дискретных систем управления, Автоматика и телемеханика, т.26, № 7, 1965.
- Прохоров Ю.В. Одна экстремальная задача теории вероятностей, Теория вероятностей и ее применения, 1959, 4, № 2, 211−214.
- Пугачев B.C. Теория случайных функций, Физматгиз, 1960.
- Пугачев B.C. Приближенное исследование стохастических систем методом нормализации, Автоматика и телемеханика, № 5, 1974.
- Пугачев B.C. Условно оптимальная фильтрация и экстраполяция непрерывных процессов, Автоматика и телемеханика, № 2, 1984 .
- Райбман Н.С. Идентификация объектов управления (обзор), Автоматика и телемеханика, № 6, 1979.
- Райбман Н.С., Чадеев В. М. Построение моделей процессов производства, М, «Энергия», 1975.
- Распопов Б.М. Влияние отклонения начального состояния управляемой системы от расчетного на эффективность оптимизации, Автоматика и телемеханика, № 3, 1972.
- Распопов Б.М. Оценка эффективности управления по упрощенной модели объекта, Фрунзе, «Илим», 1976.
- Рубинович Е. Я. Обобщенная линейно-квадратичная стохастическая задача управления по неполным данным,
- Автоматика и телемеханика, 1997, № 7.
- Сарагович В.Г. Теория адаптивных систем, М., «Наука», 1976.
- Саридис Дж. Самоорганизующиеся стохастические системы управления, «Наука», 1980.
- Симарзин В.В., Борзенко И. М., Рабинович Е. А., Серебрянский А. Я. Субоптимальные алгоритмы управления процессом каталитического крекинга, «Вопросы промышленной кибернетики».(Труды ЦНИИКА), № 5, 1978.
- Соболь И.М. Численные методы Монте-Карло, «Наука», 1973.
- Соляник А.И., Черноусько Ф. Л. Приближенный метод синтеза оптимального управления системой, подверженной случайным возмущениям, ПММ, т.36, вып.5, 1972.
- Соренсон Г. Обзор методов фильтрации и стохастического управления в динамических системах, в кн. «Фильтрация и стохастическое управление в динамических системах», под ред. Леонидеса К. Т., «Мир», 1980.
- Стратонович Р.Л. Условные марковские процессы иих применение к теории оптимального управления, Изд-во МГУ, 1966.
- Тихомиров В.М. Некоторые вопросы теории приближений, Изд-во МГУ, 1976.
- Тихонов А.Н., Арсенин В. Я. Методы решения некорректных задач, М., «Наука», 1974.
- Фельдбаум A.A. Основы теории оптимальных автоматических систем, «Наука», 1966.
- Фетисов В.Н. К задаче управления объектом с неизвестнымпараметром, Автоматика и телемеханика, № 8, 1973, с.64−67.
- Фетисов В.Н. Неравенство к методу Монте-Карло, Теория вероятностей и ее прим., т.19, № 1, 1974, с.224−226.
- Фетисов В.Н. Оценка длины выборки при решении экстремальных задач методом Монте-Карло. Журн. Вычисл. матем. и матем. физики, т.16, № 1, 1976, 256−262.
- Фетисов В.Н. Вопросы управления промышленными объектами при наличии ошибок идентификации, Автореферат диссертации насоискание ученой степени кандидата технических наук, АН СССР, Институт Проблем Управления, 1979.
- Фетисов В.Н. Марковская аппроксимация случайной последовательности в задачах оптимального управления, Известия АН СССР, Техническая кибернетика, № 1, 1979, с.37−43.
- Фетисов В.Н. Теория чувствительности в задачах стохастического управления, тезисы докл., 6-е Всесоюзное Совещание по теории инвариантности, теории чувствительности и их применениям, Москва, 1982, с.114−115.
- Фетисов В.Н. Аппроксимация распределения вероятностей ошибки идентификации в задаче управления объектом с неизвестным параметром. Идентификация и управление технологическими процессами. Сб. научных тр. ЦНИИКА, «Энергоиздат», 1982, с.8−10.
- Фетисов В.Н. Аппроксимация случайного процесса процессом авторегрессии в задачах стохастического управления, Автоматика и телемеханика, № 4, 1983, с.94−98.
- Фетисов В.Н. Проблема аппроксимации случайных процессов марковским в задаче оптимального управления. В кн. Тезисы докл. 9-го Всесоюзного Совещания по проблемам управления. Ереван, М., 1983, 103−104.
- Фетисов В.Н. Сравнительная оценка качества управления с адаптацией и без адаптации, в кн. Тезисы докл. Всесоюзной конф. «Теория адаптивных систем и ее применения». М.-Л., 1984, с. 280.
- Фетисов В.Н. К задаче аппроксимации управляемого процесса марковским, Известия АН СССР, Техническая кибернетика,№ 6, 1984, с.184−188.
- Фетисов В.Н. О двух подходах к задаче выбора математической модели стохастического объекта, в сб. «Математическое моделирование в АСУ ТП», Тр. ЦНИИКА, М. 1991, с.31−40.
- Фетисов В. Н. Применение метода скользящего среднего для одного класса задач прогноза и управления, «Интегрированные
- АСУ», Тр ЦНИИКА, М. 1992, с.55−58.
- Фетисов В.Н. Методы аппроксимации стохастических моделей в задачах управления технологическими процессами, Приборыи системы управления, 1994, № 6, 15−17.
- Фетисов В.Н., Щегляева Т. А., Штейнберг Ш. Е. Влияние ошибок идентификации на алгоритм оптимального управления процессом легирования полупроводниковых материалов, Приборы и системы управления, № 2, 1975, с. 1112.
- Фетисов В.Н., Штейнберг Ш. Е. Построение алгоритмов управления технологическими процессами при неточных результатах идентификации, Вопросы промышленной кибернетики (Тр. ЦНИИКА), «Энергия», вып. 36, 1973, 64−67.
- Фетисов В.Н., Штейнберг Ш. Е. Управление одним классом технологических процессов при неточных результатах идентификации, Вопросы промышленной кибернетики (тр. ЦНИИКА), вып. 37, 1973, с.35−37.
- См. также: Бубнов Ю. В., Фетисов В. Н., Шалашова В. П.-
- Бузник И.П., Ермаков В. А., Ицкович В. П., Фетисов В. Н. Чернова Т.Н./
- Ворчик В.Г., Фетисов В. Н., Штейнберг Ш.Е-
- Петров А. Г., Стукова J1.C., Фетисов В. Н., Хасин A.B.)
- Фишер P.A. Статистические методы для исследователей, М., «Госстатиздат», 1958.95. Флеминг У. (Fleming W.H.)
- Stochastic control for small noise intensitiers, SIAM J. Control, vol.9, № 3,1971.96. Хазен Э.М.
- Методы оптимальных статистических решений и задачи оптимального управления, Сов. радио, 1968.97. Хальд А.
- Математическая статистика с техническими приложениями, М, 1956.
- Хасин A.B. Вероятностная оценка погрешности метода Монте-Карло, применяемого для решения экстремальных задач, Вопросы промышленной кибернетики (Тр. ЦНИИКА), вып. 59, 1979.
- Хасьминский Р.З. Устойчивость систем дифференциальных уравнений при случайных возмущениях их параметров, М. «Физматгиз», 1969.
- Ховард P.A. Динамическое программирование и марковские процессы, «Сов. радио», 1964.
- Худсон Д. Статистика для физиков, «Мир», 1967.
- Цыбаков А.Б. Оценки точности метода минимизации эмпирического риска, Проблемы передачи информации, т. 17, № 1, 1981, с.50−61.
- Цыпкин Я.3. Адаптация и обучение в автоматических системах, М., «Наука», 1968.
- Цыпкин Я.З. Адаптивные алгоритмы оптимизации при априорной неопределенности, Автоматика и телемеханика, 1979,№ 6,с.94−108.
- Цыпкин Я.З. Синтез робастно оптимальных систем управления объектами в условиях ограниченной неопределенности, Автоматика и телемеханика, 1992, № 9, 139−159.
- Цыпкин Я.З. Новые подходы к теории управления, Вестник РАН, 1992, № 3, с.112−114.
- Цыпкин Я.З. Информационная теория идентификации, М., «Наука», 1995.
- Черноусько Ф.Л. Некоторые задачи оптимального управления с мальм параметром, ПММ, 1968, т.32, № 1.
- Черноусько Ф. Л. Колмановский В.Б. Оптимальное управление при случайных возмушениях, М., «Наука», 1978.
- Шеннон К.Э. Работы по теории информации и кибернетики (сб. статей), М., Изд. иностр. лит., 1963.
- Шибата P. (Shibata R.) Asymptotically efficient selection of the order of the model for estimating parameters of the linead process.- Ann. Statistics, vol. 8, № 1, 1980, p. 147
- Ширяев А.Н. Некоторые новые результаты в теории управляемых случайных процессов, Trans. Fourth Prague Confer. on Inform. Theory etc., Prague, 1967.
- Штейнберг Ш. Е. Идентификация в системах управления, «Энергоатомиздат», 1987.
- Юдин Д.Б. Задачи и методы стохастического программирования, Сов. радио, 1979.
- Ядыкин И.Б. Адаптируемость регулятора и двухуровневые алгоритмы настройки параметров адаптивных систем управления, Автоматика и телемеханика, № 5,1983.
- Yaz Е., Yildizbayrak N. Robustness of feedback-stabilized systems in the presence of non-linear and random perturbations, Int. J. Contr., vol. 41, 1985, p.345−353.
- Yaz E. Deterministic and stochastic robustness measures for discrete systems, IEEE Trans. Automat. Contr., vol. 33, № 10, 1988, p. 952−955.