Нартов Б.К.
Омский филиал института математики им. С.Л. СоболеваСО РАН, Омск
In the paper are presented the new method`s possibilities of the formalization of the path (trajectory`s) problems in the form of the optimal control problems.
Разработку метода упругих функций стимулировала известная задача планирования поиска на плоскости неподвижных целей с заданными функциями плотностей распределения вероятностей [4]. Долгое время не удавалось свести эту задачу к классическим задачам условной оптимизации. Основную проблему представлял аналитический учет пересечений и самопересечений полос поиска - непереборные решения строились лишь для частных случаев или получались при дополнительных ограничениях на управление поисковыми единицами. Предложенный нами в [1-3] подход решает эту проблему и позволяет формально просто записать общий случай планирования поиска в виде задачи оптимального управления.
Существенно, что предметная область найденного подхода оказалась много шире задач поиска стационарных объектов. Например, в задачах преследования целей с заданными траекториями метод упругих функций позволяет аналитически запоминать моменты первых касаний целей объектами - преследователями и сколь угодно точно ``затормаживать'' движения коснувшихся пар. Таким образом, удается избавиться от дифференциальных уравнений траекторий объектов - преследователей, обойти комбинаторные трудности и свести общий случай исходной задачи к классической задаче условной оптимизации. В контексте представляемого метода удалось формализовать в виде стандартных задач оптимального управления и некоторые задачи дискретной оптимизации, например задачу коммивояжера, интерпретируемую предварительно как ``задачу преследования неподвижных целей''.
За недостатком места мы опускаем проведенные доказательства и описания верифицирующих экспериментов, ограничиваясь ниже по возможности наглядными примерами, представляющими три контрастных класса задач траекторного управления.
Задача 1 (простейший случай). Задан временной интервал , траектория цели , , в евклидовом пространстве , начальная координата объекта-преследователя , динамические и пространственные ограничения на его возможные траектории , выражающиеся в системе неравенств, связывающих функцию и ее производные до второй включительно.
Требуется формализовать задачу вычисления траектории
, оптимальной в смысле задачи
Решение. Обозначив , введем (рис.1) первую вспомогательную функцию , удовлетворяющую трем условиям:
1. дифференцируема.
2.
3. Значения и регулируются параметрами функции независимо (в
смысле неравенств
0 < < и 0 < < , где - заданное число).
Конкретный вид , удовлетворяющей этим условиям, вполне произволен.
Попытаемся теперь подобрать дифференцируемую функцию , которая для любого интервала (0 (0) сколь угодно точно (регулировкой параметров функций и приближает значения функции при условии (()0)=1.
Можно показать, что простейшая удовлетворяющая этим требованиям функция является решением дифференциального уравнения
где - регулируемый положительный параметр.
Физически уравнение (2) обусловливает следующие свойства функции (s(,
``достаточно быстро'' убывает по при
``достаточно медленно'' возрастает по при
Введем для функции естественный термин ``упругая'' функция, а для функции - ``трафаретная'' функция.
Обратимся теперь к рис.2 , иллюстрирующему преобразование (() и запишем приближенное решение исходной задачи в виде
Решая уравнение (2) с начальным условием (,0) = 1, получим
Подставляя (4) в (3), получаем классическую задачу вариационного исчисления. Фактически в (3) используется следующая интерпретация ``упругой'' функции:
где - новая переменная - ``управляемое'' время ((0) = 0). Можно доказать, что для любых параметров и начальных условий задачи 1 всегда найдутся такие конкретные параметры функций и, что функция из решения (3) сколь угодно точно приблизит момент захвата цели (если, разумеется, захват вообще возможен - в противном случае с заданной точностью совпадает с .
Практически случай одной цели и одного преследователя, разумеется, легко разрешим стандартными средствами и рассмотрен здесь лишь в качестве иллюстрации. Однако предлагаемый подход позволяет формализовать и многие общие случаи задач оптимального преследования, например
Задачу 2. Задан временной интервал [0, ], траектории целей , 0 t t, 1 i M, в евклидовом пространстве , начальные координаты объектов-преследователей 1 j N, динамические и пространственные ограничения на их возможные траектории
Требуется формализовать задачу вычисления траекторий 1 j N, оптимальных в смысле минимизации суммарного времени жизни целей на интервале [0]. Если цель захвачена каким-либо объектом-преследователем (см. задачу 1), ее время жизни равно времени захвата, в противном случае время жизни цели совпадает со значением При этом объект-преследователь, захвативший какую-либо цель, вычеркивается из дальнейшего рассмотрения.
Заметим, что схему решения задачи 1 нельзя тривиально распространить на общий случай. Необходимо, например, исключить следующие версии:
``атаку'' одной цели многими объектами-преследователями;
последовательные ``атаки'' многих целей одним объектом-преследователем.
Учет подобных ограничений в функционале качества [3] существенно усложняет реализующий алгоритм.
Исходные данные рассматриваемых в этой главе задач таковы. Односвязной области достоверно принадлежат неподвижных целей с известными функциями плотностей распределения вероятностей , , где [] - замыкание области . В замыкании [] произвольным образом расположены в начальный момент времени 0 поисковых единиц (ПЕ). При движении каждая ПЕ является центром окружности радиуса , заметающей в области полосу шириной 2 - ``полосу захвата''; попавшая в полосу цель считается обнаруженной (рис. 3).
Введем следующие обозначения:
- траектория i-й ПЕ,
- время поиска;
- случайная величина - количество целей, обнаруженных на интервале времени (0,, соответствующее стратегии поиска .
Считая реальные состояния поиска на заданном интервале (0, неизвестными, сформулируем следующую задачу: при заданных ограничениях на управления ПЕ вычислить стратегию поиска , максимизирующую математическое ожидание количества целей , обнаруживаемых за время поиска .
Рассмотрим функцию
Очевидно
Обозначим , . В каждый момент времени множеству траекторий соответствует объединение полос захвата ПЕ Обозначим теперь и
Отсюда и из определения функции и математического ожидания следует:
Теперь исходную задачу можно записать в виде
Из (6) очевидно, что при планировании слепого поиска необходим учет пересечений и самопересечений полос захвата ПЕ, составляющий основную проблему формализации (7) в виде задачи оптимального управления.
Предлагаемое ниже решение основано на описанном в предыдущем разделе механизме ``упругих'' функций , задаваемых, однако, в другом виде.
Определим предварительно на области G вспомогательную функцию , связанную с координатами ПЕ,
Зададим далее дифференцируемую колоколообразную функцию , сколь угодно точно приближающую значения . Конкретный вид вполне произволен. См. рис.4.
Рассмотрим теперь функцию , являющуюся решением дифференциального уравнения
где - регулируемый положительный параметр; ,
Можно показать, что для любых начальных условий исходной задачи всегда найдутся такие и , что к моменту окончания поиска функция реализует над областью поиска дифференцируемый профиль, повторяющий движения ПЕ. При этом высота профиля с заданной точностью будет равна единице над просмотренными областями, в том числе и над областями пересечений и самопересечений полос поиска (захвата), и с заданной точностью равна нулю вне просмотренных областей. Это полезное свойство позволяет формализовать исходную задачу поиска (7) в виде
то есть получить функционал с дифференцируемым интегралом, учитывающим любое возможное наложение поле захвата ПЕ.
Фактически относительно (9) утверждается следующее:
Для любых параметров и начальных условий исходной задачи и любого >0 найдутся такие F и , что (9) формализует задачу (7) для некоторого набора плотностей вероятностей , , из интервала где - исходные плотности вероятностей.
В [3] по подобной схеме мы формализовали и некоторые задачи управления поиском в реальном масштабе времени, когда известны моменты обнаружения и координаты обнаруживаемых целей. Заметим здесь, что вопросы о цене представления в реализующем алгоритме и устойчивости траекторий ПЕ относительно точности приближениятребуют отдельного обсуждения.
Используя результаты раздела 1, интерпретируем задачу коммивояжера как ``задачу оптимального преследования неподвижных целей'', а именно как задачу минимизации времени захвата последней из неподвижных целей одним неуничтожаемым объектом-преследователем.
Обозначим:
- координата -го пункта;
- координата коммивояжера, где задана;
и - трафаретная и упругая функции - в том виде, в котором они определены в модели оптимального поиска в разделе 2 (случай одной поисковой единицы);
L - длина минимального маршрута.
Запишем задачу
с ограничением на управление
Далее легко показать, что при условии для любого найдутся такие F и , что решение (10) обеспечивает -близкий и, с точностью до, оптимальный обход пунктов. См. рис. 5
Ваши комментарии |
[Головная страница] [Конференции] [СО РАН] |
© 2001, Сибирское отделение Российской академии наук, Новосибирск
© 2001, Объединенный институт информатики СО РАН, Новосибирск
© 2001, Институт вычислительных технологий СО РАН, Новосибирск
© 2001, Институт систем информатики СО РАН, Новосибирск
© 2001, Институт математики СО РАН, Новосибирск
© 2001, Институт цитологии и генетики СО РАН, Новосибирск
© 2001, Институт вычислительной математики и математической геофизики СО РАН, Новосибирск
© 2001, Новосибирский государственный университет
Дата последней модификации Monday, 10-Sep-2001 17:11:53 NOVST