Lyapunov-90

Нартов Б.К.
Омский филиал института математики им. С.Л. СоболеваСО РАН, Омск

Аннотация:

Разработку метода упругих функций стимулировала известная задача планирования поиска на плоскости неподвижных целей с заданными функциями плотностей распределения вероятностей [4]. Долгое время не удавалось свести эту задачу к классическим задачам условной оптимизации. Основную проблему представлял аналитический учет пересечений и самопересечений полос поиска - непереборные решения строились лишь для частных случаев или получались при дополнительных ограничениях на управление поисковыми единицами. Предложенный нами в [1-3] подход решает эту проблему и позволяет формально просто записать общий случай планирования поиска в виде задачи оптимального управления.

Существенно, что предметная область найденного подхода оказалась много шире задач поиска стационарных объектов. Например, в задачах преследования целей с заданными траекториями метод упругих функций позволяет аналитически запоминать моменты первых касаний целей объектами - преследователями и сколь угодно точно ``затормаживать'' движения коснувшихся пар. Таким образом, удается избавиться от дифференциальных уравнений траекторий объектов - преследователей, обойти комбинаторные трудности и свести общий случай исходной задачи к классической задаче условной оптимизации. В контексте представляемого метода удалось формализовать в виде стандартных задач оптимального управления и некоторые задачи дискретной оптимизации, например задачу коммивояжера, интерпретируемую предварительно как ``задачу преследования неподвижных целей''.

За недостатком места мы опускаем проведенные доказательства и описания верифицирующих экспериментов, ограничиваясь ниже по возможности наглядными примерами, представляющими три контрастных класса задач траекторного управления.

Преследование подвижных целей

Задача 1 (простейший случай). Задан временной интервал $[0, t_{f}]$ , траектория цели $\bar {a}(t)$ , $0 \le t \le t_{f}$ , в евклидовом пространстве $Е^{3}$ , начальная координата объекта-преследователя $\bar {x}(0)$ , динамические и пространственные ограничения на его возможные траектории $\bar{x}(\cdot)$ , выражающиеся в системе неравенств, связывающих функцию $\bar {x}(t)$ и ее производные до второй включительно.

Требуется формализовать задачу вычисления траектории $\bar {x}^{\ast} ( \cdot)$ , оптимальной в смысле задачи

Решение. Обозначив $\bar {r}(t) = \bar {x}(t) - \bar {a}(t)$ , введем (рис.1) первую вспомогательную функцию $F(s(t)),\,s(t) = \vert \bar {r}(t)\vert$ , удовлетворяющую трем условиям:

дифференцируема.
2. $\,{\left\{ {\begin{array}{l} {0\, \le \,F(s)\, \le \,\varepsilon _{2}\, \mbox{... ...,s\, \ge \,\varepsilon _{1} + \varepsilon _{2} .} \\ \end{array}} \right.}$
3. Значения $\varepsilon$ $_{1}$ и $\varepsilon$ $_{2}$ регулируются параметрами функции

независимо (в смысле неравенств 0 < $\varepsilon$ $_{2}$ < $\varepsilon$ $_{1}$ и 0 < $\varepsilon$ $_{1}$ < $\varepsilon$ $_{3}$ , где $\varepsilon$ $_{3}$ - заданное число).

**Figure:** Вспомогательная функция
$\begin{figure}\begin{center} \epsfxsize=12cm \epsfysize=12cm\epsfbox{r1.eps} \end{center}\end{figure}$

Конкретный вид

, удовлетворяющей этим условиям, вполне произволен.

Попытаемся теперь подобрать дифференцируемую функцию $\tilde {F}(s( \cdot ),t)$ , которая для любого интервала (0 $, t) \quad \subset$ (0

) сколь угодно точно (регулировкой параметров функций $\tilde {F}$ и

приближает значения функции $F_{1} (s( \cdot ),t) = {\mathop {inf}\limits_{0 \le \tau \le t}} F(s(\tau ))$ при условии $\tilde {F}$ (

( $\cdot$ )

0)=1.

Можно показать, что простейшая удовлетворяющая этим требованиям функция $\tilde {F}(s( \cdot ),t)_{}$ является решением дифференциального уравнения

$\begin{displaymath} \dot{\tilde {F}} = \alpha {\frac{{F - \tilde {F}}}{{F}}}, \eqno (2)\end{displaymath}$

где $\alpha$ - регулируемый положительный параметр.

Физически уравнение (2) обусловливает следующие свойства функции $\tilde {F}$ (s( $\cdot )$ ,

$\tilde {F}$ ``достаточно быстро'' убывает по

при $F < \tilde {F};$

$\tilde {F}$ ``достаточно медленно'' возрастает по

при $F >\tilde {F}.$

Введем для функции $\tilde {F}$ естественный термин ``упругая'' функция, а для функции

- ``трафаретная'' функция.

Обратимся теперь к рис.2 , иллюстрирующему преобразование $s(t) \quad \to$

$\to$ (

( $\cdot$ )

и запишем приближенное решение исходной задачи в виде

**Figure:** Исходные данные в задачах поиска
$\begin{figure}\begin{center} \epsfxsize=12cm \epsfysize=12cm\epsfbox{r2.eps} \end{center}\end{figure}$

$\begin{displaymath} {\int\limits_{0}^{t_{f}} {\tilde {F}(s( \cdot ),t)dt \to \inf }}.\eqno(3) \end{displaymath}$

Решая уравнение (2) с начальным условием $\tilde {F}$ ( $s( \cdot )$ ,0) = 1, получим

$\begin{displaymath} \tilde {F}(s( \cdot ),t) = {\left[ {1 + \alpha {\int\limits_... ..._{0}^{t} {{\frac{{d\tau}} {{F(s(\tau ))}}}}}} \right).\eqno(4) \end{displaymath}$

Подставляя (4) в (3), получаем классическую задачу вариационного исчисления. Фактически в (3) используется следующая интерпретация ``упругой'' функции $\tilde {F}$ :

$\begin{displaymath}{\frac{{d\tilde {t}}}{{dt}}} = \tilde {F}(s( \cdot )t),\eqno (5) \end{displaymath}$

где $\tilde {t}$ - новая переменная - ``управляемое'' время ( $\tilde {t}$ (0) = 0). Можно доказать, что для любых параметров и начальных условий задачи 1 всегда найдутся такие конкретные параметры функций

и $\tilde {F}$ , что функция $\tilde {t}(t_{f})$ из решения (3) сколь угодно точно приблизит момент захвата цели $t_{\varsigma}$ (если, разумеется, захват вообще возможен - в противном случае $\tilde {t}(t_{f})$ с заданной точностью совпадает с $t_{f} )$ .

Практически случай одной цели и одного преследователя, разумеется, легко разрешим стандартными средствами и рассмотрен здесь лишь в качестве иллюстрации. Однако предлагаемый подход позволяет формализовать и многие общие случаи задач оптимального преследования, например

Задачу 2. Задан временной интервал [0, $t_{f}$ ], траектории целей $\bar {a}_{i} (t)$ , 0 $\le$ t $\le$ t $_{f}$ , 1 $\le$ i $\le$ M, в евклидовом пространстве $E^{3}$ , начальные координаты объектов-преследователей $\bar {x}_{j} (0),$ 1 $\le$ j $\le$ N, динамические и пространственные ограничения на их возможные траектории $\bar {x}_{j} ( \cdot ).$

Требуется формализовать задачу вычисления траекторий $\bar {x}_{j}^{ *} ( \cdot ),$ 1 $\le$ j $\le$ N, оптимальных в смысле минимизации суммарного времени жизни целей на интервале [0 $,t_{f}$ ]. Если цель захвачена каким-либо объектом-преследователем (см. задачу 1), ее время жизни равно времени захвата, в противном случае время жизни цели совпадает со значением $t_{f}.$ При этом объект-преследователь, захвативший какую-либо цель, вычеркивается из дальнейшего рассмотрения.

Заметим, что схему решения задачи 1 нельзя тривиально распространить на общий случай. Необходимо, например, исключить следующие версии:

``атаку'' одной цели многими объектами-преследователями;

последовательные ``атаки'' многих целей одним объектом-преследователем.

Учет подобных ограничений в функционале качества [3] существенно усложняет реализующий алгоритм.

Поиск стационарных объектов

Исходные данные рассматриваемых в этой главе задач таковы. Односвязной области $G \subset E^{2}$ достоверно принадлежат

неподвижных целей с известными функциями плотностей распределения вероятностей $f_{k} (x),1 \le k \le K$ , $x = (x_{1,\,} x_{2} ) \in [G]$ , где [

] - замыкание области

. В замыкании [

] произвольным образом расположены в начальный момент времени

поисковых единиц (ПЕ). При движении каждая ПЕ является центром окружности радиуса

, заметающей в области

полосу шириной 2

- ``полосу захвата''; попавшая в полосу цель считается обнаруженной (рис. 3).

**Figure:** Исходные данные в задачах поиска
$\begin{figure}\begin{center} \epsfxsize=12cm \epsfysize=12cm\epsfbox{r3.eps} \end{center}\end{figure}$

$\xi _{i} (t) = (\xi _{1} ^{i}(t),\xi _{2} ^{i}(t))$ - траектория i-й ПЕ, $1 \le i \le N,0 \le t \le t_{f} ,$

$\tilde {K} = \tilde {K}({\left\{ {\xi _{i} (t),\vert 0 \le t \le t_{f} ,1 \le i \le N} \right\}},t)$ - случайная величина - количество целей, обнаруженных на интервале времени (0,

, соответствующее стратегии поиска $u = \{\xi _{i} (t)\vert 0 \le t \le t_{f} ,1 \le i \le N\}$ .

Считая реальные состояния поиска на заданном интервале (0, $t_{f} )$ неизвестными, сформулируем следующую задачу: при заданных ограничениях на управления ПЕ вычислить стратегию поиска $u^{ *} = \{\xi _{i} ^{ * }(t)\vert 0 \le t \le t_{f} ,1 \le i \le N\}$ , максимизирующую математическое ожидание количества целей $M[\tilde {K}(u,t_{f} )]$ , обнаруживаемых за время поиска $t_{f}$ .

$\begin{displaymath}f(x) = {\sum\limits_{k = 1}^{K} {f_{k} (x).}}\end{displaymath}$

$\begin{displaymath} {\int\limits_{G} {f(x)dS = K}}. \end{displaymath}$

Обозначим $u(t) = \{\xi _{i} (\tau )\vert 0 \le \tau \le t,\,1 \le i \le N\}$ , $u(t_{f} ) = u$ . В каждый момент времени $t \in (0,t_{f} )$ множеству траекторий

соответствует объединение полос захвата ПЕ $G_{1}(u(t))$

Обозначим теперь $G(u(t)) = G\backslash G_{1} (u(t))$ и $\Delta G_{1} (u(t)) = G_{1} (u(t + \Delta t))\backslash G_{1} (u(t)).$

Отсюда и из определения функции

и математического ожидания $M[\tilde {K}(u,t)]$ следует:

$\begin{displaymath} \Delta M[\tilde {K}(u,t)] = {\int\limits_{\Delta G_{1} (u(t))} {f(x)dS}}. \eqno (6) \end{displaymath}$

Теперь исходную задачу можно записать в виде

$\begin{displaymath}\int\limits_{G_{1} (u(t_{f} ))} {f(x)dS \to \max}.\eqno(7)\end{displaymath}$

Из (6) очевидно, что при планировании слепого поиска необходим учет пересечений и самопересечений полос захвата ПЕ, составляющий основную проблему формализации (7) в виде задачи оптимального управления.

Предлагаемое ниже решение основано на описанном в предыдущем разделе механизме ``упругих'' функций $\tilde {F}$ , задаваемых, однако, в другом виде.

Определим предварительно на области G вспомогательную функцию $\lambda$ , связанную с координатами ПЕ,

$\begin{displaymath} \lambda (x,\,\xi (t)) = {\left\{ {\begin{array}{l} {1,\,\,\... ...t \xi (t) - x\vert \,\, \ge \,\,a.} \\ \end{array}} \right.} \end{displaymath}$

Зададим далее дифференцируемую колоколообразную функцию $F(x, \xi (t))$ , сколь угодно точно приближающую значения $\lambda$ . Конкретный вид

вполне произволен. См. рис.4.

**Figure:** Функции $\lambda$ и
$\begin{figure}\begin{center} \epsfxsize=12cm \epsfysize=12cm\epsfbox{r4.eps} \end{center}\end{figure}$

Рассмотрим теперь функцию $\tilde {F}(x,\,u,\,t)$ , являющуюся решением дифференциального уравнения

$\begin{displaymath} \dot {\tilde {F}} = \alpha {\sum\limits_{i = 1}^{N} {{\frac{{F_{i} - \tilde {F}}}{{1 - F_{i}}} }}}, \eqno (8) \end{displaymath}$

где $\alpha$ - регулируемый положительный параметр; $\tilde {F}(x, u$ ,

Можно показать, что для любых начальных условий исходной задачи всегда найдутся такие $F_{i}$ и

, что к моменту окончания поиска $t_{f}$ функция $\tilde {F}$ реализует над областью поиска

дифференцируемый профиль, повторяющий движения ПЕ. При этом высота профиля с заданной точностью будет равна единице над просмотренными областями, в том числе и над областями пересечений и самопересечений полос поиска (захвата), и с заданной точностью равна нулю вне просмотренных областей. Это полезное свойство $\tilde {F}$ позволяет формализовать исходную задачу поиска (7) в виде

$\begin{displaymath} J(u) = {\int\limits_{G} {f(x)\tilde {F}(x,\,u,\,t_{f} )dS \to \max ,}} \eqno (9)\end{displaymath}$

то есть получить функционал с дифференцируемым интегралом, учитывающим любое возможное наложение поле захвата ПЕ.

Фактически относительно (9) утверждается следующее:

Для любых параметров и начальных условий исходной задачи и любого $\varepsilon$ >0 найдутся такие F $_{{\rm i}}$ и $\tilde {F}$ , что (9) формализует задачу (7) для некоторого набора плотностей вероятностей $\tilde {f}_{k} (x)$ , ${\rm 1} \le k \le K$ , из интервала $\vert f_{k} (x) - \tilde {f}_{k} (x)\vert < \varepsilon ,$ где $f_{k} (x)$ - исходные плотности вероятностей.

В [3] по подобной схеме мы формализовали и некоторые задачи управления поиском в реальном масштабе времени, когда известны моменты обнаружения и координаты обнаруживаемых целей. Заметим здесь, что вопросы о цене представления $\tilde {F}$ в реализующем алгоритме и устойчивости траекторий ПЕ относительно точности приближения $f_{k} (x)$ требуют отдельного обсуждения.

Дискретная оптимизация

Используя результаты раздела 1, интерпретируем задачу коммивояжера как ``задачу оптимального преследования неподвижных целей'', а именно как задачу минимизации времени захвата последней из

неподвижных целей одним неуничтожаемым объектом-преследователем.

**Figure:** К задаче коммивояжера. $t_{1} ,\,...\,,\,t_{N}$ - моменты $\varepsilon$ - касаний пунктов ${\rm 1}{\rm ,} {\rm \ldots} , N$ Динамика запасов растительного вещества
$\begin{figure}\begin{center} \epsfxsize=12cm \epsfysize=14cm\epsfbox{r5.eps} \end{center}\end{figure}$

$\bar {x}_{i} ,\,i = \overline {1,\,N}$ - координата

-го пункта;

$\bar {x}(t)$ - координата коммивояжера, где $\bar {x}(0)$ задана;

и $\tilde {F}$ - трафаретная и упругая функции - в том виде, в котором они определены в модели оптимального поиска в разделе 2 (случай одной поисковой единицы);

$\begin{displaymath} {\int\limits_{0}^{t_{f}} {{\prod\limits_{i = 1}^{N} {\tilde ... ...{x}_{i} ,\,\bar {x}( \cdot ),\,t)dt \to \sup}} } } \eqno (10) \end{displaymath}$

$\begin{displaymath} \vert \dot {\bar {x}}(t)\vert \, \le \,V,t \in (0,t_{f} ). \end{displaymath}$

Далее легко показать, что при условии $Vt_{f} > L$ для любого $\varepsilon \, > \,0$ найдутся такие F и $\tilde {F}$ , что решение (10) обеспечивает $\varepsilon$ -близкий и, с точностью до $N\varepsilon$ , оптимальный обход пунктов. См. рис. 5

Литература

Примечание

© 2001, Сибирское отделение Российской академии наук, Новосибирск
© 2001, Объединенный институт информатики СО РАН, Новосибирск
© 2001, Институт вычислительных технологий СО РАН, Новосибирск
© 2001, Институт систем информатики СО РАН, Новосибирск
© 2001, Институт математики СО РАН, Новосибирск
© 2001, Институт цитологии и генетики СО РАН, Новосибирск
© 2001, Институт вычислительной математики и математической геофизики СО РАН, Новосибирск
© 2001, Новосибирский государственный университет
Дата последней модификации Monday, 10-Sep-2001 17:11:53 NOVST