Рефераты. Теории управления

     (2)   

                      

  Формула (2) - критерий минимума среднеквадратической

ошибки. 

2) Требуется получить реккурентную оценку, такую же как в

   фильтре Калмана.


   В чистом виде получить оптимальную оценку нельзя, есть

   лишь приближенные решения, когда функции f(x) и j(x) -

- линеаризуются.

                           

Тейлоровская линеаризация - используется ряд Тейлора,

                            линейная часть (1-я, 2-го

члена). ( j(x) и f(x) - имеют непрерывные первые про-

изводные).




    Разложение в ряд Тейлора в точке        

                           

      где  - оценка, которую мы еще не знаем, но собираем-

  ся находить.

  Эти линеаризованные функции подставим в (1) и получим

  линейную систему :


(2)               


      Коэффициенты  a,b,c,d находятся после подстановки.

      и  имеют произвольное распределение.

  Будем использовать метод наименьших квадратов для на-

хождения оценок .

                      

             ;   ;

       Выпишем эмпирический риск :  



                                          

                       

r - функционал.


После линеаризации :

      

производная из r берется легко

Продифференцировав и воспользовавшись методом индукции

  получаем :


(3)     

     

       ;  - задано


Выводы :

        1. В связи с тем, что начальная точка разложения

           в ряд Тейлора функции j(x) была выбрана в точ-

           ке , то несмотря на линеаризацию, урав-

           нение (3) получилось как нелинейное и оно по-

           хоже на уравнение (1) модели.

        2. В отличие от фильтра Калмана, в , при рек-

           курентном его вычислении входит  - оценка

           ‘x’ на первом шаге. Коэффициент усиления можно

           вычислить заранее за ‘n’ шагов (в фильтре Кал-

           мана). Но здесь этого сделать нельзя. Сущест-

           вует так называемая обратная связь.


Пример нелинейной фильтрации :


             ;  

T - период колебания

t - период дискретизации

t - текущее время

- фаза гармонического колебания с амплитудой равной 1


      процесс наблюдается на фоне шума


 - дискретная частота;


                                                                                             (4)             



                t                                                 


                       Т


Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы, такую, чтобы разница в квадрате

была минимальной.

                         

                                                                                         


                  . Из (3) получаем :


(5)     


        Перемножим и пренебрежем 2й гармоникой :

 


(6)       - ФАПЧ


      (5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз-

            ностное уравнение)    

 


         

 

    



             Структурная схема ФАП                                             

 

             - на вход


 


       вх                                        

                                    ¬        

                                                                                

                        a

                                 

 


                    синтезатор         t 

                                                                     опоры

                                     ­    

 На вход поступает аддитивная смесь.


                 Принцип работы ФАП


Измеритель фазы является следящей системой с отрицатель-

ной обратной связью. Опорное колебание  с фа-

зой  - экстраполированная фаза. º. Чем точнее

экстраполяция, т.е. чем меньше , тем точ-

нее будет оценка.



                      Глава 5

Оптимальное управление дискретными динами-

            ческими системами  


Существует два типа детерминированных управляемых процес-

сов (детерминированных систем)


(1)    - детерминированная система

    

       - управление (некоторая функция от дискретного

           времени, которая входит в разностное уравнение

           динамической системы)


         Стохастическая управляемая система


(2)  , где  - шум(может быть белым

                                             ),

    а может быть и небелым, например, описываться сколь-

зящим средним ().


 


            Критерий оптимального управления


Пусть модель (1) или (2) генерирует случайный процесс :


           -  управляемый процесс с дискретным

временем, т.е. процесс должен развиваться таким образом,

чтобы минимизировать некоторую функцию риска, тогда уп-

равление называется оптимальным.


        Математически это выглядит так :


       ,

        где   f(×) - выпуклая функция

При движении ракеты по некоторой траектории из точки А в

точку В траектория должна быть такой, чтобы минимизиро-

вать энергетические затраты на управление.


Пример 2

            Существует некоторая эталонная траектория.

                       Необходимо привести движение про-

                       цесса к эталону за минимальное

                       время. Это называется оптимизация

    x(t)-эталон        по быстродействию. Существует мно-

                       жество способов аналитического на-

                     хождения оптимальной функции упра-

      x(t)             вления.

                      



         Метод динамического программирования 


 Имеется детерминированная система :


(1)         


 Принцип Бэлмана - состоит в том, что оптимальное управ-

 ление ищется с конца в начало (из будущего в прошлое).

 Задача решается в обратном направлении.


(2)           


      Аналитическое решение задачи по Бэлману


Предположим, что мы отправились из и прошли траекторию:

 . И предположим, что за ‘k’ шагов управление вы-

брали. Принцип динамического программирования основывает-

ся на том, что любой кусок траектории оптимального управ-

ления является оптимальным.


(3)     

      Траектория от (k+1) до ‘n’ называется хвостом.

 


                         N - последняя точка в управлении 




 



                               

 


                       С учетом (3) запишем :

        

(4)   


 Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4)

оптимальное управление уже выбрано.


(5)      

                            k=N,N-1,...,1

           

 


(6)     

               


     Формула (6) называется уравнением Бэлмана (уравне-

     ние динамического программирования)


Выводы: (из уравнения (6))

        

         Уравнение (6) позволяет в реккурентной форме вы-

         вычислить управление, шаг за шагом, от точки N

         до 1 (из будущего в прошлое) получить минимиза-

         цию (6) на каждом шаге. Получить . Значе-

         ния управления фактически получаются методом пе-

         ребора. Оптимальная траектория ) неиз-

         вестна до самого последнего шага.

            Если задача имеет большую размерность, то

         сложность при вычислении очень большая. Если

         вводить динамические системы (т.е. модели), то

         можно значительно упростить метод нахождения оп-

         тимального управления. Т.е. получить управление         

         в замкнутом виде (в виде некоторой формулы).


Синтез оптимального управления для марковских динамичес-

ких систем.

 

 

(1)          ;    ;   ; где -


        - управление;  - шум динамической системы.

Управление должно менять  - траекторию, и изменять ее так, чтобы минимизировать средний критерий  качества,

причем управляется динамическая система не по всем коор-

динатам.

         - управляемый случайный процесс.

Динамическая система, сама как таковая, не наблюдается, а

наблюдается j()(нелинейно преобразованная фазовая пере-

менная) с шумом. В этом случае говорят, что динамическая система ненаблюдаема напрямую. Для того, чтобы сделать ее

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.