Рефераты. Реализация автономных адаптивных систем управления на базе нейронных сетей p>bwt+1 = [pic]

yit = ( cwt & ait ;

ait = [pic];

где [pic][pic]= t( xit = 1 - момент импульса на входе xi ;

lw t = [pic];

Nw0 = 0;
Nwt = Nwt-1 + bwt ;
Rw(Nwt) - убывающая сигмоидальная функция.


3.3. Задача построения ФРО.

Для того, чтобы более правильно и экономно построить нейронную сеть
ФРО, необходимо понять смысл или «концепцию» [Turchin] формируемых образов, т.е., более точно выражаясь, найти для данного образа множество обучающих входных фильмов или множество всех таких реализаций входных процессов, которые приводят к обучению данного нейрона или формированию данного образа. Введем понятие обучающего входного фильма.

Определение 3.3.1. Всякий входной фильм [pic] назовем обучающим для нейрона
[pic], если [pic] - начальный момент времени работы системы и [pic] [pic],
[pic].

Таким образом, задачу построения НС ФРО можно сформулировать следующим образом: для данной совокупности входных фильмов построить такую сеть, в которой бы присутствовали нейроны, для которых данные входные фильмы являются обучающими. Построенная таким образом сеть способна решать эталонную задачу классификации, где в качестве эталонов используются данные входные фильмы. Известно множество способов конструирования и настройки сетей для классических формальных моделей нейронов, например, сети обратного распространения, использующие обобщенное [pic]-правило. Проблема предлагаемого подхода состоит в том, что 1) система должна быть автономной, а значит отсутствует «учитель»; 2) вообще говоря, a priori не известны все жизненно необходимые для системы образы. Но если мы обладаем априорной информацией об условиях существования системы (что почти всегда бывает), ее следует использовать при конструировании ФРО.
Можно иначе сформулировать задачу построения ФРО. Приведем пример с системой «Пилот» [Диссер, Жданов9]. В математической модели спутника используются величины углового положения спутника [pic] и его производной
[pic], следовательно, очевидно, что всевозможные сочетания возможных значений этих величин (т.е. некоторая область на фазовой плоскости) необходимы для нахождения законов управления системой. Действительно, допустим система в момент времени t находится в состоянии [pic] и УС выбирает некоторое управляющее воздействие [pic] (включение одного из двигателей, например). Мы знаем, что в момент времени [pic] система окажется в некотором состоянии, соответствующем точке на фазовой плоскости с некоторой вероятностью [pic], где [pic] - точка на фазовой плоскости, таким образом, можно говорить о некотором вероятностном распределении
[pic], заданном в фазовом пространстве и характеризующем предсказание поведения системы через интервал [pic] при выборе воздействия [pic] в момент времени t. Если бы параметров [pic] было недостаточно для описания законов управления, то функция распределения зависела бы еще и от других параметров, и при одних и тех же величинах [pic] принимала бы другие значения в зависимости от значений неучтенных параметров. Следовательно, УС не смогла бы найти никакого закона управления, поскольку система ищет статистически достоверную корелляцию между наблюдаемым состоянием ОУ, выбранным действием и состоянием ОУ через некоторый интервал времени.
Законом управления здесь мы назовем совокупность функций распределения для каждого управляющего воздействия [pic], где [pic] находится в некотором диапазоне. Найденный УС закон управления отобразится в некотором внутреннем формате в БЗ, причем он может быть получен в процессе обучения системы в реальных условиях прямо во время работы, либо на тестовом стенде, «на земле». Следовательно, можно сказать, что задача построения ФРО состоит в конструировании образов, соответствующих необходимому набору параметров, описывающих состояние системы, и их комбинациям, необходимым для нахождения закона управления. Нахождению таких образов может помочь математическая модель объекта управления, если таковая имеется.


3.4. Распознавание пространственно-временных образов.

Определение 3.4.1. Всякую совокупность значений реализации входного процесса в некоторые выбранные интервалы времени [pic] будем называть пространственно-временным образом (ПВО).

Отметим, что один нейрон способен распознавать (т.е. способен обучиться выделять конкретный ПВО среди всех остальных) только те ПВО, у которых единичное значение сигнала для каждой выбранной компоненты входного процесса встречается не более одного раза (пример изображен на верхнем графике рис. 3.4.1). Сеть нейронов можно построить так, что в ней будут формироваться любые заданные ПВО (нижний график рис. 3.4.1).
[pic]
Рис 3.4.1.
4. База знаний.


Процесс накопления знаний БЗ в рамках методологии ААУ подробно рассмотрен в
[Диссер], [Жданов4-8]. В данном разделе мы опишем лишь основные отличия от указанных источников.
Рассмотрим общий алгоритм формирования БЗ. Основная цель алгоритма состоит в накоплении статистической информации, помогающей установить связь между выбранными управляющей системой воздействиями на среду и реакцией среды на эти воздействия. Другая задача алгоритма состоит в приписывании оценок сформированным образам и их корректировки в соответствии с выходным сигналом блока оценки состояния.

Определение 4.1. Будем называть полным отсоединением ФРО от среды следующее условие: процессы [pic] и [pic] являются независимыми. Вообще говоря, в действующей системе, конечно же эти процессы зависимы, например, в простом случае без блока датчиков [pic], но для введения некоторых понятий требуется мысленно «отсоединить» входной процесс и процесс среды.

Определение 4.2. Назовем временем реакции среды на воздействие [pic] число

[pic], где [pic] случайные величины [pic] и [pic] являются зависимыми при полном отсоединении ФРО от среды. Закономерностью или реакцией среды будем считать зависимость [pic] от [pic].

Другими словами, время реакции среды это время, через которое проявляется, т.е. может быть распознана блоком ФРО, реакция на воздействие.

Пример 4.1. [pic] = [pic]. Очевидно, что здесь [pic].

Определение 4.3. Назовем минимальной [pic] и максимальной [pic] инертностью среды минимальное и максимальное соответственно время реакции среды на воздействие [pic] для всех [pic]. Интервал [pic] будем называть интервалом чувствительности среды.

Заметим, что [pic].
Введем совокупность образов
[pic]. (4.1)
Параметр n > 0 назовем запасом на инертность среды. Смысл [pic] состоит в том, что если [pic] обучен, в текущий момент времени распознан образ [pic] и УС выберет воздействие [pic] то с некоторой вероятностью через n шагов распознается образ [pic]. Аналогично введем образ
[pic], (4.2) смысл которого совпадает со смыслом [pic], с тем лишь различием, что [pic] не распознается, а вытеснится. Поскольку в конечном итоге способом управления УС является вызов определенных образов и вытеснение других, то совокупность обученных образов [pic] является материалом, способствующим достижению цели управления, то есть вызову или вытеснению определенных образов посредством выбора воздействия [pic] из множества возможных воздействий Y на каждом шаге t. Как используется этот материал будет изложено в разделе «Блок принятия решений».
Запас на инертность введен из следующих соображений. Совершенно очевидно, что бесполезно пытаться уловить закономерность вида «был распознан образ
[pic], применили [pic]и через m шагов получили [pic]», где [pic], так как среда будет просто не успевать отреагировать. Таким образом, УС может уловить закономерности со временем реакции среды не большим чем n.
Аналогично, нет смысла выбирать n слишком большим, т.е. гораздо большим, чем [pic]. С другой стороны, используя синаптические задержки входных сигналов в нейроне, мы можем отловить любую закономерность со временем реакции меньшим либо равным запасу на инертность. Действительно, мы можем построить ФРО так, чтобы образы [pic] и [pic] формировались с нужными задержками [pic], где m – время реакции среды. Заметим, что a priori нам неизвестно время реакции среды m, поэтому имеет смысл лишь выбрать параметр n для всех образов одинаковым и «наверняка» большим чем [pic] (для этого необходимо воспользоваться априорной информацией о среде).
Теперь сопоставим каждому образу из ФРО некоторое число или оценку. Пусть
[pic] – выход блока оценки состояния, а [pic] – оценка образа [pic], получающаяся по следующему алгоритму:
[pic], [pic], где [pic]– некоторая «усредняющая» функция, [pic]- множество моментов времени, в которые образ [pic] был распознан. В качестве [pic] обычно берется просто среднее арифметическое

[pic].
Теперь можно определить, что такое база знаний.

Определение 4.4. Назовем базой знаний совокупность сформированных образов
[pic] и совокупность оценок [pic] для всех образов ФРО.

Определение 4.5. Обозначим объединение множеств всех образов (4.1) и (4.2) через [pic], где F – множество образов ФРО, Y – множество возможных воздействий. Назовем B пространством образов БЗ.
5. Система построения и исследования нейронных сетей СПИНС.


5.1. Актуальность системы.

Для моделирования на ЭВМ компонентов УС, сконструированных из нейронов, была осознана необходимость в специальном инструменте, позволяющем с помощью удобного графического интерфейса создавать библиотеки шаблонов блоков, строить сети из блоков, построенных по шаблонам, и просчитывать сеть с возможностью просмотра промежуточных состояний сети, сбора и анализа статистики о работе сети в целях отладки. При создании (или выборе) инструмента использовались следующие критерии: открытость, или спецификация и реализация (generic) интерфейса и (процедур обработки) форматов данных, позволяющие проводить модификацию и наращивание функциональности системы не затрагивая ядра системы и с минимальными затратами на модификацию связанных компонент, другими словами, минимизация связей между компонентами; гибкость, возможности по конструированию как можно большего числа классов формальных моделей нейронов и сетей под самые различные приложения от моделей УС спутников и космических аппаратов до систем поддержки принятия решений и систем предсказания курса ценных бумаг; многоплатформенность, максимальная независимость от операционной системы; удобство и приспособленность к моделированию именно систем ААУ, простота в использовании и способность эффективно работать на относительно слабых ресурсах ЭВМ (класса персональных компьютеров), дешевизна.
Анализ имеющихся в наличии или доступных систем САПР и других систем
(например, LabView или систем с классическими НС), тем или иным образом удовлетворяющих первым трем критериям, показал, что все они являются либо тяжеловесными, либо слишком дорогими, либо очень плохо приспособлены к моделированию систем ААУ и ОУ с формальной моделью нейрона, изложенной в разделе «Аппарат ФРО» или к работе с сетями, состоящими из тысяч нейронов.
Таким образом, возникла необходимость в инструменте для научно- исследовательских целей, который бы позволял проверять идеи ААУ и создавать прототипы УС на НС.

Страницы: 1, 2, 3, 4, 5, 6



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.