Задачи оптимального быстродействия

курсовая работа

1.2 Общая методика и решение задач оптимального быстродействия

Теория оптимальных систем вначале развивалась как теория систем, оптимальных по быстродействию. Оптимальные по быстродействию системы стали первоочередным объектом исследования из-за их практической важности и поэтому сейчас они исследованы наиболее полно.

оптимальное быстродействие закон управление

Задачи оптимального управления - это вариационные задачи. Но классическое вариационное исчисление имеет ряд недостатков. Во-первых, искомая функция, описывающая управляющее воздействие, должна относиться к классу непрерывных, в то время как в практических задачах управляющие функции часто носят релейный или другой кусочно-непрерывный характер. Во-вторых, координаты объекта также могут как быть ограниченными, так и иметь разрывы, что обязательно нарушит требование непрерывности функции. В-третьих, для некоторых функционалов не удается составить уравнение Эйлера, в то время как точно известно, что решение оптимальной задачи существует.

В 50-х годах 20 века академиком Понтрягиным был предложен новый метод решения задач оптимального управления, названный принципом максимума. Этот метод, являясь дальнейшим развитием вариационного исчисления, в большинстве случаев оказывается наиболее удобным для решения практических задач оптимизации.

Задачу оптимизации по быстродействию можно в общем случае сформулировать следующим образом. Пусть в n-мерном фазовом пространстве заданы точки и . Среди всех допустимых управляющих воздействий , которые переводят систему из положения в положение нужно найти такое, которое минимизирует функционал , а значит обеспечивает переход системы в новое состояние за минимальное время. Для этого вводят дополнительную координату

(1.13)

В результате система (1.3) приобретет размерность n +1 и будет иметь вид

(1.14)

В принципе максимума используются вспомогательные переменные состояния Ш0, Ш1… Шn. Функция, которая объединяет вспомогательные переменные {Шi} и систему (1.14) называется функцией Гамильтона. Общий вид функции таков:

(1.15)

Система уравнений, отражающая при помощи функции Гамильтона зависимость переменных состояния {xi} и вспомогательных переменных состояния {Шi}, будет выглядеть следующим образом:

(1.16)

Пусть уравнение объекта управления имеет вид:

(1.17)

По формуле (1.15) составим гамильтониан

(1.18)

Согласно принципу максимума управление будет оптимальным, если функция становится максимальной, то есть

.

Поскольку находится максимум гамильтониана относительно управления , то достаточно максимизировать только те слагаемые, в которые оно входит:

.

На практике управляющее воздействие всегда ограничено величиной

(1.19)

Ясно, что с учетом (1.19) оптимальное управление будет обеспечено при условии максимальных знакопериодичных воздействий

(1.20)

Искомое, оптимальное по быстродействию, управление оказывается кусочно-непрерывным.

Так как объект управления описывается дифференциальным уравнением

,

то функция Гамильтона указанного объекта управления примет вид

Из условия максимума функции Н вдоль оптимальной траектории находим оптимальное управление

Как видно, оптимальное по быстродействию управление оказывается кусочно-непрерывным, как это показано на рис.1.1 Функция на своем протяжении имеет разрывы первого рода в точках, где превращается в ноль. Эти точки называются моментами переключения и между ними (время между соседними точками переключения будем называть интервалами управляющего воздействия или интервалами управления) оптимальное управление должно поддерживаться на своем граничном максимальном уровне. Основной задачей оптимального управления является определение количества интервалов управления и их длительности.

Размещено на http://www.allbest.ru/

Рис.1.1 - Вид управляющего воздействия, его влияние на изменение координат

Из вспомогательной системы уравнений относительно вектор-функции

можно получить дифференциальное уравнение, согласно которому будет определяться вид и число интервалов управляющего воздействия

Так как это уравнение во многом похоже на дифференциальное уравнение объекта управления (1.7), то для его решения можно использовать корни характеристического уравнения объекта управления. От вида корней будет зависеть общий вид функции Ш2 (t), а значит и количество интервалов управления.

Характеристическое уравнение для (1.7) и его корни выглядят следующим образом:

Так как в данном случае корни характеристического уравнения являются комплексными числами, то на конечном интервале времени функция Ш2 (t) будет пересекать ось времени ограниченное количество раз, но установить это количество моментов переключения в общем случае невозможно, так как оно зависит от граничных значений регулирования щ0 и щk (значений x10 и x20 в фазовых координатах).

Однако известно, что при ограничении значений регулирования и и релейном законе управления количество интервалов закона оптимального управления по быстродействию не превышает двух. На первом интервале , а на втором .

Для первого интервала управления :

(1.21)

(1.22)

Так как , то

Из второго уравнения для получаем , а значит . В результате после подстановки коэффициентов уравнения (1.21) и (1.22) принимают вид:

(1.23)

(1.24)

Для определения переменных состояния на втором интервале управления используется принцип обратного движения, который заключается в рассмотрении движения точки фазовых координат объекта от конца его траектории к началу, что позволяет использовать для вычислений конечные координаты объекта управления как начальные координаты интервала управления. Но после проведения необходимых вычислений нужно изменить знак времени t на противоположный для сохранения правильного направления движения.

В результате для второго интервала управления :

(1.25)

(1.26)

Так как , то

Из второго уравнения для получаем , а значит . В результате после подстановки коэффициентов и изменения знака времени t на противоположный уравнения (1.25) и (1.26) принимают вид:

(1.27)

(1.28)

При изменении величины управляющего воздействия с на координаты x1 (t) и x2 (t) не получают разрыва, так как не могут измениться мгновенно. Если длительность первого интервала управления обозначить как t1, а длительность второго интервала - t2 и подставить время t1 в уравнения (1.23) и (1.24), а время t2 - в уравнения (1.27) и (1.28), то мы получим возможность приравнять соответствующие уравнения обоих интервалов управления, так как в этом случае оба набора уравнений будут описывать одну и ту же точку фазового пространства - момент переключения, в котором происходит изменение закона управляющего воздействия с на .

Составим систему уравнений для определения интервалов t1 и t2.

Так как эти уравнения являются трансцендентными, то решить их аналитически в общем случае не представляется возможным. Для решения подобных уравнений необходимо использовать численные методы. В пакете MatLab существует целый набор функций, использующих для решения уравнений численные методы. Для решения системы уравнений и определения временных интервалов оптимального управления используем функцию fsolve ().

Эта функция позволяет найти решение уравнений и систем уравнений любого вида (как линейных, так и нелинейных). Уравнения обязательно должны быть приведены к виду F (x1…xn) = 0, то есть в правой части уравнений обязательно должен быть нуль. Для получения результатов расчета системы необходимо вызвать функцию следующим образом:

[T] = fsolve (@Nekit_func1, [0,0], foptions), (1.29)

Где @Nekit_func1 - ссылка на М-функцию, в которой указывается уравнение или система уравнений, подлежащие решению.

[0,0] - массив начальных приближений, используемый для расчета неизвестных системы; количество значений соответствует количеству неизвестных.

foptions - переменная системы, используемая для внутренних расчетов

[T] - матрица выходных данных, в которую будут помещены результаты расчета; количество элементов соответствует количеству неизвестных системы.

Решаемая система уравнений указана в М-функции Nekit_func1, записанной в одноименном М-файле Nekit_func1. m. Текст функции Nekit_func1:

function F = Nekit_func1 (T)

x11=exp (-0.5*T (1)). * (1.8*cos (0.76*T (1)) +1.184*sin (0.76*T (1))) - 1;

x21=-1.96*exp (-0.5*T (1)). *sin (0.76*T (1));

x12=exp (0.5*T (2)). * (-1.8*cos (0.76*T (2)) +1.184*sin (0.76*T (2))) +1;

x22=-1.96*exp (0.5*T (2)). *sin (0.76*T (2));

F = [x11-x12;

x21-x22];

Здесь x11 и x21 - функции x1 (t) и x2 (t) на первом интервале управления

x12 и x22 - функции x1 (t) и x2 (t) на втором интервале управления

Т (1) и Т (2) - соответственно первый и второй интервалы времени, записываемые в элементы матрицы Т; индексы матрицы указываются в скобках.

В результате выполнения функции fsolve () вида (1.29) получен следующий результат: Т (1) =2.2356 и Т (2) = 0.3608.

Это значит, что длительность первого интервала управления t1 = 2.235, а длительность второго интервала t2 = 0.3608.

Проверка результата: подставим значения t1 и t2 в выражение

>> T1=2.2356;

>> T2 = 0.3608;

>> x11=exp (-0.5*T1). * (1.8*cos (0.76*T1) +1.184*sin (0.76*T1)) - 1

x11 = - 0.6913

>> x12=exp (0.5*T2). * (-1.8*cos (0.76*T2) +1.184*sin (0.76*T2)) +1

x12 = - 0.6913

>> x21=-1.96*exp (-0.5*T1). *sin (0.76*T1)

x21 = - 0.6357

> x22=-1.96*exp (0.5*T2). *sin (0.76*T2)

x22 = - 0.6357

Фазовые траектории имеют следующий вид:

Рисунок 1.2 - Фазовые траектории

Фазовые траектории были рассчитаны по следующему сценарию:

T1 = - 1: 0.01: 3;

T2 = - 1: 0.01: 3;

x11=exp (-0.5*T1). * (1.8*cos (0.76*T1) +1.184*sin (0.76*T1)) - 1;

x12=exp (0.5*T2). * (-1.8*cos (0.76*T2) +1.184*sin (0.76*T2)) +1;

x21=-1.96*exp (-0.5*T1). *sin (0.76*T1);

x22=-1.96*exp (0.5*T2). *sin (0.76*T2);

plot (x11,x21)

hold on

plot (x12,x)

Делись добром ;)