Нейронное робастное управление для возмущенных крановых систем

 

Авторы статьи: Hyun Cheol Cho, M. Sami Fadali, Young Jin Lee, Kwon Soon Lee

Авторы перевода: Зайцев Е.В., Бажутин Д.В.

Источник: Journal of Mechanical Science and Technology (KSME Int. J.), Vol. 20, No. 5, pp. 591-601, 2006

 

В этой статье мы представляем новую методологию управления для возмущенных крановых систем. Нелинейные крановые системы преобразуются в линейные модели с помощью линеаризации обратной связи. Для расчёта параметров контуров регулирования силы с ПД-регуляторами применяются уравнения обратной задачи динамики. Параметры ПД-регуляторов выбираются на основе номинальной модели и поэтому не являются оптимальными для конкретной возмущенной системы. Для достижения желаемого качества переходных процессов с или без учета возмущающего воздействия мы строим вспомогательный регулятор на основе нейронной сети, чтобы компенсировать ошибки моделирования и помехи. Полное управляющее воздействие представляет собой сумму номинального ПД-регулятора и нейронного вспомогательного регулятора. Нейронная сеть итерационно обучается на возмущенной системе до достижения приемлемого качества регулирования. Мы применяем предложенную схему управления для крановых систем с двумя и тремя степенями свободы с известными ограничениями на массу груза. Эффективность такого подхода к управлению продемонстрирована численно в результате компьютерного моделирования.

 

Ключевые слова: системы управления краном, нейронная сеть, возмущающее воздействие

 

1. Введение

 

Механические краны широко используются в промышленности для перемещения тяжелых объектов. Цель управления краном состоит в размещении объекта в желаемом положении в течение заданного интервала времени и с заданными граничными значениями погрешности. Исследования в моделировании и управлении крановых систем были обширными и недавно привели к реализации сложных систем крана. В частности, были разработаны и успешно внедрены в производство усовершенствованные стратегии управления для нескольких видов крановых систем.

Yu и др. использован метод управления с разделением по временной шкале для мостовой крановой системы, в которой применялась линеаризованная модель, чтобы описать ошибку динамики (Yu и др., 1995). Yoshida и др. предложен подход насыщающего регулирования, основанный на обеспечении заданного функционала качества управления для линеаризованной модели крана (Yoshida и Kawabe, 1992). Моделирование приближённой крановой системы для получения информации о точной модели и синтеза адаптивного регулятора исследовалось Martindale и др. (1995). Moustafa и Ebeid разработана нелинейная динамическая модель системы мостового крана и применено линейное управление с обратной связью на основе линеаризованных уравнений пространства состояния (Moustafa и Ebeid, 1988). Lee исследовано нелинейное моделирование системы мостового крана с использованием нового алгоритма определения угла отклонения груза от вертикали и методологии управления гашением колебаний для несвязных линеаризованных динамических характеристик (Lee, 1998). Более продвинутые исследования по нелинейной динамике крановых систем были также рассмотрены совсем недавно. Fantoni и др. предложен пассивный контроллер для не полностью управляемой системы крана с использованием основанной на энергии нелинейной схемы управления (Fantoni и др., 2000). Fang и др. исследован основанный на энергии подход к управлению мостовым краном, в котором для увеличения сопряжения между положением портала и груза в микропроцессорное устройство вводились дополнительные нелинейные термы (Fang и др., 2001). Подход привел к значительному улучшению переходной характеристики.

Большинство имеющихся методологий управления краном, как правило, основываются на линеаризованной модели системы, и немногие исследователи обращались к вопросам робастности или адаптации системы управления. Погрешности или возмущения модели на практике неизбежны, и приводят к возникновению неизвестных отклонений от номинальной модели крана. Тем не менее, некоторые знания о возмущениях известны на практике. Основываясь на этой информации, необходимо синтезировать робастный регулятор для крана. Однако, наличие неопределенностей или неполной информации о возмущениях осложняет разработку и реализацию контроллера.

Мы предлагаем разработку корректирующего регулятора для возмущенных крановых систем с использованием нейронной сети в дополнение к номинальному ПД-регулированию. Сначала получаем ПД-регулятор для номинальной динамики установки, используя обратную задачу динамики и линеаризацию обратной связи (Hunt и Meyer, 1983). Подбор параметров ПД-регулятора выполняется для номинальной модели установки и может работать плохо при наличии возмущений. Далее, мы разрабатываем вспомогательный регулятор на основе нейронной сети для корректировки ошибок, связанных с возмущением в модели. Управляющий вход определяется суммой выходов нейронного и номинального ПД-регуляторов. Нейронная сеть итерационно обучается на возмущенных моделях крановой системы, в которых параметры системы произвольно варьируются в известных пределах. В данной работе мы принимаем изменение массы полезной нагрузки в качестве возмущения системы. Это предположение верно, поскольку масса груза для крана неизвестна априори. Для оценки предлагаемой схемы управления, моделируются крановые системы с двумя и тремя степенями свободы, а качество регулирования сравнивается с номинальным управлением для возмущенных систем без коррекции по возмущению.

Оставшаяся часть работы организована следующим образом. В разделе II представлен синтез регулятора с использованием линеаризации обратной связи и нейронной сети. Крановые модели с двумя и тремя степенями свободы  и предлагаемая схема управления, применяемая к ним, приведены в разделах III и IV соответственно. Некоторые результаты моделирования показаны и описаны в разделе V. Наконец, наш вывод содержится в разделе VI.

 

2. Синтез регулятора крановых систем

 

В этом разделе мы приводим синтез регулятора, основанный на линеаризации обратной связи, для крановых систем. Будем считать, что уравнение движения для крана имеет вид:

где  – матрица инерции,  – центростремительная матрица Кориолиса,  – терм сил гравитации,  – входной вектор,  – вектор состояния. Для уравнения динамики (1) по Лагранжу (Slotine и Li, 1991) мы применяем к уравнению системы простое линейное преобразование обратной связи для вычисления входного вектора. Уравнения обратной задачи динамики дают следующее выражение для входного вектора:

где вектор состояния скорости  предполагается измерять на практике системами датчиков. В уравнении (2) u это новый входной вектор управления, который приводит к линейной модели . Зададимся следующей структурой ПД-регулятора:

где Kp – матрица коэффициентов пропорциональной, а Kd – матрица коэффициентов дифференцирующей компоненты регулятора, e – вектор ошибки, и  – вектор его производных. При условии постоянства опорного вектора его производная равна нулю. Подставляя управляющее воздействие u из уравнения (3) в линейное уравнение динамики  получим номинальную динамику замкнутого контура:

где r – опорный вектор. Подбираем матрицы регулятора Kp и Kd так, чтобы присвоить собственным числам уравнения (4) значения, которые обеспечивают желаемое время отклика. На рис. 1 показана схема линеаризации обратной связи для крановых систем.

 

 

Рис. 1 – Схема управления для крановых систем с линеаризацией обратной связи

 

2.1 Возмущение системы

Входной вектор в уравнении (2) получен в предположении, что динамическая модель системы в уравнении (1) является точной. На практике, однако, это предположение редко является действительным из-за ошибок моделирования, изменений в окружающей среде т.д. Таким образом, регулятор, построенный с использованием номинальной модели, на практике может работать плохо, и требуется компенсация возмущений в модели. Добавляя корректирующий входной вектор управления Δu в уравнение (2), мы выражаем вход возмущенной системы как:

Несмотря на то, что возмущения, как правило, неизвестны до реализации, некоторая информация такая, ​​как верхние и нижние пределы изменения параметров обычно доступны. В данной работе мы предполагаем, что пределы возмущений известны, и используем их для разработки простого вычисления корректирующего управления Δu. Рис. 2 иллюстрирует нашу нейронную сеть для управления возмущением в крановых системах. Общий сигнал управления представляет собой сумму номинального входа и корректирующего входа из нейронной сети.

 

 

Рис. 2 – Робастное управление для крановых систем с помощью нейронной сети

 

2.2 Регулятор на основе нейронной сети

Мы используем нейронную сеть для расчета корректирующего сигнала управления Δu. Нейронная сеть итерационно обучается минимизировать указанную целевую функцию в модели возмущенной системы, в которой величина возмущения изменяется в известном пределе для каждого периода обучения. Предлагаемая нейронная сеть состоит из однослойного персептрона, показанного на рис. 3.

 

 

Рис. 3 – Схема нейронной сети

 

На рис. 3 входные сигналы – это вектора ошибки системы, а выходные сигналы – корректирующий вход, который выражается в виде:

где φ является функцией активации, а wji и bj обозначают весовые коэффициенты и смещения соответственно. Обучение сети состоит в выборе оптимальных значений весов и смещений с использованием соответствующего метода оптимизации данной целевой функции. Определим целевую функцию как:

и отрегулируем веса и смещения, используя алгоритм градиентного спуска:

где k обозначает дискретное число итераций и i, j=1,…, n. С помощью правила дифференцирования для вычисления частных производных в правой части уравнений (8) и (9), получаем:

где мы для простоты линейно аппроксимировали матрицу Якоби системы за счет приращения значения входного и выходного сигнала системы (Guez и др., 1988). Наконец правила корректировки весов и смещений задаются:

 

3. Крановая система с двумя степенями свободы

 

Рассмотрим сначала стандартную крановую систему с двумя степенями свободы, которая состоит из двух поступательно и вращательно движущихся частей. Модель системы показана на рис. 4.

 

 

Рис. 4 – Крановая система с двумя степенями свободы

 

Уравнения движения этой системы:

где mt – масса крана, mp – масса груза, L – длина троса, g – гравитационная постоянная, f – скаляр силы, приложенной к крановой системе, координаты x и θ – положение тележки и угловое отклонение относительно вертикали соответственно. На практике масса крана по существу постоянна, а масса груза изменяется в пределах ограниченного диапазона, когда меняется груз на кране.

 

3.1 Синтез регулятора

Основываясь на уравнении (3), ПД-регулятор для данной системы описывается выражением:

где ex=xrx, в котором rx – эталонное положение, и eθ=θ в связи с нулевым опорным углом. Мы просто определяем диагональную матрицу параметров как Kp=diag(kpx, kpθ) и Kd=diag(kdx, kdθ). Применяя ПД-регулирование входной скаляр, сформированный в уравнении обратной задачи динамики, выражается через:

где  и . Приложенная сила, включая выражение корректирующего сигнала, находится по формуле:

где Δux и Δuθ вычисляются нейронной сетью, показанной на рис. 3, как указано в разделе II. В этом случае входными сигналами сети являются ex и eθ, а выходными – сигналы Δux и Δuθ.

 

4. Крановая система с тремя степенями свободы

 

В этом разделе мы рассмотрим не полностью управляемый мостовой кран с тремя степенями свободы и двумя внешними входами (Fang и др., 2003). На рис. 5 показана модель системы, и её уравнением динамического движения является:

 

 

Рис. 5 – Крановая система с тремя степенями свободы

 

В уравнении (19) матрица инерции M имеет вид:

и центростремительная матрица Кориолиса V задаётся:

где mc – масса тележки, входные силы fx и fy, воздействующие на тележку и мост. Система координат такова: x, положение по оси x, и y, положение по оси y. θ является углом отклонения груза относительно вертикали, и ϕ является проекцией угла отклонения груза относительно оси x. Другие обозначения в формулах (19)-(21) являются идентичными таковым в уравнениях (14) и (15) для модели крановой системы с двумя степенями свободы. Сделаем несколько предположений относительно крана с тремя степенями свободы. Во-первых, груз и тележка связаны жёстким и безмассовым соединением. Во-вторых, переменные состояния и их производные измеримы. В-третьих, масса тележки и длина троса известны точно. В-четвертых, трение в шаровом шарнире, который связывает груз с тележкой, игнорируется, и это соединение не вращается относительно соединительного троса. Наконец, θ находится в пределах: – π < θ < π.

 

4.1 Синтез регулятора

Как и в уравнении (16), выбирается вектор ПД-управления с диагональной матрицей параметров, и управляющий вход равен:

где ex=xrx, ey=yry, eθ=θ и eϕ=ϕ для нулевых опорных углов. Входные силы, приложенные к крану, вычисляются с использованием управляющего вектора из уравнения (19) как:

Входы управления возмущением:

где входы управления возмущением вычисляются нейронной сетью, чьими входами являются ex, ey, eθ и eϕ, а выходами – Δux, Δuy, Δuθ и Δuϕ.

 

5. Примеры моделирования и результаты

 

Мы моделировали два крановые системы, представленные в разделах II и III, с номинальным ПД-регулятором и корректирующим регулятором на основе нейронной сети с помощью MATLAB©. Каждая система была промоделирована в трех случаях. Во-первых, номинальные системы были смоделированы с применением ПД-регуляторов, параметры которых выбраны из нескольких экспериментов с использованием номинальных моделей. Во-вторых, мы использовали ПД-регуляторы с крановыми моделями, в которых масса груза меняется произвольно, приводя к недопустимому качеству регулирования. Наконец, приняли корректирующую нейронную сеть совместно с номинальным ПД-регулятором для кранов и сравнили результаты с номинальным управлением. Пример I является примером моделирования крановой системы с двумя степенями свободы и пример II – для системы с тремя степенями свободы.

 

Пример I-1: В этом примере моделируется номинальная модель крана с двумя степенями свободы при ПД-регулировании. Значения параметров крановой системы: mp = 160 кг, mc = 23 кг, L = 2,5 м и I = 1,5 кг∙м2. Мы используем контрольный интервал времени [0, 20] сек. и опорное (желаемое) положение rx = 10 м. Таким образом, целью управления является достижение краном опорного положения в течение этого интервала времени. Итерационное моделирование показало, что лучшее качество управления было достигнуто со следующими значениями параметров ПД-регулятора: kpx = 1,23, kpθ = 0,51, kdx = 2,18 и kdθ = 0,28. На рис. 6 показаны графики положения крана и угла отклонения, а также график управляющего воздействия. В переходном процессе по положению присутствует небольшое перерегулирование в момент времени около 3,5 сек., после чего сигнал достигает желаемого положения в интервале [0, 20] сек., что говорит о выполнении требований к управлению. В реакции угла отклонения на переходной характеристике имеет место недоход до заданной величины так же, как и перерегулирование, и система успокаивается примерно через 6,2 сек. Таким образом, качество системы управления является удовлетворительным, и параметры регулятора являются подходящими для номинальной системы.

 

 

Рис. 6 – Графики движения системы и входного сигнала (пример I-1)

 

Пример I-2: Смоделирована возмущенная система с ПД-регулятором, использованным в примере I-1. При возмущении системы масса груза из 5000 кг возрастает, т.е. mp = 5160 кг, которая является максимально допустимой для этой системы. Используется сценарий моделирования, идентичный примеру I-1. Рис. 7 иллюстрирует реакции системы и входной сигнал. Как и ожидалось, мы видим из результатов, что быстродействие является неудовлетворительным, и переходные процессы по положению и углу не завершаются в течение указанного промежутка времени. Более того, величина сигнала управления в среднем больше, чем в примере I-1. Следовательно, параметры регулятора, которые были выбраны для номинальной модели, не подходят для возмущенной системы.

 

 

Рис. 7 – Графики движения системы и входного сигнала (пример I-2)

 

Пример I-3​​: В этом примере, построена нейронная сеть, как описано в Разделе II, и в той же среде смоделирована возмущенная система с нейронным регулятором, а также с номинальным ПД-регулированием. Начальные значения весов и смещений были выбраны случайным образом с помощью равномерного распределения на промежутке [–0.5, 0.5] и использована биполярная сигмоидальная функция активации. Сеть итерационно обучалась на возмущенной системе, в которой масса полезной нагрузки изменяется в диапазоне [160, 5, 160] кг для каждого периода обучения. График положения крана и угла отклонения, а также выходы ПД- и нейронного регуляторов приведены на рис. 8. Результаты показывают, что качество регулирования улучшилось, а положение и угол достигают желаемых значений в течение установленного интервала времени. Что касается управляющих входов, величина составляющей ПД-регулирования сначала увеличивается до большого положительного значения около времени (достижения) максимума, но нейронный регулятор дает относительно небольшие отрицательные значения. Мы интерпретируем это, как корректирующее действие нейронной сети для улучшения качества управления.

 

 

Рис. 8 – Графики движения системы и входных сигналов (пример I-3)

 

Пример II-1: В этом примере моделируется крановая система с тремя степенями свободы так же, как в примере 1. Значения параметров системы такие же, как в системе с двумя степенями свободы, и масса моста составляет mr = 190 кг. Задания на положения rx = 10 м и ry = 3 м. Матрицы параметров ПД-регулятора для номинальной системы выбраны как Kp=diag{0.1, 0.25, 0.5, 0.35} и Kd=diag{0.35, 0.5, 0.8, 0.73}. На рис. 9 показаны графики положения и угла для номинальной системы с ПД-регулированием. Два графика положения имеют около 20% и 17% перерегулирования в переходном периоде соответственно, но оба достигают заданного значения примерно за 30 сек. Два графика угла имеют приемлемые переходные характеристики и сходятся к установившемуся режиму.

 

 

Рис. 9 – Графики движения системы и входных сигналов (пример II-1)

 

Пример II-2: Моделируется кран с возмущением относительно массы полезной нагрузки mp = 5160 кг и с номинальным ПД-управлением. Другие значения параметров и значения ПД-регулятора установлены, как в примере II-1. Результаты моделирования, как показано на рис. 10, указывают на неудовлетворительную работу. Очевидно, что значения параметров регулятора должны быть перенастроены для достижения желаемого качества регулирования.

 

 

Рис. 10 – Графики движения системы и входных сигналов (пример II-2)

 

Пример II-3: Составлена возмущенная система из регулятора на основе нейронной сети вместе с номинальным ПД-регулированием. Нейронная сеть спроектирована и обучена аналогично и с теми же настройками, что и для крана с двумя степенями свободы. Результаты моделирования (рис. 11) иллюстрируют положения и углы крана, на которых качество управления явно улучшилось. Перерегулирования и времена регулирования на графиках значительно уменьшились, и колебания и величины в динамике угла соответственно уменьшились. Временные диаграммы переходных процессов управляющих воздействий приведены на рис. 12. Мы, наконец, по результатам моделирования заключаем, что корректирующее управление на основе нейронной сети значительно улучшает качество регулирования для возмущенной системы.

 

 

Рис. 11 – Графики движения системы (пример II-3)

 

 

Рис. 12 – Графики входных сигналов (пример II-3)

 

6. Выводы

 

Мы предлагаем новое робастное управление для возмущенных систем крана с помощью нейронной сети. Мы синтезируем ПД-регулятор для номинальной модели крана, затем создаем нейронную сеть для компенсации возмущений в модели. Управляющий вход в случае с возмущенной системой состоит из выходов ПД- и корректирующего нейронного регуляторов. Были смоделированы и численно проанализированы крановые системы с двумя и тремя степенями свободы с предлагаемым управлением, в которых масса груза менялась. Из анализа можно заключить, что корректирующий компонент управляющего воздействия необходимо вводить в случае наличия в системе возмущений с целью достижения желаемого качества регулирования. При корректирующем управлении переходные характеристики кранов значительно улучшились. Перерегулирования по положениям крана и углам груза уменьшились, а времена регулирования этих координат значительно сократились. В будущей работе мы будем рассматривать более общие возмущения в модели крана и развивать нейронное управление соответствующим образом. Мы также рассмотрим устойчивость возмущенной системы управления с использованием теории устойчивости Ляпунова (Khalil, 1996).

 

Благодарности

 

Работа выполнена при поддержке Национальной программы лабораторных исследований корейского Министерства науки и технологий (MOST).

 

Литература

 

Fang, Y., Zergeroglu, E., Dixon, W. E. and Dawson, D. M., 2001, “Nonlinear Coupling Control Laws for an Overhead Crane System,” Proc. of IEEE Conference on Control Applications, pp. 639-644.

Fang, Y., Dixon, W. E., Dawson, D. M. and Zergeroglu, E., 2003, “Nonlinear Coupling Control Laws for an Underactuated Overhead Crane System,” IEEE/ASME Trans. on Meachatronics, Vol. 8, No. 3, pp. 418-423.

Fantoni, I., Lozano, R. and Spong, M. W., 2000, “Energy Based Control of the Pendubot,” IEEE Trans. on Automatic Control, Vol. 45, pp. 725-729.

Guez, A., Eilbert, J. L. and Kam, M., 1988, “Neural Network Architecture for Control,” IEEE Control Systems Magazine, Vol. 8, No. 2, pp. 22-25.

Hunt, L. R. and Meyer, G., 1983, “Global Transformations of Nonlinear Systems,” IEEE Trans. on Automatic Control, Vol. 28, No. 1, pp. 24-31.

Khalil, H. K., 1996, Nonlinear Systems, Prentice Hall, New Jersey.

Lee, H., 1998, “Modeling and Control of a Three-Dimensional Overhead Cranes,” Journal of Dynamic Systems, Measurement, and Control, Vol. 120, pp. 471-476.

Martindale, S. C., Dawson, D. M., Zhu, J. and Rahn, C., 1995, “Approximate Nonlinear Control for a Two Degree of Freedom Overhead Crane: Theory and Experimentation,” Proc. of American Control Conference, pp. 301-305.

Moustafa, K. A. F. and Ebeid, A. M., 1988, “Nonlinear Modeling and Control of Overhead Crane Load Sway,” Journal of Dynamic Systems, Measurement, and Control, Vol. 110, pp. 266­271.

Slotine, J. E. and Li, W., 1991, Applied nonlinear control, Prentice Hall, New Jersey.

Yoshida, K. and Kawabe, H., 1992, “A Design of Saturating Control with a Guaranteed Cost and its Application to the Crane Control Systems,” IEEE Trans. on Automatic Control, Vol. 37, pp. 121-127.

Yu, J., Lewis, F. L. and Huang, T., 1995, “Nonlinear Feedback Control of a Gantry Crane,” Proc. of American Control Conference, pp. 4310-4315.