Назад в библиотеку
Обучение нейронной сети с применением генетического алгоритма для прогнозирования свойств чугунов с вермикулярным графитом
Авторы:К.В. Клочкова, С.В. Петрович, В.В. Абрамова
Источник: Клочкова К.В. Обучение нейронной сети с применением генетического алгоритма для прогнозирования свойств чугунов с вермикулярным графитом / Клочкова К.В., Петрович С.В., Абрамова В.В. // Студенческий научный журнал «Грани науки» 2013, Том 1, С.104–107.
Введение
В настоящее время в литейном производстве, в частности при производстве
чугунов, свойства конечных изделий определяются по контрольным образцам, полученным
из соответствующей серии партии деталей. Не существует методик, позволяющих
прогнозировать свойства конечных изделий на основе информации о компонентах. Конечная
концентрация компонентов, а также свойства, зависят от исходных концентраций и
параметров технологического процесса. Следовательно, выявив эти зависимости, становится
возможным прогнозирование свойств конечного продукта на основании данных о
компонентах и параметрах технологического процесса.
Объектом исследования является чугун с вермикулярным графитом (ЧВГ), так как на
данный момент это наиболее популярный и перспективный материал при изготовлении
деталей в машиностроении (картер сцепления, картер делителя передач, блок цилиндров,
картер коробки передач). Перспективы применения чугуна с вермикулярным графитом в
машиностроении обусловлены рядом экономических, технологических и эксплуатационных
преимуществ, в сравнении с традиционными литейными сплавами. Высокие литейные
свойства ЧВГ позволяют производить отливки без усадочных раковин, неметаллических
включений, трещин, других литейных дефектов и с достаточной размерной прочностью [1].
Так как чугун с вермикулярным графитом является модифицированным чугуном, в
машиностроении появилась необходимость разработки интеллектуальной системы
прогнозирования свойств данных материалов на основе комбинированного математического
анализа и разных видов нейронных сетей. Применение элементов искусственного
интеллекта, самообучающихся нейронных сетей и комбинированного математического
анализа позволит увеличить скорость реакции системы на изменение исходных данных.
Применение популярного программного обеспечения снизит себестоимость системы и
упростит требования к машинным ресурсам. Эта система позволит снизить трудоемкость
экспериментальных исследований, повысить качество прогнозирования физико-
механических свойств материалов, что в конечном итоге отразится на качестве и
себестоимости изготавливаемых изделий, за счет возникновения возможности адаптации и
самообучения системы при изменении входных параметров и критериев оценки.
Основная часть
Проектирование системы разбито на два этапа: этап обучения и этап
проектирования. Этап обучения заключается в обучении нейронной сети с помощью
генетического алгоритма (ГА). На сегодняшний день данный способ обучения применяется для решения задачи предсказания фрактальной размерности покрытия при разных режимах
напыления.
Решение задачи прогнозирования свойств ЧВГ связано с некоторыми сложностями. На
практике, как правило, учет влияния каждого компонента потребует проведения большого
количества экспериментальных исследований. С этим в свою очередь связаны
дополнительные расходы на изготовление сплавов из ЧВГ. Разработка математического
описания потребует формализации большого количества нелинейных зависимостей и
ограничений для каждого компонента сплава. Однако подобное математическое описание
возможно реализовать с некоторой степенью точности с помощью нейронных сетей.
Для задачи прогнозирования наиболее оптимальной считается нейронная сеть типа
многослойный персептрон (Рисунок 1). Применение многослойного персептрона (МП)
позволит на основе данных экспериментальных исследований вычислять выходные физико-
механические свойства (предел прочности, твердость и т.д.) для неизвестного сплава ЧВГ.
Прогнозирование будет осуществляться на основе данных о процентном содержании
легирующих элементов в сплаве, толщине стенки и массе отливки.
Рисунок 1 – Структура МП для прогнозирования свойств ЧВГ
Обучение нейронной сети занимает одно из важных этапов ее использования. Основным
достоинством ГА, которое выделяет его из всех остальных, является определение
глобального оптимального решения. В отличие от градиентных методов и обратного
распространения ошибки, ГА не останавливается на локальном оптимальном решении. Его
метод основан на комбинировании множества решений, что позволит более объективно, т.е.
более точно, настроить нейронную сеть для работы.
Задача обучения нейронной сети состоит в минимизации функции ошибки обучения,
которая рассчитывается по формуле 1 [2]:
(1)
- i – номер обучающей выборки;
- j – номер выходного нейрона;
- p – общее количество обучающих выборок;
- m – общее количество выходных нейронов;
- yj(i) – сигнал j-ого выходного нейрона для i-ой обучающей выборки;
- dj(i) – ожидаемое значение i-ой обучающей выборки для j-ого выходного нейрона.
Аналогичную оптимизацию осуществляет алгоритм обратного распространения ошибки.
Но в отличие от генетического алгоритма оптимизация при обратном распространении ошибки происходит по пути наискорейшего спуска, что является причиной
преждевременной локальной сходимости в многоэкстремальной области решения.
Генетический алгоритм лишен такого недостатка. Поиск решения в генетическом алгоритме
осуществляется глобально, позволяя не упустить оптимальное решение. Однако в данном
вопросе важным критерием является численность популяции, а для задачи обучения
нейронной сети также – ограничение максимального и минимального значения параметров
оптимизации. Для оптимизации с помощью ГА были выбраны следующие параметры
нейронной сети:
- весовые коэффициенты синапсов нейронов;
- крутизна функции активации;
- смещение функции активации.
Рисунок 2 – Сигмоидальная функция активации
Для решения задачи прогнозирования используется нейрон с сигмоидальной функцией
активации (см. Рисунок 2). Ограничением использования нейрона подобного типа является
насыщение функции активации при достаточно больших значениях весовых коэффициентов.
Как показали результаты обучения, при использовании значений весовых коэффициентов
порядка единиц и крутизне сигмоидальной активационной функции >1, работоспособность
нейронной сети нарушается из-за высокой выходной ошибки. В связи с этим используемые
весовые коэффициенты необходимо ограничить и искать оптимальное решение с помощью
ГА в диапазоне -3..3.
Для МП применяется обучение с учителем, в котором предполагается наличие обучающей
и контрольной выборки. Размер обучающей выборки составляет примерно 80% от всего
имеющегося множества данных для обучения. Остальные 20% – контрольная выборка,
которая необходима для определения качества обучения нейронной сети. По ней
оценивается успешность обучения, пригодность метода обучения в работе с сетью. Пересчет
нейронной сети осуществляется по заранее определенной структуре нейронной сети для
каждой особи популяции в отдельности.
При использовании генетического алгоритма для настройки нейронной сети используются
следующие определения:
- ген – параметр нейронной сети (весовые коэффициенты нейронов, крутизна или
смещение функции активации);
- хромосома – набор генов (т.е. весовых коэффициентов нейронной сети, считываемых
в определенном порядке сверху вниз, справа налево); каждая хромосома является
возможным решением (т.е. таким набором оптимизируемого параметра нейронной сети, который лучше подходит для прогнозирования свойств ЧВГ);
- популяция – множество хромосом (вариантов настройки сети). ГА должен быть
построен таким образом, чтобы в популяции обязательно имелись элитарные особи
(хромосомы с наибольшей приспособленностью);
- эпоха – итерация, соответствующая созданию нового поколения хромосом [3].
Обучение МП происходит в два этапа:
- Подбор весовых коэффициентов нейронной сети (уровень нейронной сети).
- Оптимизация параметров функции активации (уровень нейронов).
Полученные результаты сравниваются с результатами, содержащимися в базе знаний.
Если такие данные отсутствуют, то проводятся эксперименты. Результаты, полученные в
ходе экспериментов, сравниваются с результатами, полученными при помощи нейронной
сети. Если результаты совпадают, то они записываются в базу знаний. Если результаты не
подтверждаются, то исходные данные корректируются экспертом и весь цикл повторяется.
Процесс проведения экспериментов разделен на несколько этапов. Предварительно
проводится планирование экспериментов по методу комбинационных квадратов, что
позволит сократить их количество в nm-2 раз (m – число факторов, n – число сочетаний
факторов). После проведения эксперимента проводится статистическая обработка
экспериментальных данных по методу комбинационных квадратов, для определения степени
влияния каждого фактора на конечные свойства материала, и корреляционно-регрессионный
анализ, для получения зависимостей элементов друг от друга. Полученные данные
записываются в базу знаний.
После того, как нейронная сеть будет обучена, можно приступать к этапу работы с
системой. Входными параметрами будут являться химические элементы и вид конечного
продукта.
Так как интеллектуальная система состоит из этапов (модулей), то имеется возможность
добавлять или исключать те или иные модули в зависимости от сложности задачи, что
расширяет диапазон применения данной интеллектуальной системы.
Заключение
В работе предложены следующие решения для проектирования
интеллектуальной системы для прогнозирования физико-механических свойств на этапе ее
обучения:
- Для задачи прогнозирования предложено использовать нейронную сеть типа
многослойный персептрон, а также использовать нейрон с сигмоидальной функцией
активации.
- Для многослойного персептрона применяется обучение с учителем, в котором
предполагается наличие обучающей и контрольной выборки. Пересчет нейронной сети
осуществляется по заранее определенной структуре нейронной сети для каждой особи
популяции в отдельности.
- Обучение нейронной сети осуществляется с помощью генетического алгоритма, так как
метод его работы основан на комбинировании множества решений, что позволит более
объективно, т.е. более точно, настроить нейронную сеть для работы.
- Определены этапы обучения многослойного персептрона: подбор весовых
коэффициентов нейронной сети (уровень нейронной сети), оптимизация параметров
функции активации (уровень нейронов).
Список источников
- Мухин Г.Г., Беляков А.И., Александров Н.Н. Стали. Чугуны. Т.II-2. Машиностроение. Энциклопедия. М.: М38 Машиностроение. 2001. 583 с.
- Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика. 2004. 155 с.
- Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком. 2006. 452 c.