Реферат по теме выпускной работы
При написании данного реферата магистерская работа еще не завершена. Окончательное завершение: май 2020 года. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.
Содержание
- Введение
- 1. Актуальность темы
- 2. Виды искусственных нейронных сетей
- 3. Способы обучения нейронных сетей
- 3.1 Обучение с учителем
- 3.2 Обучение с частичным привлечением учителя.
- 3.3 Обучение с подкреплением
- 3.4 Обучение без учителя
- Выводы
- Список источников
Введение
Нейронные сети – это одно из направлений исследований в области искусственного интеллекта, направленное на воспроизведение нервной системы человека. А именно: способность нервной системы обучаться и исправлять ошибки.
Нейронные сети (искусственная нейронная сеть) — это система соединенных и взаимодействующих между собой п ростых процессоров. Такие процессоры обычно довольно просты. Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. И, тем не менее, будучи соединёнными в достаточно большую сеть с управляемым взаимодействием, эти процессоры вместе способны выполнять довольно сложные задачи.
1. Актуальность темы
Преимущество искусственных нейронных сетей большого размера над классическими кодами с обнаружением и исправлением ошибок обусловлено тем, что они в момент обучения способны учитывать реальные распределения многомерных вероятностей биометрических данных, тогда как все классические коды с обнаружением и исправлением ошибок строились в гипотезе равновероятного распределения ошибок.
2. Виды искусственных нейронных сетей
Нейросеть состоит из двух основных слоёв - принимающего (он же и распределительный) сигналы и обрабатывающего. Однако, если нейронная сеть состоит только лишь из этих двух слоев - то она однослойная, если слоев больше, то многослойная [1].
Однослойная ИНС (рис.1) - входящие сигналы сразу передаются с входного слоя на выходной, который обрабатывает их и выдает готовый результат. На изображении распределяющий слой изображен кружочками, а обрабатывающий - квадратиками.
Многослойная ИНС (рис.2) - сеть, которая состоит из входного, скрытого и обрабатывающего слоев. Сигнал с распределяющего слоя частично обрабатывается скрытым слоем, после чего передается на последний слой нейронов, вычисляющий конечный результат.
Скрытые слои ИНС ученые научились обучать совсем недавно и это большой шаг вперед, поскольку многослойные нейросети существенно превосходят по производительности и возможностям однослойные.
Сети работают в двух направлениях - прямое распределение и обратное. ИНС прямого распределения дают возможность решать с успехом большинство задач: прогнозирование, кластеризация и распознавание. В таких нейросетях сигнал передается только вперед, назад он возвращаться не имеет возможности..
В подобных сетях часть сигнала от нейронов может быть возвращена назад и такой принцип работы существенно расширяет возможности нейросетей. Такие ИНС могут обладать кратковременной памятью как у человека. (рис.3)
3. Способы обучения нейронных сетей
3.1 Обучение с учителем
Обучение с учителем (supervised learning) предполагает наличие полного набора размеченных данных для тренировки модели на всех этапах ее построения.
Наличие полностью размеченного датасета означает, что каждому примеру в обучающем наборе соответствует ответ, который алгоритм и должен получить. Таким образом, размеченный датасет из фотографий цветов обучит нейронную сеть, где изображены розы, ромашки или нарциссы. Когда сеть получит новое фото, она сравнит его с примерами из обучающего датасета, чтобы предсказать ответ [2].
В основном обучение с учителем применяется для решения двух типов задач: классификации и регрессии.
В задачах классификации алгоритм предсказывает дискретные значения, соответствующие номерам классов, к которым принадлежат объекты. В обучающем датасете с фотографиями цветов каждое изображение будет иметь соответствующую метку — «ромашка», «роза» или «лютик». Качество алгоритма оценивается тем, насколько точно он может правильно классифицировать новые фото с ромашками и черпахами.
Задачи регрессии связаны с непрерывными данными. Один из примеров, линейная регрессия, вычисляет ожидаемое значение переменной y, учитывая конкретные значения x.
3.2 Обучение с частичным привлечением учителя [3].
Обучение с частичным привлечением учителя (semi-supervised learning) характеризуется своим названием: обучающий датасет содержит как размеченные, так и неразмеченные данные. Этот метод особенно полезен, когда трудно извлечь из данных важные признаки или разметить все объекты – трудоемкая задача.
Этот метод машинного обучения распространен для анализа медицинских изображений, таких как сканы компьютерной томографии или МРТ. Опытный рентгенолог может разметить небольшое подмножество сканов, на которых выявлены опухоли и заболевания. Но вручную размечать все сканы — слишком трудоемкая и дорогостоящая задача. Тем не менее нейронная сеть может извлечь информацию из небольшой доли размеченных данных и улучшить точность предсказаний по сравнению с моделью, обучающейся исключительно на неразмеченных данных.
Популярный метод обучения, для которого требуется небольшой набор размеченных данных, заключается в использовании генеративно-состязательной сети или GAN.
Представьте себе соревнование двух нейронных сетей, где каждая пытается перехитрить другую. Это GAN. Одна из сетей, генератор, пытается создать новые объекты данных, которые имитируют обучающую выборку. Другая сеть, дискриминатор, оценивает, являются ли эти сгенерированные данные реальными или поддельными. Сети взаимодействуют и циклично совершенствуются, поскольку дискриминатор старается лучше отделять подделки от оригиналов, а генератор пытается создавать убедительные подделки.
3.3 Обучение с подкреплением
Обучение с подкреплением (reinforcement learning) действует по принципу игры, при достижении конкретной цели получает награду. Видеоигры — популярная тестовая среда для исследований.
Агенты ИИ пытаются найти оптимальный способ достижения цели или улучшения производительности для конкретной среды. Когда агент предпринимает действия, способствующие достижению цели, он получает награду. Глобальная цель — предсказывать следующие шаги, чтобы заработать максимальную награду в конечном итоге.
При принятии решения агент изучает обратную связь, новые тактики и решения способные привести к большему выигрышу. Этот подход использует долгосрочную стратегию — так же как в шахматах: следующий наилучший ход может не помочь выиграть в конечном счете. Поэтому агент пытается максимизировать суммарную награду.[4]
Чем больше уровней с обратной связи, тем лучше становится стратегия агента. Такой подход особенно полезен для обучения роботов, которые управляют автономными транспортными средствами или инвентарем на складе.
3.4 Обучение без учителя
Идеально размеченные и чистые данные достать нелегко. Поэтому иногда перед алгоритмом стоит задача найти заранее не известные ответы. Вот где нужно обучение без учителя.
В обучении без учителя (unsupervised learning) у модели есть набор данных, и нет явных указаний, что с ним делать.[5] Нейронная сеть пытается самостоятельно найти корелляции в данных, извлекая полезные признаки и анализируя их.
В зависимости от задачи модель систематизирует данные по-разному
- Кластеризация. Наиболее распространенная задача для обучения без учителя.[6] Алгоритм подбирает похожие данные, находя общие признаки, и группируют их вместе;
- Ассоциации. Нкоторые характеристики объекта коррелируют с другими признаками. Рассматривая пару ключевых признаков объекта, модель может предсказать другие, с которыми существует связь;
- Автоэнкодеры принимают входные данные, кодируют их, а затем пытаются воссоздать начальные данные из полученного кода. Не так много реальных ситуаций, когда используют простой автоэнкодер. Но стоит добавить слои и возможности расширятся: используя зашумленные и исходные версии изображений для обучения, автоэнкодеры могут удалять шум из видеоданных, изображений или медицинских сканов, чтобы повысить качество данных..
В обучении без учителя сложно вычислить точность алгоритма, так как в данных отсутствуют «правильные ответы» или метки. [7] Но размеченные данные часто ненадежные или их слишком дорого получить. В таких случаях, предоставляя модели свободу действий для поиска зависимостей, можно получить хорошие результаты.
Выводы
В статье рассмотрены способы обучения нейронных сетей. Каждый вид обучения имеет свои уникальные особенности, которые нужно учитывать при выборе метода обучения нейронной сети для решения поставленной задачи.
Был выполнен анализ существующих видов искусственных нейронных сетей. А так же приведена структура их реализации.
Список источников
- Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. 1992 г. 236 стр.
- Ежов А. А, Шумский С. А. Нейрокомпьютинг и его применение в экономике и бизнесе. М.: МИФИ, 1998. 224 с..
- Laurene Fausett, Laurene V. Fausett. Fundamentals of Neural Networks: Architectures, Algorithms, and Applications Prentice-Hall, 1994. 461 с..
- Степанов П. П. Искусственные нейронные сети // Молодой ученый. — 2017. — №4. — С. 185-18
- Тадеусевич Р., Боровик Б. Элементарное введение в технологию нейронных сетей с примерами программ. Горячая Линия - Телеком 2111 г. 408с.
- Funahashi K. On the Approximate Realization of Continuous Mappings by Neural Networks. Neural Networks, 1989, v. 2, № 3, pp.183-191.
- Саттон Р., Барто Э., Обучение с подкреплением. Бином. Лаборатория знаний 2017 г. 400 c.