Фото Акулова Павла

Акулов Павел Владимирович

Донецкий Национальный Технический Университет
Портал магистров ДонНТУ
Факультет Вычислительной Техники и Информатики

Специальность "Системное программирование"
Группа СП-01м

e-mail : sharkoff@rambler.ru

Тема магистерской работы:
"Решение задач прогнозирования с помощью нейронных сетей"
Руководитель проекта :
зав. каф. ЭВМ проф. Святный Владимир Андреевич


 ::  Биография  ::  Ссылки  ::  Отчет по поиску  ::  Библиотека  ::  Индивидуальное задание  :: 


Автореферат

английская версия

В моей магистерской работе исследуется проблема прогнозирования с помощью использования искусственных нейронных сетей. Практической частью данной работы является создание программы – реализации нейронной сети, и обучение данной нейронной сети. Данными для обучения должны являться временные ряды или значения какой-либо функции.

Актуальность темы
В последнее время наблюдается тендениция возростания интереса к использованию нейронных сетей для решения различных задач и использования их в разных сферах человеческой жизни. С использованием нейронных сетей открылись возможности использования вычислений в сферах, до этого относящихся лишь к области человеческого интеллекта, возможности создания машин, способность которых учиться и запоминать удивительным образом напоминает мыслительные процессы человека.

 Где применяются нейросети?
По утверждению С.А. Шумского, нейросетевые технологии можно использовать почти во всех областях, стоит только проанализировать их в более детальном приближении.

  •  Экономика и бизнес : предсказание рынков, автоматический дилинг, оценка риска невозврата кредитов, предсказание банкротств, оценка стоимости недвижимости, выявление пере- и недооцененных компаний, автоматическое рейтингование, оптимизация портфелей, оптимизация товарных и денежных потоков, автоматическое считывание чеков и форм, безопасность транзакций по пластиковым карточкам. 

    • Программное обеспечение компании RETEK, дочерней фирмы HNC Software, – лидер среди крупных ритейлоров с оборотом свыше $1 млрд. Ее последний продукт января 1998 года Retek Predictive Enterprise Solution включает развитые средства нейросетевого анализа больших потоков данных, характерных для крупной розничной торговли. Он также содержит прогнозный блок, чтобы можно было заранее просчитать последствия тех или иных решений. (http://www.retek.com)

  •  Медицина: обработка медицинских изображений, мониторинг состояния пациентов, диагностика, факторный анализ эффективности лечения, очистка показаний приборов от шумов. 

    •  Группа НейроКомп из Красноярска (под руководством Александра Николаевича Горбаня) совместно с Красноярским межобластном офтальмологическом центром им. Макарова разработали систему ранней диагностики меланомы сосудистой оболочки глаза. Этот вид рака составляют почти 90% всех внутриглазных опухолей и легко диагностируется лишь на поздней стадии. Метод основан на косвенном измерении содержания меланина в ресницах. Полученные данные спектрофотометрии, а также общие характеристики обследуемого (пол, возраст и др.) подаются на входные синапсы 43-нейронного классификатора. Нейросеть решает, имеется ли у пациента опухоль, и если да, то определяет ее стадию, выдавая, кроме этого, процентную вероятность своей уверенности (http://www.chat.ru/~neurocom/).

  •  Авионика: обучаемые автопилоты, распознавание сигналов радаров, адаптивное пилотирование сильно поврежденного самолета. 

    • Компания McDonnell Douglas Electronic Systems разработала автоматический переключатель режимов полета в реальном масштабе времени в зависимости от вида повреждения самолета. Данные от 20 сенсорных датчиков и сигналов от пилота используются нейросетью для выработки около 100 аэродинамических параметров полета. Сильной стороной является возможность сети адаптироваться к непредсказуемым аэродинамическим режимам, таким как потеря части крыла и т.д. (SIGNAL Magazin, февраль 1991)

  •  Связь: сжатие видео-информации, быстрое кодирование-декодирование, оптимизация сотовых сетей и схем маршрутизации пакетов. 

    • Нейросети уже продемонстрировали коэффициент сжатия 120:1 для черно-белого видео. Цветное видео допускает примерно вдвое большую степень сжатия 240:1 за счет специальной схемы кодирования цветов. (http://www.ee.duke.edu/~cec/JPL/paper.html)

  •  Интернет: ассоциативный поиск информации, электронные секретари и агенты пользователя в сети, фильтрация информации в push-системах, коллаборативная фильтрация, рубрикация новостных лент, адресная реклама, адресный маркетинг для электронной торговли.

    • Фирма Autonomy отделилась от родительской фирмы Neurodynamics в июне 1996 года с уставным капиталом $45 млн и идеей продвижения на рынок Internet электронных нейросетевых агентов. Согласно ее пресс-релизу, первоначальные вложения окупились уже через год. Компания производит семейство продуктов AGENTWARE, создающих и использующих профили интересов пользователей в виде персональных автономных нейро-агентов. Такие компактные нейро-агенты(<1 Кб) могут представлять пользователя в любом из продуктов компании. Например, агенты могут служить в качестве нейро-секретарей, фильтруя поступающую по информационным каналам информацию. Они также могут постоянно находиться на сервере провайдера, или посылаться для поиска в удаленных базах данных, осуществляя отбор данных на месте. В будущем, когда эта технология получит достаточное распространение, она позволит снизить нагрузку на трафик Сети. (http://www.agentware.com)

  • Автоматизация производства: оптимизация режимов производственного процесса, комплексная диагностика качества продукции (ультразвук, оптика, гамма-излучение, …), мониторинг и визуализация многомерной диспетчерской информации, предупреждение аварийных ситуаций, робототехника.

    •  Ford Motors Company внедрила у себя нейросистему для диагностики двигателей после неудачных попыток построить экспертную систему, т.к. хотя опытный механик и может диагностировать неисправности он не в состоянии описать алгоритм такого распознавания. На вход нейро-системы подаются данные от 31 датчика. Нейросеть обучалась различным видам неисправностей по 868 примерам. "После полного цикла обучения качество диагностирования неисправностей сетью достигло уровня наших лучших экспертов, и значительно превосходило их в скорости." (Marko K, et. al. , Ford Motors Company, Automative Control Systems Diagnostics, IJCNN 1989)

  • Политические технологии: анализ и обобщение социологических опросов, предсказание динамики рейтингов, выявление значимых факторов, объективная кластеризация электората, визуализация социальной динамики населения. 

    • Уже упоминавшаяся ранее группа НейроКомп из Красноярска довольно уверенно предсказывает результаты президентских выборов в США на основании анкеты из 12 вопросов. Причем, анализ обученной нейросети позволил выявить пять ключевых вопросов, ответы на которых формируют два главных фактора, определяющих успех президентской кампании. Этот пример будет рассмотрен более подробно в главе, посвященной извлечению знаний с помощью нейросетей.

  • Безопасность и охранные системы: системы идентификации личности, распознавание голоса, лиц в толпе, распознавание автомобильных номеров, анализ аэро-космических снимков, мониторинг информационных потоков, обнаружение подделок.

    • Многие банки используют нейросети для обнаружения подделок чеков. Корпорация Nestor (Providence, Rhode Island) установила подобную систему в Mellon Bank, что по оценкам должно сэкономить последнему $500,000 в год. Нейросеть обнаруживает в 20 раз больше подделок, чем установленная до нее экспертная система. (Tearing up the Rules, Banking Technology, ноябрь 1993)

  • Ввод и обработка информации: Обработка рукописных чеков, распознавание подписей, отпечатков пальцев и голоса. Ввод в компьютер финансовых и налоговых документов.

    • Разработанные итальянской фирмой RES Informatica нейросетевые пакеты серии FlexRead, используются для распознавания и автоматического ввода рукописных платежных документов и налоговых деклараций. В первом случае они применяются для распознавания не только количества товаров и их стоимости, но также и формата документа. В случае налоговых деклараций распознаются фискальные коды и суммы налогов.

  • Геологоразведка: анализ сейсмических данных, ассоциативные методики поиска полезных ископаемых, оценка ресурсов месторождений.

    • Нейросети используются фирмой Amoco для выделения характерных пиков в показаниях сейсмических датчиков. Надежность распознавания пиков - 95% по каждой сейсмо-линии. По сравнению с ручной обработкой скорость анализа данных увеличилась в 8 раз. (J.Veezhinathan & D.Wadner, Amoco, First Break Picking, IJCNN, 1990)

Следует также отметить, что большинство тонкостей реализации нейронных сетей разными фирмами и организациями скрываются за коммерческой тайной.

Понятие нейронных сетей
Искусственная нейронная сеть - набор нейронов, соединенных между собой. Искусственный нейрон по своим свойствам напоминает биологический нейрон.

Искусственный нейрон

На вход искусственного нейрона поступает некоторое множество сигналов x1, x2,…, xn, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес w1, w2,…, wn, и поступает на суммирующий блок, обозначенный Σ. Суммирующий блок, соответствующий телу биологического элемента, складывает взвешенные входы алгебраически, создавая выход – NET.
Простейшей нейронной сетью считается персептрон. По своей структуре он аналогичен нейрону, но на его выходах находится некоторый анализатор. И в зависимости от значения сформированной суммы, выходное значение анализатора будет равно "1", если сумма больше порогового значения и "0", если меньше.
Персептрон

Сегодня персептрон является одной из самых популярных реализаций нейронных сетей. Причиной его популярности является относительная простота реализации на фоне универсальности и широкого круга задач, которые могут решать персептроны.
Для решения более сложных задач используют многослойные нейронные сети.
Многослойная нейронная сеть

Но для обучения многослойных нейронных сетей требуются более сложные алгоритмы обучения нейронных сетей.

Обучение нейронной сети
Искусственная нейронная сеть обучается посредством некоторого процесса, модифицирующего ее веса. Если обучение успешно, то предъявление сети множества входных сигналов приводит к появлению желаемого множества выходных сигналов. Имеется два класса обучающих методов: детерминистский и стохастический.
Детерминистский метод обучения шаг за шагом осуществляет процедуру коррекции весов сети, основанную на использовании их текущих значений, а также величин входов, фактических выходов и желаемых выходов. 
Стохастические методы обучения выполняют псевдослучайные изменения величин весов, сохраняя те изменения, которые ведут к улучшениям.

Проблема прогнозирования
 Прогнозирование – это предсказание будущих событий. Целью прогнозирования является уменьшение риска при принятии решений. В большинстве случаев прогноз получается ошибочным, причем ошибка зависит от прогнозирующей системы и методов прогнозирования. Для уменьшения ошибки следует увеличивать количество ресурсов предоставляемых для прогноза. При некотором уровне ошибки возможно добиться минимального уровня ресурсов для прогноза. Основной проблемой прогнозирования является выявление неточности прогноза. Обычно, решение, принимаемое на основании прогноза должно учитывать ошибку, о которой сообщает система прогнозирования. Таким образом, система прогнозирования должна обеспечить определение прогноза и ошибки прогнозирования.
Наиболее распространенными задачами прогнозирования, на сегодняшний день являются задачи прогнозирование в экономике и на предприятиях, а в частности финансовое планирование, планирование технологического процесса, планирование фондового рынка и т.п.
Большинство задач прогнозирования можно свести к предсказанию временного ряда. Предсказание временного ряда сводится к типовой задаче нейроанализа – аппроксимации функции многих переменных по заданному набору примеров – с помощью процедуры погружения ряда в многомерное пространство (Weigend, 1994). Согласно теореме Такенса: "Если временной ряд порождается динамической системой, т.е. значения D0 есть произвольная функция состояния такой системы, существует такая глубина погружения d (примерно равная эффективному числу степеней свободы данной динамической системы), которая обеспечивает однозначное предсказание следующего значения временного ряда" (Sauer, 1991). Таким образом, выбрав достаточно большое d можно гарантировать однозначную зависимость будущего значения ряда от его предыдущих значений: Xt=ƒ(Xt-d) , т.е. предсказание временного ряда сводится к задаче интерполяции функции многих переменных. Нейросеть далее можно использовать для восстановления этой неизвестной функции по набору примеров, заданных историей данного временного ряда.
Достоинства и недостатки прогнозирования с помощью нейронных сетей
Прогнозирование на нейронных сетях обладает рядом недостатков. Как правило необходимо около 100 наблюдений для создания приемлемой модели. Это достаточно большое число данных и существует много случаев, когда такое количество исторических данных недоступно.
Однако, необходимо отметить, что возможно построение удовлетворительной модели на нейронных сетях даже в условиях нехватки данных. Модель может уточняться по мере того, как свежие данные становится доступными.
Другим недостатком нейронных моделей – значительные затраты по времени и другим ресурсам для построения удовлетворительной модели, известно, что обучение сети может занимать довольно много времени. Однако, несмотря на перечисленные недостатки, модель обладает рядом достоинств. Существует удобный способ модифицировать модель по мере того как появляются новые наблюдения.
Выводы
Таким образом, учитывая наличие ошибок прогнозирования, прогнозирование на нейронных сетях следут использовать в тех отраслях, где возможно неправильный прогноз не может нанести критического ущерба. В противном случае целесообразно использование экспертных систем.

 Литература:

  1.  А.А. Ежов С.А. Шумский – Избранные лекции по нейрокомпьютингу – М: МИФИ, 1998 

  2.  www.anriintern.com: Тарасенко Р.А., Сидоркин К.В., Костюхин – М.Н. Прогнозирование на основе аппарата нейронных сетей 

  3. Скобцов Ю.А. – Конспект лекций по курсу "Нейронные сети"

При написании данного автореферата магистерская работа еще не завершена. Окончание завершения – январь 2007 года. Полный текст работы и все материалы могут быть получены у автора или руководителя проекта после указанной даты.


©Copyright by Akulov Pavel

 ::  Биография  ::  Ссылки  ::  Отчет по поиску  ::  Библиотека  ::  Индивидуальное задание  ::