Назад в библиотеку

Зачем нужны нейронные сети?

Авторы: Сергей Колесников
Источник: http://md-it.ru/articles/html/article57.html

Наверное, многие слышали понятие «нейронные сети», ассоциативно связывая его с искусственным интеллектом, андроидами, роботами, способными учиться, глядя на людей. Одни при этом испытывают страх неизведанного, страх перед возможными последствиями, другие заинтересовываются, понимая возможное полезное применение, и видят помощь в исследовании неразрешимых сегодня задач, третьи скептически смотрят на происходящее, имея неудачный опыт в проектировании искусственных нейронных сетей (ИНС) или отсутствие желания в этом разбираться. В любом случае, ИНС за более чем полувековой период своего существования пережили немало взлетов и падений. В этой статье предлагается рассмотреть их возможное назначение, проблемы, связанные с их внедрением, положение дел в настоящее время, а также оценить факторы, влияющие на их развитие.

Исторический обзор

Проявление интереса к искусственным нейронным сетям было обусловлено работами пионеров в этом деле — У. Маккалоха (W. McCulloch) и У. Питтса (W. Pitts). В 1943 году внимание общественности привлекла работа под названием «Логическое исчисление идей, относящихся к нервной деятельности», в которой они предложили математическую модель нейрона и сформулировали принципы построения искусственных нейронных сетей, согласно разработанной ими модели функционирования головного мозга. Многие ученые с энтузиазмом начали предлагать свои решения и новые архитектуры ИНС. Так, например, Д. Хебб (D. Hebb) в 1949 году высказал идеи о характере соединений нейронов мозга и их взаимодействии, представив впервые методы обучения ИНС, а крупный нейрофизиолог Фрэнк Розенблатт (F. Rosenblatt) предложил в 1957 году свою модель нейронной сети — персептрон, и архитектуру первой в мире модели нейрокомпьютера Mark. Однако его работа подверглась жесткой критике (существует мнение, что необоснованно) многих заслуженных научных авторитетов того времени. Одними из них были ранние приверженцы теории ИНС Минский (М. Minsky) и Пейперт (S. Papert), показавшие несостоятельность теории Розенблатта в 1969 году. Их работа остудила научный пыл многих ученых–энтузиастов практически на два десятилетия. Образовалось некоторое затишье, связанное с разочарованием в возможностях ИНС, вызванным не в последнюю очередь психологическим фактором, проявляющимся в неспособности человека описать словами то, как он думает. На мой взгляд, развитие теории ИНС происходило очень быстро, люди создавали то, что на тот момент не было востребовано, другими словами, теория обогнала свое время. И хотя в этот период было предложено много заслуживающих внимания разработок и исследований, научный мир относился к ним скептически. До тех пор, пока в 1982 году американским биофизиком Дж. Хопфилдом не была предложена архитектура нейронной сети (в настоящее время названная его именем), использующая энергетический подход, моделирующая ассоциативную память. Это был новый толчок для развития этой области, и в 1986 году Дж. Хинтон (J. Hinton) со своими коллегами опубликовал статью с описанием новой модели нейронной сети и алгоритмом ее обучения. В это же время появились первые коммерческие проекты нейрокомпьютеров (Mark III фирмы TRW, США).К исследованиям вернулся и Минский, несмотря на свою предыдущую работу об ограниченности персептронов. Дальнейшее развитие поддерживалось созданием специализированных центров нейрокомпьютеров, проведением большого числа международных конференций и форумов. Объем продаж коммерческих нейросетевых продуктов в период с 1991 по 1997 г. вырос более чем в четырнадцать раз. Сейчас, с учетом перехода на нанотехнологии, появлением новых знаний о деятельности человеческого мозга, появились принципиально новые архитектуры, технологические решения, определены направления исследований, появился широкий спектр задач, которые не под силу решать алгоритмически даже на современных ПК.

Модель нейрона

Давайте определим, что же заставило пионеров своего дела составить модель нейронных сетей. Естественно, напрашивается стремление человека воспроизвести деятельность мозга, заставить машину думать. Кора головного мозга человека содержит около 100 млрд нейронов, каждый из которых связан с 1000–10000 других нейронов, таким образом получаем приблизительно от 1014 до 1015 взаимосвязей. Предлагаю провести небольшое обозрение. Известно, что нейрон не может изменять свое состояние больше, чем 100 раз в секунду, т. е. с частотой порядка 100 герц. Человек зрительно воспринимает окружающую информацию за 0,7–1 сек, узнавая образы, идентифицируя людей, объекты, а еще следует учитывать обработку информации с других органов чувств и управление работой организма. Однако для реализации этих действий с помощью методов алгоритмизации требуются огромные вычислительные мощности и базы данных. Для такого круга задач получается, что медленные нейроны работают гораздо быстрее самых современных компьютеров, благодаря неизвестному принципу распределения ресурсов, распределенной передаче данных. Как подсчитали специалисты ITC, для создания модели головного мозга потребовался бы компьютер с тактовой частотой 2000 терагерц, с объемом оперативной памяти 200 терабайт. Или более миллиона компьютеров средней мощности с идеальным алгоритмом распределения вычислений без различного рода затрат. Ниже приведена таблица, в которой приводится сравнение архитектур машины фон Неймана (стандартной архитектуры ПК) и биологической нейронной сети (из работы Artificial Neural Networks, Anil K. Jain, Jianchang Mao, K. M. Mohiuddin, США).

биологический нейрон

Рисунок 1 – Биологический нейрон

На схематическом рисунке представлен биологический нейрон. Схема его действия достаточно проста. Нейрон получает импульсы от аксонов других нейронов через дендриты (приемники) и передает сигналы, сгенерированные телом клетки, вдоль своего аксона (передатчика), который в конце разветвляется на волокна. На окончаниях этих волокон находятся специальные образования — синапсы, которые влияют на величину импульсов. Под обучением ИНС будем понимать настройку коэффициентов для эффективного выполнения специализированной задачи. Чаще всего предлагается обучающая выборка (вход–выход) и посредством итеративного приближения ИНС настраивает свои веса необходимым образом, что улучшает функционирование сети. В этом и состоит преимущество систем на основе ИНС перед системами, в которых функционирование осуществляется по строго определенным правилам. Как происходит создание и проектирование ИНС? В упрощенном варианте этот процесс можно представить нижеописанным способом. Определяется модель процесса, для которого создается ИНС, действующие факторы, доступная информация. Затем, исходя из определенных условий, определяются правила, методы, модификации весовых коэффициентов — появляется алгоритм обучения. Такая сеть уже способна к обучению и существованию. Вполне естественно задаться вопросом: а какие, собственно, методы используются при обучении? Обратимся кратко к этому вопросу, не углубляясь в математические и специализированные теории. Имеют место три парадигмы обучения: «с учителем», «без учителя» и смешанная. В первом случае на входы нейронной сети подаются значения, необходимые результаты которых известны заранее. Коэффициенты входов модифицируются таким образом, чтобы результатом работы сети были известные заранее результаты. Модифицированный вариант обучения с учителем предполагает, что известна только оценка правильности выхода нейронной сети, но не сами правильные значения выхода. Во втором случае производится структурирование и распределение данных по категориям, исходя из определенных связей между входами. Смешанный вариант обучения предполагает под собой обучение некоторой части нейронов с учителем, а остальная часть обучается вторым методом.

Сравнительная таблица машины фон Неймана и биологической нейронной системы

Рисунок 2 – Сравнительная таблица машины фон Неймана и биологической нейронной системы

Типовые задачи для ИНС

В этой части статьи рассмотрим типовые задачи, в которых результаты, получаемые с помощью ИНС, более состоятельны по сравнению с результатами, полученными традиционными методами. А затем рассмотрим ряд реальных применений и исследований в настоящее время. По мнению Anil K. Jain из Мичиганского государственного университета и специалистов Исследовательского центра IBM Jianchang Mao и K. M. Mohiuddin, список задач можно классифицировать следующим образом.

  1. Классификация образов. Задача состоит в указании принадлежности входного образа (например, речевого сигнала или рукописного символа), представленного вектором признаков, одному или нескольким предварительно определенным классам. К известным приложениям относятся распознавание букв, распознавание речи, классификация сигнала электрокардиограммы, классификация клеток крови, обеспечение деятельности биометрических сканеров и т. п.
  2. Кластеризация/категоризация. При решении задачи кластеризации, которая известна также как классификация образов «без учителя», отсутствует обучающая выборка с метками классов. Алгоритм кластеризации основан на подобии образов и размещает близкие образы в один кластер. Известны случаи применения кластеризации для извлечения знаний, сжатия данных и исследования свойств данных.
  3. Аппроксимация функций. Предположим, что имеется обучающая выборка пар данных вход–выход, которая генерируется неизвестной функцией, зависящей от некоторого аргумента, искаженной шумом. Задача аппроксимации состоит в нахождении оценки неизвестной функции. Аппроксимация функций необходима при решении многочисленных инженерных и научных задач моделирования. Типичным примером является шумоподавление при приеме сигнала различной природы, вне зависимости от передаваемой информации.
  4. Предсказание/прогноз. Пусть заданы n дискретных отсчетов {y (t1), y (t2)..., y (tn)} в последовательные моменты времени t1, t2,..., tn. Задача состоит в предсказании значения y (tn+1) в некоторый будущий момент времени tn+1. Предсказание/прогноз имеют значительное влияние на принятие решений в бизнесе, науке и технике. Предсказание цен на фондовой бирже и прогноз погоды являются типичными приложениями техники предсказания/прогноза.
  5. Оптимизация. Многочисленные проблемы в математике, статистике, технике, науке, медицине и экономике могут рассматриваться как проблемы оптимизации. Задачей алгоритма оптимизации является нахождение такого решения, которое удовлетворяет системе ограничений и максимизирует или минимизирует целевую функцию. Задача коммивояжера об оптимальной загрузке самолета, назначение штата работников по ряду умений и факторов являются классическими примерами задач оптимизации.
  6. Память, адресуемая по содержанию (ассоциативная память). В модели вычислений фон Неймана обращение к памяти доступно только посредством адреса, который не зависит от содержания памяти. Более того, если допущена ошибка в вычислении адреса, то может быть найдена совершенно иная информация. Ассоциативная память доступна по указанию заданного содержания. Содержимое памяти может быть вызвано даже по частичному входу или искаженному содержанию. Ассоциативная память может прекрасно найти применение при создании мультимедийных информационных баз данных.
  7. Управление. Рассмотрим динамическую систему, заданную совокупностью векторов входного управляющего воздействия, текущего состояния, выходного вектора системы. Классической постановкой задачи является расчет управляющего воздействия, чтобы в конкретный момент времени система находилась в определенной желаемой точке. Примером является оптимальное управление двигателем, рулевое управление на кораблях, самолетах.

Еще раз отметим, что мы указали только типовые задачи, в общем случае чаще всего встречаются ситуации, представляющие собой комплекс определенных ранее. К примеру, обеспечить загрузку самолета, минимизировать необходимое количество топлива, время перелета, расстояния. Дополнительно к задаче оптимизации добавляется задача управления и аппроксимации (шумоподавление при обеспечении связи пилотов и управляющих сигналов). Более подробно предлагаю остановиться на решении задачи, с которой сталкивается большое количество людей — распознавание изображений символов, или, проще говоря, распознавание текста. В настоящее время существует большое количество программ–обработчиков, позволяющих решать задачу OCR. При решении этой задачи приходится сталкиваться с целым рядом проблем: шумоподавление, выделение символов, блоков и их дальнейшая обработка. Хорошо, если документ отсканирован с качественно отпечатанного источника, но чаще всего приходится сталкиваться с целым рядом проблем. Например, вам необходимо распознать старый документ, который нельзя выровнять, или, скажем, рукописный (даже написанный каллиграфическим почерком), — с этими задачами программы справляются с большим трудом. Реализация алгоритма распознавания текста достаточно сложна и составляется из целого ряда взаимосвязанных блоков, среди которых блоки препроцессирования, сегментации, выделения характеристик, классификации и контекстуальной обработки. Бумажный документ сканируется и создается изображение в оттенках серого цвета или бинарное (черно–белое) изображение. На стадии препроцессирования применяется фильтрация для удаления шума, область текста локализуется и преобразуется к бинарному изображению с помощью глобального и локального адаптивного порогового преобразователя. На шаге сегментации изображение текста разделяется на отдельные символы. Эта задача особенно трудна для рукописного текста, который содержит связи между соседними символами. Один из эффективных приемов состоит в расчленении составного образца на малые образцы (промежуточная сегментация) и нахождении точек правильной сегментации с использованием выхода классификатора по образцам. Вследствие различного наклона, искажений, помех и стилей письма распознавание сегментированных символов является непростой задачей. Решение этой задачи с помощью ИНС представляется следующим образом: происходит неявное извлечение характеристик внутри самой нейросети, в этом случае выделение признаков и их классификация объединены, проходя наряду с обучением сети. Таким образом, сеть может «привыкнуть» к стилю текста, что дает возможность получить оптимальные результаты. Но в любом случае, способности самого человека к распознаванию текста (полная независимость от вышеуказанных факторов) не могут идти ни в какое сравнение даже с самыми современными OCR–системами. Однако не следует упускать из вида и то, что ИНС не являются панацеей от проблем такого типа, они также могут «ошибаться». ИНС лишь могут помочь при решении трудно формализуемых задач, требуя высококлассного специалиста по разработке архитектуры сети, способного решать вопросы, связанные с проектированием, использованием специализированного ПО и т.д.

Особенности внедрения новых технологий

Развитие новых технологий, появление новых типов задач, в том числе и трудноформализуемых, требует от ряда фирм внедрения новых технологий, использования новых типов ПО, привлечения квалифицированных специалистов. Естественно, у каждой организации будет своя модификация процесса обновления, однако она будет базироваться (с теми или иными изменениями) на нижеприведенных методах, у каждого из которых есть свои преимущества и недостатки. Одним из способов является набор группы специалистов–экспертов. К преимуществам этого способа необходимо отнести возможность человеческого общения непосредственно с конечным «обработчиком информации», учет факторов, которые невозможно формализовать или представить в понятной для ПО форме. Однако к недостаткам этого метода следует отнести не менее важные особенности, среди которых высокие материальные расходы на эксперта, связанные с необходимостью периодического повышения квалификации работника, высоким уровнем оплаты его труда. А человеческую субъективность, противоречия и конфликты в группе также нельзя отнести к плюсам, вкупе с отсутствием гарантий постоянной работы специалиста, связанных с различными факторами. К другому способу отнесем заказ готовой системы специализированной фирме. В этом случае заказчик получает готовый продукт, созданный с учетом специфики работы компании (учтем, что только на время создания), при невысокой стоимости эксплуатации. Среди минусов следует отметить достаточно высокую стоимость разработки таких продуктов, а также невысокую гибкость их использования в дальнейшем, связанную с необходимостью привлечения сторонних специалистов для модернизации и исправления системы. А все эти факторы означают разглашение специфики работы и коммерческих секретов компании, ведь иначе невозможно создать более или менее адекватную систему. Также существует возможность недопонимания программистами необходимых особенностей или субъективность их восприятия, что скажется на конечной эффективности продукта. Теперь рассмотрим следующий способ, который обладает практически всеми достоинствами вышеописанных, но и к минусам его следует отнести практически все их недостатки. Создание системы «с нуля» позволяет контролировать процесс создания, а в дальнейшем и его модернизацию при сохранении полной конфиденциальности. Минусы очевидны — необходимо наличие штата программистов, специалистов по созданию ИНС (причем везде существует человеческий фактор), что обуславливает выплату высокой заработной платы, а также необходима адаптация продукта для конечных пользователей. Четвертый способ — организация системы на основе готовых программных продуктов — сочетает в себе профессиональные готовые архитектуры, алгоритмы обучения, как правило, техническую поддержку и относительно высокую гибкость, благодаря наличию большого количества компонентов. При широкой распространенности продукта, возникновение ошибок минимально, а их обнаружение более эффективно. Однако нет гарантий относительно полноценной адаптации для задач конечного потребителя, плюс ко всему, требуется предварительная подготовка данных, что не всегда приемлемо. Как мы уже отметили, первые три способа достаточно дорогостоящие, что не всегда приемлемо для крупных компаний, где модернизируемое направление не является приоритетным, а также для средних и мелких компаний. Четвертый способ подходит для компаний любого уровня, если сфера применения сборного пакета широко исследована, но методики его использования уникальны для каждой отдельно взятой организации.

Практическое применение

  1. Контроль операций с кредитными карточками
    В этом случае используется способность ИНС к классификации. Например, продукт, разработанный HNC Software Inc. (в настоящее время HNC выкуплена компанией Fair, Isaac and Company) HNC Falcon предназначен для обнаружения в реальном времени широкого спектра мошеннических операций с банковскими карточками. Falcon отслеживает соотношения между операциями, обнаруживая подозрительные. Система Falcon использует запатентованную унифицированную технологию поддержки принятия решения (Unified Decisions Technology), которая комбинирует расширенную базу данных правил обработки транзакций, статистический анализ и нейронную сеть. Система Falcon также содержит специальный компонент, обеспечивающий возможность опытным специалистам включать в базу данных системы правила, позволяющие с высокой степенью достоверности определять потенциальные случаи мошенничества с банковскими картами по географическому местоположению или почтовому индексу держателя карты. Практическое использование этой системы показало повышение показателей качества обнаружения на 20–60 % при значительном снижении ложных срабатываний. Falcon также используется и для обнаружения фальсификаций в различных областях, например, в здравоохранении и телекоммуникационной отрасли. Семейство систем PRISM, разработанное компанией Nestor, основано на использовании нейросетей, экспертных систем и статистических методов для обнаружения в реальном режиме времени мошенничества с кредитными и дебетовыми картами, а также для обнаружения других типов мошенничества при осуществлении финансовых или торговых сделок. Нейросеть, используемая в системах семейства PRISM, была обучена на основе более чем полумиллиона транзакций с различными типами карт. По некоторым оценкам, использование систем семейства PRISM позволяет уменьшить число мошенничеств на 50 %.
  2. Медицинская диагностика
    Компанией «НейроПроект» создана система объективной диагностики слуха у грудных детей. Общепринятая методика объективной диагностики состоит в том, что в процессе обследования регистрируются «вызванные потенциалы» (отклики мозга) в ответ на звуковой раздражитель, проявляющиеся в виде всплесков на электроэнцефалограмме. Для достаточно уверенной диагностики слуха ребенка опытному эксперту–аудиологу необходимо провести около 2000 тестов, что занимает около часа. Нейросеть способна с той же достоверностью определить уровень слуха уже по 200 наблюдениям в течение всего нескольких минут, причем без участия квалифицированного персонала. Еще одним примером использования ИНС в программах медицинской диагностики служит пакет кардиодиагностики, разработанный фирмой RES Informatica совместно с Центром кардиологических исследований в Милане. Причем для таких болезней, как ишемия миокарда и артериальная гипертензия, достигается точность постановки диагноза более чем 95 %. Кроме этого, одним из перспективных направлений в исследованиях является онлайн–постановка диагноза. Пациент заполняет форму, указывая необходимые параметры, а система на основе обучающей выборки и накопленной базы данных определяет диагноз. По некоторым данным, это позволит увеличить производительность более чем в 1000 раз, удешевить исследования не менее чем в 500 раз, обработать данные от практически неограниченного количества человек, при увеличении диагностической точности.
  3. Распознавание образов
    Для приведения примера этого направления ИНС обратимся к демонстрационному продукту компании «НейроПроект», предназначенному для речевого управления встроенным калькулятором Windows. Система уверенно распознает любое из 36 слов, сказанных в микрофон любым человеком. Для обучения ИНС использовались варианты произношения 19 дикторов. Голосовой набор телефонного номера является еще одним из примеров распознавания речи. Доктор Ортнер (Dr. Ortner) из США обучил нейронную сеть набирать номер, используя 2500 примеров для каждого из 28 слов, включая цифры от нуля до девяти, а также названия отделов в пределах компании. При этом обеспечивается точность набора выше 90 %. В настоящее время им создан «голосовой учебный центр» (Voice Training Center), в котором производится запись слов, произнесенных различными людьми. В дальнейших исследованиях планируется организовать «голосовую связь» с глухонемыми людьми. Так, слова вызывающего абонента будут преобразовывать в текст (на экране телефона вызываемого), а обратный преобразователь обеспечит произнесение текста, напечатанного вызываемым. Компанией FeinMarquart Associates Inc разработана программа распознавания почтовых индексов с автоматической дальнейшей сортировкой. Система распознает как типографские, так и написанные от руки цифры. Согласно Joe McDaniel, обеспечивается 98 % точность распознавания.
  4. Анализ потребительского рынка
    Dr. Al Behrens, сотрудник Northern Natural Gas в штате Небраска, обучил нейронную сеть, которая предсказывает изменение цен на газ в следующем месяце со средней точностью 97 %. Ежемесячная цена иногда привязывается к индексации цен в печатных изданиях (Inside FERC и Natural Gas Week), включая недавнюю рыночную деятельность компании, сезонные факторы, погоду и т. д. Профессор Awad Hanna из University of Wisconsin построил нейронную сеть, которая на основе данных дорожного покрытия в конкретном месте в разное время года укажет наилучший тип покрытия для этой местности. Для построения такой сети он использовал информацию, полученную от специалистов в этой области, однако отсутствие спонсорской поддержки не позволяет провести испытания. Небезызвестная корпорация Microsoft также использует программные продукты на основе нейросетей в своей маркетинговой политике. Каждый год Microsoft отсылает более 40 млн рекламных предложений о покупке своих продуктов более чем по 8,5 млн зарегистрированных пользователей. Большая часть направлена на модернизацию ПО или покупку дополнительных пакетов. Цель использования ПО на основе ИНС очевидна — увеличение объема продаж. По словам Jim Minervino, было достигнуто увеличение спроса с 4,9 % до 8,2 %. А различие в затратах на рекламу снизилось на 35 %. Что изменилось? В базе данных накапливались данные по каждому адресату, что и когда он купил, учитывались следующие факторы, среди которых использовались данные регистрации — место работы, доход, количество человек в фирме, занимаемая должность. Система, анализируя соотношения между факторами и ответными письмами о согласии на приобретение, отправляла в дальнейшем письма только адресатам, похожим по набору факторов. GoalAssist Corporation построила нейронную сеть, позволяющую предугадать, какое количество призов и в каком соотношении требуется иметь в наличии при проведении рекламной кампании. Проще говоря, приславший три крышки от кофе получает определенный приз, приславший больше — другой приз. А система, на основе различных факторов, с высокой степенью достоверности (ошибка менее 4 %) определит, какие поощрения будут пользоваться высокой популярностью, а какие — нет.
  5. Спортивное прогнозирование
    Don Emmons из Детройта построил нейронную сеть, позволяющую на скачках предугадывать лошадь–победителя. ИНС, анализируя предыдущие забеги, время финиша, рекорд на ипподроме и другие факторы, с 75 % точностью оценивала вероятного победителя. С помощью результатов этой ИНС Don Emmons получил выигрыш с 17 из 22 ставок. Mr. Derek Anderson (Lakewood, CO) обучил нейронную сеть прогнозировать победителя на собачьих гонках. Он учитывал похожие факторы, в результате чего получалась ИНС с 504 входами, что обеспечивает ему точность в 94 %, правда, только на трети трасс.
  6. Оценка стоимости продуктов
    Например, оценка стоимости автомобиля зависит от множества факторов, таких как марка, год выпуска, объем двигателя, внутренняя «начинка», состояние и т. д. Так как вид зависимости этих факторов неизвестен, то стандартные методы анализа неэффективны. Фирма Attrasoft приводит пример оценки стоимости автомобиля по 7 ключевым факторам. Оценка стоимости домов проводится по 13 факторам. На сайте этой компании можно скачать большое количество баз данных, касающихся различных вопросов для проведения собственного исследования с помощью их продукта Decision Maker.
  7. Прогнозирование потребления услуг
    Рассмотрим пример потребления электроэнергии. Фирмой ZSolutions был выполнен заказ энергетической компании на анализ данных об энергопотреблении. На основании полученных данных о количестве потребляемой энергии в определенное время суток, изменилась ценовая политика, а, соответственно, и прибыль. Аналогичную задачу можно рассмотреть и для провайдеров Интернет–доступа.

Научные исследования

  1. Прогнозирование магнитных бурь
    Доктор Henrik Lundstedt из Lund Observatory, Швеция, обучил нейронные сети прогнозировать эффекты от солнечных вспышек, такие как возмущения магнитных полей Земли. Как известно, т. н. магнитные бури оказывают влияние не только на состояние и здоровье человека, под их влияние попадают и электростанции, случаются сбои в передаче радио– и телевизионных программ, сбои в работе геологического оборудования, спутников и т. д. Нейронная сеть, учитывая 37 известных влияющих факторов раз в четыре дня и анализируя их изменения, способна с высокой степенью точности определить «космическую погоду». Описывается случай, когда стандартный метод прогнозирования не определил сильных магнитных бурь вообще, а метод на основе ИНС в то же время точно спрогнозировал две из трех бурь.
  2. Определение пола москитов
    Aubrey Moore из Maui Agricultural Research Station, University of Hawaii, обучил нейронную сеть определять пол москитов в полете. Учитывая статистические данные о среднем количестве взмахов крыльями у каждого из полов, нейросеть обрабатывает информацию со специального фотодатчика и со средней точностью 98 % определяет принадлежность москита к тому или иному полу. Испытания Aubrey Moore проводил на 57 насекомых, а при обучении было привлечено 403 особи.
  3. Прогнозирование ливневых дождей
    О необходимости этого процесса упоминать не стоит, отметим лишь, что такая информация позволит принять необходимые меры по обеспечению безопасности. Компьютерные системы, производящие обработку информации, основываются на конкретных данных, в то время как ИНС — на обучении и использовании значений в предыдущее время в конкретной местности, что позволяет делать прогнозы с точностью до 85%. В модели ИНС, разработанной Tony Hall, используются 19 метеорологических переменных.

Производство

  1. Определение качества пива
    Anheuser–Busch использует нейронные сети, чтобы идентифицировать органические компоненты, содержащиеся в пиве конкурентов, с 96 %–ой точностью. Это позволяет ему удерживать качество выпускаемого им продукта и не отставать в производстве нового. Методы использования и подробности указанных действий Anheuser–Busch держит в глубоком секрете.
  2. Производство микросхем
    Нейронная сеть, примененная на заводе Intel, способна идентифицировать брак на производстве. Первоначально опытной системе давали электрическую испытательную информацию от готовых чипов и соответствующих переменных управления производственным процессом. Отношения между этими двумя параметрами были определены числовым экспериментом и моделированием процесса CMOS. Чувствительная поверхностная модель (RSM, Responsive Surface Model) использовалась для сохранения результатов достаточного количества числовых экспериментов. В результате нейронная сеть была способна забраковать нефункционирующий чип с точностью 99,5%.
  3. Применение в строительстве
    При проведении испытаний качества бетона используется большое количество методов. Одним из них является бурение в поисках образовавшейся полости. Однако с помощью нейросетей возможно проверить весь материал, а также определить глубину, на которой находится полость. Путем подачи звуковых волн и приема отраженного сигнала, а затем обработкой ИНС, специалисты из National Institute of Standards and Technology (NIST) способны проверить качество бетона при толщине материала до полуметра.

Заключение

В заключение, хочется отметить, что в статье, разумеется, приведен далеко не полный перечень примеров использования нейронных сетей. Мы попытались показать, насколько широки области применения и решаемые задачи. Однако до широкого распространения ИНС в России, на мой взгляд, достаточно далеко, что связано, с одной стороны, со стоимостью таких продуктов, с другой стороны — со скептическим отношением возможных конечных потребителей.