Автор: Истягин А.О., Боднар А.В.
Источник (еще не издан): Истягин А.О. Перспективы применения нейронных сетей в задаче классификации / А.О. Истягин, А.В. Боднар // Информационные технологии и технические средства управления (ICCT-2024) : сб. материалов VIII Междунар. науч.-техн. конф.
Истягин А.О., Боднар А.В. - Перспективы применения нейронных сетей в задаче классификации В статье рассмотрены основные функции отельного бизнеса по работе со статической информацией отелей. Проведен анализ существующего подхода классификации комнат отелей и гостиниц, экспериментальным путем получены контрольные замеры времени выполнения различных процедур, связанных с классификацией комнат. Сделаны выводы о целесообразности введения нейросетевого модуля в существующий алгоритм поставщика.
Классификация комнат гостиниц и отелей является критически важной задачей, от результатов которой зависят не только объемы продаж услуг, но и уровень удовлетворенности клиентов, а также общее восприятие бренда. Несмотря на то что в настоящее время многие процессы в отельном бизнесе автоматизированы, существующие методы классификации зачастую ограничиваются стандартными алгоритмами, которые не всегда учитывают уникальные особенности каждого объекта размещения. Это создает потребность в более гибких и адаптивных системах, способных обрабатывать большой объем данных с высокой точностью и скоростью. В данной статье рассматривается возможность интеграции нейросетевых технологий в процессы классификации комнат отелей. Использование нейронных сетей позволяет не только автоматизировать обработку статической информации о комнатах, но и значительно повысить точность классификации посредством обучения на различных данных и примерах. Таким образом, внедрение данной технологии открывает новые перспективы для повышения конкурентоспособности и оперативности в отельной индустрии, что, в свою очередь, способствует повышению качества предоставляемых услуг и улучшению пользовательского опыта. Эта работа является продолжением исследований, начатых в статье «Сравнение производительности различных подходов в задаче классификации»[1].
Перед началом исследования перспектив внедрения нейронной сети для классификации комнат в отелях, важно провести тщательный анализ текущих методов классификации, используемых в данной области. Существующий механизм, основанный на регулярных выражениях, представляет собой автоматизированный процесс, который анализирует названия и описания комнат, предоставляемые различными поставщиками, классифицирует их по заданным критериям, готовит информацию для отображения клиентам и сохраняет её в базу данных. Хотя данный подход эффективен в определённых контекстах, он может быть ограничен в способности адаптироваться к нестандартным и разнообразным форматам данных, что часто встречается в отельной индустрии.
В связи с этим, в рамках данного исследования будет проведена оценка производительности существующего механизма классификации и сравнение его с нейросетевым модулем, разработанным в предыдущей работе. Этот модуль обладает потенциалом значительно ускорить процесс классификации комнат, применяя глубокое обучение для более точного распознавания и категоризации комнат по различным характеристикам, таким как тип комнаты, тип кровати и подтип комнаты.
Проведение контрольных замеров производительности определит необходимость внедрения нейросетевого модуля и поможет выявить потенциальные проблемы существующего механизма.
Вся бизнес-логика поставщика реализована с использованием языка программирования C# с применением передовых практик разработки ПО[2]. Это позволяет создать надежную систему, готовую к интеграции новых технологий, таких как нейронные сети.
Модуль классификации работает с реляционной базой данных, что требует строгой типизации и структурирования данных. Это особенно важно, поскольку точность и однозначность классификации напрямую зависит от корректности и актуальности информации, хранящейся в базе данных[3].
Контрольные замеры производительности будут проведены на выборке, состоящей из двухсот тестовых отелей различных иностранных поставщиков. Для каждого отеля в среднем представлено десять различных типов комнат. Использование такой выборки позволяет оценить работу системы в различных условиях и с разным объемом данных, что критически важно для оценки эффективности внедрения нейросетевых технологий.
Тестирование будет проходить на тестовом стенде со следующей конфигурацией: CPU Ryzen 5 2600, 32 GB DDR4, GeForce 1660. Поскольку база данных находится на удаленном сервере, важно учитывать возможные сетевые задержки и накладки.
Весь модуль классификации представляет собой сложную систему, разделенную на несколько подсистем и процедур, каждая из которых играет ключевую роль в обработке и классификации информации о номерах отелей. Замеры времени будут произведены для каждой процедуры по отдельности, что позволит сделать более полные выводы о работе системы. Первый этап работы модуля - получение информации об отеле из базы данных. Затем следует этап получения «сырой» информации о комнатах поставщика, формирование пустых комнат, которые будут заполнены данными в ходе классификации. Третий, четвертый и пятый этапы представляют собой процесс классификации каждой комнаты по различным критериям: типу комнаты, типу кровати и подтипу комнаты соответственно. Последний этап заключается в сохранении классифицированных комнат в базу данных.
Каждый из этих этапов является критически важным, поскольку от точности и эффективности классификации зависит дальнейшая работа системы. Предполагается, что разработанный нейросетевой модуль может значительно ускорить классификацию по трем категориям, однако необходимо удостовериться, что в данном ускорении есть смысл. В таблице 1 приведены результаты контрольных замеров времени классификации комнат отелей при помощи регулярных выражений.
Таблица 1. Контрольные замеры
Значение | Извлечение данных | Классификация | Сохранение в БД | Всего | |||
---|---|---|---|---|---|---|---|
об отеле из БД | о комнатах и подготовка заглушек | По типу комнаты | По типу кровати | По подтипу комнаты | |||
Секунды, 200 отелей | 16575 | 39213 | 1401 | 772 | 2146 | 16575 | 76682 |
Секунды, в среднем для 1 отеля | 90 | 213 | 7 | 4 | 11 | 90 | 415 |
Процент от общего | 22 | 51 | 2 | 1 | 3 | 21 | 100 |
Исходя из полученных результатов контрольных замеров можно сделать следующий вывод: время классификации по трем категориям занимает не более шести процентов от общего времени работы модуля (с учетом статистической погрешности и округления в таблице и расчетах). Значительную часть времени занимает раздельное извлечение данных из БД, формирование результата и сохранение в БД. Используемый в настоящее время алгоритм обрабатывает комнаты синхронно, в то время как нейронная сеть – параллельно, за счет чего скорость может возрастать в десятки раз. Тем не мене, даже с применением нейронной сети большая часть времени все равно будет тратиться на обращение к базе данных, так что в первую очередь необходимо оптимизировать первые и последние этапы работы модуля. Для внедрения нейронной сети необходимо значительно переработать имеющийся модуль, что потребует значительных затрат времени и ресурсов предприятия. Внедрение нейронной сети для повышения производительности рассматриваемого модуля не является перспективным решением без оптимизации работы с базой данных.
1. Истягин А.О. Рычка О.В. Сравнение производительности различных подходов в задаче классификации. Современные информационные технологии в образовании и научных исследованиях (СИТОНИ-23): сб. материалов VIII Всерос. науч.-техн. конф., г. Донецк, 29 нояб. 2023. / отв. ред. В.Н.Павлыш – Донецк: ДонНТУ, 2023.
2. Хорсдал К. Микросервисы на платформе .NET. — СПб.: Питер, 2018. — 352 с.: ил.
3. Молинаро Э. SQL. Сборник рецептов. – Пер. с англ. – СПб: Символ-Плюс, 2009. – 672 с.: ил.