В работе рассматриваются новые методы классификации и упорядочения многопризнаковых объектов, которые характеризуются многими разнородными (количественными и качественными) признаками и могут существовать в нескольких экземплярах с отличающимися, в частности, противоречивыми значениями признаков. Методы основаны на теории метрических пространств мультимножеств и применены для решения практических задач принятия решений: конкурсного отбора проектов и построения рейтинга компаний, оцененных несколькими экспертами по многим критериям.

Введение

В различных прикладных задачах многокритериального принятия решений, распознавания образов, классификации, обработки разнородной информации, теории кодирования, других предметных областях часто возникает необходимость сгруппировать или упорядочить анализируемые объекты, основываясь на их свойствах, выраженных признаками (атрибутами) объектов. Вместе с тем имеется достаточно широкий круг задач, где изучаемые объекты характеризуются многими разнородными признаками, которые могут быть и количественными, и качественными, и, кроме того, одни и те же объекты могут существовать в нескольких экземплярах с отличающимися значениями признаков, свертка которых или невозможна, или математически некорректна. В качестве примеров таких задач укажем классификацию и ранжирование объектов, оцененных несколькими экспертами по многим качественным критериям, распознавание графических символов, обработку текстовых документов. Множественность и повторяемость факторов, описывающих объекты, усложняет и затрудняет решение таких задач. Главные трудности связаны с необходимостью учитывать одновременно большое количество вербальных и числовых данных и обрабатывать эти данные, не прибегая к дополнительным преобразованиям типа усреднения, смешивания, взвешивания, которые могут привести к необоснованным и необратимым искажениям исходных данных. Удобной математической моделью для представления многопризнаковых объектов является мультимножество или множество с повторяющимися элементами. Кратность элементов – существенная особенность мультимножества, позволяющая отличать его от множества и рассматривать мультимножество как качественно новое математическое понятие. В работе предложены методы классификации и упорядочения совокупности многопризнаковых объектов, которые базируются на теории метрических пространств мультимножеств. Метод классификации объектов позволяет строить обобщенное решающее правило для их отбора, которое аппроксимирует различные правила экспертной сортировки объектов. Метод упорядочения объектов основан на оценке их близости по отношению к некоторому «идеальному» объекту в многопризнаковом пространстве. Эти методы допускают использование различных, в том числе и противоречивых, данных для описания объектов.

Мультимножества и операции над ними

В этой главе дан краткий обзор теории мультимножеств и метрических пространств мультимножеств.

Представление многопризнаковых объектов

Выбор той или иной модели для представления и исследования структуры совокупности рассматриваемых объектов определяется их свойствами, которые выражаются признаками (атрибутами) объектов. Признаки объектов могут быть непрерывными и дискретными, количественными, качественными или смешанными. Обычно совокупность объектов представляется множеством точек в некотором многомерном (как правило, метрическом) пространстве, оси которого соотносятся с соответствующими признаками. В прикладных задачах в качестве такого пространства достаточно часто (но, заметим, не всегда обоснованно) выбирается пространство типа евклидового. Задание расстояния между объектами позволяет оценивать близость или удаленность этих объектов относительно друг друга вне зависимости от их природы, исследовать структурные особенности совокупности объектов и всего пространства в целом.

Примеры практических задач

Рассмотрена важная практическая задача конкурсного отбора проектов для их финансирования из некоторого фонда или для включения в состав программы, направленной на решение какой-либо важной проблемы (научно-технической, экономической, экологической, производственной). Каждая конкурсная заявка Ai i=1,…,k независимо оценивается несколькими экспертами по определенным критериям. Такими критериями могут быть, например:Q1. Важность проекта для программы; Q2. Перспективность проекта; Q3. Новизна подхода к решению поставленных задач; Q4. Квалификация исполнителей проекта; Q5. Ресурсное обеспечение работ; Q6. Возможность быстрого выхода результатов в практику. Каждый критерий имеет порядковую или номинальную шкалу оценок с развернутыми словесными формулировками градаций качества.

Каждый эксперт, наряду с оценкой заявки по всем критериям, дает одну из следующих рекомендаций:
r1 – включить проект в программу; r2 – отклонить проект; r3 – отложить рассмотрение заявки и отправить проект на доработку.
Указанные рекомендации экспертов являются, по существу, правилами предварительной классификации (сортировки) множества рассматриваемых заявок A={A1,...,Ak}. Основываясь на заключениях экспертов, конкурсная комиссия принимает решение о включении того или иного проекта в соответствующий раздел программы. В других задачах критерии оценки объектов и правила их сортировки могут быть и иными.

Каждая компания из совокупности A={A1,...,Ak} оценивается несколькими экспертами по всем критериям. Оценки разных экспертов могут отличаться друг от друга и даже противоречить друг другу. Каждая компания Ai представляет собой многопризнаковый объект, и определение рейтинга можно рассматривать как задачу упорядочивания многопризнаковых объектов. Основной трудностью при решении таких задач является необходимость учета всех описаний объекта – различающихся оценок, сделанных разными экспертами, при условии, что не существует «главного» эксперта, и мнения всех экспертов считаются одинаково важными.
В существующих методах классификации и упорядочивания объектов построение итогового решения производится либо на основе информации, полученной от одного источника, либо путем согласования или усреднения различных оценок [5, 7, 13]. Однако бывает крайне сложно, а иногда и невозможно найти согласованное мнение экспертов, например, если эксперты работают независимо друг от друга и не могут знать оценок, данных другими экспертами. Поэтому необходимы методы классификации и упорядочения многопризнаковых объектов, которые позволяли бы одновременно учитывать оценки, в том числе и противоречивые, всех экспертов без поиска компромисса между мнениями отдельных экспертов.

Классификация многопризнаковых объектов

В данной главе рассматривается формальная постановка задачи классификации совокупности объектов. Порядковые значения качественного признака обычно считаются упорядоченными от лучшего значения к худшему. Задача поиска обобщенного решающего правила классификации многопризнаковых объектов сводится к m оптимизационным задачам для каждой группы признаков.

Упорядочение многопризнаковых объектов

Дана формальная постановка задачи упорядочения совокупности многопризнаковых объектов A={A1,...,Ak}, которые оцениваются n экспертами по m критериям Q1,…,Qm.Предполагается, что разные критерии могут иметь различную относительную важность, но значения оценок, относящихся к одному и тому же критерию, равноценны. Будем также считать, что каждый объект оценивается всеми n экспертами по всем m критериям, и что экспертные оценки независимы. В таком случае можно выделить два объекта (возможно, гипотетических) – абсолютно лучший и абсолютно худший, которым все эксперты дали соответственно самые лучшие и самые худшие оценки по всем критериям. Требуется, исходя из многокритериальных оценок объектов, упорядочить объекты от лучшего к худшему. Упорядочивание объектов происходит используя аппарат мультимножеств.

Заключение

Проблемы классификации и упорядочения объектов, которые описываются многими количественными и качественными признаками, причем каждый из объектов может существовать в нескольких различающихся «экземплярах», являются достаточно трудными. Эти трудности имеют и содержательные основания (например, некорректность применения процедур «усреднения» качественных признаков), и формальные причины (например, большая размерность задачи). Преодолеть главные из перечисленных трудностей оказалось возможным благодаря использованию нового теоретического инструментария, основанного на понятии мультимножества. Теория мультимножеств позволяет разрабатывать новые методы анализа данных и решения новых классов задач, которые содержат новые способы преобразований исходной информации, не приводящие к потере или искажению данных. В работе изложены методы классификации и упорядочения многопризнаковых объектов, основанные на их представлении с помощью мультимножеств. В качестве признаков могут выступать количественные и качественные, в том числе и противоречивые данные. Предложенный подход к построению обобщенного решающего правила для классификации многопризнаковых объектов, которое аппроксимирует большое число предварительных противоречивых сортировок, был проверен на результатах экспертной оценки и конкурсного отбора проектов при формирования государственной научно-технической программы по высокотемпературной сверхпроводимости [6]. Каждая представленная на конкурс заявка независимо оценивалась 3 экспертами по 6 качественным критериям, которые давали также свое заключение по принятию или отклонению заявки. Всего было подано более 250 заявок, около 170 из них было отобрано для включения в программу. Разработанным методом были сформулированы несколько решающих правил, одно из которых полностью совпало с примененным на практике [6]. Обобщенное решающее правило классификации объектов 11 позволило также выделить наиболее важные для отбора проектов критерии и выявить расхождения в индивидуальных правилах сортировки проектов, применявшихся экспертами. Упорядочивание объектов по их близости к наилучшему объекту в метрическом пространстве мультимножеств дает возможность получать как строгое, так и нестрогое ранжирование объектов при равнозначных или различных по важности критериях. Рассмотренный метод упорядочения многопризнаковых объектов был применен для построения рейтинга российских компаний, работающих в секторе информационно-коммуникационных технологий [4]. Результаты экспертизы обрабатывались по описанной процедуре в предположении равнозначности критериев. В итоге из 50 оцененных компаний были выделены 30 ведущих высокотехнологичных компаний, а также составлены рейтинги 10 наиболее динамично развивающихся компаний и 10 ведущих разработчиков программного обеспечения.

Источник: http://www.raai.org/about/persons/petrovsky/pages/Petrovsky_2004.pdf