Введение
Ранжирование и классификация объектов, заданных векторами противоречивых характеристик, находит свое применение в различных областях научных исследований. Примерами могут служить задачи теории кодирования, классификации и обработки разнородной информации [1].
Мультимножество или множество с повторяющимися элементами [1] служит удобной математической моделью для представления объектов, которые характеризуются многими разнородными (количественными и качественными) признаками и могут существовать в нескольких экземплярах с отличающимися, в частности, противоречивыми значениями признаков.
В рамках введения Болонского процесса в Украине [2] одной из актуальных задач при составлении учебных планов для подготовки бакалавров и магистров является выделение дисциплин, которые будут входить в циклы по выбору студентов. В данной работе предлагается подход, благодаря которому, на основании оценки студентами (бакалаврами и магистрами) набора дисциплин, будут упорядочены критерии, по которым студенты выбирают предметы для обучения.
Цель работы – построение рейтинга критериев оценок дисциплин студентами на базе аппарата мультимножеств.
В соответствии с поставленной целью в работе решены следующие задачи:
- - рассмотрены мультимножества как аппарат для многокритериального выбора;
- - сформулированы критерии оценки дисциплин студентами, которые их уже изучили;
- - построен рейтинг критериев оценки дисциплин.
Основные понятия и определения теории мультимножеств
В работах [1,3] введены базовые понятия теории мультимножеств. Рассмотрим основные из них.
Выбор той или иной модели для представления рассматриваемых объектов и исследования структуры их связей определяется свойствами этих объектов, которые выражаются признаками (атрибутами) объектов. Признаки, характеризующие свойства объектов, могут быть непрерывными и дискретными, количественными и качественными, или смешанными.
Обычно совокупность объектов представляется множеством точек в некотором многомерном (как правило, метрическом) пространстве, оси которого соотносятся с соответствующими признаками. В прикладных задачах в качестве такого пространства достаточно часто (но, заметим, не всегда обоснованно) выбирается пространство типа евклидового. Задание расстояния между объектами позволяет оценивать близость или удаленность этих объектов относительно друг друга вне зависимости от их природы, исследовать структурные особенности совокупности объектов и всего пространства в целом.
В различных предметных областях рассматриваются совокупности A ={A1,...,Ak} объектов, которыеописываются m дискретными признаками Q1,…,Qm, имеющими конечное число , es=1,…,hs, s=1,…,m количественных (числовых) или качественных (номинальных, либо порядковых) значений. Каждый объект Ai, i=1,…,k из совокупности A можно представить как точку qi в m-мерном векторном пространстве Q=Q1?Q2?…?Qm, являющемся прямым произведением шкал значений признаков Qs, и поставить объекту Ai в соответствие m-мерный вектор Ai =(,,…,).
Мультимножеством A, порожденным обычным множеством U={x1,x2,…}, все элементы которого различны, называется совокупность групп элементов вида А={kA(х)•x|xIU, kA(х)IZ+}. Здесь kA:U®Z+={0,1,2,…} называется функцией числа экземпляров мультимножества, определяющей кратность вхождения элемента xiIU в мультимножество А, что обозначено символом •.
Если kA(x)=cA(x), где cA(х)=1 при xIА и cA(х)=0 при xIА, то мультимножество А становится обычным множеством.
Если все мультимножества семейства A ={A1,A2,…} образуются из элементов множества G, то G называется доменом для семейства A, а множество SuppA={x|xIG, cSuppA(х)=cА(х)} – опорным множеством или носителем мультимножества А.
Мощность мультимножества |А|=SxkA(х) определяется как общее число экземпляров всех его элементов; размерность мультимножества /А/=SxcA(х)=|SuppA| – как общее число различных элементов. Максимальное значение функции кратности hgtA= называется высотой, а элемент xA*=arg – пиком мультимножества А. Мультимножество называется пустым ?, если k?(x)=0, и максимальным Z, если kZ(х)=kA(х), "xIU.
Рассмотрим возможные способы сопоставления мультимножеств, обусловленные особенностями их различных характеристик. Мультимножества А и В называются равными (А=В), если kA(х)=kB(х) для всех элементов xIG, и неравными (А?В), если kA(х)?kB(х) хотя бы для одного хIG. Для равных мультимножеств имеем |А|=|В|, /A/=/B/, hgtA=hgtВ, xA*=xB*, SuppA=SuppB. Мультимножества А и В будем называть равномощными, если |А|=|В|; равноразмерными, если /A/=/B/; равновеликими, если они равномощны и равноразмерны. Равные мультимножества равновелики, обратное утверждение, вообще говоря, неверно.
Будем говорить, что мультимножество В содержится или включено в мультимножество А (ВIА), если kВ(х)?kА(х), для каждого элемента xIG. Мультимножество В называется тогда подмультимножеством мультимножества А, а мультимножество А – надмультимножеством мультимножества В. В этом случае |В|?|А|, /В/?/А/, hgtВ?hgtА, SuppBISuppA, а xA*=xB*, либо xA*?xB*. Как и в случае обычных множеств, одновременное выполнение условий ВIА и АIВ влечет равенство мультимножеств А=В. Включение мультимножества обладает свойствами рефлексивности (AIА) и транзитивности (АIВ, ВIC ? АIC), а значит, является отношением предпорядка.
Мультимножества А и В будем называть одноименно или S-эквивалентными (А@В), если их носители совпадают (SuppA=SuppB) и существует взаимно однозначное соответствие f между одноименными компонентами: kВ(х)=f(kА(х)), "x IG; разноименно или D-эквива-лентными (А»В), если их носители эквивалентны (SuppA~SuppB) и существует взаимно однозначное соответствие f между разноименными компонентами: kВ(хi)=f(kА(хj)), xi,xjIG, где f – целочисленная функция с областью значений Z+.
Введем следующие основные операции над мультимножествами:
- объединение
AB= {kAUB(x)•x | kAUB(x)=max(kA(x), kB(x))};
- пересечение
AB= {kAIB(x)•x | kAIB(x)=min(kA(x), kB(x))};
- арифметическое сложение
A+B= {kA+B(x)•x| kA+B(x)=kA(x)+kB(x)};
- арифметическое вычитание
A-B= {kA-B(x)•x| kA-B(x)=kA(x)-kA?B(x)};
- симметрическая разность
ADB = {kADB(x)•x | kADB(x)=|kA(x)-kB(x)|};
- дополнение
= Z–A = {•x | =kZ(x)–kA(x)}.
Другие операции, а также способы определения носителей операций над мультимножествами рассмотрены подробно в [3].
Действительная неотрицательная функция m(A), определенная на алгебре L (Z) и удовлетворяющая условию коаддитивности: m(A)+m(B)=m(A+B), называется мерой мультимножества. Мера мультимножества m(A) обладает следующим свойствами: m(?)=0; монотонность m(A)?m(B)UAIB; непрерывность m(Ai)=m(Ai); симметричность m(A)+m()=m(Z); эластичность m(h•A)=hm(A). Меру мультимножества можно определить различными способами, например, как линейную комбинацию функций кратности: m(A)=ajwjkA(xj), wj>0. Заметим, что мощность мультимножества |A| также будет мерой мультимножества
Метрические пространства мультимножеств (A ,d) введены в [3], где определены следующие виды расстояний между мультимножествами:
d3(A,B) = m(A?B)/m(AB).
Функции d2(A,B) и d3(A,B) удовлетворяют условию нормировки 0?d(A,B)?1. По определению принимается d3(?,?)=0. Основное расстояние d1(A,B) является метрикой типа Хемминга, традиционно используемым во многих приложениях. Полностью усредненное расстояние d2(A,B) характеризует различие между двумя мультимножествами A и B, отнесенное к расстоянию, максимально возможному в исходном пространстве. Локально усредненное расстояние d3(A,B) задает различие, отнесенное к максимально возможной «общей части» только этих двух мультимножеств в исходном пространстве.
Построение модели оценки дисциплин студентами.
Предварительно отметим, что проводился опрос студентов специальности «Программное обеспечение автоматизированных систем» Донецкого национального технического университета.
В качестве дисциплин-объектов для анализа А предлагаются следующие дисциплины:
- А1 – функциональное и логическое программирование;
-– автоматизированная разработка программного обеспечения;
- А3 – программирование в Интернет;
- А4 – основы автоматизированного проектирования систем;
- А5 – системное программирование и операционные системы;
- А6 – графическое и геометрическое моделирование;
- А7 – системы искусственного интеллекта;
- А8 – организация функционирования ЭВМ.
Введем множество Q – множество критериев оценки дисциплин студентами:
- Q1 – получение новых знаний о языках программирования (возможные ответы: да, нет);
- - получение новых знаний о средах разработки программ (возможные ответы: да, нет);
- - получение знаний о проектировании и описании программ (возможные ответы: да, нет);
- - получение фундаментальных теоретических знаний по специальности (возможные ответы: да, нет);
- - уровень изложения материала (возможные ответы: высокий, средний, низкий);
- - развитие логического и образного мышления (возможные ответы: да, нет);
-- использование материалов на практике (возможные ответы: да, нет).
Кроме оценки каждой из предлагаемой дисциплины множества А по критериям множества Q каждому эксперту (студенту) предлагалось отнести каждую дисциплину к одному из множеств (дисциплина, необходимая при подготовке специалиста) или (дисциплина, которая не нужна при подготовке специалиста).
Результаты оценок дисциплин по критериям.
В качестве экспертов для оценки дисциплин было выбрано 30 студентов четвертого и пятого курса специальности «Программное обеспечение автоматизированных систем» Донецкого национального технического университета, 12 из которых проходят подготовку в качестве магистров, а 18 – в качестве специалистов.
Результаты анкетирования экспертов приведены в таблице 1.
Объединим объекты Ai, относящиеся к заданным классам Xa и Xb. Получим преобразованную таблицу решений, строки которой соответствуют мультимножествам Xa и Xb (таблица 2). Считаем, что дисциплина Ai относится к классу Ха, если , иначе дисциплина относится к классу Хb, для
Рассчитаем расстояние d1 для каждого критерия согласно формуле:
d1(Qsa*,Qsb*) = axIQs*|kXa(xj)-kXb(xj)|, d1(Ra,Rb) = axIR|kXa(xj)-kXb(xj)|.
Результаты расчета приведены в таблице 3.
Оценим точность аппроксимации по s-ой группе признаков ():
rs = d(Qsa*, Qsb*)/d(Ra, Rb).
Результаты оценки точности аппроксимации даны в таблице 4.
Выберем аппроксимирующие признаки qs* для каждого критерия (аппроксимирующим считаем тот признак, для которого выполняется условие для данных таблицы 2
Упорядочим аппроксимирующие признаки qs* по убыванию точности аппроксимации rs:
Выбрав некоторое желаемое значение точности аппроксимации r0, получим обобщенные решающие правила для отбора дисциплин. Предварительно отметим, что критериине могут быть значимыми в связи с низкой точностью аппроксимации.
«Материалы дисциплины должны использоваться на практике» (оценка точность аппроксимации r0=0,8).
«Материалы дисциплины должны использоваться на практике и дисциплина должна давать знания о средах разработки программ» (оценки , точность аппроксимации r0=0,52).
«Материалы дисциплины должны использоваться на практике, дисциплина должна давать знания о средах разработки программ и языках программирования» (оценки , точность аппроксимации r0=0,44).
Ранжирование аппроксимирующих признаков по величине расстояния d1 показывает, что наиболее важным при выборе дисциплины студентом является критерий , характеризующий применение материалов дисциплины на практике.
Таблица 1. Результаты анкетирования экспертов
|
|||||||||||||||||
|
29 |
1 |
20 |
10 |
15 |
15 |
18 |
12 |
16 |
13 |
1 |
26 |
4 |
10 |
20 |
14 |
16 |
|
15 |
15 |
21 |
9 |
27 |
3 |
19 |
11 |
10 |
12 |
8 |
21 |
9 |
18 |
12 |
28 |
2 |
|
25 |
5 |
15 |
15 |
8 |
22 |
19 |
11 |
4 |
14 |
12 |
8 |
22 |
18 |
12 |
26 |
4 |
|
4 |
26 |
8 |
22 |
11 |
19 |
5 |
25 |
3 |
17 |
10 |
11 |
19 |
3 |
27 |
9 |
21 |
|
28 |
2 |
26 |
4 |
21 |
9 |
22 |
8 |
18 |
11 |
1 |
19 |
11 |
28 |
2 |
30 |
0 |
|
12 |
18 |
20 |
10 |
7 |
23 |
16 |
14 |
11 |
16 |
3 |
25 |
5 |
15 |
15 |
27 |
3 |
|
11 |
19 |
14 |
16 |
16 |
14 |
13 |
17 |
3 |
15 |
12 |
11 |
19 |
4 |
26 |
13 |
17 |
|
9 |
21 |
7 |
23 |
18 |
12 |
21 |
9 |
8 |
11 |
11 |
19 |
11 |
12 |
18 |
14 |
16 |
Таблица 2. Результаты разделения дисциплин на принятые Хa и непринятые Xb
|
|||||||||||||||||
80 |
40 |
82 |
38 |
63 |
57 |
76 |
44 |
43 |
53 |
24 |
73 |
47 |
79 |
41 |
111 |
9 |
|
53 |
67 |
49 |
71 |
60 |
60 |
57 |
63 |
30 |
56 |
34 |
67 |
53 |
29 |
91 |
50 |
70 |
Таблица 3. Результаты расчета расстояний d1
|
Q1 |
Q2 |
Q3 |
Q4 |
Q5 |
Q6 |
Q7 |
d1 |
54 |
66 |
6 |
38 |
26 |
12 |
100 |
Таблица 4. Результаты оценки точности аппроксимации
|
Q1 |
Q2 |
Q3 |
Q4 |
Q5 |
Q6 |
Q7 |
0,443 |
0,541 |
0,049 |
0,311 |
0,213 |
0,098 |
0,82 |
Заключение.
Классификация и ранжирование объектов, заданных противоречивыми признаками является сложной и одновременно актуальной задачей. Аппарат мультимножеств, рассмотренный в работе, дает возможность решения задач многокритериального выбора. Построение обобщенного решающего правила для отбора дисциплин студентами является актуальной задачей в период внедрения положений Болонской декларации в систему высшего образования.
Результаты, полученные в работе, показывают, что наиболее интересными для студентов (для конкретной рассматриваемой специальности) являются дисциплины, материалы которых находят свое применение на практике.
В дальнейшем планируется построение обобщающих правил ранжирования критериев выбора дисциплин студентами ВУЗов вне зависимости от специальности, по которой они обучаются.
ЛИТЕРАТУРА:
1. Петровский А.Б. Упорядочение и классификация объектов с противоречивыми признаками // Новости искусственного интеллекта. – 2003. – №4. – 17 с.
2. Наказ № 49 від 23.01.2004р. "Про затвердження Програми дій щодо реалізації положень Болонської декларації в системі вищої освіти і науки України на 2004-2005 роки.", http://www.mon.gov.ua/
3. Петровский А.Б. Пространства множеств и мультимножесв. – Москва: Едиториал УРСС, 2003. – 248 с.