Назад в библиотеку

ОТБОР ИНФОРМАТИВНЫХ ПРИЗНАКОВ, ВЛИЯЮЩИХ НА ОТЧИСЛЕНИЕ СТУДЕНТОВ МЕХАНИКО-МАТЕМАТИЧЕСКОГО ФАКУЛЬТЕТА

В статье описан алгоритм отбора информативных признаков, основанный на использовании нейронной сети, представляются результаты применения метода к задаче анализа отчисления студентов механико-математического факультета.

Ключевые слова: отбор признаков, нейронная сеть, успеваемость

Предлагаемое исследование проведено в рамках направления Прикладная математика и информатика. В Пермском государственном национальном исследовательском университете (ПГНИУ) это направление характеризуется массовым набором (более 85 бюджетных мест) и многолетними традициями подготовки (с 1971 года).

Связь объема финансирования вуза с количеством обучающихся, а также сама возможность вести учебный процесс определяется аккредитацией вуза, успешное прохождение которой связано с рядом показателей, в число которых входит минимальный проходной балл по единому государственному экзамену (ЕГЭ), количество магистров и аспирантов, защитивших диссертации. В связи с этим необходимо уметь анализировать и получать прогноз количества обучающихся студентов, для более эффективной организации учебного процесса.

Согласно исследованию [1] традиционная система оценки знаний студентов, базирующая на итоговом контроле в форме экзамена и (или) зачета, не стимулирует в должной мере систематической работы студентов. Оценка, получаемая студентом на экзамене, в определенной мере зависит от ряда случайных факторов (выбора билета, психологического и физического состояния студента и экзаменатора и др.).

Исходя из этих рассуждений, данные, представленные в 100-бальной шкале БРС отражают более полную информацию о студенте, чем традиционные оценки по 5-бальной шкале.

В ПГНИУ с 01.09.2013 года введена в действие бально-рейтинговая система (БРС), которая позволяет получить дифференцированную и разностороннюю информацию о качестве и результативности обучения.

На данный момент в иностранной литературе существует огромное количество исследований на тематику анализа и прогнозирования успеваемости студентов. Иностранные исследователи выделяют разные факторы, влияющие на успеваемость студентов. В обзоре [2], рассматривались разные подходы к прогнозированию успеваемости обучающихся в колледжах. Были рассмотрены SAT и оценки аттестата для прогнозирования меры успешности в колледжах, под которой понимается средняя оценка, выпускная оценка, лидерские качества и доход после выпуска. В работе [3] авторы использовали мульти-регрессионный метод, использующий комбинацию k регрессионных моделей и метод, основанный на матрице факторизации. Авторы прогнозировали успеваемость студентов при прохождении онлайн курсов. За входные параметры были взяты оценки в аттестате, балл SAT, оценки за уже пройденные курсы, информация о содержимом курса и какой преподаватель проводит занятия по данному курсу.

Данная работа берет свое начало из [4], в которой проводилось исследование успешности окончания курса программирования студентами первокурсниками механико-математического факультета ПГНИУ.

В качестве объекта исследования были выбраны студенты 1 курса, 2014-2016 года поступления. Использовались данные за первый год обучения, то есть три учебных периода и промежуточных аттестации. Исследование проводится с целью выявить, какие факторы оказывают наибольшее влияние на отчисление студента.

Были использованы следующие входные параметры:

Объем выборки составляет 274 студентов, на обучающую и тестовую выборки были поделены следующим образом: 2014 и 2016 год на обучение, а 2015 год на тестирование.

C помощью технологии, сложившейся в Пермской научной школе искусственного интеллекта [5-6] выполнялось проектирование нейронной сети, ее обучение и тестирование, а также эксперименты над нейросетевой математической моделью. Моделирование осуществлялось с помощью нейросимулятора [7].

Оптимальная структура нейронной сети представляла собой персептрон, имеющий 16 входных нейронов, один скрытый слой с 15 нейронами и один выходной нейрон.

В качестве активационных функций нейронов скрытого слоя и выходного нейрона использовалась функция тангенса гиперболического. алгоритм обучения – упругого распространения. После обучения прогностические свойства нейронной сети проверялись на примерах тестирующего множества, которые не использовались при ее обучении. Ошибка сети на обучающем множестве в среднем составила 28,7%, а ошибка на тестирующем множестве – 34,11%.

Было обучено 10 моделей нейронных сетей и посчитана значимость параметров для каждой модели. Результаты приведены в таблице 1. Для каждой модели была посчитана медиана для значимостей, и для показателей, со значимостью меньше делалась отметка. Были получены результаты, представленные в таблице 1.

Таблица 1

12345678910
X10,1260,1650,1120,1160,2270,1130,1110,1430,1550,119
X20,0880,0560,1160,1370,0670,0570,0940,1090,1080,113
X30,1010,1510,1690,1460,3190,0840,1440,1060,1560,159
X40,060,0790,0510,0690,0170,0630,0510,0760,060,07
X50,0480,0350,0460,0330,030,0440,0320,0150,0240,007
X60,0610,0640,0490,0240,0050,0670,0450,0630,0440,053
X70,0410,0630,0260,030,0040,0410,0650,0190,0420,027
X80,0450,0340,0320,0630,0150,030,0410,0440,040,048
X90,0510,0380,0780,0880,0750,0640,0840,0970,0410,077
X100,0780,0510,0590,0620,0820,0530,0720,0480,0530,067
X110,050,0390,0620,0330,1390,0920,0360,0610,0740,059
X120,0560,0350,0340,0460,0010,0590,0350,0580,0510,026
X130,0610,0290,030,0190,0050,0480,0430,0470,030,043
X130,0370,0540,0210,0440,0050,0310,0310,0220,040,041
X140,0360,040,0550,0420,010,0340,0350,020,0190,015
X150,0180,0370,0060,0340,0000,0530,0230,030,0340,045
X160,0440,0290,0550,0160,0010,0680,0590,0420,0280,031

Таким образом, можно предположить, что параметры X5, X7, X8, X13, X14, X15, X16 (форма обучения, преподаватель по предмету Алгоритмизация и программирование, преподаватель по предмету Математический анализ, проживание дома, проживание в общежитии, время, затраченное на дорогу до университета, учебное заведение: Лицей/Гимназия или Школа, получение соц.стипендии) оказывают наименьшее влияние на результирующий параметр, то есть отчисление студентов.

Таблица 2

X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16
Количество отметок00009377214598107

В дальнейшем планируется продолжить исследование в данном направлении и построить модель, которая поможет классифицировать студентов по группам риска.

Библиографический список

  1. Бельская Е.Г. «Влияние системы рейтинг-контроля на успеваемость студентов на примере ИАТЭ НИЯУ МИФИ» Москва: «Образование. Наука. Научные кадры» (журнал, реферируемый ВАК) № 4, стр. 275-279, 2011г.
  2. Nancy W. Burton, Leonard Ramist. Predicting Success in College: SAT® Studies of Classes Graduating Since 1980. College Entrance Examination Board, New York, 2001 3.
  3. A. Elbadrawy , Ag. Polyzou , Z. Ren , Mackenzie Sweeney , G. Karypis , H. Rangwala. Predicting Student Performance Using Personalized Analytics. Computer. Volume 49 Issue 4, April 2016 Pages 61-69
  4. Русаков, С. В. Исследование успешности освоений курса программирования студентами первокурсниками // Новые информационные технологии в образовании : материалы IХ международной научно-практической конференции, 15-18 марта 2016 г., Екатеринбург - Екатеринбург, 2016. - С. 76-80.
  5. Ясницкий Л.Н. Введение в искусственный интеллект. – М.: Издательский центр «Академия», 2005. – 176с.
  6. Ясницкий Л. Н., Бондарь В. В., Бурдин С. Н. и др. Пермская научная школа искусственного интеллекта и ее инновационные проекты. 2-е изд. Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2008. 75 с.
  7. Черепанов Ф.М., Ясницкий Л.Н. Нейросимулятор 5.0. Свидетельство о государственной регистрации программы для ЭВМ № 2014618208.