СКГТА, г.Черкесск

Анализ успеваемости по данным в бумажной форме отличается высокой трудоемкостью и низкой оперативностью.

Компьютерный учет позволяет создать средства контроля регистрации оценок со стороны студента, преподавателя, декана, зав. кафедрой, учебного отдела, проректора по учебной работе. Контроль позволит уменьшить долю неправильно оформленных документов.

Данные для эконометрического анализа успеваемости студентов были получены из директората института Прикладной математики и информационных технологий (с удалением из формируемой выборки личных данных с целью защиты персональной информации студентов). О каждом студенте в выборке име­ется следующая информация: регион, населенный пункт, школа, результаты ЕГЭ, результаты аттестаций (текущей и промежуточной).

Собранным данные были предварительно подготовлены и систематизированы в среде MS EXCEL с использование продвинутых функций управления БД.

Фрагменты БД, сформированной из исходных обезличенных сведений, показаны на рисунке 1.

В настоящей работе демонстрируются возможности пакета R на примере исследования успеваемости студентов.

Модель зависимости числа часов пропусков по аттестациям от типа школы и пола студента

Call:

lm(formula = Attest_propusk ~ 0 + Type * Sex, data = MyDB)

 

Residuals:

Min 1Q Median 3Q Max

-7.912 -4.011 -2.236 1.801 41.801

 

Coefficients: (1 not defined because of singularities)

Estimate Std. Error t value Pr(>|t|)

Typecolleage 4.0113 0.2693 14.893 < 2e-16 ***

Typegymnaz 0.9375 1.0982 0.854 0.393341

Typelicey -0.7764 1.5479 -0.502 0.616000

Typeschool 3.1369 0.2450 12.804 < 2e-16 ***

Sexm 2.1882 0.3549 6.165 8.01e-10 ***

Typegymnaz:Sexm 4.7864 1.3252 3.612 0.000309 ***

Typelicey:Sexm NA NA NA NA

Typeschool:Sexm -1.0891 0.4755 -2.290 0.022077 *

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

 

Residual standard error: 6.212 on 2992 degrees of freedom

(330 observations deleted due to missingness)

Multiple R-squared: 0.3625,  Adjusted R-squared: 0.361

F-statistic: 243 on 7 and 2992 DF, p-value: < 2.2e-16

Статистически значимы пропуски только по колледжам и СОШ, а так же по полу студента. Выпускницы колледжей пропускают в среднем по 4,0 часа занятий (парни на 2,2 часа больше), а выпускницы СОШ – 3,1 часа (парни – меньше на 1 час, но результат значим только на уровне 5%).

Модель зависимости оценок в сессии от пола и результатов аттестации (базовые значения качественных переменных: пол-женский, результат аттестации-«-»)

Call:

lm(formula = Mark ~ 0 + Sex + Attest_gram, data = MyDB)

Residuals:

Min 1Q Median 3Q Max

-1.91967 -0.35993 0.08033 0.38041 1.42324

 

Coefficients:

Estimate Std. Error t value Pr(>|t|)

Sexf 3.47234 0.10294 33.733 < 2e-16 ***

Sexm 3.35993 0.09506 35.345 < 2e-16 ***

Attest_gram0 0.21683 0.12740 1.702 0.0894 .

Attest_gram1 0.61106 0.10325 5.918 6.09e-09 ***

Attest_gram2 1.14725 0.10475 10.953 < 2e-16 ***

Attest_gram+ 1.44732 0.10700 13.527 < 2e-16 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

 

Residual standard error: 0.5099 on 495 degrees of freedom

(2828 observations deleted due to missingness)

Multiple R-squared: 0.9867,  Adjusted R-squared: 0.9865

F-statistic: 6107 on 6 and 495 DF, p-value: < 2.2e-16

Как и следовало ожидать, успеваемость зависит от пола студента. Кроме того, чем выше результат аттестации, тем лучше успеваемость студента. При этом, результаты для студентов, не аттестованных, и студентов, получивших аттестацию «0», различаются статистически значимо только на уровне значимости 10%.

В магистерской диссертации был собран и проанализирован большой объем информации по успеваемости и посещаемости студентов института прикладной математики и информационных технологий СевКавГГТА, сформирована подробная БД. Были разработаны эконометрические модели успеваемости студентов.

Проведение эконометрического анализа было бы невозможно без использования ПО статистического программирования R. Для обработки собранных данных были разработаны многомерные эконометрические модели, в т.ч. с качественными (категорическими) переменными, которые позволили построить уравнения, описывающих зависимость успеваемости от посещения, результатов текущих аттестаций, района, пола студента, результатов ЕГЭ по информатике, математике и русскому языку.

мадий1

Рисунок 1–Первоначальные данные

 

Список литературы

  1. Айвазян, С.А., Иванова, С. С. Эконометрика. Краткий курс: учеб.пособие/−М.: Маркет ДС, 2007.−104 с.
  2. Бабешко, Л. О. Основы эконометрического моделирования / Л.О. Бабешко. – М.: КомКнига, 2014. – 432 c.
  3. Мастицкий, С.Э., Шитиков, В.К. Статистический анализ и визуализация данных с помощью R/ С.Э. Мастицкий В.К. Шитиков: Феникс,2014. -256с.