Математический аппарат Admission Radar
Справочная страница к докладу «Математическое моделирование приемной кампании высшего учебного заведения». Здесь собраны основные обозначения, формулы и пояснения, используемые в модели анализа, прогноза, оценки рисков и сценарной поддержки решений приемной комиссии.
1. Общая идея математической модели
Приемная кампания рассматривается как многоэтапная многоуровневая дискретно-временная система. В каждый день кампании наблюдаются показатели по конкурсным группам: заявления, уникальные абитуриенты, согласия на зачисление, выполнение контрольных цифр приема и риск недобора.
Назначение модели — не просто описать статистику приема, а поддержать управленческие решения: заранее выявить проблемные направления, оценить прогнозный дефицит, сравнить сценарии действий и определить зоны, требующие внимания приемной комиссии.
2. Основные обозначения
| Обозначение | Смысл |
|---|---|
| \(g \in G\) | конкурсная группа |
| \(p \in P\) | направление подготовки |
| \(f \in F\) | факультет / институт |
| \(t \in T\) | день или контрольная точка приемной кампании |
| \(N_g(t)\) | накопленное число заявлений по группе \(g\) к моменту \(t\) |
| \(U_g(t)\) | число уникальных поступающих |
| \(C_g(t)\) | накопленное число согласий на зачисление |
| \(Q_g\) | контрольная цифра приема / план приема |
| \(B_g(t)\) | расчетное число занятых мест |
| \(\theta_g(t)\) | степень выполнения плана |
| \(R_g(t)\) | интегральный риск проблемной ситуации |
| \(e(t)\) | фаза приемной кампании |
| \(\widehat{C}_g(T\mid t)\) | прогноз итогового числа согласий на конец кампании \(T\), построенный по данным на момент \(t\) |
3. Иерархия уровней и фазовая структура
Модель учитывает, что приемная кампания анализируется одновременно на нескольких уровнях: конкурсная группа → направление подготовки → факультет → университет. Это позволяет не потерять локальные проблемные зоны при переходе к агрегированной картине.
T=\{1,2,\ldots,T_{end}\}
E=\{1,2,\ldots,M\}, \qquad T=\bigcup_{m=1}^{M}T_m, \qquad T_m=[\tau_{m-1},\tau_m)
\varphi:T\rightarrow E
Фаза важна, потому что одинаковое значение показателя может иметь разный смысл на разных этапах: малое число согласий в начале приема нормально, но в финальной фазе уже указывает на риск недобора.
4. Вектор состояния конкурсной группы
Для каждой конкурсной группы в каждый момент времени задается вектор состояния. Он объединяет фактические показатели, производные индикаторы и риск.
x_g(t)=\left(N_g(t),U_g(t),C_g(t),B_g(t),k_g^{(N)}(t),k_g^{(U)}(t),\rho_g(t),\theta_g(t),j_g(t),\delta_g(t),R_g(t),e(t)\right)
x_g(t)=\left(N_g(t), C_g(t), Q_g, \theta_g(t), R_g(t), e(t)\right)
X(t)=\{x_g(t)\mid g\in G\}
X(t+1)=\Phi(X(t),u(t),\xi(t))
Здесь \(u(t)\) — управленческие воздействия, например информационная работа, консультации, перераспределение внимания приемной комиссии; \(\xi(t)\) — внешние и ненаблюдаемые факторы.
5. Кумулятивная динамика
Кумулятивная динамика — это динамика накопленного итога. Она показывает не «сколько пришло сегодня», а «сколько всего накопилось к текущему дню».
N_g(t+1)=N_g(t)+\Delta N_g(t)
N_g(t)=\sum_{\tau=1}^{t}\Delta N_g(\tau)
C_g(t+1)=C_g(t)+\Delta C_g(t)
6. Показатели выполнения плана приема
B_g(t)=\min\{C_g(t),Q_g\}
\theta_g(t)=\frac{B_g(t)}{Q_g}
\theta_g(t)=\frac{C_g(t)}{Q_g}
\widehat{\theta}_g(T\mid t)=\frac{\min\{\widehat{C}_g(T\mid t),Q_g\}}{Q_g}
7. Целевая функция управления
Основная цель управления — минимизировать отклонение прогнозируемого или фактического набора от контрольных цифр приема по конкурсным группам или направлениям подготовки.
F=\sum_{g\in G}\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min
F=\sum_{g\in G}w_g\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min
D_g=\widehat{C}_g(T)-Q_g
Если \(D_g<0\), возникает риск недобора. Если \(D_g>0\), наблюдается избыточный спрос или потенциальный структурный перекос.
8. Модели динамики заявлений
Заявления являются ранним индикатором спроса. Они позволяют выявить слабые направления раньше, чем начнется активный этап поступления согласий.
\Delta N_g(t)=N_g(t)-N_g(t-1)
k_g^{(N)}(t)=\frac{N_g(t)}{Q_g}
k_g^{(U)}(t)=\frac{U_g(t)}{Q_g}
j_g(t)=\frac{k_g^{(N)}(t)}{\frac{1}{|G^*(g)|}\sum_{h\in G^*(g)}k_h^{(N)}(t)}
N_g(t)=\frac{K_g}{1+\exp(-r_g(t-t_{0g}))}
N_g(t)=K_g\exp(-b_g\exp(-c_gt))
\widehat{N}_g(T\mid t)=N_g(t)+\sum_{\tau=t}^{T-1}\widehat{\Delta N}_g(\tau)
Логистическая модель и модель Гомпертца применяются для описания S-образных траекторий: сначала поток заявлений растет медленно, затем ускоряется, а ближе к насыщению темп снова снижается.
9. Модели динамики согласий
Согласия на зачисление ближе всего связаны с фактическим выполнением плана приема. Поэтому они используются для прогноза итогового набора и оценки риска недобора.
W_g(t)=\max\{0,U_g(t)-C_g(t)\}
\Delta C_g(t)\sim Bin(W_g(t),\pi_g(t))
logit(\pi_g(t))=a_{0g}+a_{1g}I\{e(t)=e_2\}+a_{2g}I\{e(t)=e_3\}+a_{3g}j_g(t)+a_{4g}\rho_g(t)+a_{5g}z_g(t)
\rho_g(t)=\frac{C_g(t)}{N_g(t)}, \qquad N_g(t)>0
\widehat{C}_g(T\mid t)=C_g(t)+\sum_{\tau=t}^{T-1}E[\Delta C_g(\tau)\mid x_g(\tau)]
10. Оценка риска недобора
Риск недобора переводит прогнозные значения в управленческий сигнал: где вероятен дефицит, насколько он велик и за счет какого компонента возникает.
D_g(t)=\max\{0,Q_g-\widehat{C}_g(T\mid t)\}
\mathcal{U}_g(t)=\{\widehat{C}_g(T\mid t)
p_g^{(U)}(t)=P(\mathcal{U}_g(t)\mid x_g(t))
r_g^{(N)}(t)=\max\left\{0,1-\frac{\widehat{N}_g(T\mid t)}{\kappa_1 Q_g}\right\}
r_g^{(C)}(t)=\max\left\{0,1-\frac{\widehat{C}_g(T\mid t)}{Q_g}\right\}
\delta_g(t)=\theta_g(t)-\overline{\theta}_g(t)
r_g^{(F)}(t)=\max\left\{0,\frac{\overline{\theta}_g(t)-\theta_g(t)}{\max\{\overline{\theta}_g(t),\varepsilon\}}\right\}
r_g^{(V)}(t)=\frac{\sigma_g^{loc}(t)}{|\mu_g^{loc}(t)|+\varepsilon}
R_g(t)=\alpha_1r_g^{(N)}(t)+\alpha_2r_g^{(C)}(t)+\alpha_3r_g^{(F)}(t)+\alpha_4r_g^{(V)}(t), \qquad \sum_{i=1}^{4}\alpha_i=1
Интегральный риск учитывает не один показатель, а несколько источников проблем: слабый поток заявлений, недостаток согласий, отставание от нормальной фазовой траектории и нестабильность динамики.
11. Многоуровневая агрегация рисков
При переходе от конкурсных групп к факультетам и университету нельзя ограничиваться средним значением риска: оно может скрыть одну критическую группу среди нескольких благополучных. Поэтому используется не полностью компенсируемая агрегация.
N_P(t)=M_{G\to P}N_G(t), \qquad C_P(t)=M_{G\to P}C_G(t), \qquad Q_P=M_{G\to P}Q_G
\overline{R}_L(t)=\sum_{g\in L}\omega_gR_g(t)
R_L(t)=\beta_1\overline{R}_L(t)+\beta_2\max_{g\in L}R_g(t)+\beta_3\sigma_R(t), \qquad \sum_{j=1}^{3}\beta_j=1
Компонента \(\max R_g(t)\) не позволяет «спрятать» локальную проблемную зону за благополучным средним значением, а \(\sigma_R(t)\) показывает неоднородность рисков внутри факультета или университета.
12. Траекторный риск
Траекторный риск оценивает не только текущее состояние, но и отклонение всей прогнозной траектории от нормативной или исторически типичной траектории приемной кампании.
m_g(t)=\left(\overline{N}_g(t),\overline{C}_g(t),\overline{\theta}_g(t)\right)^T
d_N^g(t)=\max\left\{0,\frac{\overline{N}_g(t)-N_g(t)}{\max\{\overline{N}_g(t),\varepsilon\}}\right\}
d_C^g(t)=\max\left\{0,\frac{\overline{C}_g(t)-C_g(t)}{\max\{\overline{C}_g(t),\varepsilon\}}\right\}
R_{traj}^{g}(T\mid t)=\sum_{u=t}^{T}\lambda^{u-t}\left(w_1d_N^g(u)+w_2d_C^g(u)+w_3d_{\theta}^g(u)+w_4R_g(u)\right)
13. Сценарное управление
Сценарный блок позволяет сравнивать возможные управленческие действия не только по одному показателю, а по совокупному эффекту: выполнение плана, снижение риска, структурный баланс и административная стоимость.
\widehat{x}_g^{(s)}(u+1)=F_{\varphi(u)}\left(\widehat{x}_g^{(s)}(u),u_g^{(s)}(u),z_g^{(s)}(u),\eta_g\right)
J(s)=\gamma_1\Delta Q^{(s)}+\gamma_2R_U^{(s)}+\gamma_3B^{(s)}+\gamma_4C_{adm}^{(s)}
s^*=\arg\min_{s\in S_{adm}}J(s)
s^*=\arg\min_{s\in S_{adm}}\max_{\xi\in\Xi}J(s,\xi)
Alert_g(t)=1,\quad \text{если } R_{traj}^{g}(T\mid t)\geq\tau_R \text{ или } R_{traj}^{g}(T\mid t)-R_{traj}^{g}(T\mid t-1)\geq\tau_D
14. Метрики качества прогноза и валидации
Для доказательности модели важно проверять ее на ретроспективных данных: модель получает данные до определенного дня кампании и строит прогноз, который сравнивается с фактическим итогом.
MAE=\frac{1}{n}\sum_{i=1}^{n}|y_i-\widehat{y}_i|
RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\widehat{y}_i)^2}
MAPE=\frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i-\widehat{y}_i}{y_i}\right|
sMAPE=\frac{100\%}{n}\sum_{i=1}^{n}\frac{|y_i-\widehat{y}_i|}{(|y_i|+|\widehat{y}_i|)/2}
Accuracy=\frac{TP+TN}{TP+TN+FP+FN}
Для прогноза итоговых численных значений применяются MAE, RMSE, MAPE и sMAPE. Для проверки системы раннего предупреждения дополнительно используются метрики классификации: точность, полнота, ROC-AUC или PR-AUC.
15. Минимальный набор формул для слайда
Если на презентационном слайде нужно показать математический аппарат компактно, достаточно 5 формул. Они демонстрируют состояние системы, динамику, выполнение плана, целевую функцию и риск.
x_g(t)=\left(N_g(t), C_g(t), Q_g, \theta_g(t), R_g(t), e(t)\right)
N_g(t+1)=N_g(t)+\Delta N_g(t)
\theta_g(t)=\frac{C_g(t)}{Q_g}
F=\sum_{g\in G}w_g\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min
R_g(t)=\alpha_1r_g^{(N)}(t)+\alpha_2r_g^{(C)}(t)+\alpha_3r_g^{(F)}(t)+\alpha_4r_g^{(V)}(t)
16. Короткая интерпретация для слушателей
Математический аппарат Admission Radar описывает приемную кампанию как систему, в которой ежедневно изменяются накопленные показатели заявлений и согласий. Для каждой конкурсной группы рассчитывается степень выполнения плана, прогноз итогового результата и риск недобора. Затем локальные риски агрегируются на уровни направления, факультета и университета так, чтобы критические группы не скрывались за средними значениями.
Практический результат модели — ранжированный список проблемных конкурсных групп, прогнозный дефицит, оценка риска и возможность сравнить управленческие сценарии до завершения приемной кампании.