Математический аппарат Admission Radar

Справочная страница к докладу «Математическое моделирование приемной кампании высшего учебного заведения». Здесь собраны основные обозначения, формулы и пояснения, используемые в модели анализа, прогноза, оценки рисков и сценарной поддержки решений приемной комиссии.

Admission Radar приемная кампания математическое моделирование сценарное управление
Как пользоваться страницей. Формулы показаны в двух видах: в отрисованном математическом виде и в виде LaTeX-кода. LaTeX-код можно копировать кнопкой «Скопировать» и вставлять в Gamma, Word, Markdown, HTML-страницу с MathJax/KaTeX или научный текст.

1. Общая идея математической модели

Приемная кампания рассматривается как многоэтапная многоуровневая дискретно-временная система. В каждый день кампании наблюдаются показатели по конкурсным группам: заявления, уникальные абитуриенты, согласия на зачисление, выполнение контрольных цифр приема и риск недобора.

Назначение модели — не просто описать статистику приема, а поддержать управленческие решения: заранее выявить проблемные направления, оценить прогнозный дефицит, сравнить сценарии действий и определить зоны, требующие внимания приемной комиссии.

2. Основные обозначения

Обозначение Смысл
\(g \in G\)конкурсная группа
\(p \in P\)направление подготовки
\(f \in F\)факультет / институт
\(t \in T\)день или контрольная точка приемной кампании
\(N_g(t)\)накопленное число заявлений по группе \(g\) к моменту \(t\)
\(U_g(t)\)число уникальных поступающих
\(C_g(t)\)накопленное число согласий на зачисление
\(Q_g\)контрольная цифра приема / план приема
\(B_g(t)\)расчетное число занятых мест
\(\theta_g(t)\)степень выполнения плана
\(R_g(t)\)интегральный риск проблемной ситуации
\(e(t)\)фаза приемной кампании
\(\widehat{C}_g(T\mid t)\)прогноз итогового числа согласий на конец кампании \(T\), построенный по данным на момент \(t\)

3. Иерархия уровней и фазовая структура

Модель учитывает, что приемная кампания анализируется одновременно на нескольких уровнях: конкурсная группа → направление подготовки → факультет → университет. Это позволяет не потерять локальные проблемные зоны при переходе к агрегированной картине.

Множество дней кампании
\[T=\{1,2,\ldots,T_{end}\}\]
T=\{1,2,\ldots,T_{end}\}
Разбиение кампании на фазы
\[E=\{1,2,\ldots,M\}, \qquad T=\bigcup_{m=1}^{M}T_m, \qquad T_m=[\tau_{m-1},\tau_m)\]
E=\{1,2,\ldots,M\}, \qquad T=\bigcup_{m=1}^{M}T_m, \qquad T_m=[\tau_{m-1},\tau_m)
Функция фазы
\[\varphi:T\rightarrow E\]
\varphi:T\rightarrow E

Фаза важна, потому что одинаковое значение показателя может иметь разный смысл на разных этапах: малое число согласий в начале приема нормально, но в финальной фазе уже указывает на риск недобора.

4. Вектор состояния конкурсной группы

Для каждой конкурсной группы в каждый момент времени задается вектор состояния. Он объединяет фактические показатели, производные индикаторы и риск.

Расширенный вектор состояния
\[ x_g(t)= \left( N_g(t), U_g(t), C_g(t), B_g(t), k_g^{(N)}(t), k_g^{(U)}(t), \rho_g(t), \theta_g(t), j_g(t), \delta_g(t), R_g(t), e(t) \right) \]
x_g(t)=\left(N_g(t),U_g(t),C_g(t),B_g(t),k_g^{(N)}(t),k_g^{(U)}(t),\rho_g(t),\theta_g(t),j_g(t),\delta_g(t),R_g(t),e(t)\right)
Краткий вариант для презентации
\[ x_g(t)=\left(N_g(t), C_g(t), Q_g, \theta_g(t), R_g(t), e(t)\right) \]
x_g(t)=\left(N_g(t), C_g(t), Q_g, \theta_g(t), R_g(t), e(t)\right)
Состояние всей приемной кампании
\[ X(t)=\{x_g(t)\mid g\in G\} \]
X(t)=\{x_g(t)\mid g\in G\}
Общее уравнение динамики системы
\[ X(t+1)=\Phi(X(t),u(t),\xi(t)) \]
X(t+1)=\Phi(X(t),u(t),\xi(t))

Здесь \(u(t)\) — управленческие воздействия, например информационная работа, консультации, перераспределение внимания приемной комиссии; \(\xi(t)\) — внешние и ненаблюдаемые факторы.

5. Кумулятивная динамика

Кумулятивная динамика — это динамика накопленного итога. Она показывает не «сколько пришло сегодня», а «сколько всего накопилось к текущему дню».

Накопленная динамика заявлений
\[ N_g(t+1)=N_g(t)+\Delta N_g(t) \]
N_g(t+1)=N_g(t)+\Delta N_g(t)
Заявления как сумма дневных приростов
\[ N_g(t)=\sum_{\tau=1}^{t}\Delta N_g(\tau) \]
N_g(t)=\sum_{\tau=1}^{t}\Delta N_g(\tau)
Накопленная динамика согласий
\[ C_g(t+1)=C_g(t)+\Delta C_g(t) \]
C_g(t+1)=C_g(t)+\Delta C_g(t)

6. Показатели выполнения плана приема

Расчетное число занятых мест
\[ B_g(t)=\min\{C_g(t),Q_g\} \]
B_g(t)=\min\{C_g(t),Q_g\}
Степень выполнения плана приема
\[ \theta_g(t)=\frac{B_g(t)}{Q_g} \]
\theta_g(t)=\frac{B_g(t)}{Q_g}
Упрощенный вариант, если согласия напрямую интерпретируются как занятые места
\[ \theta_g(t)=\frac{C_g(t)}{Q_g} \]
\theta_g(t)=\frac{C_g(t)}{Q_g}
Прогнозное выполнение плана
\[ \widehat{\theta}_g(T\mid t)= \frac{\min\{\widehat{C}_g(T\mid t),Q_g\}}{Q_g} \]
\widehat{\theta}_g(T\mid t)=\frac{\min\{\widehat{C}_g(T\mid t),Q_g\}}{Q_g}

7. Целевая функция управления

Основная цель управления — минимизировать отклонение прогнозируемого или фактического набора от контрольных цифр приема по конкурсным группам или направлениям подготовки.

Невзвешенная целевая функция
\[ F=\sum_{g\in G}\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min \]
F=\sum_{g\in G}\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min
Взвешенная целевая функция
\[ F=\sum_{g\in G}w_g\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min \]
F=\sum_{g\in G}w_g\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min
Локальное отклонение от плана
\[ D_g=\widehat{C}_g(T)-Q_g \]
D_g=\widehat{C}_g(T)-Q_g

Если \(D_g<0\), возникает риск недобора. Если \(D_g>0\), наблюдается избыточный спрос или потенциальный структурный перекос.

8. Модели динамики заявлений

Заявления являются ранним индикатором спроса. Они позволяют выявить слабые направления раньше, чем начнется активный этап поступления согласий.

Дневной прирост заявлений
\[ \Delta N_g(t)=N_g(t)-N_g(t-1) \]
\Delta N_g(t)=N_g(t)-N_g(t-1)
Заявочная обеспеченность
\[ k_g^{(N)}(t)=\frac{N_g(t)}{Q_g} \]
k_g^{(N)}(t)=\frac{N_g(t)}{Q_g}
Обеспеченность уникальными поступающими
\[ k_g^{(U)}(t)=\frac{U_g(t)}{Q_g} \]
k_g^{(U)}(t)=\frac{U_g(t)}{Q_g}
Индекс конкурентной позиции
\[ j_g(t)= \frac{k_g^{(N)}(t)} {\frac{1}{|G^*(g)|}\sum_{h\in G^*(g)}k_h^{(N)}(t)} \]
j_g(t)=\frac{k_g^{(N)}(t)}{\frac{1}{|G^*(g)|}\sum_{h\in G^*(g)}k_h^{(N)}(t)}
Логистическая модель накопления заявлений
\[ N_g(t)=\frac{K_g}{1+\exp(-r_g(t-t_{0g}))} \]
N_g(t)=\frac{K_g}{1+\exp(-r_g(t-t_{0g}))}
Модель Гомпертца
\[ N_g(t)=K_g\exp(-b_g\exp(-c_gt)) \]
N_g(t)=K_g\exp(-b_g\exp(-c_gt))
Прогноз итогового числа заявлений
\[ \widehat{N}_g(T\mid t)= N_g(t)+ \sum_{\tau=t}^{T-1}\widehat{\Delta N}_g(\tau) \]
\widehat{N}_g(T\mid t)=N_g(t)+\sum_{\tau=t}^{T-1}\widehat{\Delta N}_g(\tau)

Логистическая модель и модель Гомпертца применяются для описания S-образных траекторий: сначала поток заявлений растет медленно, затем ускоряется, а ближе к насыщению темп снова снижается.

9. Модели динамики согласий

Согласия на зачисление ближе всего связаны с фактическим выполнением плана приема. Поэтому они используются для прогноза итогового набора и оценки риска недобора.

Пул потенциальных согласий
\[ W_g(t)=\max\{0,U_g(t)-C_g(t)\} \]
W_g(t)=\max\{0,U_g(t)-C_g(t)\}
Вероятностная модель прироста согласий
\[ \Delta C_g(t)\sim Bin(W_g(t),\pi_g(t)) \]
\Delta C_g(t)\sim Bin(W_g(t),\pi_g(t))
Логит-модель вероятности согласия
\[ logit(\pi_g(t))= a_{0g} +a_{1g}I\{e(t)=e_2\} +a_{2g}I\{e(t)=e_3\} +a_{3g}j_g(t) +a_{4g}\rho_g(t) +a_{5g}z_g(t) \]
logit(\pi_g(t))=a_{0g}+a_{1g}I\{e(t)=e_2\}+a_{2g}I\{e(t)=e_3\}+a_{3g}j_g(t)+a_{4g}\rho_g(t)+a_{5g}z_g(t)
Конверсия заявлений в согласия
\[ \rho_g(t)=\frac{C_g(t)}{N_g(t)}, \qquad N_g(t)>0 \]
\rho_g(t)=\frac{C_g(t)}{N_g(t)}, \qquad N_g(t)>0
Прогноз итогового числа согласий
\[ \widehat{C}_g(T\mid t)= C_g(t)+ \sum_{\tau=t}^{T-1}E[\Delta C_g(\tau)\mid x_g(\tau)] \]
\widehat{C}_g(T\mid t)=C_g(t)+\sum_{\tau=t}^{T-1}E[\Delta C_g(\tau)\mid x_g(\tau)]

10. Оценка риска недобора

Риск недобора переводит прогнозные значения в управленческий сигнал: где вероятен дефицит, насколько он велик и за счет какого компонента возникает.

Прогнозный дефицит
\[ D_g(t)=\max\{0,Q_g-\widehat{C}_g(T\mid t)\} \]
D_g(t)=\max\{0,Q_g-\widehat{C}_g(T\mid t)\}
Событие недобора
\[ \mathcal{U}_g(t)=\{\widehat{C}_g(T\mid t)
\mathcal{U}_g(t)=\{\widehat{C}_g(T\mid t)
        
Вероятность риска недобора
\[ p_g^{(U)}(t)=P(\mathcal{U}_g(t)\mid x_g(t)) \]
p_g^{(U)}(t)=P(\mathcal{U}_g(t)\mid x_g(t))
Риск дефицита заявлений
\[ r_g^{(N)}(t)= \max\left\{ 0, 1-\frac{\widehat{N}_g(T\mid t)}{\kappa_1 Q_g} \right\} \]
r_g^{(N)}(t)=\max\left\{0,1-\frac{\widehat{N}_g(T\mid t)}{\kappa_1 Q_g}\right\}
Риск дефицита согласий
\[ r_g^{(C)}(t)= \max\left\{ 0, 1-\frac{\widehat{C}_g(T\mid t)}{Q_g} \right\} \]
r_g^{(C)}(t)=\max\left\{0,1-\frac{\widehat{C}_g(T\mid t)}{Q_g}\right\}
Фазовое отклонение
\[ \delta_g(t)=\theta_g(t)-\overline{\theta}_g(t) \]
\delta_g(t)=\theta_g(t)-\overline{\theta}_g(t)
Фазовый риск
\[ r_g^{(F)}(t)= \max\left\{ 0, \frac{\overline{\theta}_g(t)-\theta_g(t)} {\max\{\overline{\theta}_g(t),\varepsilon\}} \right\} \]
r_g^{(F)}(t)=\max\left\{0,\frac{\overline{\theta}_g(t)-\theta_g(t)}{\max\{\overline{\theta}_g(t),\varepsilon\}}\right\}
Риск волатильности
\[ r_g^{(V)}(t)= \frac{\sigma_g^{loc}(t)} {|\mu_g^{loc}(t)|+\varepsilon} \]
r_g^{(V)}(t)=\frac{\sigma_g^{loc}(t)}{|\mu_g^{loc}(t)|+\varepsilon}
Интегральный риск конкурсной группы
\[ R_g(t)= \alpha_1r_g^{(N)}(t) +\alpha_2r_g^{(C)}(t) +\alpha_3r_g^{(F)}(t) +\alpha_4r_g^{(V)}(t), \qquad \sum_{i=1}^{4}\alpha_i=1 \]
R_g(t)=\alpha_1r_g^{(N)}(t)+\alpha_2r_g^{(C)}(t)+\alpha_3r_g^{(F)}(t)+\alpha_4r_g^{(V)}(t), \qquad \sum_{i=1}^{4}\alpha_i=1

Интегральный риск учитывает не один показатель, а несколько источников проблем: слабый поток заявлений, недостаток согласий, отставание от нормальной фазовой траектории и нестабильность динамики.

11. Многоуровневая агрегация рисков

При переходе от конкурсных групп к факультетам и университету нельзя ограничиваться средним значением риска: оно может скрыть одну критическую группу среди нескольких благополучных. Поэтому используется не полностью компенсируемая агрегация.

Линейная агрегация экстенсивных показателей
\[ N_P(t)=M_{G\to P}N_G(t), \qquad C_P(t)=M_{G\to P}C_G(t), \qquad Q_P=M_{G\to P}Q_G \]
N_P(t)=M_{G\to P}N_G(t), \qquad C_P(t)=M_{G\to P}C_G(t), \qquad Q_P=M_{G\to P}Q_G
Средний риск уровня \(L\)
\[ \overline{R}_L(t)=\sum_{g\in L}\omega_gR_g(t) \]
\overline{R}_L(t)=\sum_{g\in L}\omega_gR_g(t)
Не полностью компенсируемая агрегация риска
\[ R_L(t)= \beta_1\overline{R}_L(t) +\beta_2\max_{g\in L}R_g(t) +\beta_3\sigma_R(t), \qquad \sum_{j=1}^{3}\beta_j=1 \]
R_L(t)=\beta_1\overline{R}_L(t)+\beta_2\max_{g\in L}R_g(t)+\beta_3\sigma_R(t), \qquad \sum_{j=1}^{3}\beta_j=1

Компонента \(\max R_g(t)\) не позволяет «спрятать» локальную проблемную зону за благополучным средним значением, а \(\sigma_R(t)\) показывает неоднородность рисков внутри факультета или университета.

12. Траекторный риск

Траекторный риск оценивает не только текущее состояние, но и отклонение всей прогнозной траектории от нормативной или исторически типичной траектории приемной кампании.

Фазово-нормативная траектория
\[ m_g(t)= \left( \overline{N}_g(t), \overline{C}_g(t), \overline{\theta}_g(t) \right)^T \]
m_g(t)=\left(\overline{N}_g(t),\overline{C}_g(t),\overline{\theta}_g(t)\right)^T
Отклонение по заявлениям
\[ d_N^g(t)= \max\left\{ 0, \frac{\overline{N}_g(t)-N_g(t)} {\max\{\overline{N}_g(t),\varepsilon\}} \right\} \]
d_N^g(t)=\max\left\{0,\frac{\overline{N}_g(t)-N_g(t)}{\max\{\overline{N}_g(t),\varepsilon\}}\right\}
Отклонение по согласиям
\[ d_C^g(t)= \max\left\{ 0, \frac{\overline{C}_g(t)-C_g(t)} {\max\{\overline{C}_g(t),\varepsilon\}} \right\} \]
d_C^g(t)=\max\left\{0,\frac{\overline{C}_g(t)-C_g(t)}{\max\{\overline{C}_g(t),\varepsilon\}}\right\}
Интегральный траекторный риск
\[ R_{traj}^{g}(T\mid t)= \sum_{u=t}^{T} \lambda^{u-t} \left( w_1d_N^g(u) +w_2d_C^g(u) +w_3d_{\theta}^g(u) +w_4R_g(u) \right) \]
R_{traj}^{g}(T\mid t)=\sum_{u=t}^{T}\lambda^{u-t}\left(w_1d_N^g(u)+w_2d_C^g(u)+w_3d_{\theta}^g(u)+w_4R_g(u)\right)

13. Сценарное управление

Сценарный блок позволяет сравнивать возможные управленческие действия не только по одному показателю, а по совокупному эффекту: выполнение плана, снижение риска, структурный баланс и административная стоимость.

Прогноз состояния при сценарии \(s\)
\[ \widehat{x}_g^{(s)}(u+1)= F_{\varphi(u)} \left( \widehat{x}_g^{(s)}(u), u_g^{(s)}(u), z_g^{(s)}(u), \eta_g \right) \]
\widehat{x}_g^{(s)}(u+1)=F_{\varphi(u)}\left(\widehat{x}_g^{(s)}(u),u_g^{(s)}(u),z_g^{(s)}(u),\eta_g\right)
Функционал качества сценария
\[ J(s)= \gamma_1\Delta Q^{(s)} +\gamma_2R_U^{(s)} +\gamma_3B^{(s)} +\gamma_4C_{adm}^{(s)} \]
J(s)=\gamma_1\Delta Q^{(s)}+\gamma_2R_U^{(s)}+\gamma_3B^{(s)}+\gamma_4C_{adm}^{(s)}
Выбор предпочтительного сценария
\[ s^*=\arg\min_{s\in S_{adm}}J(s) \]
s^*=\arg\min_{s\in S_{adm}}J(s)
Робастный выбор сценария при неопределенности
\[ s^*= \arg\min_{s\in S_{adm}} \max_{\xi\in\Xi} J(s,\xi) \]
s^*=\arg\min_{s\in S_{adm}}\max_{\xi\in\Xi}J(s,\xi)
Правило раннего предупреждения
\[ Alert_g(t)=1, \quad \text{если } R_{traj}^{g}(T\mid t)\geq\tau_R \text{ или } R_{traj}^{g}(T\mid t)-R_{traj}^{g}(T\mid t-1)\geq\tau_D \]
Alert_g(t)=1,\quad \text{если } R_{traj}^{g}(T\mid t)\geq\tau_R \text{ или } R_{traj}^{g}(T\mid t)-R_{traj}^{g}(T\mid t-1)\geq\tau_D

14. Метрики качества прогноза и валидации

Для доказательности модели важно проверять ее на ретроспективных данных: модель получает данные до определенного дня кампании и строит прогноз, который сравнивается с фактическим итогом.

MAE
\[ MAE=\frac{1}{n}\sum_{i=1}^{n}|y_i-\widehat{y}_i| \]
MAE=\frac{1}{n}\sum_{i=1}^{n}|y_i-\widehat{y}_i|
RMSE
\[ RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\widehat{y}_i)^2} \]
RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\widehat{y}_i)^2}
MAPE
\[ MAPE=\frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i-\widehat{y}_i}{y_i}\right| \]
MAPE=\frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i-\widehat{y}_i}{y_i}\right|
sMAPE
\[ sMAPE= \frac{100\%}{n} \sum_{i=1}^{n} \frac{|y_i-\widehat{y}_i|} {(|y_i|+|\widehat{y}_i|)/2} \]
sMAPE=\frac{100\%}{n}\sum_{i=1}^{n}\frac{|y_i-\widehat{y}_i|}{(|y_i|+|\widehat{y}_i|)/2}
Доля правильного выявления проблемных групп
\[ Accuracy=\frac{TP+TN}{TP+TN+FP+FN} \]
Accuracy=\frac{TP+TN}{TP+TN+FP+FN}

Для прогноза итоговых численных значений применяются MAE, RMSE, MAPE и sMAPE. Для проверки системы раннего предупреждения дополнительно используются метрики классификации: точность, полнота, ROC-AUC или PR-AUC.

15. Минимальный набор формул для слайда

Если на презентационном слайде нужно показать математический аппарат компактно, достаточно 5 формул. Они демонстрируют состояние системы, динамику, выполнение плана, целевую функцию и риск.

1. Состояние
\[ x_g(t)=\left(N_g(t), C_g(t), Q_g, \theta_g(t), R_g(t), e(t)\right) \]
x_g(t)=\left(N_g(t), C_g(t), Q_g, \theta_g(t), R_g(t), e(t)\right)
2. Кумулятивная динамика
\[ N_g(t+1)=N_g(t)+\Delta N_g(t) \]
N_g(t+1)=N_g(t)+\Delta N_g(t)
3. Выполнение плана
\[ \theta_g(t)=\frac{C_g(t)}{Q_g} \]
\theta_g(t)=\frac{C_g(t)}{Q_g}
4. Целевая функция
\[ F=\sum_{g\in G}w_g\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min \]
F=\sum_{g\in G}w_g\left|\widehat{C}_g(T)-Q_g\right|\rightarrow\min
5. Интегральный риск
\[ R_g(t)= \alpha_1r_g^{(N)}(t) +\alpha_2r_g^{(C)}(t) +\alpha_3r_g^{(F)}(t) +\alpha_4r_g^{(V)}(t) \]
R_g(t)=\alpha_1r_g^{(N)}(t)+\alpha_2r_g^{(C)}(t)+\alpha_3r_g^{(F)}(t)+\alpha_4r_g^{(V)}(t)

16. Короткая интерпретация для слушателей

Математический аппарат Admission Radar описывает приемную кампанию как систему, в которой ежедневно изменяются накопленные показатели заявлений и согласий. Для каждой конкурсной группы рассчитывается степень выполнения плана, прогноз итогового результата и риск недобора. Затем локальные риски агрегируются на уровни направления, факультета и университета так, чтобы критические группы не скрывались за средними значениями.

Практический результат модели — ранжированный список проблемных конкурсных групп, прогнозный дефицит, оценка риска и возможность сравнить управленческие сценарии до завершения приемной кампании.