Clear Sky Science · ru

Интеграция машинного обучения и объяснимого ИИ для прогнозирования текучести сотрудников в HR‑аналитике

2026-02-12 · Назад к списку

Почему потеря людей бьёт больно

Каждое увольнение имеет скрытую цену. Когда опытный сотрудник уходит, компания теряет не только строку в бюджете на зарплату — она теряет навыки, деловые связи и накопленный импульс. В этой статье рассматривается, как современные инструменты анализа данных помогают организациям выявлять тех, кто может уйти, и, что важнее, понимать причины. Сочетая машинное обучение с объяснимым искусственным интеллектом, исследователи стремятся дать HR‑командам практическую систему раннего предупреждения и рекомендации для удержания ценных сотрудников.

Преобразование HR‑записей в сигналы

Большинство организаций уже собирают детальную информацию о персонале: возраст, должность, зарплату, оценки эффективности и даже ответы на опросы удовлетворённости. В исследовании используются четыре таких набора данных, включая широко известный образец IBM и несколько реальных или реалистичных корпоративных выборок с тысячами сотрудников. Эти таблицы содержат числовые поля (например, ежемесячный доход или стаж в компании) и категориальные (например, роль в компании или семейное положение). Авторы сначала очищают и стандартизируют всю информацию, преобразуя текстовые метки в числа и приводя измерения к сопоставимым шкалам. Такая тщательная подготовка превращает разрозненные HR‑записи в последовательную основу, на которой могут учиться компьютеры.

Обучение моделей выявлять риски ухода

Когда данные готовы, команда проверяет широкий набор методов прогнозирования — от простой логистической регрессии до более продвинутых приёмов «усиления» (boosting), которые объединяют множество слабых правил в одно сильное. Ключевая проблема в том, что в любой компании большинство сотрудников остаются, поэтому «ушедшие» составляют малую долю. Без компенсации модель может просто предсказывать, что все останутся, и на бумаге казаться точной. Чтобы избежать этой ловушки, авторы применяют методы балансировки, создавая реалистичные синтетические примеры ушедших, что помогает алгоритмам уловить тонкие закономерности, отделяющие тех, кто, вероятно, уйдёт, от тех, кто останется. Они также используют автоматизированный поиск для тонкой настройки внутренних параметров каждой модели в тысячах испытаний, выжимая дополнительную точность.

Кто уходит и что имеет наибольшее значение

По результатам на разных наборах данных выделяются две группы моделей: Adaptive Boosting (AB) и Histogram Gradient Boosting (HGB). Эти подходы показывают высокие показатели точности (как часто предсказанный ушедший действительно уходит), полноты (сколько реальных ушедших поймано) и общей точности. Но сытая производительность недостаточна для реального применения. Менеджерам по персоналу нужно понимать, какие факторы влияют на прогноз, чтобы реагировать справедливо. Чтобы «раскрыть» эти «чёрные ящики», команда использует метод SHAP, заимствованный из теории игр. SHAP назначает каждой характеристике вклад в итоговый прогноз для конкретного сотрудника и при усреднении по множеству работников показывает, какие факторы важны в целом. В этом исследовании переработки, уровень должности, опционные планы и удовлетворённость работой регулярно выступают мощными сигналами будущих уходов или смены работы.

От чисел к конкретным действиям

Поскольку объяснения SHAP работают и на глобальном уровне, и для каждого отдельного человека, они соединяют статистику с повседневными решениями. На уровне компании они выявляют широкие проблемные зоны: например, частые переработки или застой на среднем этапе карьеры, связанные с повышенным риском ухода. Для одного сотрудника они могут показать, толкают ли его риск‑балл вверх переработки, зарплата или отсутствие перспектив продвижения. Авторы утверждают, что такой двойной взгляд позволяет HR‑командам разрабатывать целевые меры — например, перераспределять нагрузку, прояснять пути продвижения или пересматривать планы по акциям — при этом имея прозрачные основания для обсуждения с руководителями и сотрудниками.

Что это значит для рабочих мест

Проще говоря, статья показывает: теперь возможно строить системы, которые не только прогнозируют, кто может уйти, но и объясняют почему на понятном человеку языке. Тщательно очищая HR‑данные, балансируя соотношение остающихся и ушедших и сочетая сильные модели прогнозирования с наглядными объяснениями, организации могут перейти от реактивных интервью при увольнении к проактивным стратегиям удержания. При ответственном использовании, с учётом приватности и смягчения предвзятости, такие инструменты помогают компаниям защищать свой человеческий капитал и одновременно делать рабочие места справедливее и отзывчивее.

Цитирование: AL-Ali, M., Alwateer, M., Alsaedi, S.A. et al. Integrating machine learning and explainable AI for employee attrition prediction in HR analytics. Sci Rep 16, 6344 (2026). https://doi.org/10.1038/s41598-026-36424-2

Ключевые слова: текучесть сотрудников, HR‑аналитика, машинное обучение, объяснимый ИИ, стратегии удержания