Clear Sky Science · pt

Integrando aprendizado de máquina e IA explicável para previsão de rotatividade de funcionários em analytics de RH

2026-02-12 · Voltar ao índice

Por que a perda de pessoas dói tanto

Cada demissão carrega um custo oculto. Quando um funcionário experiente sai, a empresa não perde apenas uma linha da folha de pagamento; perde competências, relacionamentos e impulso. Este artigo explora como ferramentas de dados modernas podem ajudar organizações a identificar quem pode estar prestes a sair e, o mais importante, entender por quê. Ao combinar aprendizado de máquina com inteligência artificial explicável, os pesquisadores buscam oferecer às equipes de RH um sistema prático de alerta precoce e orientação para manter profissionais valiosos na empresa.

Transformando registros de RH em sinais

A maioria das organizações já coleta informações ricas sobre seu quadro de funcionários: idade, função, remuneração, notas de desempenho e até respostas a pesquisas de satisfação. O estudo aproveita quatro desses conjuntos de dados, incluindo uma amostra amplamente utilizada da IBM e várias coleções reais ou realistas de empresas com milhares de funcionários. Essas tabelas misturam números (como renda mensal ou anos na empresa) com categorias (como função ou estado civil). Os autores primeiro limpam e padronizam todas essas informações, convertendo rótulos de texto em números e colocando medidas em escalas comparáveis. Essa preparação cuidadosa transforma registros de RH desorganizados em uma base consistente que os computadores podem aprender.

Ensinando máquinas a identificar riscos de saída

Com os dados prontos, a equipe testa uma ampla gama de métodos de previsão, desde a regressão logística simples até técnicas mais avançadas de "boosting" que combinam muitas regras fracas em uma forte. Um desafio chave é que, em qualquer empresa, a maioria dos funcionários permanece, de modo que os “que saem” formam uma minoria pequena. Se não for tratado, um modelo poderia simplesmente prever que todos ficam e ainda assim parecer preciso nos números. Para evitar essa armadilha, os autores usam métodos de balanceamento que criam exemplos sintéticos realistas de quem sai, ajudando os algoritmos a aprender os padrões sutis que separam os que provavelmente vão pedir demissão dos que provavelmente vão ficar. Eles também utilizam uma estratégia automatizada de busca para afinar os parâmetros internos de cada modelo ao longo de milhares de tentativas, extraindo desempenho extra.

Quem sai e o que mais importa

Nos conjuntos de dados, duas famílias de modelos se destacam: Adaptive Boosting (AB) e Histogram Gradient Boosting (HGB). Essas abordagens alcançam altas pontuações em precisão (com que frequência um previsto como leaver realmente sai), recall (quantos saíram de fato são detectados) e acurácia geral. Mas desempenho bruto não basta para uso no mundo real. Gestores de RH precisam saber quais fatores impulsionam uma previsão para poder responder de forma justa. Para abrir essas “caixas‑pretas”, a equipe usa uma técnica chamada SHAP, emprestada da teoria dos jogos. SHAP atribui a cada característica uma contribuição para a previsão final de um trabalhador individual e, quando média entre muitos trabalhadores, revela quais fatores importam mais no conjunto. Neste estudo, horas extras, nível do cargo, opções de ações e satisfação no trabalho surgem repetidamente como sinais fortes de futuras saídas ou mudanças de função.

Dos números a ações concretas

Porque as explicações SHAP funcionam tanto globalmente quanto para cada indivíduo, elas fazem a ponte entre estatística e decisões do dia a dia. Em nível de empresa, elas destacam áreas problemáticas amplas: por exemplo, horas extras frequentes ou cargos de meio de carreira estagnados ligados a maior risco de saída. Para um único empregado, podem mostrar se horas extras, remuneração ou falta de oportunidades de promoção estão elevando sua pontuação de risco. Os autores argumentam que essa visão dual permite às equipes de RH desenhar respostas direcionadas — como reequilibrar cargas de trabalho, clarificar caminhos de promoção ou revisar planos de participação acionária — ao mesmo tempo em que oferecem razões transparentes para discutir com gestores e funcionários.

O que isso significa para os locais de trabalho

Em termos simples, o artigo mostra que agora é viável construir sistemas que não apenas preveem quem pode sair, mas também explicam por quê de forma compreensível para humanos. Ao limpar cuidadosamente os dados de RH, equilibrar as chances entre os que ficam e os que saem e combinar modelos de previsão robustos com explicações visuais claras, as organizações podem passar de entrevistas reativas de desligamento para estratégias proativas de retenção. Usadas de forma responsável, com atenção à privacidade e ao viés, tais ferramentas podem ajudar empresas a proteger seu capital humano ao mesmo tempo em que oferecem aos funcionários ambientes de trabalho mais justos e responsivos.

Citação: AL-Ali, M., Alwateer, M., Alsaedi, S.A. et al. Integrating machine learning and explainable AI for employee attrition prediction in HR analytics. Sci Rep 16, 6344 (2026). https://doi.org/10.1038/s41598-026-36424-2

Palavras-chave: rotatividade de funcionários, analytics de RH, aprendizado de máquina, IA explicável, estratégias de retenção