top of page

Modelos de classificação de crédito - v2

Foto do escritor: Fran MateusFran Mateus

Foto: Mídia do Wix
Foto: Mídia do Wix

No post anterior, a primeira versão dos modelos para definição de credit scoring foi feita usando 8 algoritmos de classificação de dados. Nesta versão, somente os algorimos com os três melhores resulatdos foram utilizados no processo de otimização com o RandomizedSearchCV: CatBoost, GradientBoosting e LightGBM.


Para fins de experimentação, as otimizações foram realizadas, somente, em dois hiperparâmetros: número de estimadores (n_estimators) e taxa de aprendizado (learning_rate).


Os resultados do Gradient Boosting apresentaram uma leve melhora em tanto em Acurácia como no F1 Score, ao passo que o LightGBM e o CatBoost tiveram um aumento de performance, apenas, no Teste KS.

Métrica: Acurácia

  • CatBoost = De 0.8222 para 0.8220

  • LightGBM = De 0.8223 para 0.8215

  • Gradient Boosting = De 0.8202 para 0.8214


Métrica: F1 Score

  • LightGBM = De 0.4824 para 0.4776

  • CatBoost = De 0.4835 para 0.4765

  • Gradient Boosting = De 0.4726 para 0.4729


Métrica: Teste KS

  • CatBoost = De 0.4338 para 0.4456

  • Gradient Boosting = De 0.4396 para 0.4360

  • LightGBM = De 0.4282 para 0.4348


 

Se desejar, confira o código dos modelos acessando o GitHub.



Comments


bottom of page