Negócios + Dados + IA
Classificação é uma técnica de aprendizagem supervisionada que usa dados históricos rotulados para identificar se algo irá ou não acontecer no futuro.
Os dois tipos mais comuns de classificação são a binária (com duas classes, como sim ou não) e a multiclasses (com mais de duas classes. Por exemplo, positivo, negativo e neutro).
Modelos de classificação podem determinar se:
-
Um cliente irá fazer algo ou não, como pagar uma dívida, responder a uma campanha promocional ou cancelar uma assinatura;
-
Uma operação é ou não é fraudulenta;
- Um email é ou não é spam;
-
Uma doença irá ou não irá se desenvolver;
-
O sentimento de um consumidor é positivo, negativo ou neutro em relação a um produto;
-
uma imagem pertence a um ou outro grupo;
-
Entre muitos outros casos de uso.
Algoritmos para classificação de dados incluem:
-
Métodos ensemble como
-
Entre muitas outras técnicas tanto de Machine Learning como de Deep Learning.
-
Acurácia
-
Precisão
-
Recall
-
F1 Score
-
Entre outras.
Saiba mais: Wikipedia, sklearn-classification, todos os posts.
Algoritmos: AdaBoost, Árvore de decisão, Bagging, Extra Trees, Gradient Boosting e Random Forest