Target y estrategia

R, Árboles de Decisión

Este proyecto ha sido realizado con el dataset de una institución bancaria portuguesa recopilado el 2014, cuando el banco llevó a cabo una campaña de telemarketing para clientes interesados en depósitos a plazo. Los datos incluyen numerosas características sobre los clientes de la empresa, así como los detalles y el resultado de la campaña. La finalidad del estudio es determinar con esta información tanto el perfil de cliente ideal para este y otros productos similares como la estrategia óptima para cerrar las ventas con este target. Esto se consigue con un árbol de decisión.

 

Objetivos

Resultados

Árbol de decisión

Los árboles de decisión son algoritmos de aprendizaje supervisado que, en este caso, se utilizaron para clasificar los clientes entre aquellos interesados en un depósito a plazos y los que no. Resulta conveniente justificar esta decisión, ya que existen otros métodos como el random forest o el gradient boosting que suelen ofrecer un rendimiento mucho mayor en problemas de clasificación. No obstante, los árboles de decisión cuentan con la ventaja de la simplicidad y la transparencia, es decir, el proceso de decisión que sigue el ordenador al clasificar los datos puede visualizarse en forma de árbol. Esto permite que el modelo pueda ser interpretado fácilmente y, por lo tanto, pueda utilizarse para informar estrategias corporativas y no solo para realizar predicciones.

El primer modelo creado resulta satisfactoriamente simple y cuenta con una métrica de accuracy sorprendentemente elevada (0.83). Sin embargo, al examinar el dataset con detenimiento puede observarse un cierto sesgo, ya que el 75% de las observaciones corresponden a clientes no interesados en el producto. A pesar de haber utilizado un muestreo estratificado, esta deficiencia en los datos puede ocasionar que el modelo aprenda simplemente a clasificar la mayoría de las observaciones como clientes no interesados. En casos problemáticos como este, la métrica ROC AUC es la más recomendada para evaluar modelos. El primer árbol presentaba una puntuación de 0.76.

Afinando el modelo

Con el objetivo de mejorar la ROC AUC se optó por afinar el modelo buscando el valor óptimo para los hiperparámetros tree depth y cost-complexity del árbol. El método utilizado fue una regular grid search.

El mejor modelo creado fue una mejora significativa del primero, con una accuracy de 0.82 y un ROC AUC de 0.81.



Segundo árbol

El segundo árbol creado es significativamente más complejo que el primero, ya que incluye más factores a la hora de decidir si un cliente está o no interesado en el producto, por ello, resulta más abstruso a nivel visual. Esto no supone un problema, puesto que se pueden extraer fácilmente las características de los clientes interesados en el producto y la estrategia a utilizar. De esta forma se obtuvo el perfil del comprador ideal, un cliente que, según el modelo, adquirirá el depósito a plazo un 95% de las veces. Además, también se definieron los perfiles de los otros dos tipos de compradores más susceptibles de comprar el producto y la estrategia que debe adoptarse con cada tipo de cliente.

Targets

95%

Según el modelo, existe un cliente ideal que comprará el producto el noventa y cinco por ciento de las veces.

Para asegurar la compra, la estrategia que deberemos utilizar con compradores de este perfil será:

89%

Si por alguna razón deseamos contactar con otro tipo de cliente, existe un segundo perfil con una probabilidad de compra también muy elevada.

Para asegurar la compra, la estrategia que deberemos utilizar con compradores de este perfil será:

83%

Finalmente, este corresponde al último perfil con una probabilidad de compra mayor al ochenta por ciento.

Para asegurar la compra, la estrategia que deberemos utilizar con compradores de este perfil será: