Estrategias de identificación de bajas

Un enfoque basado en la Minería de Datos

Analista: Tomás Delvechio

IT BI Group - Banco DMEF

introducción

Aprovechando la historia de nuestros

clientes y las modernas técnicas de DM y ML, se puede lograr un salto cuantitativo en la detección del crunch de nuestros clientes

Modelo

Lightgbm

estrategia

Ensamble nivel 1

semillerÍo

Ensamble nivel 2

hibridación

Lightgbm

Para generar los modelos base

SemillerÍo

LGB Machine

$

$

$

$

$

1

2

3

4

5

SemillerÍo

$

$

$

$

$

Ensamble

$

Semillerío

Hibridación de Semilleríos

Semillerio 1

Hibridación de Semilleríos

Semillerio 1

Hibridación de Semilleríos

Semillerio 1

Semillerio 2

Semillerio 3

Hibridación de Semilleríos

Semillerio 1

Semillerio 2

Semillerio 3

$

$

$

Hibridación de Semilleríos

Semillerio 1

Semillerio 2

Semillerio 3

$

$

$

Hibridación de Semilleríos

Semillerio 1

Semillerio 2

Semillerio 3

$

$

$

Ensamble de Semilleríos

$

RESUMEN del modelo

Modelo LGBM

Modelo poderoso, sensible a la elección de semillas

semillerio

Ensamble de LGBMs, fijando el modelo y variando las semillas

hibridación semillerio

Se varían modelo y semillas, ensamblándose sus resultados

Pendientes

Puntos de corte

Estrategías de ensamble

Aporte de las OB

Todo es un WIP

Canaritos para acelerar proceso

aportes del sector B.I. e infra

acumulación meses

Ignorando mes "roto" Junio 2020

Temporalidad

Incorporar Lags, Tendencias

(6 meses es convervador)

sin undersampling

Enfoque en paralelización de scripts

Tampoco Canaritos

a hombros de gigantes

Baseline el gran modelo de la campaña Julio 2021

paralelización

Sector de infra hizo su aporte para semillerio paralelizable en cloud

WFV

Evitar CV con resultados competitivos

Scripts y despliegue

Repo con prueba de concepto

Scripts de campaña con Code Review

Scripts basados en prácticas del sector

Apto para su despliegue en la Nube del Banco

Escollos y trabajos futuros

Ensamble con otros modelos no dieron resultados al momento

Canaritos no llegó a probarse por falta de tiempo

Cantidad de incentivos no esta bien modelada en el esquema actual

No hubo tiempo para CV, sería ideal haber tenido un Baseline

PresentacionJG

By Tomas Delvechio

PresentacionJG

  • 166