X

No eres miembro aún?

Regístrate
 
 
 
 
 

Analytics Cono Sur

 
 
 
 

Credit Scoring en Banca: Inferencia de Rechazos ¿De qué se trata?

March 30, 2010 por Guido Sagasti   comentarios (1)

, , , , , , , , ,

Las entidades financieras deben enfrentar un problema de sesgo de selección importante para construir modelos de Credit Scoring. Cuando un individuo recurre a una entidad financiera para solicitar un crédito puede darse la ocurrencia de dos eventos:

- Que su solicitud sea aceptada. En este caso, transcurrido un periodo de tiempo (o de madurez del cliente) se determina según su comportamiento si se trata de un cliente bueno o malo.

- Que su solicitud sea rechazada, quedando guardada en el repositorio de datos de la entidad la información relativa a la solicitud del crédito.

Si el individuo fue rechazado, ya sea por medio de un criterio objetivo o no, se desconoce como hubiera sido su comportamiento. Podría haberse convertido en un mal o buen pagador. Sin importar la forma de evaluación crediticia original o inicial, las características de los individuos que fueron rechazados posiblemente sean diferentes a las de aquellos que fueron aceptados, y como se desea que la regla de decisión sea válida para todos los que deseen sacar un crédito, excluir a estos individuos de la muestra sería incurrir en un sesgo de selección, lo que generaría problemas de representatividad al score final.

La estimación o definición del comportamiento o categoría de desempeño de los individuos que se rechazaron se denomina “Inferencia de Rechazos”. Así como hay algunos malos en la población de aprobados, es coherente pensar en buenos dentro de la población de rechazados. Con la inferencia de los rechazos lo que se busca es “recrear” el comportamiento de la población como si se hubieran aprobado el 100% de las solicitudes de crédito.

¿En qué puede ayudar SAS?  SAS posee una solución específicamente diseñada para cubrir todo el proceso de Credit Scoring de punta a punta, desde el armado de la tabla que se va a utilizar para realizar los modelos analíticos hasta la elaboración de reportes web de seguimiento de los modelos, lo que es muy importante para la automatización de todo el proceso.

La parte analítica se realiza a través de SAS Enterprise Miner, que posee una solapa de Credit Scoring (extra) en esta solución. Uno de los nodos de dicha solapa es el de “Reject Inference” o “Inferencia de Rechazos”, que se puede utilizar para predecir cómo se hubieran comportado los clientes rechazados en el caso en que hubieran sido aceptados. Los tres métodos diferentes que el nodo posee para crear datos inferidos a partir de los rechazos son: Fuzzy, Hard Cutoff y Parceling.

El método Fuzzy usa clasificaciones parciales de evento (default) /no evento para ponderar cada observación rechazada. En lugar de clasificar a los rechazos en una de las dos categorías mencionadas, lo que se hace es agregar dos observaciones por cada rechazo al conjunto de datos de aceptados (al nuevo conjunto se lo denomina aumentado). A una le asigna la categoría asociada al evento, mientras que a la otra le asigna la categoría asociada al no evento. Luego se utiliza el score obtenido de un modelo ajustado con los aceptados, combinado con la tasa de rechazos para modificar el factor de expansión asociado a cada observación.

La técnica de Hard Cutoff permite al usuario de riesgo ingresar un valor de corte para definir que rechazos son evento y cuáles no evento.

Mientras que por medio del método de Parceling se distribuyen los rechazados en intervalos  de igual tamaño definidos por rangos de score elegidos por el usuario. Luego, los rechazos dentro del intervalo son clasificados al azar como evento o no evento, teniendo en cuenta las proporciones de eventos y no eventos de los aceptados dentro del intervalo.

Una vez aplicada la técnica de inferencia de rechazos correspondiente se vuelven a generar los scores, cuyos beneficios son, además de tener un modelo más correcto en términos estadísticos, será más eficiente para detectar buenos y malos clientes, derivando eso en menores perdidas de dinero debido al correcto rechazo de perfiles de alto riesgo y mayores ganancias por la mayor aceptación de buenos clientes.

Hola Guido. Quería hacerte una consulta sobre el tema que mencionás. ¿Hay alguna recomendación de acuerdo al tipo de problema / datos disponibles para poder usar uno u otro método?

Muchas gracias!

Guillermo Henrion hace 180 dias