- fjroar
- 12 ene 2024
- 5 Min. de lectura
Como prometí voy con la segunda parte parte del anterior post, dejando en una tercera, como con R, sería factible hacer todo esto, eso sí, siempre y cuando se tenga la información preparada que por lo general (por no decir nunca, lo está).
Pues bien, el método anteriormente descrito, nos daba de un modo bastante prudente una estimación de los beneficios sin demasiada “inferencia estadística”, pero debido a sus limitaciones y a que consume, bastante información de la disponible, resulta preferible este segundo método que hace uso del concepto de curva de riesgos que va a permitir inferir la cantidad de información necesaria a partir de la existente:
Figura 1: Distribución de las tasas de riesgo en importe frente a la población acumulada
Nota: Hay borrones y eliminación de datos a propósito en la anterior figura
Con un poco más de dificultad, se puede trabajar con los rechazados por el modelo y por tanto cabe deducir una barra adicional justo delante de la primera donde se tiene:
El número de transacciones (o clientes) rechazados por score
La exposición de las transacciones
E incluso el tipo de interés a nivel de transacción aplicado (si éste depende del producto, merchant, condiciones del cliente, etc)
El único dato que no se conoce va a resultar ser la tasa de riesgo en importe, es decir, al ser los anteriores clientes rechazados por el modelo, no se conoce si dichos clientes finalmente acaban pagando o no y cuánto dejarían de pagar exactamente, por esta última razón, para cada uno de los buckets observados el ratio que se calcula es:
A diferencia de lo mostrado en la figura anterior, el número buckets para este propósito suele ser mayor y no tienen por qué tener tasas de población similares (sobre todo si el modelo no es muy granular), por ese motivo, es conveniente definir un eje horizontal donde se tengan la tasa de exposición acumulada y un eje vertical con las tasas de riesgo (o risk rates). Además la curva anterior debe construirse recalculando todo el eje horizontal para tener en cuenta a los rechazados, por lo que se obtendrá el porcentaje de rechazo. En este caso, se estima la curva de riesgos sobre los buckets que se tienen datos y que dará una expresión del tipo:
Así pues se tendría inferido el dato final necesario que permitiría inferir el importe impagado en la zona desconocida.
Nótese que lo que se ha hecho ha sido una construcción similar a lo comentado en el anterior post pero desde otro punto de vista.
Figura 2 Esquema gráfico análogo al del anterior post
En este caso, se tiene el cutoff aplicado a la población mediante el modelo puesto en producción pero ¡Ojo! Yo siempre digo que: “los modelos no producen dinero, sino que lo producen quienes lo aplican”, en un modelo de riesgo, la producción de dinero, cuando el modelo es bueno, viene de su aplicación natural mediante el rechazo activo de los clientes que probablemente impagen.
Además del cutoff, se conoce toda la exposición antes y después de éste ya que en el momento de rechazo se ha intentado adquirir el producto financiero con su coste y en general (si no habría que estimarlo en función de lo conocido) se conoce también el ingreso que se habría obtenido de haberse contratado. Finalmente mediante la inferencia se va tener también el valor del impago que se habría producido de no haber aplicado el modelo por lo comentado anteriormente, por tanto se tiene toda la información necesaria de lo que se ha denominado Detection Zone que ahora cabría denominarse Rejection Zone. Así pues se tienen las siguientes cantidades:
Profits without Model = (Inferred Income + Income) – (Inferred Exposure at Default + Exposure at Default)
Profits with Model = Income – Exposure at Default
El valor por tanto que aportaría el modelo sería:
Model Add value = Profits with Model – Profits without Model = Inferred Income – Inferred Exposure at Default
Nótese que esta metodología, no es mucho más complicada que la anterior y tan sólo hay que añadir la estimación de la curva de riesgos y cabe seguirla periódicamente. Además al igual que en el anterior caso, también permitiría la comparación de modelos y también se observa que por lo general a mejores Ginis (o ROCs) para una misma cartera, mayor valor añadido por parte de los modelos utilizados.
Varios comentarios a todo esto:
Model Add value no es más que la diferencia entre el ingreso que se habría obtenido por comisiones o fees al cliente (que pueden conocerse en muchos casos con precisión pero que en otras ocasiones deberá ser estimado) menos el riesgo que se habría evitado, este último número será mayor cuanto “más empinada” sea la curva, además es una función que dependerá de los siguientes elementos:
El nivel de demanda del producto (o número de transacciones)
La calidad en riesgo de la comentada demanda
El cutoff elegido
La política de precios
El Gini o capacidad discriminante del modelo
Nótese que si se sube el precio o las comisiones, manteniéndose todo lo demás constante, el Model Add value disminuiría y tiene su lógica porque las comisiones irían cubriendo los posibles riesgos que tendrían lugar y entonces o se consigue un modelo más eficiente o dicho valor cae (esto tiene bastantes connotaciones adicionales que no voy a comentar aquí)
En esta metodología no están incluidos los siguientes costes:
Costes financieros: el principal es el tipo de interés del dinero que al menos va a ser el nivel euribor y en el caso de las financieras cabe esperar que sea ligeramente superior
Costes operativos: en general hay reglas y variables externas que tienen un precio y que se paga por exposición aceptada e incluso rechazada
Costes de estructura: donde cabe al menos considerar el coste del personal implicado en generar y mantener el producto financiero
Todo lo anterior indica que si por ejemplo me compro un ordenador a plazos en Amazon por 1000 € a pagar durante un año ¿Cuánto me debe cobrar Amazon en términos de financiación de esta compra sabiendo que su tasa de impago es de un 3%? Pues por lo pronto tendrá que tomar dinero prestado para financiar el producto seguramente al 4% si consigue un “precio amigo” dado que actualmente el euribor está al 3.5%, aparte hará consultas a bureau de crédito y otros agentes que podrá suponer en el mejor de los casos unos 10€ lo que añade un 1% (o algo más) a todo y finalmente el coste de mantener a un personal que haga la gestión, que gestione el dato, que plantee un plan de recobro en caso de impago, etc. Por tanto al menos
entre un 8% - 10% para no incurrir en pérdidas. Actualmente, para este tipo de
compras la TAE de Amazon ronda el 13% como se observa a continuación:
Lo anterior hace que, aunque en general es rentable tener modelos, hay que seguir su evolución a nivel de poder discriminante y de valor añadido con períodos de tiempo lo más cortos pero a la vez, lo más representativos posible
Figura 3: Tabla de seguimiento de la eficiencia de una cartera de pago aplazado a 3 meses con algunas columnas relevantes (ac significa after cutoff y bc before cutoff)
Nota: (1) Hay borrones y eliminación de datos a propósito en la anterior figura
(2) Nótese que Global Profits sería Profits without model y Profits ac sería Profits with model
Para finalizar, cabe comentar que mientras el método del post anterior es útil para analizar variaciones en la política de riesgo al crear escenarios por variación del cutoff, este método es menos restrictivo si bien es cierto que la inferencia realizada con la curva de riesgos será muy imprecisa en modelos malos y en estos casos, donde no se sea capaz de discriminar adecuadamente el riesgo, las tasas de la región de rechazo serán por lo general las tasas medias, lo que también tiene sentido que sea así, ya que para esos casos se tendría una curva plana.