Modelado del riesgo crediticio en Python
Aprende a preparar datos para solicitudes de crédito y aplicar machine learning y reglas para una mejor seguridad y rentabilidad.
Comienza El Curso Gratis4 horas15 vídeos57 ejercicios20.632 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
Si alguna vez has solicitado una tarjeta de crédito o un préstamo, sabes que las empresas financieras procesan toda tu información antes de tomar una decisión. Esto se debe a que concederte un préstamo puede tener un grave impacto financiero en su negocio. Pero ¿cómo toman esa decisión? En este curso aprenderás a preparar los datos de una solicitud de crédito. Después, aplicarás machine learning y reglas empresariales para reducir el riesgo y garantizar la rentabilidad. Utilizarás dos conjuntos de datos que emulan solicitudes de crédito reales, centrándose en el valor empresarial. Sígueme en este curso y aprende el valor que tiene el modelado del riesgo crediticio.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Finanzas Aplicadas en Python
Ir a la pista- 1
Exploración y preparación de datos para préstamos
GratuitoEn este primer capítulo, hablaremos sobre el concepto de riesgo de crédito y definiremos cómo se calcula. Utilizando tablas cruzadas y gráficos, exploraremos un conjunto de datos real. Y, antes de aplicar el machine learning, procesaremos estos datos buscando y resolviendo problemas.
Qué es el riesgo crediticio50 xpExplora los datos crediticios100 xpCrosstab y tablas dinámicas100 xpValores atípicos en los datos crediticios50 xpBúsqueda de valores atípicos con tablas cruzadas100 xpVisualización de los valores atípicos crediticios100 xpRiesgo de falta de datos en los datos de préstamos50 xpSustitución de los datos crediticios que faltan100 xpEliminación de los datos que faltan100 xpIntuición sobre datos que faltan50 xp - 2
Regresión logística para incumplimientos
Con los datos del préstamo totalmente preparados, hablaremos del modelo de regresión logística, que es un estándar en la modelización del riesgo. Comprenderemos los componentes de este modelo, así como la forma de puntuar su rendimiento. Una vez creadas las previsiones, podremos explorar el impacto financiero de la utilización de este modelo.
Regresión logística para la probabilidad de impago50 xpConceptos básicos de la regresión logística100 xpRegresión logística multivariante100 xpCreación de conjuntos de entrenamiento y de prueba100 xpPrevisión de la probabilidad de impago50 xpCambio de coeficientes100 xpDatos crediticios con codificación one-hot100 xpPrevisión de la probabilidad de impago100 xpRendimiento del modelo crediticio50 xpInformes de clasificación de impago100 xpSelección de métricas del informe100 xpModelos crediticios de puntuación visual100 xpDiscriminación e impacto del modelo50 xpUmbrales y matrices de confusión100 xpCómo afectan los umbrales al rendimiento100 xpSelección del umbral100 xp - 3
Árboles potenciados por gradiente con XGBoost
Los árboles de decisión son otro modelo estándar de riesgo crediticio. Iremos más allá de los árboles de decisión utilizando el paquete XGBoost, que está de moda, en Python para crear árboles impulsados por gradiente. Tras desarrollar modelos sofisticados, someteremos a test de estrés su rendimiento y hablaremos de qué es la selección de columnas en datos no equilibrados.
Árboles con potenciación del gradiente con XGBoost50 xpÁrboles para impagos100 xpRendimiento del portafolio con potenciación del gradiente100 xpEvaluación de árboles con potenciación del gradiente100 xpSelección de columnas para el riesgo crediticio50 xpImportancia de la columna y previsión de impago100 xpVisualización de la importancia de la columna100 xpSelección de columnas y rendimiento del modelo100 xpValidación cruzada para modelos crediticios50 xpModelos crediticios de validación cruzada100 xpLímites de las pruebas de validación cruzada100 xpPuntuación de validación cruzada100 xpDesequilibrio de clases en los datos de préstamos50 xpSubmuestreo de los datos de entrenamiento100 xpRendimiento del árbol con submuestreo100 xpIntuición de submuestreo50 xp - 4
Evaluación e implementación del modelo
Tras desarrollar y probar dos potentes modelos de machine learning, utilizaremos métricas de rendimiento clave para compararlos. Utilizando técnicas avanzadas de selección de modelos específicamente para la modelización financiera, seleccionaremos un modelo. Con ese modelo, haremos lo siguiente: desarrollar una estrategia empresarial, calcular el valor del portafolio y minimizar la pérdida esperada.
Evaluación e implementación del modelo50 xpComparación de informes de modelos100 xpComparación con ROCs100 xpCurvas de calibración100 xpTasas de aceptación de créditos50 xpTasas de aceptación100 xpVisualización de cuantiles de aceptación100 xpTasas malas100 xpEfecto de la tasa de aceptación100 xpEstrategia crediticia y pérdida mínima esperada50 xpCreación de la tabla de estrategias100 xpVisualización de la estrategia100 xpCreación de perfiles del valor estimado100 xpPérdida total esperada100 xpResumen del curso50 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Finanzas Aplicadas en Python
Ir a la pistaconjuntos de datos
Raw credit dataClean credit data (outliers and missing data removed)Credit data (ready for modeling)colaboradores
requisitos previos
Intermediate Python for FinanceMichael Crabtree
Ver MásData Scientist
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Modelado del riesgo crediticio en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.