Machine learning con modelos basados en árboles en Python
En este curso, aprenderás a usar modelos basados en árboles y conjuntos para regresión y clasificación con scikit-learn.
Comienza El Curso Gratis5 horas15 vídeos57 ejercicios95.211 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
Los árboles de decisión son modelos de aprendizaje supervisado que se utilizan para problemas de clasificación y regresión. Los modelos de árbol presentan una gran flexibilidad que tiene un precio: por un lado, los árboles son capaces de captar relaciones no lineales complejas; por otro, son propensos a memorizar el ruido presente en un conjunto de datos. Al agregar las predicciones de árboles entrenados de forma diferente, los métodos de conjunto aprovechan la flexibilidad de los árboles, al tiempo que reducen su tendencia a memorizar el ruido. Los métodos de ensamblaje se utilizan en diversos campos y tienen un historial probado de victorias en muchas competiciones de machine learning.
En este curso, aprenderás a utilizar Python para entrenar árboles de decisión y modelos basados en árboles con la sencilla biblioteca de machine learning scikit-learn. Comprenderás las ventajas e inconvenientes de los árboles y demostrarás cómo el ensamblaje puede paliar estos inconvenientes, todo ello mientras practicas con conjuntos de datos del mundo real. Por último, también comprenderás cómo afinar los hiperparámetros más influyentes para sacar el máximo partido a tus modelos.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Científico de machine learning en Python
Ir a la pistaAprendizaje automático supervisado en Python
Ir a la pista- 1
Árboles de clasificación y regresión
GratuitoLos Árboles de clasificación y regresión (CART) son un conjunto de modelos de aprendizaje supervisado que se utilizan para problemas de clasificación y regresión. En este capítulo, conocerás el algoritmo CART.
Árbol de decisión para la clasificación50 xpEntrena tu primer árbol de clasificación100 xpEvaluar el árbol de clasificación100 xpRegresión logística frente a árbol de clasificación100 xpAprendizaje del árbol de clasificación50 xpHacer crecer un árbol de clasificación50 xpUtilizar la entropía como criterio100 xpEntropía vs índice de Gini100 xpÁrbol de decisión para la regresión50 xpEntrena tu primer árbol de regresión100 xpEvaluar el árbol de regresión100 xpRegresión lineal vs árbol de regresión100 xp - 2
El equilibrio entre sesgo y varianza
El equilibrio entre sesgo y varianza es uno de los conceptos fundamentales del machine learning supervisado. En este capítulo, comprenderás cómo diagnosticar los problemas de sobreajuste e infraajuste. También conocerás el concepto de ensamblaje, que consiste en agregar las predicciones de varios modelos para obtener predicciones más sólidas.
Error de generalización50 xpComplejidad, sesgo y varianza50 xpSobreajuste e infraajuste50 xpDiagnosticar problemas de sesgo y varianza50 xpInstanciar el modelo100 xpEvalúa el error de CV a 10100 xpEvalúa el error de entrenamiento100 xp¿Alto sesgo o alta varianza?50 xpAprendizaje conjunto50 xpDefinir el conjunto100 xpEvaluar clasificadores individuales100 xpMejor rendimiento con un clasificador de votación100 xp - 3
Bagging y bosques aleatorios
El bagging es un método de ensamblaje que consiste en entrenar el mismo algoritmo muchas veces utilizando diferentes subconjuntos muestreados de los datos de entrenamiento. En este capítulo, comprenderás cómo puede utilizarse el bagging para crear un conjunto de árboles. También aprenderás cómo el algoritmo de los bosques aleatorios puede conducir a una mayor diversidad del conjunto mediante la aleatorización a nivel de cada división en los árboles que forman el conjunto.
Bagging50 xpDefinir el clasificador bagging100 xpEvaluar el rendimiento del bagging100 xpEvaluación Out of Bag (OOB)50 xpPrepara el terreno100 xpPuntuación OOB frente a la puntuación del conjunto de pruebas100 xpBosques aleatorios (RF)50 xpEntrena un regresor RF100 xpEvalúa el regresor RF100 xpVisualizar la importancia de las características100 xp - 4
Potenciación
El refuerzo se refiere a un método conjunto en el que se entrenan varios modelos secuencialmente y cada modelo aprende de los errores de sus predecesores. En este capítulo, conocerás los dos métodos de refuerzo: AdaBoost y Gradient Boosting (potenciación del gradiente).
Adaboost50 xpDefinir el clasificador AdaBoost100 xpEntrenar el clasificador AdaBoost100 xpEvaluar el clasificador AdaBoost100 xpPotenciación del gradiente (GB)50 xpDefine el regresor GB100 xpEntrena el regresor GB100 xpEvalúa el regresor GB100 xpPotenciación del gradiente estocástico (SGB)50 xpRegresión con SGB100 xpEntrena el regresor SGB100 xpEvalúa el regresor SGB100 xp - 5
Ajuste del modelo
Los hiperparámetros de un modelo de machine learning son parámetros que no se aprenden a partir de los datos. Deben fijarse antes de ajustar el modelo al conjunto de entrenamiento. En este capítulo, aprenderás a ajustar los hiperparámetros de un modelo basado en árboles utilizando la validación cruzada de búsqueda en cuadrícula.
Ajuste de los hiperparámetros de CART50 xpHiperparámetros del árbol50 xpEstablece la rejilla de hiperparámetros del árbol100 xpBúsqueda del árbol óptimo100 xpEvalúa el árbol óptimo100 xpAjuste de los hiperparámetros de RF50 xpHiperparámetros de los bosques aleatorios50 xpEstablece la rejilla de hiperparámetros de RF100 xpBúsqueda del bosque óptimo100 xpEvaluar el bosque óptimo100 xp¡Enhorabuena!50 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Científico de machine learning en Python
Ir a la pistaAprendizaje automático supervisado en Python
Ir a la pistacolaboradores
requisitos previos
Supervised Learning with scikit-learnElie Kawerk
Ver MásSenior Data Scientist
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Machine learning con modelos basados en árboles en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.