Saltar al contenido principal
InicioPython

Machine learning con modelos basados en árboles en Python

En este curso, aprenderás a usar modelos basados en árboles y conjuntos para regresión y clasificación con scikit-learn.

Comienza El Curso Gratis
5 horas15 vídeos57 ejercicios95.211 aprendicesTrophyDeclaración de cumplimiento

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group

¿Entrenar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas


Descripción del curso

Los árboles de decisión son modelos de aprendizaje supervisado que se utilizan para problemas de clasificación y regresión. Los modelos de árbol presentan una gran flexibilidad que tiene un precio: por un lado, los árboles son capaces de captar relaciones no lineales complejas; por otro, son propensos a memorizar el ruido presente en un conjunto de datos. Al agregar las predicciones de árboles entrenados de forma diferente, los métodos de conjunto aprovechan la flexibilidad de los árboles, al tiempo que reducen su tendencia a memorizar el ruido. Los métodos de ensamblaje se utilizan en diversos campos y tienen un historial probado de victorias en muchas competiciones de machine learning. En este curso, aprenderás a utilizar Python para entrenar árboles de decisión y modelos basados en árboles con la sencilla biblioteca de machine learning scikit-learn. Comprenderás las ventajas e inconvenientes de los árboles y demostrarás cómo el ensamblaje puede paliar estos inconvenientes, todo ello mientras practicas con conjuntos de datos del mundo real. Por último, también comprenderás cómo afinar los hiperparámetros más influyentes para sacar el máximo partido a tus modelos.
Empresas

¿Entrenar a 2 o más personas?

Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.
DataCamp Para EmpresasPara obtener una solución a medida, reserve una demostración.

En las siguientes pistas

Certificación disponible

Científico de datos asociado en Python

Ir a la pista

Científico de machine learning en Python

Ir a la pista

Aprendizaje automático supervisado en Python

Ir a la pista
  1. 1

    Árboles de clasificación y regresión

    Gratuito

    Los Árboles de clasificación y regresión (CART) son un conjunto de modelos de aprendizaje supervisado que se utilizan para problemas de clasificación y regresión. En este capítulo, conocerás el algoritmo CART.

    Reproducir Capítulo Ahora
    Árbol de decisión para la clasificación
    50 xp
    Entrena tu primer árbol de clasificación
    100 xp
    Evaluar el árbol de clasificación
    100 xp
    Regresión logística frente a árbol de clasificación
    100 xp
    Aprendizaje del árbol de clasificación
    50 xp
    Hacer crecer un árbol de clasificación
    50 xp
    Utilizar la entropía como criterio
    100 xp
    Entropía vs índice de Gini
    100 xp
    Árbol de decisión para la regresión
    50 xp
    Entrena tu primer árbol de regresión
    100 xp
    Evaluar el árbol de regresión
    100 xp
    Regresión lineal vs árbol de regresión
    100 xp
  2. 2

    El equilibrio entre sesgo y varianza

    El equilibrio entre sesgo y varianza es uno de los conceptos fundamentales del machine learning supervisado. En este capítulo, comprenderás cómo diagnosticar los problemas de sobreajuste e infraajuste. También conocerás el concepto de ensamblaje, que consiste en agregar las predicciones de varios modelos para obtener predicciones más sólidas.

    Reproducir Capítulo Ahora
  3. 3

    Bagging y bosques aleatorios

    El bagging es un método de ensamblaje que consiste en entrenar el mismo algoritmo muchas veces utilizando diferentes subconjuntos muestreados de los datos de entrenamiento. En este capítulo, comprenderás cómo puede utilizarse el bagging para crear un conjunto de árboles. También aprenderás cómo el algoritmo de los bosques aleatorios puede conducir a una mayor diversidad del conjunto mediante la aleatorización a nivel de cada división en los árboles que forman el conjunto.

    Reproducir Capítulo Ahora
  4. 4

    Potenciación

    El refuerzo se refiere a un método conjunto en el que se entrenan varios modelos secuencialmente y cada modelo aprende de los errores de sus predecesores. En este capítulo, conocerás los dos métodos de refuerzo: AdaBoost y Gradient Boosting (potenciación del gradiente).

    Reproducir Capítulo Ahora
  5. 5

    Ajuste del modelo

    Los hiperparámetros de un modelo de machine learning son parámetros que no se aprenden a partir de los datos. Deben fijarse antes de ajustar el modelo al conjunto de entrenamiento. En este capítulo, aprenderás a ajustar los hiperparámetros de un modelo basado en árboles utilizando la validación cruzada de búsqueda en cuadrícula.

    Reproducir Capítulo Ahora
Empresas

¿Entrenar a 2 o más personas?

Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.

En las siguientes pistas

Certificación disponible

Científico de datos asociado en Python

Ir a la pista

Científico de machine learning en Python

Ir a la pista

Aprendizaje automático supervisado en Python

Ir a la pista

conjuntos de datos

Auto-mpgBike Sharing DemandWisconsin Breast CancerIndian Liver Patient

colaboradores

Collaborator's avatar
Kara Woo
Collaborator's avatar
Eunkyung Park
Collaborator's avatar
Sumedh Panchadhar
Elie Kawerk HeadshotElie Kawerk

Senior Data Scientist

Ver Más

¿Qué tienen que decir otros alumnos?

¡Únete a 15 millones de estudiantes y empieza Machine learning con modelos basados en árboles en Python hoy mismo!

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.