Pular para o conteúdo principal
InícioPython

Aprendizado de máquina com modelos baseados em árvores em Python

Neste curso, você aprenderá a usar modelos de árvore e ensembles para regressão e classificação com scikit-learn.

Comece O Curso Gratuitamente
5 horas15 vídeos57 exercícios95.211 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas


Descrição do Curso

As árvores de decisão são modelos de aprendizado supervisionado usados para problemas que envolvem classificação e regressão. Os modelos de árvore apresentam uma alta flexibilidade que tem um preço: por um lado, as árvores são capazes de capturar relações não lineares complexas; por outro lado, elas são propensas a memorizar o ruído presente em um conjunto de dados. Ao agregar as previsões de árvores treinadas de forma diferente, os métodos de agrupamento aproveitam a flexibilidade das árvores e reduzem sua tendência de memorizar ruídos. Os métodos de agrupamento são usados em uma variedade de campos e têm um histórico comprovado de vitórias em muitas competições de aprendizado de máquina. Neste curso, você aprenderá a usar o Python para treinar árvores de decisão e modelos baseados em árvores com a biblioteca de aprendizado de máquina scikit-learn, de fácil utilização. Você entenderá as vantagens e as deficiências das árvores e demonstrará como o agrupamento pode atenuar essas deficiências, tudo isso enquanto pratica com conjuntos de dados do mundo real. Por fim, você também entenderá como ajustar os hiperparâmetros mais influentes para obter o máximo dos seus modelos.
Para Empresas

Treinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.
DataCamp Para EmpresasPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Certificação disponível

Cientista de dados associado em Python

Ir para a trilha

Cientista de aprendizado de máquina em Python

Ir para a trilha

Aprendizado de máquina supervisionado em Python

Ir para a trilha
  1. 1

    Árvores de classificação e regressão

    Gratuito

    As árvores de classificação e regressão (CART) são um conjunto de modelos de aprendizado supervisionados usados para problemas que envolvem classificação e regressão. Neste capítulo, você conhecerá o algoritmo CART.

    Reproduzir Capítulo Agora
    Árvore de decisão para classificação
    50 xp
    Treine sua primeira árvore de classificação
    100 xp
    Avaliar a árvore de classificação
    100 xp
    Regressão logística vs. árvore de classificação
    100 xp
    Aprendizado de árvore de classificação
    50 xp
    Crescimento de uma árvore de classificação
    50 xp
    Usando a entropia como um critério
    100 xp
    Entropia versus índice de Gini
    100 xp
    Árvore de decisão para regressão
    50 xp
    Treine sua primeira árvore de regressão
    100 xp
    Avaliar a árvore de regressão
    100 xp
    Regressão linear versus árvore de regressão
    100 xp
  2. 2

    O comprometimento entre viés e variância

    A troca de viés e variância é um dos conceitos fundamentais do aprendizado de máquina supervisionado. Neste capítulo, você entenderá como diagnosticar os problemas de sobreajuste e subajuste. Você também conhecerá o conceito de agrupamento, em que as previsões de vários modelos são agregadas para produzir previsões mais robustas.

    Reproduzir Capítulo Agora
  3. 3

    Agregação de Bootstrap e Florestas Aleatórias

    Agregação de bootstrap é um método de agrupamento que envolve o treinamento do mesmo algoritmo várias vezes usando diferentes subconjuntos amostrados dos dados de treinamento. Neste capítulo, você entenderá como a agregação de bootstrap pode ser usada para criar um agrupamento de árvores. Você também aprenderá como o algoritmo de florestas aleatórias pode levar a uma maior diversidade de agrupamentos por meio da randomização no nível de cada divisão nas árvores que formam o agrupamento.

    Reproduzir Capítulo Agora
  4. 4

    Boosting

    Boosting refere-se a um método de agrupamento no qual vários modelos são treinados sequencialmente com cada modelo aprendendo com os erros de seus predecessores. Neste capítulo, você conhecerá os dois métodos de boosting do AdaBoost e do Gradient Boosting.

    Reproduzir Capítulo Agora
  5. 5

    Ajuste de modelo

    Os hiperparâmetros de um modelo de aprendizado de máquina são parâmetros que não são aprendidos com os dados. Eles devem ser definidos antes de você ajustar o modelo ao conjunto de treinamento. Neste capítulo, você aprenderá a ajustar os hiperparâmetros de um modelo baseado em árvore usando a validação cruzada de pesquisa de grade.

    Reproduzir Capítulo Agora
Para Empresas

Treinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.

Nas seguintes faixas

Certificação disponível

Cientista de dados associado em Python

Ir para a trilha

Cientista de aprendizado de máquina em Python

Ir para a trilha

Aprendizado de máquina supervisionado em Python

Ir para a trilha

conjuntos de dados

Auto-mpgBike Sharing DemandWisconsin Breast CancerIndian Liver Patient

colaboradores

Collaborator's avatar
Kara Woo
Collaborator's avatar
Eunkyung Park
Collaborator's avatar
Sumedh Panchadhar
Elie Kawerk HeadshotElie Kawerk

Senior Data Scientist

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 15 milhões de alunos e comece Aprendizado de máquina com modelos baseados em árvores em Python hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.