Pular para o conteúdo principal
InícioPython

Pré-processamento para aprendizado de máquina em Python

"Aprenda a limpar e preparar seus dados para aprendizado de máquina!"

Comece O Curso Gratuitamente
4 horas20 vídeos62 exercícios50.711 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas


Descrição do Curso

Este curso aborda os conceitos básicos de como e quando realizar o pré-processamento de dados. Essa etapa essencial em qualquer projeto de aprendizado de máquina é quando você prepara os dados para a modelagem. Entre a importação e a limpeza dos dados e o ajuste do modelo de aprendizado de máquina é quando o pré-processamento entra em ação. Você aprenderá a padronizar seus dados para que estejam no formato certo para o seu modelo, criar novos recursos para aproveitar melhor as informações do seu conjunto de dados e selecionar os melhores recursos para melhorar o ajuste do modelo. Por fim, você terá alguma prática de pré-processamento ao obter um conjunto de dados sobre avistamentos de UFO prontos para modelagem.
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.
DataCamp Para EmpresasPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Certificação disponível

Cientista de dados em Python

Ir para a trilha

Cientista de aprendizado de máquina em Python

Ir para a trilha
  1. 1

    Introdução ao pré-processamento de dados

    Gratuito

    Neste capítulo, você aprenderá exatamente o que significa pré-processar dados. Você dará os primeiros passos em qualquer jornada de pré-processamento, incluindo a exploração de tipos de dados e o tratamento de dados ausentes.

    Reproduzir Capítulo Agora
    Introdução ao pré-processamento
    50 xp
    Explorando dados ausentes
    50 xp
    Eliminação de dados ausentes
    100 xp
    Trabalhar com tipos de dados
    50 xp
    Explorando tipos de dados
    50 xp
    Conversão de um tipo de coluna
    100 xp
    Conjuntos de treinamento e teste
    50 xp
    Desequilíbrio de classe
    50 xp
    Amostragem estratificada
    100 xp
  2. 2

    Padronização de dados

    Este capítulo trata da padronização de dados. Geralmente, um modelo faz algumas suposições sobre a distribuição ou a escala de seus recursos. A padronização é uma maneira de fazer com que seus dados se ajustem a essas suposições e melhorem o desempenho do algoritmo.

    Reproduzir Capítulo Agora
  3. 4

    Seleção de recursos para modelagem

    Este capítulo aborda algumas técnicas diferentes para selecionar os recursos mais importantes do seu conjunto de dados. Você aprenderá a eliminar recursos redundantes, trabalhar com vetores de texto e reduzir o número de recursos em seu conjunto de dados usando a análise de componentes principais (PCA).

    Reproduzir Capítulo Agora
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.

Nas seguintes faixas

Certificação disponível

Cientista de dados em Python

Ir para a trilha

Cientista de aprendizado de máquina em Python

Ir para a trilha

conjuntos de dados

Hiking dataWine dataUFO sightings dataVolunteering data

colaboradores

Collaborator's avatar
Nick Solomon
Collaborator's avatar
Kara Woo
James Chapman HeadshotJames Chapman

Curriculum Manager, DataCamp

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 15 milhões de alunos e comece Pré-processamento para aprendizado de máquina em Python hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.