Pular para o conteúdo principal

curso

Pré-processamento para aprendizado de máquina em Python

Intermediário

Updated 12/2024

"Aprenda a limpar e preparar seus dados para aprendizado de máquina!"

Iniciar curso gratuitamente

Incluído gratuitamentePremium or Teams

PythonMachine learning4 horas20 vídeos62 exercícios4,700 XP51,935Declaração de Realização

Crie sua conta gratuita

Google LinkedIn Facebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição do curso

Este curso aborda os conceitos básicos de como e quando realizar o pré-processamento de dados. Essa etapa essencial em qualquer projeto de aprendizado de máquina é quando você prepara os dados para a modelagem. Entre a importação e a limpeza dos dados e o ajuste do modelo de aprendizado de máquina é quando o pré-processamento entra em ação. Você aprenderá a padronizar seus dados para que estejam no formato certo para o seu modelo, criar novos recursos para aproveitar melhor as informações do seu conjunto de dados e selecionar os melhores recursos para melhorar o ajuste do modelo. Por fim, você terá alguma prática de pré-processamento ao obter um conjunto de dados sobre avistamentos de UFO prontos para modelagem.

Pré-requisitos

Cleaning Data in Python Supervised Learning with scikit-learn

1

Introdução ao pré-processamento de dados

Iniciar capítulo

Introdução ao pré-processamento

Explorando dados ausentes

Eliminação de dados ausentes

Trabalhar com tipos de dados

Explorando tipos de dados

Conversão de um tipo de coluna

Conjuntos de treinamento e teste

Desequilíbrio de classe

Amostragem estratificada

2

Padronização de dados

Iniciar capítulo

Padronização

Quando padronizar

Modelagem sem normalização

Normalização de logs

Verificação da variação

Normalização de registros em Python

Escalonamento de dados para comparação de recursos

Dimensionamento de dados - investigando colunas

Dimensionamento de dados - padronização de colunas

Dados e modelagem padronizados

KNN em dados não escalonados

KNN em dados escalonados

3

Engenharia de recursos

Iniciar capítulo

Engenharia de recursos

Teste de conhecimento de engenharia de recursos

Identificação de áreas para engenharia de recursos

Codificação de variáveis categóricas

Codificação de variáveis categóricas - binárias

Codificação de variáveis categóricas - one-hot

Recursos numéricos de engenharia

Agregação de recursos numéricos

Extração de componentes de data e hora

Recursos de texto de engenharia

Extração de padrões de string

Vetorização de texto

Classificação de texto usando vetores tf/idf

4

Seleção de recursos para modelagem

Iniciar capítulo

Seleção de recursos

Quando usar a seleção de recursos

Identificação de áreas para seleção de recursos

Remoção de recursos redundantes

Seleção de recursos relevantes

Verificação de recursos correlacionados

Seleção de recursos usando vetores de texto

Explorando vetores de texto, parte 1

Explorando vetores de texto, parte 2

Treinamento do Naive Bayes com seleção de recursos

Redução da dimensionalidade

Treinamento de um modelo com PCA

5

Colocando tudo junto

Iniciar capítulo

UFOs e pré-processamento

Verificação dos tipos de coluna

Eliminação de dados ausentes

Variáveis categóricas e padronização

Extração de números de cadeias de caracteres

Identificação de recursos para padronização

Engenharia de novos recursos

Codificação de variáveis categóricas

Recursos de datas

Vetorização de texto

Seleção e modelagem de recursos

Selecionando o conjunto de dados ideal

Modelagem do conjunto de dados UFO, parte 1

Modelagem do conjunto de dados UFO, parte 2

Pré-processamento para aprendizado de máquina em Python

Curso
Completo

Declaração de Realização Earn

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 15 milhões de alunos e comece Pré-processamento para aprendizado de máquina em Python Hoje!

Crie sua conta gratuita

Google LinkedIn Facebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.