Limpeza de dados no R
Aprenda a limpar dados rápida e precisamente para transformar dados brutos em insights incríveis.
Comece O Curso Gratuitamente4 horas13 vídeos44 exercícios51.871 aprendizesDeclaração de Realização
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?
Tentar DataCamp for BusinessAmado por alunos de milhares de empresas
Descrição do Curso
Supere problemas comuns de dados, como a remoção de duplicatas no R
Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. O tempo gasto com a limpeza é vital, pois a análise de dados sujos pode levar você a tirar conclusões imprecisas.Neste curso, você aprenderá uma variedade de técnicas para ajudá-lo a limpar dados sujos usando o R. Você começará convertendo tipos de dados, aplicando restrições de intervalo e lidando com duplicatas totais e parciais para evitar contagem dupla.
Mergulhe nos desafios dos dados avançados
Depois de praticar o trabalho com problemas comuns de dados, você passará para desafios mais avançados, como garantir a consistência das medições e lidar com dados ausentes. Após cada novo conceito, você terá a oportunidade de realizar um exercício prático para consolidar seu conhecimento e aumentar sua experiência.Aprenda a usar a vinculação de registros durante a limpeza de dados
O Record Linkage é usado para mesclar conjuntos de dados quando os valores apresentam problemas como erros de digitação ou grafias diferentes. Você explorará essa técnica útil no capítulo final e praticará o aplicativo usando-a para unir dois conjuntos de dados de avaliações de restaurantes em um único conjunto de dados.Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Importação e limpeza de dados in R
Ir para a trilha- 1
Problemas comuns de dados
GratuitoNeste capítulo, você aprenderá a superar alguns dos problemas mais comuns de dados sujos. Você converterá tipos de dados, aplicará restrições de intervalo para remover pontos de dados futuros e removerá pontos de dados duplicados para evitar contagem dupla.
Restrições de tipo de dados50 xpTipos de dados comuns100 xpConversão de tipos de dados100 xpCorte de cordas100 xpRestrições de alcance50 xpRestrições de duração da viagem100 xpDe volta ao futuro100 xpRestrições de exclusividade50 xpDuplicatas completas100 xpRemoção de duplicatas parciais100 xpAgregação de duplicatas parciais100 xp - 2
Dados categóricos e de texto
Os dados categóricos e de texto podem ser algumas das partes mais confusas de um conjunto de dados devido à sua natureza não estruturada. Neste capítulo, você aprenderá a corrigir inconsistências de espaço em branco e de letras maiúsculas nos rótulos de categoria, a recolher várias categorias em uma só e a reformatar cadeias de caracteres para obter consistência.
Verificação de associação50 xpSomente para membros100 xpNão sou membro100 xpProblemas de dados categóricos50 xpIdentificação de inconsistências100 xpCorreção de inconsistências100 xpColapso de categorias100 xpLimpeza de dados de texto50 xpDetecção de dados de texto inconsistentes100 xpSubstituição e remoção100 xpNúmeros de telefone inválidos100 xp - 3
Problemas avançados de dados
Neste capítulo, você se aprofundará em problemas mais avançados de limpeza de dados, como garantir que todos os pesos sejam escritos em quilogramas em vez de libras. Você também adquirirá habilidades valiosas que o ajudarão a verificar se os valores foram adicionados corretamente e se os valores ausentes não afetam negativamente suas análises.
- 4
Vinculação de registros
A vinculação de registros é uma técnica poderosa usada para mesclar vários conjuntos de dados, usada quando os valores têm erros de digitação ou grafias diferentes. Neste capítulo, você aprenderá a vincular registros calculando a similaridade entre cadeias de caracteres. Em seguida, usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.
Comparação de cadeias de caracteres50 xpCálculo da distância50 xpPequena distância, pequena diferença100 xpCorreção de erros de digitação com distância de string100 xpGeração e comparação de pares50 xpVocê pode criar um link ou participar?100 xpBloqueio de pares100 xpComparação de pares100 xpPontuação e vinculação50 xpVocê marca e depois seleciona ou seleciona e depois marca?100 xpMontagem100 xpParabéns!50 xp
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Importação e limpeza de dados in R
Ir para a trilhacolaboradores
pré-requisitos
Joining Data with dplyrMaggie Matsui
Ver MaisCurriculum Manager at DataCamp
O que os outros alunos têm a dizer?
Junte-se a mais de 15 milhões de alunos e comece Limpeza de dados no R hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.