Junção de dados com o pandas
Aprenda a combinar dados de várias tabelas unindo-os com pandas.
Comece O Curso Gratuitamente4 horas15 vídeos51 exercícios164.427 aprendizesDeclaração de Realização
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?
Tentar DataCamp for BusinessAmado por alunos de milhares de empresas
Descrição do Curso
A capacidade de combinar e trabalhar com vários conjuntos de dados é uma habilidade essencial para qualquer aspirante a cientista de dados. O pandas é uma base fundamental do ecossistema de ciência de dados do Python, com o Stack Overflow registrando 5 milhões de visualizações de perguntas sobre o pandas. Aprenda a lidar com vários DataFrames combinando, organizando, unindo e remodelando-os usando o pandas. Você trabalhará com conjuntos de dados do Banco Mundial e da cidade de Chicago. Você terminará o curso com um conjunto sólido de habilidades para a junção de dados no pandas.
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Manipulação de dados em Python
Ir para a trilha- 1
Noções básicas de mesclagem de dados
GratuitoSaiba como você pode mesclar dados díspares usando “inner joins”. Ao combinar informações de várias fontes, você descobrirá insights interessantes que podem estar ocultos anteriormente. Você também aprenderá como o relacionamento entre essas fontes, como um para um ou um para muitos, pode afetar seu resultado.
Inner join50 xpEm qual coluna você deve fazer a mesclagem?50 xpSeu primeiro “inner join”100 xpInner joins e número de linhas retornadas100 xpRelacionamentos um-para-muitos50 xpClassificação de um para muitos100 xpMesclagem de um para muitos100 xpMesclagem de vários DataFrames50 xpTotal de usuários em um mês100 xpMesclagem de três mesas100 xpMesclagem de um para muitos com várias tabelas100 xp - 2
Mesclar tabelas com diferentes tipos de junção
Leve seu conhecimento sobre junções para o próximo nível. Neste capítulo, você trabalhará com os dados do filme TMDb e aprenderá sobre “left joins”, “right joins” e “outer joins”. Você também descobrirá como mesclar uma tabela com ela mesma e mesclar em um índice do DataFrame.
Left join50 xpContagem de linhas ausentes com “left join”100 xpEnriquecimento de um conjunto de dados100 xpQuantas linhas você tem com um “left join”?50 xpOutras junções50 xpRight join para encontrar filmes exclusivos100 xpGêneros populares com right join100 xpUso de outer join para selecionar atores100 xpMesclagem de uma tabela com ela mesma50 xpSelf join100 xpComo o pandas lida com self-joins?50 xpMesclagem em índices50 xpMesclagem de índices para classificações de filmes100 xpAs sequências rendem mais?100 xp - 3
Mesclagem e concatenação avançadas
Neste capítulo, você aproveitará técnicas avançadas de filtragem, incluindo “semi-joins” e “anti-joins”. Você também aprenderá a colar DataFrames combinando verticalmente e usando a função pandas.concat para criar novos conjuntos de dados. Por fim, como os dados raramente são limpos, você também aprenderá a validar as estruturas de dados recém-combinadas.
Filtragem de junções50 xpEtapas de um semi-join100 xpExecução de um anti-join100 xpExecução de um semi-join100 xpConcatenar DataFrames verticalmente50 xpNoções básicas de concatenação100 xpConcatenação com chaves100 xpVerificação da integridade50 xpValidação de uma mesclagem50 xpConcatenar e mesclar para encontrar músicas em comum100 xp - 4
Mesclar dados ordenados e de séries temporais
Neste capítulo final, você aumentará a velocidade e aprenderá a aplicar os métodos especializados do pandas para mesclar séries temporais e dados ordenados com dados financeiros e econômicos do mundo real da cidade de Chicago. Você também aprenderá a consultar as tabelas resultantes usando um formato no estilo SQL e a desvincular os dados usando o método melt.
Uso de merge_ordered()50 xpCorrelação entre GDP e S&P500100 xpCurva de Phillips usando merge_ordered()100 xpmerge_ordered() caution, várias colunas100 xpUso de merge_asof()50 xpUso de merge_asof() para estudar ações100 xpUso de merge_asof() para criar um conjunto de dados100 xpDiferenças entre merge_asof() e merge_ordered()100 xpSeleção de dados com .query()50 xpExplore os dados financeiros com .query()50 xpSubconjunto de linhas com .query()100 xpReformulação de dados com .melt()50 xpSelecione os argumentos .melt() corretos50 xpUso de .melt() para remodelar dados governamentais100 xpUso de .melt() para desempenho de ações e títulos100 xpConclusão do curso50 xp
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Manipulação de dados em Python
Ir para a trilhaEm outras faixas
Fundamentos de dados Pythonconjuntos de dados
Chicago WardsChicago Business LicensesChicago CensusChicago Demographics by Zip CodeChicago Business OwnersChicago Land UseChicago Taxi VehiclesChicago Taxi OwnersCTA RidershipCTA CalendarCTA StationsMoviesMovie ActorsMovie RatingsMovie CastsMovie CrewsMovie GenresMovie SequelsMovie Financial DataMovie Tag LinesS&P 500World Bank GDPWorld Bank Populationcolaboradores
pré-requisitos
Data Manipulation with pandasAaren Stubberfield
Ver MaisSenior Data Scientist @ Microsoft
O que os outros alunos têm a dizer?
Junte-se a mais de 15 milhões de alunos e comece Junção de dados com o pandas hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.