Introdução à engenharia de dados
Aprenda sobre engenharia de dados neste curso curto, cobrindo ETL e computação em nuvem.
Comece O Curso Gratuitamente4 horas15 vídeos57 exercícios114.490 aprendizesDeclaração de Realização
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?
Tentar DataCamp for BusinessAmado por alunos de milhares de empresas
Descrição do Curso
Comece a trabalhar com engenharia de dados
Você tem curiosidade de seguir uma carreira em engenharia de dados, mas não sabe por onde começar? Ou talvez você queira mais informações sobre o que os engenheiros de dados fazem antes de dar os próximos passos? Este curso de quatro horas é uma introdução à engenharia de dados e aos principais conceitos, técnicas e ferramentas que você precisa entender para fazer o trabalho.Aprenda os conceitos e as técnicas de engenharia de dados
Você começará aprendendo as diferenças entre um engenheiro de dados e um cientista de dados (e como eles trabalham juntos) antes de saber mais sobre as ferramentas do ofício, falando especificamente sobre computação em nuvem e computação paralela. Ao final do segundo capítulo, você entenderá as aplicações de SQL e NoSQL, usando DataFrames, e por que a computação paralela é tão importante.Executar ETL em exercícios práticos
O processo de ETL é essencial para o fluxo de trabalho de um engenheiro de dados. Você aprenderá como os dados são extraídos, transformados e carregados para prepará-los para análise e geração de insights. Ao final do curso, você colocará todo esse conhecimento em prática executando e programando um processo de ETL usando dados reais.Nossos exercícios e testes interativos permitem que você revise e consolide seus novos conhecimentos, para que tenha confiança para discuti-los e aplicá-los depois de receber sua Declaração de Realização.
Este curso introdutório faz parte de uma trilha de engenharia de dados, que oferece a você caminhos para melhorar sua compreensão da engenharia de dados e um conjunto claro das próximas etapas para se tornar um engenheiro de dados profissional.
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.- 1
Introdução à engenharia de dados
GratuitoNeste primeiro capítulo, você conhecerá o mundo da engenharia de dados! Explore as diferenças entre um engenheiro de dados e um cientista de dados, obtenha uma visão geral das várias ferramentas que os engenheiros de dados usam e amplie sua compreensão de como a tecnologia de nuvem desempenha um papel na engenharia de dados.
O que é engenharia de dados?50 xpTarefas do engenheiro de dados50 xpVocê é engenheiro de dados ou cientista de dados?100 xpProblemas de engenharia de dados50 xpFerramentas do engenheiro de dados50 xpTipos de bancos de dados50 xpTarefas de processamento50 xpFerramentas de agendamento50 xpProvedores de nuvem50 xpPor que a computação em nuvem?50 xpGrandes participantes da computação em nuvem100 xpServiços em nuvem100 xp - 2
Caixa de ferramentas de engenharia de dados
Agora que você conhece as principais diferenças entre um engenheiro de dados e um cientista de dados, prepare-se para explorar a caixa de ferramentas do engenheiro de dados! Aprenda em detalhes sobre os diferentes tipos de bancos de dados que os engenheiros de dados usam, como a computação paralela é uma pedra angular do kit de ferramentas do engenheiro de dados e como agendar trabalhos de processamento de dados usando estruturas de agendamento.
Bancos de dados50 xpSQL vs NãoSQL100 xpO esquema do banco de dados100 xpUnir-se em relações100 xpDiagrama de esquema em estrela50 xpO que é computação paralela50 xpPor que a computação paralela?50 xpDe tarefa para subtarefas100 xpUsando um DataFrame100 xpEstruturas de computação paralela50 xpSpark, Hadoop e Hive100 xpUm grupo do PySpark100 xpExecutando arquivos do PySpark50 xpEstruturas de agendamento de fluxo de trabalho50 xpFluxo de ar, Luigi e cron50 xpFluxo de ar DAGs100 xp - 3
Extrair, transformar e carregar (ETL)
Depois de conhecer a caixa de ferramentas dos engenheiros de dados, chegou a hora de você começar a trabalhar no fluxo de trabalho de um engenheiro de dados! Com o ETL, você aprenderá a extrair dados brutos de várias fontes, transformá-los em insights acionáveis e carregá-los em bancos de dados relevantes, prontos para consumo!
Extrair50 xpFontes de dados50 xpObter de um API100 xpLer de um banco de dados100 xpTransformar50 xpDivisão da taxa de aluguel100 xpPrepare-se para as transformações50 xpJuntar-se a classificações100 xpCarregamento50 xpOLAP ou OLTP50 xpGravação em um arquivo100 xpCarregar no Postgres100 xpJuntando tudo50 xpDefinição de um DAG100 xpConfiguração do fluxo de ar50 xpInterpretando o DAG50 xp - 4
Estudo de caso: DataCamp
Termine tudo o que você aprendeu nos três capítulos anteriores concluindo um caso de uso de engenharia de dados do mundo real do DataCamp! Você executará e programará um processo ETL que transforma dados brutos de classificação de cursos em recomendações de cursos acionáveis para os alunos do DataCamp!
Classificações do curso50 xpExplorando o esquema50 xpConsultando a tabela100 xpClassificação média por curso100 xpDe classificações a recomendações50 xpFiltrar dados corrompidos100 xpUsando a transformação de recomendação100 xpAgendamento de trabalhos diários50 xpA tabela de destino100 xpDefinindo o DAG100 xpAtivar o DAG50 xpConsultando as recomendações100 xpParabéns a você50 xp
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.conjuntos de dados
datacamp_application.sqlcolaboradores
Vincent Vankrunkelsven
Ver MaisData and Software Engineer @DataCamp
O que os outros alunos têm a dizer?
Junte-se a mais de 15 milhões de alunos e comece Introdução à engenharia de dados hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.