Pular para o conteúdo principal

curso

ETL e ELT em Python

Intermediário

Updated 12/2024

"Este curso introdutório ajudará você a desenvolver habilidades para criar pipelines de dados eficazes."

Iniciar curso gratuitamente

Incluído gratuitamentePremium or Teams

PythonEngenharia de dados4 horas14 vídeos53 exercícios4,450 XP15,977Declaração de Realização

Crie sua conta gratuita

Google LinkedIn Facebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição do curso

Capacitar a análise com pipelines de dados

Os pipelines de dados são a base de toda plataforma de dados sólida. A criação desses pipelines é uma habilidade essencial para os engenheiros de dados, que fornecem um valor incrível para uma empresa pronta para entrar em um futuro orientado por dados. Este curso introdutório ajudará você a aprimorar as habilidades para criar pipelines de dados eficazes, eficientes e confiáveis.

Criar e manter soluções de ETL e ELT

Ao longo deste curso, você mergulhará no processo completo de criação de um pipeline de dados. Você desenvolverá suas habilidades aproveitando as bibliotecas Python, como `pandas` e `json`, para extrair dados de fontes estruturadas e não estruturadas antes de serem transformados e mantidos para uso posterior. Ao longo do caminho, você ganhará confiança em ferramentas e técnicas, como diagramas de arquitetura, testes unitários e monitoramento, que ajudarão a diferenciar seus pipelines de dados dos demais. À medida que progredir, você colocará suas novas habilidades à prova com exercícios práticos.

Pré-requisitos

Data Warehousing Concepts Streamlined Data Ingestion with pandas

1

Introdução aos pipelines de dados

Iniciar capítulo

Introdução aos pipelines de dados

Running an ETL Pipeline

ELT in Action

ETL and ELT Pipelines

Projetar pipelines de dados

Building an ETL Pipeline

The "T" in ELT

Extracting, Transforming, and Loading Student Scores Data

2

Criando ETL Pipelines

Iniciar capítulo

Extração de dados de fontes estruturais

Extração de dados de arquivos parquet

Extração de dados de bancos de dados SQL

Criar funções para extrair dados

Transformando dados com o pandas

Filtragem de DataFrames do pandas

Transformando dados de vendas com pandas

Validação de transformações de dados

Persistência de dados com o pandas

Carregando dados de vendas em um arquivo CSV

Personalizando um arquivo CSV

Persistência de dados em arquivos

Monitoramento de um pipeline de dados

Registro em um pipeline de dados

Tratamento de exceções ao carregar dados

Monitoramento e alertas em um pipeline de dados

3

Técnicas avançadas do site ETL

Iniciar capítulo

Extração de dados não tabulares

Ingerindo dados do JSON com o pandas

Leitura de dados do site JSON na memória

Transformação de dados não tabulares

Iteração sobre dicionários

Analisar dados de dicionários

Transformando os dados do JSON

Transformar e limpar DataFrames

Transformação avançada de dados com pandas

Preenchimento de valores ausentes com pandas

Agrupamento de dados com pandas

Aplicação de transformações avançadas a DataFrames

Carregando dados em um banco de dados SQL com pandas

Carregamento de dados em um banco de dados Postgres

Validação de dados carregados em um banco de dados Postgres

4

Implementação e manutenção de um pipeline de dados

Iniciar capítulo

Teste manual de um pipeline de dados

Teste de pipelines de dados

Validação de um pipeline de dados em "pontos de verificação"

Teste de um pipeline de dados de ponta a ponta

Teste de unidade de um pipeline de dados

Validação de um pipeline de dados com assert e isinstance

Escrevendo testes de unidade com o pytest

Criando acessórios com o pytest

Teste de unidade de um pipeline de dados com acessórios

Executar um pipeline de dados na produção

Ferramentas de orquestração e ETL

Padrões de arquitetura de pipeline de dados

Execução de um pipeline de dados de ponta a ponta

ETL e ELT em Python

Curso
Completo

Declaração de Realização Earn

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 15 milhões de alunos e comece ETL e ELT em Python Hoje!

Crie sua conta gratuita

Google LinkedIn Facebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.