Conceitos de Databricks
"Conheça o poder do Databricks Lakehouse e aprimore suas habilidades em engenharia de dados e machine learning."
Comece O Curso Gratuitamente4 horas19 vídeos60 exercícios11.963 aprendizesDeclaração de Realização
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?
Tentar DataCamp for BusinessAmado por alunos de milhares de empresas
Descrição do Curso
Aprenda o poder da Lakehouse No mundo atual, repleto de dados, precisamos de ferramentas que nos permitam ser tão orientados por dados quanto possível. Este curso orienta você do início ao fim sobre como a plataforma Databricks Lakehouse oferece uma plataforma única, dimensionável e de alto desempenho para seus processos de dados. Ao trabalhar com um conjunto de dados do mundo real, você aprenderá a realizar várias tarefas na plataforma Databricks. Você iniciará o curso aprendendo a administrar a plataforma Databricks e a garantir que seu ambiente esteja configurado com segurança.
Praticar engenharia de dados dimensionável Depois de configurar seu espaço de trabalho, você aprenderá a criar pipelines de dados avançados usando o Databricks. Você aplicará diferentes transformações ao conjunto de dados, movendo-o de Bronze para Prata e depois para Ouro em uma arquitetura Medallion. Você aprenderá como os clusters da Databricks oferecem potência de computação e escalabilidade prontamente disponíveis. Você configurará um fluxo de trabalho Databricks de ponta a ponta para automatizar todo o pipeline de dados.
Use o Lakehouse como seu depósito de dados Uma parte importante da arquitetura da Lakehouse é que você pode consultar o armazenamento de dados como se fosse um data warehouse tradicional. Nesta seção, você aprenderá como o Databricks SQL oferece o desempenho de data warehousing que você deseja em cima do seu lago de dados. Você aprenderá a criar consultas usando ANSI SQL padrão e a usar esses resultados para criar painéis ad-hoc em todo o seu conjunto de dados.
Implementar ciência de dados e aprendizado de máquina governados Por fim, você aprenderá como a Databricks oferece um conjunto completo de ferramentas para casos de uso de ciência de dados e aprendizado de máquina. Você aprenderá a rastrear e avaliar seus modelos usando a estrutura MLFlow totalmente integrada para MLOps. Você aprenderá como o Feature Store e o Model Registry simplificam o processo de criação de modelos de aprendizado de máquina com qualidade de produção. Por fim, você aprenderá a implantar e monitorar seus modelos usando os recursos integrados de fornecimento de modelos.
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.- 1
Bem-vindo à Databricks
GratuitoSaiba mais sobre o novo paradigma de Lakehouse para sua estratégia de dados na nuvem e como a plataforma Databricks Lakehouse pode modernizar sua arquitetura de dados. Entenda os componentes fundamentais da plataforma Databricks e como eles se encaixam.
Introdução à plataforma Databricks Lakehouse50 xpPor que escolher uma Lakehouse?50 xpBenefícios do Databricks Lakehouse50 xpDecisões arquitetônicas100 xpPrincipais recursos da plataforma Databricks Lakehouse50 xpPor que a Delta?50 xpTelas de dados para diferentes personas50 xpRecursos para cada pessoa de dados100 xpAdministração de um espaço de trabalho do Databricks50 xpGerenciar e adicionar usuários50 xpExemplo de configuração de um espaço de trabalho do Databricks50 xpPlano de controle vs. Plano de dados50 xpConfigurar o espaço de trabalho do Databricks100 xp - 2
Engenharia de dados
Saiba como processar, transformar e limpar seus dados usando a funcionalidade do Databricks. Pratique o uso de recursos como o formato de armazenamento Delta, Delta Live Tables e fluxos de trabalho para criar um pipeline de dados de ponta a ponta.
Como começar a usar o Databricks50 xpRecursos do Data Explorer50 xpConfiguração de um notebook50 xpConfigurações do cluster100 xpFundamentos de engenharia de dados na Databricks50 xpDataFrames50 xpLeitura de um banco de dados50 xpEscrever uma tabela externa100 xpTransformações de dados em Databricks50 xpCarregamento em arquivos hospedados50 xpSelecionando o idioma certo100 xpEtapas do pipeline de dados100 xpOrquestração de dados em Databricks50 xpAutomações possíveis no Databricks100 xpBenefícios das mesas Delta Live50 xpExemplo de pipeline de dados de ponta a ponta no Databricks50 xpEtapas do pipeline de dados100 xp - 3
Databricks SQL e Data Warehousing
Use a plataforma Databricks Lakehouse como sua solução de armazenamento de dados para seus casos de uso de Business Intelligence (BI). Use os recursos incorporados otimizados do SQL no Databricks para criar consultas e painéis em seus dados.
Visão geral do Databricks SQL50 xpBenefícios do Databricks SQL50 xpDatabricks SQL no fluxo de trabalho de dados100 xpDatabricks SQL vs. outros bancos de dados100 xpComo começar a usar o Databricks SQL50 xpEscolhendo seu armazém SQL50 xpSQL Editor vs. notebooks50 xpCriando a tabela usSales100 xpDatabricks SQL consultas e painéis de controle50 xpCompreensão dos ativos do Databricks SQL50 xpUso de parâmetros em consultas50 xpCriando um painel do Databricks SQL50 xpCriar uma consulta de revisão do usuário100 xp - 4
Tecidos de dados para aplicativos de grande escala e aprendizado de máquina
Use o Databricks para gerenciar seus pipelines de aprendizado de máquina com o MLFlow gerenciado. Siga o ciclo de vida de desenvolvimento de modelos de ponta a ponta com o Feature Store, o Model Registry e os Model Serving Endpoints para criar uma plataforma robusta de MLOps na casa do lago.
Visão geral do Lakehouse AI50 xpBenefícios da Lakehouse para ML50 xpMLOtarefas ps no Databricks100 xpUsando o Databricks para aprendizado de máquina50 xpEDA em Databricks50 xpPor que o tempo de execução do ML?50 xpExplorando dados em um notebook100 xpTreinamento de modelos com MLFlow em Databricks50 xpNó único vs. vários nós ML100 xpDatabricks para cientistas de dados cidadãos50 xpUsando MLFlow para rastreamento100 xpImplementação de um modelo no Databricks50 xpModelos e o registro de modelos50 xpPor que a Databricks para implantação de modelos?50 xpExemplo de pipeline de aprendizado de máquina de ponta a ponta50 xpPipeline ML de ponta a ponta100 xpResumo50 xp
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.colaboradores
Kevin Barlow
Ver MaisData Professional
O que os outros alunos têm a dizer?
Junte-se a mais de 15 milhões de alunos e comece Conceitos de Databricks hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.