Conceptos de Databricks
Descubre el poder de Databricks Lakehouse y mejora tus habilidades en ingeniería de datos y aprendizaje automático.
Comienza El Curso Gratis4 horas19 vídeos60 ejercicios11.963 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
Aprende el poder de la Casa del Lago En el mundo actual, lleno de datos, necesitamos herramientas que nos permitan basarnos en ellos tanto como sea posible. Este curso te guía de principio a fin sobre cómo la Plataforma Lakehouse de Databricks proporciona una plataforma única, escalable y de alto rendimiento para tus procesos de datos. Trabajar con un conjunto de datos del mundo real te enseñará a realizar diversas tareas dentro de la plataforma Databricks. Empezarás el curso aprendiendo a administrar la plataforma Databricks y asegurándote de que tu entorno está configurado de forma segura.
Practica la ingeniería de datos escalable Tras configurar tu espacio de trabajo, aprenderás a crear potentes canalizaciones de datos utilizando Databricks. Aplicarás distintas transformaciones al conjunto de datos, haciéndolo pasar de Bronce a Plata y luego a Oro en una arquitectura Medallón. Aprenderás cómo los clusters Databricks proporcionan potencia de cálculo y escalabilidad fácilmente disponibles. Configurarás un flujo de trabajo Databricks de extremo a extremo para automatizar toda tu canalización de datos.
Utiliza Lakehouse como almacén de datos Una parte clave de la arquitectura de Lakehouse es que puedes consultar tu almacenamiento de datos como si fuera un almacén de datos tradicional. En esta sección, aprenderás cómo Databricks SQL te proporciona el rendimiento de almacenamiento de datos que deseas sobre tu lago de datos. Aprenderás a crear consultas utilizando SQL ANSI estándar, y a utilizar esos resultados para crear cuadros de mando ad hoc con todo tu conjunto de datos.
Implementar la ciencia de datos gobernada y el machine learning Por último, aprenderás cómo Databricks proporciona un conjunto completo de herramientas para casos de uso de ciencia de datos y machine learning. Aprenderás a seguir y evaluar tus modelos utilizando el marco MLFlow totalmente integrado para MLOps. Aprenderás cómo el Almacén de Características y el Registro de Modelos simplifican el proceso de creación de modelos de machine learning con calidad de producción. Por último, aprenderás a desplegar y supervisar tus modelos utilizando las funciones integradas de servicio de modelos.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.- 1
Bienvenido a Databricks
GratuitoConoce el nuevo paradigma Lakehouse para tu estrategia de datos en la nube y cómo la plataforma Databricks Lakehouse puede modernizar tu arquitectura de datos. Comprende los componentes básicos de la plataforma Databricks y cómo encajan entre sí.
Introducción a la Plataforma Lakehouse de Databricks50 xp¿Por qué elegir una casa en el lago?50 xpVentajas de Databricks Lakehouse50 xpDecisiones arquitectónicas100 xpCaracterísticas principales de la Plataforma Lakehouse de Databricks50 xp¿Por qué Delta?50 xpTejidos de datos para diferentes personas50 xpCapacidades para cada persona de datos100 xpAdministrar un espacio de trabajo Databricks50 xpGestionar y añadir usuarios50 xpEjemplo de configuración de un espacio de trabajo Databricks50 xpPlano de control vs. Plano de datos50 xpConfigura tu espacio de trabajo Databricks100 xp - 2
Ingeniería de datos
Aprende a procesar, transformar y limpiar tus datos utilizando las funciones de Databricks. Practica el uso conjunto de capacidades como el formato de almacenamiento Delta, las Tablas Delta Live y los Flujos de Trabajo para crear una canalización de datos de extremo a extremo.
Primeros pasos con Databricks50 xpFunciones del Explorador de datos50 xpConfigurar un cuaderno50 xpConfiguraciones de clúster100 xpFundamentos de Ingeniería de Datos en Databricks50 xpMarcos de datos50 xpLeer de una base de datos50 xpEscribe una tabla externa100 xpTransformaciones de datos en Databricks50 xpCarga de archivos alojados50 xpSeleccionar la lengua adecuada100 xpPasos de la canalización de datos100 xpOrquestación de datos en Databricks50 xpAutomatizaciones posibles en Databricks100 xpVentajas de las Mesas Delta Live50 xpEjemplo de canalización de datos de extremo a extremo en Databricks50 xpPasos de la canalización de datos100 xp - 3
Databricks SQL y Almacenamiento de Datos
Utiliza la plataforma Lakehouse de Databricks como solución de almacenamiento de datos para tus casos de uso de Business Intelligence (BI). Utiliza las funciones optimizadas integradas en SQL dentro de Databricks para crear consultas y cuadros de mando sobre tus datos.
Visión general de Databricks SQL50 xpVentajas de los Databricks SQL50 xpDatabricks SQL en el flujo de trabajo de datos100 xpDatabricks SQL frente a otras bases de datos100 xpPrimeros pasos con Databricks SQL50 xpElegir tu almacén SQL50 xpSQL Editor vs. cuadernos50 xpCreación de la tabla usVentas100 xpDatabricks SQL consultas y cuadros de mando50 xpComprender los activos de Databricks SQL50 xpUtilizar parámetros en las consultas50 xpCreación de un panel Databricks SQL50 xpCrear una consulta de revisión del usuario100 xp - 4
Tejidos de datos para aplicaciones a gran escala y aprendizaje automático
Utiliza Databricks para gestionar tus pipelines de Aprendizaje Automático con MLFgestionado bajo. Sigue el ciclo de vida de desarrollo de modelos de principio a fin con el Almacén de Características, el Registro de Modelos y los Puntos Finales de Servicio de Modelos para crear una sólida plataforma MLOps en la casa del lago.
Visión general de Lakehouse AI50 xpBeneficios de la casa del lago para ML50 xpMLOtareas ps en Databricks100 xpUtilizar Databricks para el aprendizaje automático50 xpEDA en Tejidos de datos50 xp¿Por qué el tiempo de ejecución ML?50 xpExplorar datos en un cuaderno100 xpEntrenamiento de modelos con MLFbajo en Databricks50 xpNodo único frente a nodo múltiple ML100 xpDatabricks para científicos de datos ciudadanos50 xpUtilizando MLFlow para el Seguimiento100 xpDesplegar un modelo en Databricks50 xpModelos y Registro de Modelos50 xp¿Por qué Databricks para el despliegue de modelos?50 xpEjemplo de canal de aprendizaje automático integral50 xpCanalización de extremo a extremo ML100 xpConclusión50 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.colaboradores
Kevin Barlow
Ver MásData Professional
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Conceptos de Databricks hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.