WeWork - The Landmark
06/03/2019 al 08/03/2019
09:00 - 17:00
SOBRE EL CURSO
Este
curso está diseñado para ingenieros de datos, analistas, arquitectos;
Ingenieros de software; Operaciones de TI; Y gerentes técnicos
interesados en una descripción completa y práctica de Apache Spark.
El
programa cubre las API básicas para el uso de Spark, mecanismos
fundamentales y elementos internos básicos del marco, SQL y otros
accesos de datos de alto nivel herramientas, así como las capacidades de
transmisión de Spark y las API de aprendizaje automático.
Cada
tema incluye diapositivas y contenido de conferencias junto con el uso
práctico de Spark a través de un elegante entorno basado en la web.
Inspirados en herramientas como IPython / Jupyter, los materiales
permiten a los asistentes codificar trabajos, realizar consultas de
análisis de datos y visualizaciones utilizando su propio clúster Spark,
al que se accede a través de un navegador web. Todo el código de clase
se puede utilizar directamente con Spark de código abierto puro o
cualquier distribución comercial de Spark.
Las clases son impartidas en español, sin embargo los materiales de trabajo y evaluación se encuentran en inglés.
OBJETIVOS
Después de tomar esta clase podrás:
• Describir los mecanismos fundamentales de Spark.
• Utilizar las API de Spark para operar con datos
• Articular e implementar casos de uso típicos para Spark.
• Construir tuberías de datos con SparkSQL y DataFrames
• Analizar trabajos Spark utilizando las interfaces de usuario y registros
• Crear trabajos de transmisión y aprendizaje automático
MÓDULOS
• Descripción general de Spark
• Fundamentos del RDD
• SparkSQL y DataFrames
• Ejecución de Spark
• Arquitecturas de grupo para Spark
• Introducción a Spark Streaming
• Conceptos básicos de aprendizaje automático
REQUERIMIENTOS
Todos
los participantes necesitarán una computadora portátil con versiones
actualizadas de Chrome o Firefox (no se admiten Internet Explorer ni
Safari)
COSTO: $ 46,400 por persona*