Seleccionar página

Curso de Big Data con Hadoop & Spark

Hadoop es un entorno utilizado para el almacenamiento y procesamiento de grandes volúmenes de datos aportando un análisis rápido y fiable, mientras que Spark aporta su motor de computación haciendo más rápido el procesamiento de datos al ser ejecutados en memoria.

Sobre el Curso de Big Data con Hadoop & Spark

En este curso totalmente práctico aprenderás todo lo referente al big data con estas dos grandes herramientas, partiendo desde los conceptos más básicos, el entendimiento de su uso, su entorno, su potencial, las líneas de negocio principales y el desarrollo de algoritmos de inteligencia artificial en casos prácticos.

 Duración:

200 Horas / 3-5 meses

 Modalidad:

Presencial, Telepresencial y Online

 Requisitos Previos:

Conocimientos previos de Sistemas. Existen programas específicos para las personas que parten de cero. 

Sobre la certificación:

El curso incluye un seminario de certificación para prepararte para las certificaciones oficiales de Cloudera CCA175 (CCA Spark and Hadoop Developer).

Para qué te prepara este curso:

Al finalizar este curso podrás desarrollar la profesión de Arquitecto Big Data, desarrollar tus propios algoritmos o detectar patrones para usarlos en diversos sectores como los seguros, el marketing, la salud o incluso la banca. Además te convertirás en uno de los perfiles más codiciados por grandes empresas y organizaciones.

Temario:

Formación Técnica

Introducción y debate sobre Big Data

Conceptos básicos y marco competitivo actual.

Best Practices en Big Data

Líneas estratégicas en Big Data de los grandes triunfadores: Amazon, Facebook y Google.
Modelos de negocio más frecuentes y tendencias futuras.

Entorno virtual de Cloudera

Instalación en una máquina virtual de Cloudera Quickstart. Presentación del entorno y de la herramienta.

Primeras operaciones con Cloudera

Sqoop – Migración desde un entorno MySQL a HDFS realizada por el alumno.
Primeras consultas básicas del entorno creado con Impala y Hive
.

Hive e Impala

Consultas con un grado de dificultad medio del entorno creado.
Migración de ficheros log no estructurados a un entorno HDFS para su exploración en Hive e Impala.
Ejemplo de Spark con Scala
.

Impala Avanzado

Consultas con un grado de dificultad avanzado realizadas por el alumno tutorizado por el profesor.
Primeros conceptos de Cloud
.

PAAS, IAAS, SAAS

Conceptos básicos de Cloud.
Marco competitivo actual y tendencias
.

AWS

Conceptos básicos de Amazon Web Services.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito
.

Azure

Conceptos básicos de Microsoft Azure.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito
.

Google Cloud

Conceptos básicos de Google Cloud.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito
.

Formación Específica

Organización orientada al dato<br />

Estrategia Empresarial.
Inteligencia de negocio.
Actores y tendencias.
Planificación.
Mercado Bigdata.
Situación actual.
Innovación en experiencia de usuario.
Design Thinking.
Fundamentos BI y Bigdata.
Diferencias.
Tecnologías BD y aspectos jurídicos.

Big Data y su ecosistema Hadoop

Introducción al Big Data.
Introducción a Hadoop y su arquitectura.
Hadoop en detalle:
a) Sistema de ficheros HDFS.
b) El paradigma MapReduce.
c) Estructura de un cluster Hadoop: JobTracker, TaskTracker, NameNode y Datanode.
d) Arquitectura YARN. Despliegue de sandbox Big Data y configuración inicial.
Ejercicios con el sistema de ficheros de Hadoop.
Ecosistema Hadoop:
a) Herramientas
b) Distribuciones: Cloudera, Horton, MapR.
c) Tecnologías Datawarehouse:
   a) Hive
   b) Ejercicios Hive.
Tecnologías Desarrollo:
a) Pig.
b) Sqoop.

Procesamiento de datos con Spark

Introducción Apache Spark.
Conceptos más importantes (librerías internas y visión general).
RDD’s:
a) Creación.
b) Operaciones (Transformaciones, acciones, evaluación lazy). c) Persistencia. Carga y exportación de datos:
    a) Formatos de fichero
    b) Sistema de fichero.
Ejecución en cluster:
a) Driver y sus ejecutores.
b) Cluster manager.
c) Despliegue con spark-submit.
Spark SQL.
Introducción a Spark Streaming.

Machine learning, inteligencia artificial<br />

Spark streaming y Ecosistema Hadoop.
Bases Datoa NoSQL.
Análisis de sentimiento en Redes Sociales.
Toma decisiones estratégicas: Watson Analytics.
Adquisición datos y ETL.
OLAP/ROLAP y Datawarehousing.
Tecnologías Bigdata.
Visualización Datos con Tableau.
Machine Learning: Introducción. Estadísticas. Tareas. Técnicas. Lenguaje R y modelado.
Modelos descriptivos.
Personalización Avanzada en Marketing: Next best Activity. DeepLearning y BigML.
People Analytics: El problema de la rotación análisis modelos.

Casos de uso

IOT como generador grandes cantidades Información.
Riesgos financieros y Aplicación Práctica.
Inteligencia Artificial aplicada a la Arquitectura.
Big Data y el Marketing Digital.
Casos prácticos sector seguros.
Big Data e Información Geográfica.
Análisis Redes Sociales.

Proyecto y certificación.

Al finalizar las clases de la formación específica realizarás, con la supervisión de tu tutor, un Proyecto de implantación sobre los conocimientos adquiridos. También, asíncronamente, tienes acceso a exámenes “tipo” para preparar por libre la Certificación oficial, prueba que se puede realizar en cualquier centro Cloudera.

SOLICITA MÁS INFORMACIÓN

    SOLICITA MÁS INFORMACIÓN

      NUESTROS MÁSTERS SAP

      SAP Recursos Humanos

      SAP Recursos Humanos HCM

      SAP SuccessFactors SF

      MOC TR (SAP Tesorería)

      SAP Logística y Operaciones

      SAP Compras MM

      SAP Ventas SD

      SAP Transporte MOC TM

      SAP Producción, Fabricación y Mantenimiento

      Especialista SAP Planificación de la Producción y Fabricación MA/AM

      Especialista SAP Compras MM

      SAP Calidad MOC QM

      SAP Desarrollo ABAP y Analítica de Datos

      Especialista SAP ABAP

      Especialista SAP Business Warehouse BW

      SAP Cloud Platform (Desarrollo) MOC SCP-D

      SAP mantenimiento BASIS y Big Data Hana

      Especialista SAP BASIS

      SAP HANA Big Data

      SAP Cloud Platform (Integración) MOC SCP-I

      Usuario Básico con Fiori

      Un módulo que habilita al alumno en el manejo del programa a nivel auxiliar. Pudiendo aprender de forma horizontal y a nivel básico el manejo de todos los módulos operativos de SAP: FI/ MM/ SD/ HCM. Y añade el modulo de Fiori que completa la experiencia interactiva de usuario y más de 300 nuevas aplicaciones.

      Usuario Key User

      El alumno aprende a desempeñar la función de Key User, para ser intermediario con los Consultores de Soporte, especializándose en una de las 4 áreas operativas: FI (Finanzas), MM(Compras), SD (Ventas), HCM (RRHH). Con acceso a la Certificación Oficial.

      Formación bonificada para las empresas

      Cloud Formación como entidad inscrita con el código 16753 en el Registro Estatal de Entidades de Formación, gestiona e imparte, dentro de la iniciativa de Formación Programada por las Empresas, formación profesional para el empleo, de acuerdo con lo establecido en la Ley 30/2015, de 9 de septiembre.

      Cloud Formación, les ayuda de forma gratuita a consultar el importe del crédito de su empresa para este año.