Seleccionar página

Curso de Big Data con Hadoop & Spark

Hadoop es un entorno utilizado para el almacenamiento y procesamiento de grandes volúmenes de datos aportando un análisis rápido y fiable, mientras que Spark aporta su motor de computación haciendo más rápido el procesamiento de datos al ser ejecutados en memoria.

Sobre el Curso de Big Data con Hadoop & Spark

En este curso totalmente práctico aprenderás todo lo referente al big data con estas dos grandes herramientas, partiendo desde los conceptos más básicos, el entendimiento de su uso, su entorno, su potencial, las líneas de negocio principales y el desarrollo de algoritmos de inteligencia artificial en casos prácticos.

 Duración:

200 Horas / 3-5 meses

 Modalidad:

Presencial, Telepresencial y Online

 Requisitos Previos:

Conocimientos previos de Sistemas. Existen programas específicos para las personas que parten de cero. 

Sobre la certificación:

El curso incluye un seminario de certificación para prepararte para las certificaciones oficiales de Cloudera CCA175 (CCA Spark and Hadoop Developer).

Para qué te prepara este curso:

Al finalizar este curso podrás desarrollar la profesión de Arquitecto Big Data, desarrollar tus propios algoritmos o detectar patrones para usarlos en diversos sectores como los seguros, el marketing, la salud o incluso la banca. Además te convertirás en uno de los perfiles más codiciados por grandes empresas y organizaciones.

Temario:

Formación Técnica

Introducción y debate sobre Big Data

Conceptos básicos y marco competitivo actual.

Best Practices en Big Data

Líneas estratégicas en Big Data de los grandes triunfadores: Amazon, Facebook y Google.
Modelos de negocio más frecuentes y tendencias futuras.

Entorno virtual de Cloudera

Instalación en una máquina virtual de Cloudera Quickstart. Presentación del entorno y de la herramienta.

Primeras operaciones con Cloudera

Sqoop – Migración desde un entorno MySQL a HDFS realizada por el alumno.
Primeras consultas básicas del entorno creado con Impala y Hive
.

Hive e Impala

Consultas con un grado de dificultad medio del entorno creado.
Migración de ficheros log no estructurados a un entorno HDFS para su exploración en Hive e Impala.
Ejemplo de Spark con Scala
.

Impala Avanzado

Consultas con un grado de dificultad avanzado realizadas por el alumno tutorizado por el profesor.
Primeros conceptos de Cloud
.

PAAS, IAAS, SAAS

Conceptos básicos de Cloud.
Marco competitivo actual y tendencias
.

AWS

Conceptos básicos de Amazon Web Services.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito
.

Azure

Conceptos básicos de Microsoft Azure.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito
.

Google Cloud

Conceptos básicos de Google Cloud.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito
.

Formación Específica

Organización orientada al dato<br />

Estrategia Empresarial.
Inteligencia de negocio.
Actores y tendencias.
Planificación.
Mercado Bigdata.
Situación actual.
Innovación en experiencia de usuario.
Design Thinking.
Fundamentos BI y Bigdata.
Diferencias.
Tecnologías BD y aspectos jurídicos.

Big Data y su ecosistema Hadoop

Introducción al Big Data.
Introducción a Hadoop y su arquitectura.
Hadoop en detalle:
a) Sistema de ficheros HDFS.
b) El paradigma MapReduce.
c) Estructura de un cluster Hadoop: JobTracker, TaskTracker, NameNode y Datanode.
d) Arquitectura YARN. Despliegue de sandbox Big Data y configuración inicial.
Ejercicios con el sistema de ficheros de Hadoop.
Ecosistema Hadoop:
a) Herramientas
b) Distribuciones: Cloudera, Horton, MapR.
c) Tecnologías Datawarehouse:
   a) Hive
   b) Ejercicios Hive.
Tecnologías Desarrollo:
a) Pig.
b) Sqoop.

Procesamiento de datos con Spark

Introducción Apache Spark.
Conceptos más importantes (librerías internas y visión general).
RDD’s:
a) Creación.
b) Operaciones (Transformaciones, acciones, evaluación lazy). c) Persistencia. Carga y exportación de datos:
    a) Formatos de fichero
    b) Sistema de fichero.
Ejecución en cluster:
a) Driver y sus ejecutores.
b) Cluster manager.
c) Despliegue con spark-submit.
Spark SQL.
Introducción a Spark Streaming.

Machine learning, inteligencia artificial<br />

Spark streaming y Ecosistema Hadoop.
Bases Datoa NoSQL.
Análisis de sentimiento en Redes Sociales.
Toma decisiones estratégicas: Watson Analytics.
Adquisición datos y ETL.
OLAP/ROLAP y Datawarehousing.
Tecnologías Bigdata.
Visualización Datos con Tableau.
Machine Learning: Introducción. Estadísticas. Tareas. Técnicas. Lenguaje R y modelado.
Modelos descriptivos.
Personalización Avanzada en Marketing: Next best Activity. DeepLearning y BigML.
People Analytics: El problema de la rotación análisis modelos.

Casos de uso

IOT como generador grandes cantidades Información.
Riesgos financieros y Aplicación Práctica.
Inteligencia Artificial aplicada a la Arquitectura.
Big Data y el Marketing Digital.
Casos prácticos sector seguros.
Big Data e Información Geográfica.
Análisis Redes Sociales.

Proyecto y certificación.

Al finalizar las clases de la formación específica realizarás, con la supervisión de tu tutor, un Proyecto de implantación sobre los conocimientos adquiridos. También, asíncronamente, tienes acceso a exámenes “tipo” para preparar por libre la Certificación oficial, prueba que se puede realizar en cualquier centro Cloudera.

SOLICITA MÁS INFORMACIÓN
SOLICITA MÁS INFORMACIÓN

NUESTROS MÁSTERS SAP

SAP Finanzas

Especialista SAP FI. Finanzas

Consultor SAP Especialista CO ERP y S/4Hana

MOC TR (SAP Tesorería)

SAP Recursos Humanos

Consultor SAP Especialista HR ERP y S/4Hana

Consultor SAP Especialista Success Factors

MOC QM (SAP Calidad)

SAP Logística

Consultor SAP Especialista en MM ERP y S/4Hana

Consultor SAP Especialista en SD ERP y S/4Hana

MOC TM (SAP Transporte)

SAP Produccion y
E-commerce

Consultor SAP Especialista en MA/ AM S/4Hana

CConsultor SAP Especialista en HYBRIS ERP y S/4Hana

MOC PS (SAP Proyectos)

SAP Desarrollo y
Analítica de Datos

Consultor SAP Especialista Programador ABAP

Consultor SAP Especialista Bigdata BW

MOC ABAP for HANA

SAP Soporte y
Bigdata Hana

Consultor SAP Especialista Administración BASIS

Consultor SAP Especialista Modelado Hana BigData

MOC SAP Cloud Platform

Programa Usuario BÁSICO

Un módulo que habilita al alumno, en el manejo del programa, a nivel auxiliar. Pudiendo aprender de forma horizontal y a nivel básico, el manejo de todos los módulos operativos de SAP: FI/ MM/ SD/ HCM

ESPECIALISTA Key User

El alumno puede aprender a desempeñar la función de Key User, o intermedario con los Consultores de Soporte, especializándose una vez finalizado el curso de Usuario Básico, en una especialidad de libre acceso, y que permite acceder a la certificación oficial: FI (Finanzas) MM(Compras) SD(Ventas) HCM(RRHH)

Formación bonificada para las empresas

Cloud Formación como entidad inscrita con el código 16753 en el Registro Estatal de Entidades de Formación, gestiona e imparte, dentro de la iniciativa de Formación Programada por las Empresas, formación profesional para el empleo, de acuerdo con lo establecido en la Ley 30/2015, de 9 de septiembre.

Cloud Formación, les ayuda de forma gratuita a consultar el importe del crédito de su empresa para este año.

Les recordamos a todas las empresas de menos de 50 personas, que pueden acumular el crédito no consumido de un año para el siguiente, siempre que se comunique expresamente dicha intención, a través de la plataforma de Fundae, antes del 30 de junio.