Curso de Big Data con Hadoop & Spark
Hadoop es un entorno utilizado para el almacenamiento y procesamiento de grandes volúmenes de datos aportando un análisis rápido y fiable, mientras que Spark aporta su motor de computación haciendo más rápido el procesamiento de datos al ser ejecutados en memoria.
Sobre el Curso de Big Data con Hadoop & Spark
En este curso totalmente práctico aprenderás todo lo referente al big data con estas dos grandes herramientas, partiendo desde los conceptos más básicos, el entendimiento de su uso, su entorno, su potencial, las líneas de negocio principales y el desarrollo de algoritmos de inteligencia artificial en casos prácticos.
Duración:
200 Horas / 3-5 meses
Modalidad:
Presencial, Telepresencial y Online
Requisitos Previos:
Conocimientos previos de Sistemas. Existen programas específicos para las personas que parten de cero.
Sobre la certificación:
El curso incluye un seminario de certificación para prepararte para las certificaciones oficiales de Cloudera CCA175 (CCA Spark and Hadoop Developer).
Para qué te prepara este curso:
Al finalizar este curso podrás desarrollar la profesión de Arquitecto Big Data, desarrollar tus propios algoritmos o detectar patrones para usarlos en diversos sectores como los seguros, el marketing, la salud o incluso la banca. Además te convertirás en uno de los perfiles más codiciados por grandes empresas y organizaciones.
Temario:
Formación Técnica
Introducción y debate sobre Big Data
Conceptos básicos y marco competitivo actual.
Best Practices en Big Data
Líneas estratégicas en Big Data de los grandes triunfadores: Amazon, Facebook y Google.
Modelos de negocio más frecuentes y tendencias futuras.
Entorno virtual de Cloudera
Instalación en una máquina virtual de Cloudera Quickstart. Presentación del entorno y de la herramienta.
Primeras operaciones con Cloudera
Sqoop – Migración desde un entorno MySQL a HDFS realizada por el alumno.
Primeras consultas básicas del entorno creado con Impala y Hive.
Hive e Impala
Consultas con un grado de dificultad medio del entorno creado.
Migración de ficheros log no estructurados a un entorno HDFS para su exploración en Hive e Impala.
Ejemplo de Spark con Scala.
Impala Avanzado
Consultas con un grado de dificultad avanzado realizadas por el alumno tutorizado por el profesor.
Primeros conceptos de Cloud.
PAAS, IAAS, SAAS
Conceptos básicos de Cloud.
Marco competitivo actual y tendencias.
AWS
Conceptos básicos de Amazon Web Services.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito.
Azure
Conceptos básicos de Microsoft Azure.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito.
Google Cloud
Conceptos básicos de Google Cloud.
Presentación del entorno y principales herramientas.
Debate sobre los casos de éxito.
Formación Específica
Organización orientada al dato<br />
Estrategia Empresarial.
Inteligencia de negocio.
Actores y tendencias.
Planificación.
Mercado Bigdata.
Situación actual.
Innovación en experiencia de usuario.
Design Thinking.
Fundamentos BI y Bigdata.
Diferencias.
Tecnologías BD y aspectos jurídicos.
Big Data y su ecosistema Hadoop
Introducción al Big Data.
Introducción a Hadoop y su arquitectura.
Hadoop en detalle:
a) Sistema de ficheros HDFS.
b) El paradigma MapReduce.
c) Estructura de un cluster Hadoop: JobTracker, TaskTracker, NameNode y Datanode.
d) Arquitectura YARN. Despliegue de sandbox Big Data y configuración inicial.
Ejercicios con el sistema de ficheros de Hadoop.
Ecosistema Hadoop:
a) Herramientas
b) Distribuciones: Cloudera, Horton, MapR.
c) Tecnologías Datawarehouse:
a) Hive
b) Ejercicios Hive.
Tecnologías Desarrollo:
a) Pig.
b) Sqoop.
Procesamiento de datos con Spark
Introducción Apache Spark.
Conceptos más importantes (librerías internas y visión general).
RDD’s:
a) Creación.
b) Operaciones (Transformaciones, acciones, evaluación lazy). c) Persistencia. Carga y exportación de datos:
a) Formatos de fichero
b) Sistema de fichero.
Ejecución en cluster:
a) Driver y sus ejecutores.
b) Cluster manager.
c) Despliegue con spark-submit.
Spark SQL.
Introducción a Spark Streaming.
Machine learning, inteligencia artificial<br />
Spark streaming y Ecosistema Hadoop.
Bases Datoa NoSQL.
Análisis de sentimiento en Redes Sociales.
Toma decisiones estratégicas: Watson Analytics.
Adquisición datos y ETL.
OLAP/ROLAP y Datawarehousing.
Tecnologías Bigdata.
Visualización Datos con Tableau.
Machine Learning: Introducción. Estadísticas. Tareas. Técnicas. Lenguaje R y modelado.
Modelos descriptivos.
Personalización Avanzada en Marketing: Next best Activity. DeepLearning y BigML.
People Analytics: El problema de la rotación análisis modelos.
Casos de uso
IOT como generador grandes cantidades Información.
Riesgos financieros y Aplicación Práctica.
Inteligencia Artificial aplicada a la Arquitectura.
Big Data y el Marketing Digital.
Casos prácticos sector seguros.
Big Data e Información Geográfica.
Análisis Redes Sociales.
Proyecto y certificación.
Al finalizar las clases de la formación específica realizarás, con la supervisión de tu tutor, un Proyecto de implantación sobre los conocimientos adquiridos. También, asíncronamente, tienes acceso a exámenes “tipo” para preparar por libre la Certificación oficial, prueba que se puede realizar en cualquier centro Cloudera.
NUESTROS MÁSTERS SAP
SAP Producción, Fabricación y Mantenimiento
Especialista SAP Planificación de la Producción y Fabricación MA/AM
SAP Calidad MOC QM
SAP Desarrollo ABAP y Analítica de Datos
Especialista SAP Business Warehouse BW
SAP Cloud Platform (Desarrollo) MOC SCP-D
SAP mantenimiento BASIS y Big Data Hana
SAP Cloud Platform (Integración) MOC SCP-I
Usuario Básico con Fiori
Un módulo que habilita al alumno en el manejo del programa a nivel auxiliar. Pudiendo aprender de forma horizontal y a nivel básico el manejo de todos los módulos operativos de SAP: FI/ MM/ SD/ HCM. Y añade el modulo de Fiori que completa la experiencia interactiva de usuario y más de 300 nuevas aplicaciones.
Usuario Key User
El alumno aprende a desempeñar la función de Key User, para ser intermediario con los Consultores de Soporte, especializándose en una de las 4 áreas operativas: FI (Finanzas), MM(Compras), SD (Ventas), HCM (RRHH). Con acceso a la Certificación Oficial.
Formación bonificada para las empresas
Cloud Formación como entidad inscrita con el código 16753 en el Registro Estatal de Entidades de Formación, gestiona e imparte, dentro de la iniciativa de Formación Programada por las Empresas, formación profesional para el empleo, de acuerdo con lo establecido en la Ley 30/2015, de 9 de septiembre.
Cloud Formación, les ayuda de forma gratuita a consultar el importe del crédito de su empresa para este año.