Especialización en Big Data. Extracción de valor a escala (nivel avanzado).
Volumen, Variedad y Velocidad en la Automatización de la Inteligencia de Cliente.
Programa con metodología SyncTeractive Learning: Clases online en directo con dinámicas participativas, grupos reducidos, plataforma e-learning y tutorización personalizada.
Ejes del programa
- Big Data y Analítica Avanzada.
- Del Data Warehouse al Data Lake.
- Arquitectura Big Data y Ciencia de Datos.
- Análisis de datos a escala (volumen).
- Manejo de datos desestructurados (variedad).
- Arquitecturas de streaming y fast data (velocidad).
- Modelos de negocio basados en Big Data (valor).
- Gobierno del dato, calidad y rigor analítico (veracidad).
Introducción
Todo el mundo habla de obtener valor a partir de los datos, pero ¿qué significa realmente esto? ¿En qué consisten las iniciativas Big Data? ¿Qué diferencia hay con la Inteligencia de Negocio? ¿Dónde se puede aplicar la Inteligencia Artificial y para qué?
En este programa formativo, diseñado para perfiles con formación técnica previa en informática, se trabajará de forma práctica en la comprensión de todos estos conceptos, desmitificando las expresiones de moda y entendiendo las principales fases del ciclo de vida de los datos en una organización (para perfiles sin experiencia en tecnologías de la información, ver la versión básica de este programa).
Además, se aplicará un enfoque muy pragmático, basado en la combinación de clases online tipo taller con trabajo colaborativo tutorizado. Durante el itinerario planteado se utilizarán diversos proyectos-reto con datos y casos reales. Los participantes en el programa no serán alumnos pasivos, sino que trabajarán en la consecución de las diversas fases de los proyectos-reto planteados contando con la guía del instructor.
Objetivos
- Comprender las oportunidades reales de los nuevos sistemas Big Data y de Analítica Avanzada, distinguiendo el valor que aportan los Sistemas Operacionales, los Sistemas Informacionales y los Sistemas de Inteligencia de Cliente.
- Estudiar el enfoque y los factores críticos en casos de uso y de negocio con modelos de predicción.
- Familiarizarse con el uso de pilas, arquitecturas y los ecosistemas Big Data más empleados en la actualidad, comprendiendo cómo se implementa un Data Lake.
- Descubrir las capacidades de los algoritmos de Inteligencia Artificial aplicados a datos desestructurados (visión artificial, procesamiento del lenguaje natural, reconocimiento de patrones).
- Descubrir las mejores prácticas en cuanto al ciclo de vida de los proyectos basados en modelos predictivos.
- Aprender a usar algunas de las herramientas y los entornos de desarrollo más populares en el ámbito de la analítica avanzada (Python, pySpark, SparkML).
- Analizar las claves del pre-procesamiento de datos y la construcción de modelos predictivos a escala (Machine Learning sobre Big Data).
- Dominar las mejores prácticas en cuanto a metodología de desarrollo de proyectos de ingeniería de datos y analítica avanzada (gobierno del dato).
A quién va dirigido el programa
Este programa formativo es de nivel avanzado y está diseñado para perfiles con conocimientos previos de informática. Para perfiles sin conocimientos técnicos en informática, ver el programa básico.
La experiencia de aprendizaje está diseñada para aquellas personas que:
- Ya trabajan con conjuntos de datos estructurados y quieren dar el paso a entornos Big Data, para poder manejar grandes volúmenes de datos, así como datos desestructurados.
- Quieren iniciarse en el uso de arquitecturas Big Data, dando sus primeros pasos en la explotación de un Data Lake.
- Necesitan aplicar algoritmos de análisis a escala, utilizando un entorno Big Data en vez de un entorno monocomputador.
- Buscan aplicar algoritmos de analítica avanzada (incluyendo aprendizaje automático) en grandes conjuntos de datos.
- Requieren ampliar sus operaciones de Inteligencia de Negocio (BI) añadiendo una nueva capacidad Big Data para afrontar nuevos retos de negocio que implican grandes volúmenes de datos y/o datos desestructurados.
Metodología
Plataforma Online
Se utilizará Moodle como plataforma de formación online (LMS), incluyendo las herramientas habituales en este tipo de cursos: acceso a los contenidos, foros de discusión, entrega de actividades, calificación de trabajos, etc.
Cada alumno contará con un usuario de Moodle y de esta forma tendrá acceso a todos los recursos disponibles del programa formativo. Así mismo, se monitorizará el acceso y la participación de los alumnos en la plataforma (incluyendo datos de acceso, tiempo de participación, actividades realizadas, fechas de entrega, asistencia a clases online, etc.).
Las clases online se realizarán a través de videoconferencia con la herramienta Zoom, que estará integrada en la plataforma Moodle.
Dinámica del Curso
El curso se realiza combinando sesiones síncronas en directo con actividades que se realizan de forma asíncrona en la plataforma. La duración total del programa puede variar entre uno y tres meses (dependiendo del periodo entre sesiones que se establezca en cada edición – consultar más abajo el programa específico de cada edición).
El programa consta de 10 sesiones síncronas de 2 horas (20 horas de clase en total) más la realización de actividades entre sesiones y el trabajo final de curso (se estima un total de al menos 25 horas de dedicación del alumno, equivalente a 1 crédito ECTS).
Las sesiones online combinan de forma dinámica contenidos teóricos con ejercicios prácticos, de forma que el alumno pueda adquirir las competencias especificadas anteriormente de forma ágil y natural.
Se espera que los alumnos dediquen algún tiempo entre las sesiones para practicar con los conceptos aprendidos en la sesión anterior y plantear dudas concretas en la sesión siguiente.
Como parte del programa formativo, los alumnos desarrollarán un proyecto final de integración de conocimientos, que se irá desarrollando, de forma tutorizada, desde el inicio del curso. La tutorización del proyecto se realizará de forma asíncrona a través de los foros correspondientes en Moodle y de forma síncrona a través de dos sesiones de tutoría online incluidas en la programación.
Evaluación, Diploma y Certificado de Realización
Tras la realización del curso con aprovechamiento los alumnos recibirán el correspondiente certificado. Para obtener el certificado de «Actualización Profesional en Big Data aplicado a la Inteligencia de Cliente«, se deberá superar la evaluación del proyecto final de curso (este programa no tiene evaluación basada en exámenes).
Plan de Estudios
Sesión 1. Introducción a los ecosistemas Big Data.
- Desmitificación de términos.
- Datos versus algoritmos.
- Los sistemas de inteligencia.
- Evolución de las arquitecturas de datos.
- Del Data Warehouse al Data Lake.
- Los entornos Big Data Analytics.
- Ecosistemas SMAC.
Sesión 2. Arquitecturas Big Data.
- Escalado y computación de alto rendimiento en clúster.
- Almacenamiento distribuido.
- Procesamiento distribuido.
- Arquitecturas Lambda.
- Arquitecturas Kappa.
- Arquitecturas Fast Data.
- Streaming Vs. Tiempo Real.
- Caso: diseño de arquitectura.
Sesión 3. Análisis de Datos a Escala.
- Ingeniería de datos y ciencia de datos.
- Analítica descriptiva y diagnóstica.
- Analítica avanzada (predictiva, prescriptiva, generativa).
- Técnicas de modelado predictivo.
- Machine Learning y Deep Learning a escala.
- Modelo de madurez analítica de la organización.
- Práctica: identificación de requisitos de ingeniería de datos y algorítmica en un caso real.
Sesión 4. El proceso de ciencia de datos en entornos Big Data.
- Gestión organizacional en Big Data.
- Unidades especializadas y gobierno global del dato (CDO).
- Ciclo de vida del dato.
- Calidad del datos.
- Visualización e informe.
- Soporte a la toma de decisiones.
- Despliegue de modelos en producción.
- Práctica: adaptación proyectos Big Data en Pymes.
Sesión 5. Tutoría de Proyecto I.
- Presentación del proyecto fin de curso.
- Resolución de dudas y planificación de proyecto.
Sesión 6. Construyendo un Data Lake I.
- Introducción a Apache Hadoop.
- Introducción a Apache Spark.
- Creación del clúster.
- Carga de datos.
- Modelado con datos estructurados (Spark DataFrames y Spark SQL).
- Práctica: Manos a la obra: desarrollo de un lago de datos en nube con Databricks Cloud – Cluster Spark.
Sesión 7. Construyendo un Data Lake II.
- Manejo de cuadernos interactivos con python sobre clúster Spark (pySpark).
- Construcción de modelos escalables con Spark MLlib.
- Práctica: Manos a la obra: desarrollo de un lago de datos en nube con Databricks Cloud – Cluster Spark.
Sesión 8. Construyendo un Data Lake III.
- Ingeniería de características.
- Hiperparametrización y ajuste de modelos (tuning).
- Práctica: Manos a la obra: desarrollo de un lago de datos en nube con Databricks Cloud – Cluster Spark.
Sesión 9. Innovación y nuevas tendencias.
- Modelo de adopción de tecnologías emergentes.
- Vigilancia tecnológica.
- Tendencias de mercado (ML Automation, EdgeAI, DeepRL, etc.).
Sesión 10. Tutoría de Proyecto II.
- Revisión de estado y avance de los proyectos.
- Resolución de dudas.
- Implantación de planes de contingencia.
Equipo Formador

Raúl Arrabales Moreno.
Senior Data Scientist, Consultor Big Data, Doctor en Inteligencia Artificial, MBA.
Raúl es un profesional interdisciplinar con 20 años de experiencia en negocio, tecnología, investigación, gestión y docencia, habiendo desarrollado su carrera en diferentes centros de reconocido prestigio. Ha liderado proyectos y start-ups de base tecnológica en compañías como IBM, Orange, Altran y Accenture. Actualmente Raúl es Socio en Psicobōtica.
Próximas Ediciones
Si estás interesad@ en participar en este programa formativo, podrías apuntarte para alguna de las siguientes ediciones:
- Edición intensiva enero 2021 (BDIC-A/2021/2):
- Inicio 12 de enero.
- Duración: 1 mes.
- Máximo 20 participantes.
- Precio reducido online: 145 €.
- Horario: L-M-X de 17:00 a 19:00h.
- Ediciones personalizadas InCompany
- Adaptadas para organizaciones.
- Presenciales u online.
- Consultar condiciones.
Solicitud de Admisión y Pre-Inscripción
Para pre-inscribirte o aclarar cualquier duda sobre este curso, rellena el siguiente formulario (la admisión a los programas formativos está sujeta a la revisión del perfil del candidato/a y el número de plazas disponibles):