Repositorio de los contenidos y las prácticas del curso BIG DATA
- Introducción y contexto
- Entendiendo los datos
- Big Data
- Ejercicios (sin uso de aplicaciones)
- Recorrido por el mundo DATA
- Datos en los negocios online
- Ejercicios (sin uso de aplicaciones)
- Búsquedas avanzadas de Google
- Datos y decisiones de negocio
- Modelos de datos
- Soluciones BI
- Minería de datos
- Ejercicios: uso de Looker Studio (anteriormente Google Data Studio)
- Conceptos básicos
- JS: Objetos JSON y API
- Bases de datos SQL
- SQL y Reporting
- Ejercicios: uso de MySQL
- Big Data
- Data Science: AI y ML
- ML: entender el proceso
- Ejercicios
- Analítica digital.
- Objetivos.
- Métricas y KPIs.
- Ejercicios.
- Google Analytics GA4.
- Recopilación de datos de Analytics.
- Interfaz Google Analytics 4.
- El Ámbito de los datos.
- Ejercicios.
- Dimensiones GA4.
- Uniendo dimensiones y métricas.
- Centro de análisis de GA4.
- Informes.
- Ejercicios.
- Inteligencia Artificial GA4.
- Insights automáticos.
- Seguimiento de una campaña de marketing.
- Utilizando la publicidad.
- Ejercicios.
- Entornos analíticos
- SEO
- Analítica en Social Ads
- Otros entornos
- Ejercicios.
- Análisis inicial de una Base de Datos BBDD.
- ¿Big Data?
- Ingesta y tratamiento.
- Ejercicios.
- Antes de empezar.
- Statements & clauses básicos.
- Where Clause.
- Order by statement.
- Case When statement.
- Ejercicios (SQL - carpeta MYSQL): diferentes sentencias de SQL usando diferentes datasets
- Agregaciones. Funciones de agregación, GROUP BY statement, HAVING clause.
- Trabajando con fechas. STRFTIME function
- Agregaciones condicionales
- Ejercicios (SQL - carpeta MYSQL): sentencias SQL utilizando funciones de agregación, agregaciones condicionales y funciones fecha.
- Subqueries
- Unions: union y union all
- Joins: left join, inner join, full join, right join
- No-code
- Ejercicios (SQL): sentencias SQL utilizando subqueries y uniones/joins.
- Resolución de problemas
- Programar
- Ejemplos básicos de Python: 1- BasicosPythonOriginal.ipynb, 2- Repasillo Estructuras.ipynb
- CRISP-DM y EDA
- Problemas
- Librerías y PIP
- Ejercicios: String y Cadenas Victor.ipynb
- NumPy y Pandas
- Estructuras de datos
- EDA
- Ejercicios con Pandas: Practica Kaggle.ipynb
- Data Wrangling
- Datos incompletos
- Atípicos
- Incoherentes
- Ejercicio de EDA: Panda_Practicas_chipotle.ipynb
- Contenidos adicionales
- Ejercicio de EDA: Panda_Practicas_chipotle.ipynb (continuación)
- Presentación
- Contextualización
- Introducción al Aprendizaje Automático
- Conceptos fundamentales del ML
- Repasemos EDA y Data Preparation
- Herramientas para el ML
- Ejercicios:
- Estructuras de Datos en Python
- Preprocesado de un dataset con Pandas
- Librería NumPY
- Librerías para el análisis de datos
- Conceptos fundamentales
- Tipos de modelos de ML
- Regresión
- Clasificación
- Modelos no supervisados
- Redes neuronales
- Ejercicios
- Regresión
- Regresión linear
- Regresión KNN
- Regresión linear y polinómica
- Clasificación
- Regresión Logística
- Clasificación KNN
- Más clasificadores
- Clasificadores multiclase
- Otros clasificadores
- Modelos no supervisados
- Principales modelos no supervisados
- Otros modelos no supervisados
- NLP y Redes Neuronales
- Redes neuronales recursivas (RNNs) para análisis de opinión.
- Presentación Arquitecturas Cloud y Big Data
- Ejercicios
- Python Notebook
- Presentación Arquitecturas Cloud y Big Data.
- Ejercicios:
- Condicionales
- Bucles
- Ejercicios:
- Bucles
- Programación funcional
- Introducción a PySpark: RDDs Master-Worker RDD Closure.
- Crear un RDD a partir de una lista con sus elementos.
- SPARK: ejemplo de Evaluación Perezosa.
- Ejercicios:
- SparkSession Teoría
- Primer RDD Teoría
- RDDs: Transformaciones.
- RDDs: Acciones.
- EJERCICIO PRÁCTICO: archivo de texto.
- Ejercicios
- Transformaciones y Acciones sobre RDDs
- Data Collection API
- EDA
- EDA using SQL
- EDA with Data Visualization
- Interactive Visual Analytics con Folium
- Machine learning predictions