De Datos Caóticos a Modelos Eficientes: Mi Guía Práctica de Power Query y Esquema Estrella para el PL-300

Written by:

¡Hola a todos!

Ayer, en nuestra clase del curso PL-300 en NamasData , nos sumergimos de lleno en uno de los temas más desafiantes y, a la vez, más gratificantes en el camino hacia la certificación PL-300: la transformación avanzada de datos y la construcción de un modelo de datos eficiente. Fue una sesión intensa, “durita” como mencioné al empezar, pero fundamental. Superar estos ejercicios no solo nos prepara para las preguntas más complejas del examen, sino que nos convierte en profesionales de datos mucho más competentes en el mundo real.

En este artículo, quiero destilar la esencia de esa clase. Recorreremos juntos los dos grandes bloques que abordamos: primero, cómo domar un archivo de Excel con una estructura jerárquica compleja usando Power Query y, segundo, cómo transformar una tabla plana y pesada en un elegante y optimizado Esquema en Estrella. Para quienes asistieron, servirá de repaso; para los demás, espero que sea una guía práctica que ilumine vuestro camino.

Parte 1: El Desafío Real – Domando un Excel Complejo con Power Query

Todos nos hemos enfrentado a ello: un archivo Excel que parece diseñado para desafiar cualquier intento de análisis. En nuestro ejercicio, teníamos una tabla con meses en las filas superiores, pero con un nivel jerárquico adicional: cada mes se dividía en tres columnas (Ingresos, Presupuesto y Variación). Esta estructura, aunque visualmente clara para un humano, es un veneno para Power BI. Nuestro objetivo era convertir este caos en una tabla tabular limpia y funcional.

Contenido del artículo

Este fue nuestro plan de ataque, paso a paso:

  • Limpieza Inicial: Lo primero es siempre quitar el ruido. Eliminamos las filas de totales que Excel suele añadir y los pasos automáticos que Power Query a veces genera, como “Tipo cambiado” y “Encabezados promovidos”. Esto nos da un lienzo limpio sobre el cual trabajar. A continuación, usamos una de nuestras herramientas más fieles, Rellenar hacia abajo, para propagar los valores de categorías como “Alta Población” y “Baja Población” por todas las filas correspondientes.
Contenido del artículo
  • El Truco de la Doble Transposición: Aquí es donde la magia comienza. Para poder rellenar los nombres de los meses (Enero, Febrero, etc.) hacia la derecha, nos encontramos con un problema: no existe un “rellenar hacia la derecha”. La solución es elegante: transponemos toda la tabla. Esto convierte las columnas en filas, permitiéndonos usar de nuevo “Rellenar hacia abajo” para que cada fila sepa a qué mes pertenece.
  • La Clave: Combinar para Simplificar: El verdadero escollo era la jerarquía dual (Mes e Indicador). Intentar anular la dinamización directamente con dos niveles jerárquicos mezcla los textos con los números y genera un desastre. La solución contraintuitiva pero poderosa fue seleccionar las dos columnas jerárquicas (la del mes y la del indicador) y combinarlas en una sola, usando un delimitador personalizado y único, como los dos puntos (:). Al hacer esto, convertimos un problema de dos dimensiones en uno de una sola dimensión, mucho más manejable.
Contenido del artículo
  • Dando Forma Final: Con nuestra columna combinada (“Enero:Ingresos”, “Enero:Presupuesto”…), volvimos a transponer la tabla a su orientación original. Ahora sí, el terreno estaba preparado. Promovimos la primera fila como encabezado y aplicamos la Anulación de dinamización de otras columnas para convertir todas las columnas de meses en dos: “Atributo” y “Valor”. El paso final fue usar Dividir columna por nuestro delimitador (:) para separar de nuevo el mes y el indicador.
Contenido del artículo

El resultado fue una tabla perfectamente estructurada. Pero la prueba de fuego fue añadir los meses de marzo y abril al Excel original. Con solo actualizar la vista previa en Power Query, los nuevos datos fluyeron perfectamente en nuestra estructura sin añadir nuevas columnas, demostrando que habíamos construido un proceso de transformación robusto y escalable.

Parte 2: De Tabla Plana a Esquema Estrella – La Clave del Rendimiento

El segundo gran bloque de nuestra clase se centró en la arquitectura del modelo de datos. Partimos de una única y gigantesca tabla de ventas “desnormalizada”, donde toda la información (venta, producto, cliente, empleado) estaba mezclada. Este enfoque, común en empresas grandes y pequeñas, es terriblemente ineficiente. Ocupa mucho espacio, el rendimiento se resiente y el mantenimiento es una pesadilla.

Nuestro objetivo era transformarla en un Esquema en Estrella, el modelo recomendado por Microsoft por su rendimiento y claridad. Este modelo consiste en una tabla central de hechos (aquello que queremos medir, como las unidades vendidas o los precios) rodeada de tablas de dimensiones (el contexto de esos hechos: quién, qué, dónde, cuándo).

Contenido del artículo

Así lo conseguimos:

  • Duplicar para Crear Dimensiones: En Power Query, el primer paso es duplicar nuestra consulta de ventas original tantas veces como dimensiones queramos crear: una para Cliente, una para Empleado y una para Producto.
  • Aislar y Depurar: En cada una de estas nuevas consultas, usamos Elegir columnas para quedarnos únicamente con los campos que pertenecen a esa dimensión. Por ejemplo, en la tabla de Cliente, eliminamos todo lo que fuera de producto o empleado. A continuación, aplicamos Quitar duplicados para asegurar que cada cliente, empleado o producto apareciera una sola vez, creando así nuestras tablas maestras.
  • Resolviendo la Ambigüedad con Claves Subrogadas: Durante la depuración de la tabla Producto, nos topamos con un problema crucial. Un mismo código de producto (B-65) correspondía a dos fabricantes distintos. Si quitábamos duplicados basándonos solo en el código, perderíamos información. Esto nos habría llevado a una relación “varios a varios” entre ventas y productos, algo que debemos evitar a toda costa. La solución profesional es crear una clave subrogada (o suplente). Usando la función Agregar columna de índice, generamos un identificador numérico único para cada fila de nuestra tabla de productos ya depurada. Así, aunque el código de producto se repita, nuestro nuevo “IdProducto” (1, 2, 3…) es único y garantiza una futura relación “uno a varios”.
Contenido del artículo
  • Conectando el Modelo: Con nuestra clave subrogada creada en la dimensión Producto, el siguiente paso era llevarla a nuestra tabla de hechos (Ventas). Para ello, utilizamos Combinar consultas. Unimos la tabla de ventas con la de productos, pero aquí estuvo el detalle: la unión no se basó solo en el Código de Producto, sino en la combinación del Código de Producto Y el Nombre del Proveedor para asegurar una correspondencia exacta. Una vez hecha la combinación, expandimos únicamente nuestra nueva columna IdProducto.
  • Limpieza Final: Con los identificadores (IdCliente, IdEmpleado, IdProducto) ya en nuestra tabla de ventas, pudimos eliminar de ella todas las columnas descriptivas originales (nombre del cliente, categoría del producto, etc.). Esto dejó nuestra tabla de hechos increíblemente ligera y eficiente, conteniendo solo claves numéricas y las métricas a analizar.

Para demostrar el impacto, usamos una herramienta externa para comparar el tamaño del modelo antes y después. El resultado fue espectacular: pasamos de un modelo de 20 MB a uno de 2.32 MB. Esta optimización es la diferencia entre un informe lento y frustrante y uno rápido y eficaz.

Contenido del artículo

Conclusión: Un Paso de Gigante hacia la Certificación

La sesión fue exigente, pero los conceptos que cubrimos son la columna vertebral de cualquier buen modelo en Power BI. Aprender a manipular datos complejos y a estructurarlos correctamente no solo te dará los puntos que necesitas en el examen PL-300, sino que te diferenciará como un verdadero profesional del análisis de datos.

Os agradezco a todos por vuestra energía y compromiso. No desistáis. Cada clase como esta es una inversión directa en vuestro futuro profesional. Visualizad esa certificación con vuestro nombre; con cada desafío superado, estáis cinco clases más cerca de conseguirla.

¡Nos vemos en la próxima clase!

Si quieres aprender Power BI y prepararte para la certificación PL-300 con nosotros, puedes ver todos los detalles del curso en Curso certificación PL-300 en NamasData.

Deja un comentario

Descubre más desde Blog de Alex Ayala

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo