Para utilizar adecuadamente la información en informes, análisis o aplicaciones de inteligencia artificial, se necesita que los datos estén limpios y preparados para ser combinados con otras fuentes. A menudo, la información se encuentra fragmentada en sistemas que tienen distintos formatos de fecha, hora, moneda y muchos otros detalles que imposibilitan un análisis integral. En este artículo profundizaremos en cómo Power Query—la herramienta de Power BI para la preparación de datos—nos ayuda a superar estos desafíos.
Ejemplo de la utilidad de la limpieza y la transformación
Imagina que tienes un conjunto de datos de ventas diarias procedentes de terminales de punto de venta. Podrías conocer el total de ventas de cada periodo (día, semana o mes) con solo sumar las transacciones. Sin embargo, quizá desees conocer la influencia del clima en esas ventas. ¿Afecta la lluvia los volúmenes de compra? Para explorar esta hipótesis, podrías combinar tus datos de ventas con registros meteorológicos. Es posible que:
- Las fechas y horas se almacenen de manera distinta en ambos orígenes, por ejemplo:Ventas en formato 2021-10-14T11:03Clima en formato 10-14-2021 11:00am
- Exista información ausente o no válida (fechas incompletas, valores corruptos, etc.) que requiera corrección.
Tener la capacidad de “limpiar” los campos defectuosos y unificar formatos (por ejemplo, normalizando la fecha a un patrón único) será esencial para, posteriormente, poder correlacionar las ventas con el factor climático.
¿Qué es Power Query?
Power Query es el módulo de Power BI Desktop dedicado a la obtención y transformación de datos. Permite conectarte a multitud de fuentes (archivos, bases de datos, servicios en la nube, OData, etc.) y aplicar pasos de limpieza y conformación de datos. Posteriormente, la información resultante puede ser cargada en el modelo de Power BI para crear informes y paneles interactivos.
En este artículo, profundizaremos en:
- Acceso a Power Query en Power BI Desktop
- Ordenación y filtrado
- Gestión de columnas
- Transformaciones de columnas
- Transformaciones de filas
- Combinación de datos
- Enriquecimiento de datos con inteligencia artificial
- Operaciones avanzadas
Requisitos técnicos
Para seguir estas prácticas necesitas:
- Power BI Desktop instalado en un equipo con Windows.
- Acceso a alguna fuente de datos para practicar. Puedes, por ejemplo, conectarte al servicio de ejemplo de Northwind (a través de OData) disponible en: https://services.odata.org/v4/northwind/northwind.svc
En caso de tener tus propios conjuntos de datos (por ejemplo, ficheros CSV o bases de datos corporativas), también podrás aplicar exactamente los mismos pasos que describiremos aquí.
1. Acceso a Power Query en Power BI Desktop
Para comenzar a usar Power Query:
- Conéctate a una fuente de datos desde Power BI Desktop.En la pantalla de inicio, elige Obtener datos y selecciona tu tipo de origen (OData, Excel, SQL Server, etc.).
- Elige Transformar datos en lugar de Cargar o Cancelar.Esto abrirá el Editor de Power Query, donde verás la información en forma de tabla y podrás iniciar su limpieza y modelado.
Si ya tienes un modelo de datos existente, puedes hacer clic derecho sobre la consulta en el panel Campos (a la derecha) y seleccionar Editar consulta para reabrir la ventana de Power Query.
En el editor de Power Query reconocerás:
- La cinta de opciones en la parte superior, organizada en pestañas como Inicio, Transformar, Agregar columna, Vista, Herramientas y Ayuda.
- El panel Configuración de la consulta a la derecha, donde verás el nombre de la consulta y los Pasos aplicados que se van acumulando a medida que realizas transformaciones.
- El panel Consultas a la izquierda, que lista todas las tablas o consultas que componen tu modelo de datos.
2. Ordenación y filtrado
Una de las primeras operaciones que puede resultar útil al explorar datos es la ordenación. Esto permite, por ejemplo, identificar los valores más altos o más bajos con rapidez. Para ordenar:
- Haz clic en la flecha que aparece al lado del nombre de la columna y selecciona Ordenar de forma ascendente o Ordenar de forma descendente.
- Igualmente, puedes seleccionar la columna y usar las opciones en la cinta de opciones, dentro de la pestaña Inicio o Transformar.
El filtrado, por su parte, te ayuda a centrarte en valores relevantes o excluir información incompleta. Para aplicar filtros:
- Utiliza la misma flecha junto al encabezado de la columna.
- Verás opciones como Eliminar vacías, criterios de texto (por ejemplo, “contiene”, “no contiene”), números o fechas (mayor que, menor que, etc.).
- Cada vez que ordenas o filtras, se añade un paso en Pasos aplicados dentro del panel Configuración de la consulta.
Estos pasos son reversibles y editables, lo cual facilita experimentar sin miedo a “romper” nada, ya que Power Query registra un historial de transformaciones.
3. Gestión de columnas
En Power Query, gran parte de la limpieza comienza eligiendo qué campos (columnas) nos interesan y cuáles no. Tal vez hayas importado una tabla con 30 columnas, pero solo 10 de ellas son relevantes para tu análisis. Algunas acciones frecuentes:
- Eliminar columnas innecesarias. Puedes hacer clic derecho → Eliminar, o usar la herramienta Eliminar otras columnas si quieres conservar únicamente las que selecciones.
- Reordenar columnas arrastrándolas a la posición deseada con el ratón.
- Duplicar columnas, útil si deseas conservar la original y aplicar una transformación (por ejemplo, convertir texto a mayúsculas) en la copia.
- Agregar columna desde ejemplos, que permite escribir valores de ejemplo en una nueva columna para que Power Query infiera las transformaciones necesarias.
Todas estas acciones se reflejan de inmediato en el panel de previsualización y agregan pasos a la lista de Pasos aplicados.
4. Transformaciones de columnas
Una vez definidas las columnas relevantes, es hora de realizar transformaciones para asegurar la coherencia de la información. Dependiendo del tipo de dato (texto, numérico, fecha/hora, etc.), dispondrás de diversas opciones.
a) Renombrar columnas
Para que tu modelo sea más comprensible, conviene darle nombres claros a las columnas. Por ejemplo, en un origen de datos transaccional la columna podría llamarse UnitPrice, pero en tu modelo analítico quizá te interese nombrarla PrecioUnidad o VentasTotales (según la lógica de tu análisis). Para ello:
- Haz clic derecho → Cambiar nombre, o
- Selecciona la columna y, en la cinta de opciones, busca la sección Transformar → Cambiar nombre.
b) Ajustar el tipo de dato
El tipo de dato definido para cada columna (texto, número entero, fecha, etc.) condiciona las operaciones que podrás realizar. Aunque Power Query trata de asignar automáticamente uno al importar, no siempre acierta:
- Haz clic derecho → Cambiar tipo de dato para seleccionar el correcto.
- También puedes usar la pestaña Transformar y, en Cualquier columna, abrir el menú desplegable Tipo de dato.
Tener los tipos adecuados es crítico para que funciones como suma, promedio, extracto de fecha (día, mes, año) o cualquier cálculo adicional se realicen correctamente.
c) Otras transformaciones según el tipo de dato
- Texto: Dividir columna puede realizarse por un delimitador como «,» o «;», o bien por un número fijo de caracteres. También es posible realizar modificaciones de formato, como convertir todo a mayúsculas, todo a minúsculas, eliminar espacios en blanco, o añadir prefijos o sufijos. Además, se pueden extraer datos, obteniendo solo la parte antes o después de un delimitador. Por último, se pueden parsear columnas que contengan datos en XML o JSON, convirtiéndolos en tablas.
- Números: Las operaciones con números incluyen diversas funcionalidades. Se pueden realizar operaciones matemáticas como sumar, restar, multiplicar, dividir o calcular el módulo, entre otras. También es posible aplicar herramientas estadísticas para obtener valores como el mínimo, máximo, promedio, mediana o desviación estándar. Además, se dispone de funciones científicas como valores absolutos, exponenciales, logaritmos y potencias, así como funciones trigonométricas (seno, coseno, tangente) y sus inversas. Finalmente, se pueden aplicar técnicas de redondeo, ya sea hacia arriba, hacia abajo o a un cierto número de decimales.
- Fecha y hora: Las operaciones con fecha y hora permiten diversas manipulaciones. Es posible extraer información específica, como el año, mes, día, hora, minuto o segundo. También se pueden transformar los datos, por ejemplo, calculando la edad en días, semanas o años, o convirtiendo una combinación de fecha y hora en solo fecha o solo hora. Además, si la columna contiene datos de tipo duración, se pueden realizar operaciones para hallar equivalencias en días, horas, minutos y otras unidades de tiempo.
5. Transformaciones de filas
Además de cambiar columnas, también podemos aplicar transformaciones que afectan a filas concretas:
- Reemplazar valores: similar a la herramienta “buscar y reemplazar” en un editor de texto. Por ejemplo, reemplazar la palabra “N/A” por un valor nulo o por “Desconocido”.
- Reemplazar errores: si una celda muestra un error (por incompatibilidad de tipo o datos corruptos), podemos sustituirlo por un valor predeterminado.
- Invertir filas: altera el orden de la tabla, convirtiendo la primera fila en la última, la segunda en la penúltima, y así sucesivamente.
- Transponer: convierte columnas en filas y viceversa, lo cual resulta útil cuando la tabla viene estructurada de manera poco convencional.
6. Combinación de datos
Frecuentemente, necesitamos unificar información que proviene de diversas fuentes o que está repartida en varias tablas. Power Query ofrece varias formas de hacerlo:
- Anexar consultas: usado cuando dos tablas tienen la misma estructura (mismas columnas) y quieres “apilar” sus filas para formar una sola. Un caso típico es cuando recibes archivos mensuales con el mismo formato y quieres unirlos en una única tabla.
- Combinar consultas: equivalente a hacer un “join” en bases de datos relacionales. Se especifica una o varias columnas en común (por ejemplo, “IdProducto”) y se unen las filas coincidentes.Dentro de esta opción, también puede usarse la coincidencia difusa (Fuzzy Matching) para emparejar valores que no sean exactamente iguales (por ejemplo, “Producto ABC” y “Producto-ABC”).
Con estas técnicas, puedes obtener una sola tabla maestra combinada donde se encuentran las columnas requeridas para tu análisis.
7. Enriquecimiento de datos con inteligencia artificial
Power Query incluye capacidades de enriquecimiento basadas en inteligencia artificial, especialmente si cuentas con licencias de Power BI Premium o con extensiones de IA en el servicio. Algunas posibilidades son:
- Detección de lenguaje: identifica el idioma predominante en un campo de texto.
- Análisis de sentimiento: clasifica frases como positivas, negativas o neutras.
- Extracción de frases clave: útil en análisis de texto, donde se identifican términos con alta relevancia (por ejemplo, en comentarios de clientes).
- Reconocimiento de entidades: puede extraer nombres de personas, organizaciones o ubicaciones a partir de un texto.
Estas técnicas añaden columnas con información nueva y enriquecida que puede resultar muy valiosa para modelos predictivos, informes de satisfacción de clientes u otros escenarios de análisis avanzado.
8. Operaciones avanzadas
Finalmente, Power Query permite realizar acciones más sofisticadas que potencian el desarrollo de modelos complejos:
- Columnas personalizadas: Puedes crear expresiones en el lenguaje M (nativo de Power Query) para realizar operaciones complejas, como condicionales avanzadas (SI, SINO, SINO SI), cálculos combinados, manipulación de texto y más. La opción Personalizar columna abre un editor donde ingresas la fórmula; el panel de la derecha sugiere funciones y campos disponibles.
- Invocar funciones personalizadas: Si creas consultas que aceptan parámetros (por ejemplo, un rango de fechas o un identificador de producto), puedes convertirlas en funciones reutilizables. Esto facilita aplicar la misma lógica a múltiples fuentes o escenarios.
- Columnas condicionales: Proporcionan una interfaz de apuntar y hacer clic para aplicar reglas lógicas del tipo “Si la columna X es mayor que 100, entonces ‘Alto’, de lo contrario ‘Bajo’”, sin necesidad de escribir código.
- Columnas índice: Generan un valor incremental para cada fila (0, 1, 2, 3, …), útil cuando se requiere un identificador artificial o un orden secuencial.
- Pivot y Unpivot: Dinamizar columnas transforma los valores de una columna en encabezados nuevos, condensando información y anular la dinamizació de columnas es la operación inversa, llevando columnas fijas a un formato de filas que facilita ciertos análisis o la combinación con otras fuentes.
- Consulta de parámetros y uso de listas: Permite definir listas o parámetros en Power Query para filtrar datos, controlar rutas de archivos o manejar configuraciones de manera dinámica, lo que resulta muy útil al desarrollar soluciones de autoservicio en equipos grandes.
Conclusiones
Dominar Power Query es imprescindible para quienes buscan alcanzar un nivel profesional en Power BI y, en particular, para quienes se preparan para la certificación PL-300. Contar con datos limpios y coherentes es la base para crear informes dinámicos, paneles bien estructurados y, en definitiva, para tomar decisiones basadas en información confiable.
Recuerda:
- Cada transformación que realices quedará registrada en la lista de Pasos aplicados y podrá ser modificada o eliminada en cualquier momento.
- Al completar tu proceso de limpieza y transformación, asegúrate de Cerrar y aplicar los cambios para que se reflejen en el modelo de datos y los informes de Power BI.
Si estás en proceso de preparación para el examen PL-300 o buscas asesoría para proyectos concretos de Power BI, ¡no dudes en contactarme! Estoy aquí para acompañarte en tu camino hacia la excelencia en análisis y visualización de datos.




Deja un comentario