Cómo combinar datos en Power BI: una habilidad esencial para el examen PL-300

Written by:

¿Te has preguntado cómo aprovechar diferentes fuentes de información para construir un modelo de datos sólido en Power BI? Combinar datos es un paso fundamental en cualquier proyecto de análisis, especialmente para quienes se preparan para la certificación PL-300. En este artículo, revisaremos las principales técnicas para unir y procesar datos en Power BI, con un lenguaje claro y ejemplos prácticos que te ayudarán a aplicar estos conocimientos de forma inmediata.


Combinar (merge) consultas

En Power BI, unir consultas significa combinar columnas de dos o más orígenes de datos en una sola consulta. Esta técnica es especialmente útil cuando trabajamos con bases de datos normalizadas, donde los datos están distribuidos en varias tablas relacionadas mediante columnas clave (también conocidas como joins o claves de unión).

  1. Paso inicial: En el Editor de Power Query, selecciona una de las consultas en el panel de la izquierda y haz clic en la opción Combinar consultas (o Combinar consultas como nuevo), ubicada en la pestaña Inicio.
  2. Selección de datos: Elige la segunda consulta que deseas unir, selecciona las columnas clave en ambas tablas y escoge el tipo de unión que se aplicará.
  3. Tipos de uniones:
  • Externo izquierdo (Left Outer): Devuelve todas las filas de la primera consulta y solo las coincidentes de la segunda.
  • Externo derecho (Right Outer): Devuelve todas las filas de la segunda consulta y solo las coincidentes de la primera.
  • Externo completo (Full Outer): Devuelve todas las filas de ambas consultas, independientemente de si coinciden o no. Las filas sin coincidencia se muestran con valores nulos en algunas columnas.
  • Interno (Inner): Devuelve únicamente las filas que coinciden en ambas tablas.
  • Anti izquierdo (Left Anti): Devuelve únicamente las filas de la primera consulta que no tienen coincidencia en la segunda.
  • Anti derecho (Right Anti): Devuelve únicamente las filas de la segunda consulta que no tienen coincidencia en la primera.

Coincidencia difusa

La opción de coincidencia difusa (o aproximada) permite unir datos aunque no coincidan exactamente en los valores de las columnas clave. Puedes ajustar:

  1. Umbral de similitud (entre 0,00 y 1,00): define cuán estricta será la coincidencia.
  2. Ignorar mayúsculas y minúsculas: unifica la comparación de texto sin importar el uso de mayúsculas.
  3. Combinar partes de texto: busca coincidencias por segmentos de palabras.
  4. Número máximo de coincidencias: limita cuántas coincidencias se devuelven por valor.

Anexar (append) consultas

A diferencia de la unión, donde combinamos columnas, anexar consultas consiste en sumar filas de varias consultas para crear una sola. Imagina un sistema de punto de venta con múltiples tablas, cada una correspondiente a una tienda diferente. Si deseas un reporte unificado, necesitas anexar las tablas para consolidar toda la información de ventas.

  1. Cómo realizarlo: Desde la pestaña Inicio del Editor de Power Query, haz clic en Anexar consultas.
  2. Selección de tablas: Elige las tablas que quieres unir. Puedes anexar dos o más tablas a la vez.
  3. Consideraciones:Nombres de columnas coincidentes: si los nombres de columna no coinciden exactamente, Power Query creará columnas con valores nulos para las filas que no correspondan.Tipos de datos: conviene homogeneizar los tipos de datos (por ejemplo, convertir todo a número entero o a texto) para evitar errores o valores inesperados.

En bases de datos relacionales, a este proceso se le conoce generalmente como una consulta de tipo UNION, pues combina registros de varias tablas en una sola.


Combinar archivos de una carpeta

Cuando recibes archivos con una estructura similar (por ejemplo, hojas de cálculo o archivos CSV periódicos), existe la opción de combinar todos los documentos almacenados en una carpeta:

  1. Conexión a carpeta: Elige la carpeta que contiene los archivos. Power BI mostrará una lista con nombre de archivo, ruta y otros atributos.
  2. Combinar archivos: Haz clic en Combinar archivos. Power Query te permitirá configurar opciones como delimitador (en caso de CSV) o la hoja que se desea importar (en el caso de Excel).
  3. Automatización: Cada vez que se agregue un nuevo archivo a esa carpeta, Power Query podrá detectar y procesar esos datos siguiendo la misma lógica.

Esta técnica te ahorra tiempo al evitar repetir pasos manuales cada vez que llegue un archivo adicional.


Conclusión

Dominar la combinación de datos en Power BI es un paso esencial para quienes se preparan para la certificación PL-300 y, en general, para cualquier profesional que busque maximizar el valor de la información en sus proyectos de inteligencia de negocios. Aprender a unir, anexar y combinar archivos de forma correcta te permitirá desarrollar informes más completos y eficaces, además de sentar bases sólidas para el análisis avanzado y la toma de decisiones.

¿Has aplicado ya estas técnicas de combinación de datos en tus proyectos de Power BI? ¡Cuéntanos tu experiencia en los comentarios y comparte tus mejores prácticas!

Así, todos podremos aprender y crecer como comunidad.

Deja un comentario

Descubre más desde Blog de Alex Ayala

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo