Tipos de consultas en Power BI: DirectQuery vs Importación – Claves para la certificación PL-300

Written by:

Este artículo está diseñado para ayudarte a comprender conceptos fundamentales de Power BI, como los diferentes tipos de consultas disponibles. Si estás preparándote para el examen de certificación PL-300 de Power BI, entender estos conceptos es esencial para tu éxito y para consolidar tu habilidad en la herramienta. Cuando Power BI se conecta a cualquier fuente de datos, realiza uno de dos tipos de conexiones o consultas.

DirectQuery

El primer tipo se llama DirectQuery, o una conexión en vivo a los datos. Esto significa que Power BI almacena las credenciales y una cadena de conexión a la fuente de datos. Por ejemplo, podría ser la base de datos relacional que almacena datos de inventario utilizados en un almacén.

Esta conexión DirectQuery permite que Power BI consulte la base de datos de inventario y recupere información como las tablas y vistas disponibles, el esquema de esas tablas y vistas, así como los registros que contienen. Una vez establecida la conexión, los datos recuperados son utilizados y mostrados por Power BI. DirectQuery es especialmente útil cuando los datos subyacentes cambian rápidamente y se necesita la información más actualizada en los informes y paneles de Power BI. Este tipo de conexión es un tema recurrente en el examen PL-300, ya que conocer cuándo y cómo utilizar DirectQuery es clave para optimizar tus reportes. Imagina, por ejemplo, que en un almacén se implementa un sistema de inventario en tiempo real que mantiene un registro actualizado al segundo de los bienes disponibles; en este caso, el equipo de compras necesitará acceder a informes en tiempo real para tomar decisiones informadas sobre la reposición de stock.

Importación de Datos

El segundo tipo de conexión se llama Importación. Importar se conecta a una fuente de datos y almacena las mismas credenciales y cadena de conexión, pero también importa los datos y los guarda en la memoria de Power BI (ya sea en la herramienta de escritorio o en el servicio en línea). Importar es ideal cuando los datos necesarios pueden caber en la memoria, y además puede acelerar significativamente el rendimiento de los informes, ya que no es necesario consultar la fuente de datos cada vez que se genera una vista del informe o panel.

Con el modo Importación, Power BI se encarga de todo el procesamiento: almacenar los datos, calcular los campos y renderizar las visualizaciones dinámicas. Entender el funcionamiento de la Importación es fundamental para dominar el rendimiento de los informes en Power BI, algo que se evalúa de manera detallada en la certificación PL-300. DirectQuery, en cambio, reparte parte de ese trabajo con la fuente de datos subyacente mediante consultas directas a la base de datos. Generalmente, la Importación es la mejor opción desde una perspectiva de rendimiento, ya que Power BI almacena los datos de manera óptima usando su propio formato interno VertiPaq, que está altamente optimizado para la compresión y para los cálculos necesarios en los informes.

Conectando a fuentes de datos

Este apartado es especialmente relevante para quienes se preparan para la certificación PL-300, ya que una correcta configuración y manejo de las fuentes de datos es esencial para obtener buenos resultados en el examen.

Una característica destacable del modo Importación es que permite actualizar los datos periódicamente. En Power BI Desktop, esto se puede hacer manualmente con el botón Actualizar. Una vez publicado el informe en el servicio de Power BI, es posible programar actualizaciones automáticas para mantener los datos al día, sin necesidad de conectarse constantemente a la fuente de datos. Esto es útil cuando los informes necesitan importar datos para ofrecer la mejor experiencia de rendimiento y al mismo tiempo requieren mostrar datos actualizados (aunque no necesariamente en tiempo real). Existen limitaciones en la frecuencia con la que los datos pueden actualizarse, dependiendo de la capacidad donde esté desplegado el informe. Para muchas organizaciones, tener datos relativamente frescos es suficiente, y una actualización diaria o varias veces al día puede funcionar perfectamente y ofrecer una experiencia de usuario excelente.

Es importante señalar que DirectQuery y el modo Importación admiten diferentes fuentes de datos de diversas maneras. Por ejemplo, cuando la fuente de datos es un archivo CSV almacenado en un sistema de archivos local, debe usarse la Importación porque no existe un motor de consulta subyacente al cual Power BI pueda enviar una consulta directa a la base de datos. Los datos del archivo CSV se importarán en el motor de almacenamiento de Power BI y se utilizarán para los informes. Al hacer clic en Actualizar, estos datos se volverán a extraer desde el archivo CSV y se importarán nuevamente a Power BI.

Otro ejemplo sería una base de datos en la nube como Azure Synapse Analytics, que se utiliza para almacenar grandes volúmenes de datos y permite consultas complejas. En este caso, el creador del informe en Power BI tiene la opción de elegir entre DirectQuery o Importación. Conocer las diferencias entre ambas opciones es crucial, ya que impactarán tanto en el rendimiento del informe como en la carga de la fuente de datos subyacente.

Por ejemplo, si se usa el modo Importación para conectarse a una base de datos SQL dedicada en la nube, pero el servicio se detiene durante ciertos periodos, como los fines de semana, Power BI no podrá realizar actualizaciones programadas en esos momentos. Además, cuando se ejecuten actualizaciones, habrá una mayor carga en la base de datos, lo cual podría afectar el rendimiento.

Cuando se crea una consulta en Power BI, se genera una definición de los datos en el modelo de datos. Este componente del modelo se denomina modelo semántico de Power BI. A continuación, exploraremos más a fondo los conjuntos de datos de Power BI.

Modelos semánticos de Power BI

Los datos utilizados en los informes de Power BI se gestionan mediante modelos semánticos. Básicamente, un modelo semántico de Power BI es una representación lógica de los datos, incluyendo la conexión a la fuente de datos y las credenciales necesarias. Cada informe creado en Power BI debe tener un modelo semántico asociado, asegurando que el informe tenga la información necesaria para visualizar.

Los modelos semánticos de Power BI suelen crearse utilizando Power BI Desktop. Al publicar un informe, tanto el informe como el modelo se suben al servicio de Power BI. Es importante destacar que las credenciales no se envían al servicio, y deben reingresarse al publicar. Esto permite a los desarrolladores de informes crear informes localmente con sus propias credenciales (a menudo usando fuentes de datos de desarrollo) y luego cambiarlas al publicar los informes en producción.

Los modelos semánticos pueden compartirse entre varios informes, o incluso pueden crearse cargando archivos de Excel directamente al servicio de Power BI, o desde fuentes de streaming. Por ejemplo, el servicio Azure Stream Analytics ofrece la capacidad de transmitir datos directamente a un modelo semántico de streaming del servicio de Power BI, para utilizarlos en paneles creados en el mismo.

Flujos de datos de Power BI

A medida que las necesidades de datos cambian, Power BI se adapta continuamente para ayudar a las organizaciones a comprender y utilizar su información de manera efectiva. Los flujos de datos son una capacidad de Power BI que permite a los usuarios realizar la preparación de datos de autoservicio, un componente a veces necesario en las soluciones de análisis e informes completas.

Al igual que otras herramientas de transformación de datos, los flujos de datos de Power BI se conectan a diferentes fuentes y realizan transformaciones antes de que los datos se utilicen como un modelo semántico de Power BI.

Esto es especialmente útil cuando una organización quiere evitar que los desarrolladores de informes accedan directamente a las fuentes de datos subyacentes (posiblemente por razones de seguridad o rendimiento). Los flujos de datos también permiten optimizar las transformaciones que deben realizarse siempre para que los datos sean utilizables en los informes. Por ejemplo, si siempre es necesario renombrar columnas y unir datos de varias tablas, hacerlo una única vez en un flujo de datos puede ser mucho más eficiente que dejar que cada creador de informes lo haga individualmente (y posiblemente de formas diferentes).

Además, los flujos de datos permiten transformar y preparar datos de manera uniforme para que estén listos para su uso en informes de Power BI desde otros servicios de Power Platform o Azure. Utilizando la infraestructura de la nube de Microsoft Azure, servicios como Microsoft Dataverse y Dynamics 365 son fuentes populares para trabajar con flujos de datos, aunque también aplican otros servicios en la nube.

Aunque los flujos de datos pueden ser utilizados por usuarios de Power BI Pro, algunas características requieren capacidades Premium Per User (PPU) o Premium, aspectos que también son abordados en el examen PL-300, asegurando que los candidatos comprendan las capacidades y limitaciones de estas licencias., como la posibilidad de hacer DirectQuery desde fuentes de datos, la actualización incremental, entidades calculadas y vinculadas, y el motor de cómputo mejorado.

Deja un comentario

Descubre más desde Blog de Alex Ayala

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo