Dominar el perfilado de datos en Power BI: la base invisible que marca la diferencia

Written by:

A menudo, cuando alguien empieza a estudiar Power BI, su atención se centra en los gráficos, los paneles y las medidas DAX. Es lógico: son la parte más visible y la que produce el “wow” en una presentación. Sin embargo, los analistas con experiencia saben que la solidez de un informe no se construye en la vista de informes, sino mucho antes, en Power Query.

Y dentro de Power Query, hay una herramienta silenciosa que decide si nuestros datos serán fiables o un campo minado de errores: el perfilado de datos.

En la clase del 8 de octubre de 2025 del curso PL-300 de NamasData , dedicamos una sesión completa a este tema. Fue una de esas clases donde se entrelazan la práctica, la lógica del examen y la realidad profesional. Hoy quiero condensar lo esencial en este artículo, para que puedas entender cómo estas funciones no solo aparecen en el examen, sino que también definen la calidad de cualquier modelo de datos serio.


1. ¿Por qué es tan importante perfilar los datos?

Imagina que importas una tabla desde Excel con 80.000 filas. Todo parece correcto, sin errores aparentes, y la cargas directamente al modelo. Minutos después, Power BI te muestra una alerta: 3.371 registros con error de tipo de datos.

Contenido del artículo

Lo que ha ocurrido es simple: Power Query solo evalúa las primeras mil filas por defecto cuando determina el tipo de datos y genera las estadísticas de calidad. Si el error está más allá de esa fila 1000, no lo verá… hasta que cargues el modelo.

En el examen PL-300, esta pregunta aparece constantemente: ¿Cuántas filas utiliza Power Query para detectar el tipo de datos por defecto? Respuesta: 1.000.

Es un detalle que vale un punto, pero sobre todo representa algo mucho más profundo: la idea de que los errores invisibles existen. Y que Power BI, aunque inteligente, no puede corregirlos si no los inspeccionamos.


2. Tipos de errores y su impacto en el modelo

Cuando Power Query detecta un error de tipo de datos durante la carga (por ejemplo, un texto en una columna numérica), sustituye ese valor por un nulo. Esto no bloquea la carga, pero distorsiona los resultados. Si esos registros eran ventas, unidades o presupuestos, su ausencia alterará totales, promedios o ratios.

Contenido del artículo

El propio Power Query crea de forma automática una consulta de errores, donde cada registro erróneo aparece junto con una columna “número de fila” que indica su posición original. Esta tabla auxiliar es una mina de oro para los analistas: permite auditar exactamente dónde se han producido los fallos.

En resumen:

– Los errores de tipo de datos bloqueantes detienen la carga.

– Los errores no bloqueantes se sustituyen por blancos.

– Y ambos pueden afectar tus informes sin que lo notes.


3. Calidad, distribución y perfil de columnas: tres ventanas para mirar tus datos

Aquí está uno de los núcleos de la clase. Microsoft ha agrupado las funciones de perfilado bajo tres indicadores que aparecen en la pestaña Vista de Power Query:

  • Calidad de columnas

– Muestra el porcentaje de valores válidos, vacíos y con error.

– Es la forma más rápida de detectar fallos.

– Pregunta típica del examen: ¿Cuál es la forma más rápida de identificar errores en todas las columnas?

→ Respuesta: Calidad de columnas.

  • Distribución de columnas

– Indica cuántos valores distintos y cuántos únicos existen.

– Ayuda a detectar duplicados o inconsistencias, como nombres escritos de forma diferente o espacios invisibles.

  • Perfil de columna

– Permite ver el detalle estadístico de una columna concreta.

– Desde aquí se puede agrupar por longitud, signo, paridad o incluso por día de la semana si la columna es de tipo fecha.

Un truco mnemotécnico que recordamos en clase: C, D, P, en orden alfabético: Calidad, Distribución, Perfil. Puede parecer una tontería, pero cuando estás en el examen y todo te suena, este detalle te puede ahorrar segundos valiosos.

Contenido del artículo

4. Cómo Power Query “lee” tus datos

Cada vez que activas las opciones de perfilado, Power Query genera estadísticas basadas en la muestra (mil filas o el conjunto completo, según lo configures). Esa muestra determina qué tipos asigna: entero, texto, fecha, decimal…

Un ejemplo clásico: en la columna “Fecha” todo parece correcto, pero un registro contiene el 29 de febrero de un año no bisiesto. Power Query no lo interpreta como error, sino como tipo indeterminado (ABC123). El valor se cargará como texto y pasará desapercibido, pero luego no podrás usarlo en funciones de tiempo.

Esto ilustra una idea clave: no todos los errores son visibles como tales. Algunos simplemente cambian de tipo y se convierten en falsos positivos.

Contenido del artículo

5. Limpiar, recortar y reemplazar: las tres operaciones que más aparecen en el examen

Una de las secciones más recurrentes del examen PL-300 gira en torno a las transformaciones de texto. Microsoft suele plantear preguntas del tipo: “¿Qué función usarías para eliminar caracteres no imprimibles?” o “¿Qué transformación quita espacios en blanco al principio y al final de un texto?”.

Las respuestas correctas son:

Limpiar (Clean) → elimina caracteres no imprimibles (por ejemplo, saltos de línea ocultos).

Recortar (Trim) → elimina espacios al principio y al final, pero no en el centro.

Reemplazar valores (Replace Values) → sustituye cadenas específicas por otras.

En la clase, usamos el ejemplo clásico de “Accesorios de telefonía móvil” duplicado por un salto de línea invisible. Solo al activar “Mostrar espacio en blanco” se descubría el error. Aplicando “Limpiar”, desaparecía el salto y los datos se consolidaban correctamente. Un detalle de examen, pero también un gesto que salva proyectos reales.

Contenido del artículo

Si quieres comprobar tu nivel antes de lanzarte a la certificación, puedes hacerlo con el test gratuito de nivel de Power BI de Namasdata. En pocos minutos sabrás qué temas dominar y cuáles reforzar antes de llegar a este tipo de ejercicios.


6. Los errores que el ojo no ve

El caso anterior nos sirvió para introducir otra pregunta habitual: Cuando en una columna textual aparece el mismo valor dos veces pero uno incluye un espacio al final, ¿cómo lo detectas?

La respuesta es doble:

  1. Activar Distribución de columnas para ver el número de valores distintos.
  2. Usar la opción Mostrar espacios en blanco en la pestaña Vista.

La diferencia entre “distintos” y “únicos” también genera confusión.

Distintos cuenta cuántos valores diferentes hay en total.

Únicos cuenta los que aparecen una sola vez.

En el examen nunca te pedirán calcularlos, pero sí interpretar una captura donde se muestren ambas cifras.

Por eso en clase insistimos en entrenar el ojo: en el examen hay preguntas con capturas de frutas, países o productos donde tienes que identificar cuál se repite más, menos o igual. Parecen triviales, pero roban tiempo si no las has practicado.


7. Agrupar por longitud, signo, paridad o día de la semana

Otra funcionalidad de perfilado que suele pasar desapercibida es el menú de los tres puntitos dentro del perfil de columna. Desde ahí puedes agrupar los datos según distintos criterios, sin crear columnas adicionales (algo importante porque no afecta al tamaño del modelo).

Ejemplo práctico de examen:

“Cargas una tabla con una columna de texto libre y necesitas analizar la distribución de longitudes de las cadenas sin aumentar el tamaño del modelo. ¿Qué haces?”

La respuesta correcta es: Usar el perfil de columna y agrupar por longitud de texto.

Crear una columna calculada o agregar con DAX sería incorrecto porque aumenta el tamaño del modelo.

Este tipo de matices separa a quien aprueba del que se queda cerca. Por eso repetimos tanto en clase: no basta con saber hacerlo, hay que saber cómo te lo van a preguntar.


8. Cuando el formato visual del gráfico revela un error

A mitad de clase, hicimos una teatralización con un informe: un ranking de subcategorías por presupuesto. El gráfico mostraba un mismo produco —“Accesorios de telefonía móvil”— tanto en el top superior como en el top inferior.

El error no estaba en DAX ni en la medida, sino en el dato fuente: dos registros idénticos, uno con salto de línea. La moraleja es potente: Power BI solo refleja lo que hay. Si los datos son incoherentes, ningún gráfico lo arreglará.


9. El poder del detalle: detectar valores atípicos

Otra aplicación del perfilado es la detección de outliers o valores atípicos. En la demo, analizamos la columna “Presupuesto económico” y apareció un valor que sobresalía del resto: un cero descomunal frente a cifras pequeñas.

Bastó con aplicar un filtro “es igual a cero” para descubrir que todos esos registros correspondían al canal “Catálogo”, que no sumaba al presupuesto.

No era un error, pero era una anomalía explicable. El perfilado permite encontrar estas historias ocultas antes de que se reflejen en los indicadores.


10. Casos típicos del examen con reemplazo de valores

Otra pregunta recurrente: la de los países duplicados por diferentes formatos (“EE. UU.”, “Estados Unidos”, “United States”). En este caso, la acción correcta es reemplazar valores. El examen suele incluir capturas con varias versiones del mismo país, y el objetivo es identificar el procedimiento más eficiente para unificarlos.

Lo importante no es solo saber qué botón usar, sino entender por qué:

– Porque Power Query distingue cada cadena aunque signifique lo mismo.

– Porque no basta con “filtrar”, hay que normalizar.

– Y porque reemplazar desde la columna no afecta al resto del modelo.


11. Conexión con bases de datos: una transición necesaria

Hacia el final de la clase hicimos una pausa en Power Query para preparar el siguiente bloque del curso: la conexión con bases de datos SQL. En concreto, vimos cómo instalar SQL Server Express 2022, la versión gratuita que utilizamos para practicar sin depender de la nube ni de créditos en Azure.

El procedimiento es simple:

  1. Entrar en la página oficial de descargas de Microsoft.
  2. Elegir la versión SQL Server Express 2022.
  3. Instalar con la opción básica y mantener las rutas por defecto.

No necesitamos personalizar nada ni ser administradores de bases de datos. El objetivo es disponer de un entorno local que nos permita practicar conexiones, consultas y transformaciones, igual que haríamos en un entorno corporativo.

Contenido del artículo

12. Lo que el examen valora (aunque no lo diga)

Detrás de todas estas preguntas, Microsoft evalúa algo más que memoria: la comprensión del flujo de datos. Quiere saber si entiendes cómo Power Query transforma, valida y limpia antes de modelar.

Cada pregunta sobre “calidad”, “distribución” o “perfil” es, en realidad, una forma de comprobar si puedes detectar un problema antes de que se propague. Porque un modelo de datos no se rompe en DAX; se rompe en los orígenes, cuando un salto de línea o un formato erróneo pasa desapercibido.


13. Trucos prácticos que te ahorran horas

Durante la sesión se compartieron varios consejos que conviene tener a mano:

Ver todo el conjunto de datos: cambia la opción “mil primeras filas” a “conjunto completo” en el perfilado.

No elimines errores sin analizarlos: “Quitar errores” borra filas completas.

Guarda la consulta de errores: te permite auditar la calidad del origen.

No agregues columnas innecesarias: todo lo que aumente el modelo penaliza rendimiento y tamaño.

Recuerda el orden alfabético (C-D-P): Calidad, Distribución, Perfil.

No todos los errores bloquean la carga: algunos se convierten en texto o nulos.

Practica leer rápido capturas con listas de valores: el examen incluye ejercicios visuales donde el reto es la agilidad.


14. Más allá del examen: pensamiento analítico

Aunque todas estas herramientas tienen una traducción directa en preguntas del examen PL-300, su valor real está en el día a día del analista.

Cuando un profesional es capaz de identificar que un país está duplicado, que una fecha no es válida o que un valor cero tiene sentido, está haciendo algo más que “pasar un test”: está garantizando que las decisiones que se tomen sobre ese modelo sean fiables.

Y eso es, en última instancia, lo que distingue a un técnico de un analista de negocio.

Si quieres avanzar en esa dirección, te recomiendo revisar el programa completo del curso PL-300 de Namasdata, donde abordamos cada módulo del examen con ejemplos reales, plantillas descargables y simulacros de certificación.


15. Hacia la siguiente etapa: el modelo y las bases de datos

La clase terminó preparando el terreno para la siguiente gran fase del curso: la conexión a bases de datos. Pasamos de la limpieza y el perfilado a la estructura del modelo relacional.

Contenido del artículo

Porque Power BI no solo consume archivos Excel; se alimenta de sistemas transaccionales, de servidores SQL, de orígenes corporativos. Saber conectarse correctamente y comprender cómo viajan los datos es fundamental para las siguientes competencias del examen (relaciones, cardinalidad, normalización, etc.).


16. Conclusión: dominar lo invisible

Perfilar los datos es como revisar los cimientos antes de construir un edificio. Nadie ve el trabajo que hay debajo, pero todo depende de él.

En Power BI, el éxito de tus informes —y tu tranquilidad en el examen PL-300— empieza aquí:

– Detectando los errores antes de cargarlos.

– Entendiendo las tres vistas (calidad, distribución, perfil).

– Usando las transformaciones adecuadas (limpiar, recortar, reemplazar).

– Y sabiendo interpretar lo que Power Query te está diciendo entre líneas.

Al final de la clase, al hablar de SQL Server, recordé algo que resume bien este enfoque:

“No se trata de aprender a responder preguntas del examen. Se trata de entender lo suficiente como para que ninguna pregunta te parezca extraña.”

Si te gustaría recorrer este camino con una guía clara, estructurada y 100 % en español, te invito a conocer todos los recursos disponibles en namasdata.com y comenzar hoy mismo con el test gratuito de nivel para descubrir tu punto de partida.

Si quieres seguir aprendiendo y avanzar en tu recorrido como analista de datos, aquí tienes varios recursos gratuitos y formativos de Namasdata:

– Test gratuito de nivel de Power BI → https://test.namasdata.com
– Curso oficial para la certificación PL-300 → https://pl300.namasdata.com
– Biblioteca de recursos y guías de Power BI → https://biblioteca.namasdata.com
– Desafíos prácticos gratuitos de Power BI → https://desafios.namasdata.com
– Membresía Namasdata para analistas → https://www.namasdata.com/bundles/paquete-curso-certificacion-pl-300

Deja un comentario

Descubre más desde Blog de Alex Ayala

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo