Logo Studenta

PBI - Semana 2

¡Este material tiene más páginas!

Vista previa del material en texto

POWER BI
2da semana
Programa de
alfabetización
digital
skill
en alianza con instituciones 
públicas y privadas.
LA TRANSFORMACIÓN
01
¿Te subirías a este globo aerostático?
Proceso ETL
Recordemos la semana 1
¿Qué es Power Query?
Power Query es un motor de preparación de 
datos y transformación de datos. 
Incluye una interfaz gráfica para obtener datos 
de orígenes y un Editor para aplicar 
transformaciones. 
Corazón de Power Query es: Dejar tablas en 
formato estándar
IMPORTAR VISUALIZAR
Algunas transformaciones pueden requerir 
configuraciones especiales que la interfaz gráfica 
no admite actualmente. 
El motor de Power Query usa un lenguaje de 
scripting en segundo plano para todas las 
transformaciones de Power Query: el lenguaje de 
fórmulas M de Power Query, también conocido 
como M, en el script del Editor avanzado.
El lenguaje M es el lenguaje de transformación de 
datos. Todo lo que sucede en la consulta se 
escribe en última instancia en M. 
Lenguaje de fórmulas de Power Query M
En este ejemplo, podemos observar como al crear un nuevo paso de transformación mediante la interacción con los 
componentes de la interfaz de Power Query, se crea automáticamente el código M (lenguaje de funciones)
IMPORTANCIA DE 
POWER QUERY
02
IMPORTANCIA DE POWER QUERY
Los usuarios empresariales invierten hasta 
el 80 % de su tiempo en la preparación de 
datos, lo que retrasa el trabajo de análisis 
y toma de decisiones. 
Varios desafíos contribuyen a esta 
situación y Power Query ayuda a abordar 
muchos de ellos.
Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query
COMPONENTES DE POWER BI
POWER BI DESKTOP SERVICIO POWER BI POWER BI MOBILE
Aplicación de escritorio 
Windows
01 02 03
Que funciona como 
SaaS (Software as a 
Service) en línea
Aplicaciones móviles en 
Windows Phone, tablets, 
iOS y dispositivos 
Android. 
Para traer datos y crear 
informes Para compartir informes, crear nuevas 
visualizaciones y paneles
Para consumir los informes y 
cuadros de mando creados por 
las 2 anteriores
FUNCIONES
Los informes se pueden compartir desde el servidor de informes
Recordemos la semana 1
EXPERIENCIAS DE POWER QUERY
Power Query para escritorio
Se encuentra en integraciones como 
Power Query para Excel y Power BI 
Desktop.
Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query
Actualmente, hay disponibles dos experiencias de Power Query:
POWER BI DESKTOP
Aplicación de escritorio 
Windows
01
Para traer datos y crear 
informes
EXPERIENCIAS DE POWER QUERY
Power Query Online
Se encuentra en integraciones como flujos de 
datos de Power BI, flujos de datos de Microsoft 
Power Platform, Azure Data Factory flujos de 
datos de limpieza y transformación, y muchos 
más que proporcionan la experiencia a través de 
una página web en línea.
Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query
Actualmente, hay disponibles dos experiencias de Power Query:
SERVICIO POWER BI
02
Que funciona como 
SaaS (Software as a 
Service) en línea
Para compartir informes, crear nuevas 
visualizaciones y paneles
FUNCIONES
DESAFIOS DE 
POWER QUERY
03
DESAFIOS DE POWER QUERY
2. Las experiencias de 
conectividad de datos son 
demasiado fragmentadas
3. A menudo, es necesario 
volver a dar forma a los datos 
antes del consumo
4. Cualquier forma es 
puntual y no repetible
1. Buscar y conectarse 
a datos es demasiado 
difícil
5. Volumen (tamaños de datos), 
velocidad (velocidad de cambio) 
y variedad (amplitud de orígenes 
de datos y formas de datos)
COMPONENTES DE POWER BI
Desafío existente ¿Cómo ayuda Power Query?
Buscar y conectarse a datos es 
demasiado difícil
Power Query permite la conectividad a una amplia gama de orígenes de datos, 
incluidos los datos de todos los tamaños y formas.
Las experiencias de conectividad 
de datos son demasiado 
fragmentadas
Coherencia de la experiencia y paridad de las funcionalidades de consulta en 
todos los orígenes de datos.
A menudo, es necesario volver a 
dar forma a los datos antes del 
consumo
Experiencia altamente interactiva e intuitiva para crear consultas de forma 
rápida e iterativa a través de cualquier origen de datos, de cualquier tamaño.
Cualquier forma es puntual y no 
repetible
Al usar Power Query para acceder a los datos y transformarlos, se define un 
proceso repetible (consulta) que se puede actualizar fácilmente en el futuro 
para obtener datos actualizados.
Volumen (tamaños de datos), 
velocidad (velocidad de cambio) y 
variedad (amplitud de orígenes de 
datos y formas de datos)
Power Query ofrece la capacidad de trabajar con un subconjunto de todo el 
conjunto de datos para definir las transformaciones de datos necesarias, lo que 
le permite filtrar y transformar fácilmente los datos en un tamaño administrable.
Power Query proporciona conectividad con cientos de orígenes de datos y más 
de 350 tipos diferentes de transformaciones de datos para cada uno de estos 
orígenes.
Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query
Temario
Nivel básico
Sesión Temario
Semana 1
Introducción, extracción 
de datos y primeros 
gráficos
Introducción, componentes, fases de trabajo
Entorno de trabajo en Power BI Desktop
Instalar Power BI Desktop
Obtención de datos: Excel
Obtención de datos: delimitados (Txt o Csv)
Obtención de datos: desde web
Obtención de datos: JSON
Obtención de datos: Crear tablas
Obtención de datos: desde One Drive
Desarrollo de gráficos I (Barras, anillos y tablas)
Tarjetas y filtros
Proyecto I
E
T
L
Temario
Nivel básico
Sesión Temario
Semana 2
Transformación de 
datos
Combinar y dividir columnas
Crear y utilizar parámetros
Importar datos desde carpetas
Combinar consultas
Integrar datos anexando consultas
Referenciar versus duplicar consultas
Agrupar filas para crear agregados
Dinamizar o anular dinamización en columnas
Añadir lógicas de negocio condicional
Configurar tipos de datos según configuración regional
Utilizar primera fila como encabezados
Limpiar y recortar datos
Eliminar filas duplicadas
Desarrollo de gráficos II (mapas, líneas con proyecciones, textos, 
embudos)
Conexión de gráficos interactivos
Proyecto II
E
T
L
TRANSFORMACIONES 
EN POWER QUERY
04
1. Combinar y dividir columnas
Para el caso utilizaremos el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Producto”
Enlace: 
https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=101511685610127635770&rtpof=tru
e&sd=true
Combinar columnas
Para ingresar al Editor de Power Query, en Inicio, debemos seleccionar Transformar datos y luego el 
elemento Transformar datos
Combinar columnas
Una vez en el editor de Power Query, en el panel superior seleccionamos Transformar y luego Combinar 
columnas
Combinar columnas
Elegimos el separador y el nuevo nombre de la columna combinada
Combinar columnas
Podremos observar la nueva columna; sin embargo, también visualizaremos que las columnas que usamos 
como insumos han desaparecido. Para evitar esto, antes de la transformación debemos duplicar las 
columnas que deseamos mantener.
Duplicar columnas
Para duplicar una columna debemos seleccionar su encabeza y con clic derecho, abrir la ventana de 
opciones donde seleccionaremos “Duplicar columna”
Dividir columnas
Para este ejemplo, dentro del archivo Excel “1 Ventas Adventure Works” conectando la pestaña 
“Producto”, dentro del Editor de Query, seleccionaremos la columna Rango Tamaño. Como podrán 
observar tiene datos en medida “centímetros” y en “tallas”. Nuestro objetivo será dividir ello para 
identificar las unidades de medida
Dividir columnas
Seleccionamos la columna que 
queremos dividir, le damos clic 
derecho, seleccionamos Dividir 
columna y en el desglose que 
aparecerá, elegimos la opción de Por 
delimitadorDividir columnas
- Elegimos como delimitador Espacio
- Seleccionamos como división en: 
Delimitador situado más a la 
izquierda
Dividir columnas
La columna se ha dividido en 2 y ha renombrado 
ambas columnas como:
- RangoTamaño.1
- RangoTamaño.2
Dando doble clic en cualquiera de los encabezados 
podremos renombrar la nueva columna a “Unidad de 
medida” o lo que sea más conveniente.
2. Crear y utilizar parámetros
C:\Power BI\Archivos_PowerBI\1 Ventas Adventure Works.xlsx
parámetro Archivo
Ruta de acceso
2. Crear y utilizar parámetros
Es común que nuestros archivos se muevan de lugar por múltiples razones. El problema está en 
que si sucede esto y actualizamos nuestro modelo en Power BI, se romperá la conexión ya que 
Power BI no encontrará los archivos y esperará que conectemos uno por uno
C:\Power BI\Archivos_PowerBI\Ventas.xlsx
C:\Power BI\Archivos_PowerBI\Finanzas.xlsx
C:\Power BI\Archivos_PowerBI\Clientes.xlsx
C:\Power BI\Archivos_PowerBI\Campañas_publicitarias.xlsx
2. Crear y utilizar parámetros
\Ventas.xlsx
\Finanzas.xlsx
\Clientes.xlsx
\Campañas_publicitarias.xlsx
Parámetro 1
Para evitar esto, podemos configurar parámetros, y simplemente se editaría el “parámetro” con la 
nueva ruta de acceso inicial, sabiendo que los archivos seguirán teniendo el mismo nombre.
2. Crear y utilizar parámetros
En el editor de Query, dentro de Pasos aplicados podemos hacer clic dos veces en “Origen” y podremos 
observar la Ruta de acceso de archivo. Podremos copiar y pegar dicha ruta (sin seleccionar al archivo)
2. Crear y utilizar parámetros
Una vez tengamos claro cuál es nuestra ruta de acceso, dentro de Inicio, seleccionaremos Administrar 
parámetros y luego Parámetro nuevo
2. Crear y utilizar parámetros
Aquí podremos darle un nombre al 
nuevo parámetro y una descripción 
(opcional).
En Tipo debemos seleccionar Texto y 
en Valores sugeridos Cualquier valor.
Finalmente, en valor actual, debemos 
copiar la ruta de acceso. Es muy 
importante que aquí no se coloque el 
nombre del archivo y que se cierre la 
ruta con el símbolo “ \ ”
2. Crear y utilizar parámetros
Automáticamente, al lado derecho observaremos que en la sección de consultas ahora puedes 
observarse el Parámetro que hemos creado.
2. Crear y utilizar parámetros
Si regresamos a nuestro archivo original ahora en la barra de Inicio seleccionaremos: Configuración 
de origen de datos
2. Crear y utilizar parámetros
Observaremos que aquí está la ruta 
de origen de nuestro archivo, por lo 
que seleccionaremos “Cambiar 
origen”
2. Crear y utilizar parámetros
De forma predeterminada nos 
encontraremos en la opción de 
cambio Básico.
Aquí podemos reajustar la ruta 
simplemente dando copiar y pegar; 
sin embargo, nuestro interés es dejar 
configurado un parámetro, por lo que 
vamos seleccionar Uso avanzado
2. Crear y utilizar parámetros
Una vez que hemos elegido el Uso avanzado, al seleccionar el botón de ABC, podremos elegir el Parámetro que 
habíamos creado y de esa forma, repetir el proceso con cada archivo para que si hay algún cambio de datos con el 
origen, simplemente se tenga que actualizar el Parámetro
2. Crear y utilizar parámetros
Debajo del parámetro elegido, colocaremos el nombre del archivo y al dar aceptar, nuestro parámetro ya 
estará configurado 
Parámetro
Nombre de archivo
2. Crear y utilizar parámetros
En adelante, si queremos actualizar el parámetro, solo debemos ir a Inicio, seleccionar Administrar 
parámetros y Editar parámetros.
3. Combinar consultas
Dentro del Editor de Query, en inicio, seleccionaremos Combinar, luego Combinar consultas y finalmente 
Combinar consultas para crear una nueva
Para el caso utilizaremos del archivo Excel “1 Ventas Adventure Works” las pestañas 
“Producto” y “subproducto”
3. Combinar consultas
Primero, elegimos las 2 tablas 
que vamos a combinar.
A continuación seleccionamos 
las cabeceras de columna 
que van a generar el puente 
entre ambas tablas.
Finalmente, elegimos el tipo 
de combinación, dependiendo 
de qué deseamos observar 
en la nueva tabla (en este 
caso, migrar todos los datos 
de la tabla 1 y colocarles el 
nombre de la subcategoría)
3. Combinar consultas
Dentro de la nueva tabla, vamos a observar que hay una columna con un botón de flechas a ambos lados, 
debemos seleccionarlo para expandir los nuevos datos.
3. Combinar consultas
Elegimos Expandir y luego seleccionamos el campo Subcategoría
3. Combinar consultas
Finalmente, tendremos la replica de la tabla Productos5 en una nueva tabla llamada Combinar1. Esta tabla va a 
indicar el nombre de la subcategoría cada vez que corresponda, debido a la combinación efectuada.
4. Importar datos desde carpetas
Copiamos la ruta de la carpeta con 5 archivos TXT:
C:\Power BI\Semana 2\1 Productos TXT
4. Importar datos desde carpetas
Para este ejemplo, vamos a importar 5 archivos TXT al mismo tiempo, desde la carpeta 1 Productos TXT
Enlace: https://drive.google.com/drive/folders/1qQPgZaupHX5nR5mpHM222VGmw8yx8B__?usp=sharing
4. Importar datos desde carpetas
Copiamos la ruta de la carpeta
4. Importar datos desde carpetas
Observamos los 5 
archivos TXT que 
contiene la 
carpeta.
Seleccionaremos:
Combinar y 
transformar 
datos 
4. Importar datos desde carpetas
Configuraremos la 
combinación de los 5 
archivos TXT según 
las características del 
primer archivo y 
seleccionaremos 
Aceptar
4. Importar datos desde carpetas
Podremos observar en la columna 
Source.Name que la combinación 
es exitosa al observar que están 
las 5 líneas de productos.
5. Integrar datos anexando consultas en Power Query
Para este ejercicio vamos a 
conectar 3 archivos TXT:
Productos_M
Productos_R
Productos_T
Como podremos observar 
en la columna ProductLine
solo hay una letra por cada 
consulta
En esta ocasión vamos a 
aprender a unir los 3 
archivos, pero no buscando 
coincidencias (como en la 
combinación de datos) sino 
anexando filas
5. Integrar datos anexando consultas en Power Query
Dentro de consultas, seleccionaremos Productos_M y luego en Inicio elegiremos combinar, anexar consultas y 
Anexar consultas para crear una nueva
5. Integrar datos anexando consultas en Power Query
Es muy importante haber 
seleccionado primero al 
archivo inicial del anexo 
para que en base a ello, 
podamos anexar el resto 
de tablas.
En caso tengamos más 
de 2 tablas por anexar, 
elegiremos la opción Tres 
o más tablas y 
seleccionando las tablas 
disponibles, elegiremos 
cuales Anexar
5. Integrar datos anexando consultas en Power Query
Una vez hayamos 
seleccionado las 3 tablas 
podremos seleccionar 
Aceptar
5. Integrar datos anexando consultas en Power Query
Observaremos que se habrá creado una nueva tabla llamada Anexar1 y que en la columna ProductLine ahora 
están los 3 productos anexados 
6. Referenciar versus duplicar consultas
En la sección de consultas, al hacer clic derecho en cada 
tabla, podremos seleccionar las opciones de Duplicar o 
Referencia.
Duplicar: Crea una tabla idéntica al momento de la 
copia, inclusive, incluyendo las transformaciones y pasos 
aplicados al momento de la duplicidad. No tiene 
dependencia, por lo que si se continúan haciendo 
cambios en la tabla original, la tabla duplicada no 
cambiará.
Referencia: Es una copia con dependencia al origen del 
que se referencia. Si se hacen cambios en los pasos 
aplicados de la tabla madre, las tablas referenciadas 
también cambiarán
7. Agrupar filas para crear agregados
Luego, seleccionaremos la nueva consulta y elegiremos la opción de Agrupar por
Primero vamos a crear una referencia a la tabla Ventas1 y la llamaremos Productos vendidos
7. Agrupar filas para crear agregados
Para la agrupación, seleccionaremos las casillas con CodProducto, elegiremos como nombre total ventas y 
colocaremos Operación Suma, basado en la columna Ventas
7. Agrupar filas para crear agregadosAhora tendremos una tabla con el nombre 
Productos vendidos donde podremos observar por 
cada CodProducto el total de sus ventas
Cabe resaltar que al ser una tabla referenciada, al 
actualizarse su tabla de origen, esta tabla 
conectada también actualizará sus totales.
8. Anular dinamización en columnas en Power Query
Tablas pueden estar dinamizadas o apiladas (es decir, que pueden dinamizarse)
Caso: Población Mundial - Wikipedia
Enlace: https://es.wikipedia.org/wiki/Poblaci%C3%B3n_mundial
Modelo no es conveniente para el modelo de datos de Power BI. La única columna estática debería 
ser la columna de “Año”, por lo que haremos clic derecho sobre cabecera de columna “Año”
Al hacer clic derecho en Año 
seleccionaremos la opción de Anulación 
de dinamización de otras columnas
8. Anular dinamización en columnas en Power Query
Al hacerlo, todas las columnas van a 
desglosarse en Atributo y Valor, 
donde el atributo contendrá a cada 
continente y el valor a la población 
que corresponde por Año y 
continente. 
Gracias a ello, podremos trabajar 
esta tabla con un modelo 
apropiado para Power BI.
8. Anular dinamización en columnas en Power Query
Para este ejemplo, trabajaremos con la tabla de Ventas desde el archivo Excel “1 Ventas Adventure Works” 
conectando la pestaña “Producto”. Una vez en la tabla, para efectos del ejercicio, vamos a elegir solo las 
columnas que observamos en la imagen.
9. Dinamizar columnas en Power Query
Enlace: 
https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=1015116856101276357
70&rtpof=true&sd=true
Vamos a anular la dinamización de las columnas: Precio, Coste, Venta e IVA
9. Dinamizar columnas en Power Query
Imaginemos que recibimos el
archivo de este modo, con las
medidas y valores en columnas.
En este caso lo que necesitamos 
hacer es dinamizar las columnas 
para que cada medida tenga su 
propia columna.
Para ello, seleccionaremos la 
columna que tenga los atributos y 
en transformar, buscaremos la 
opción columna dinámica.
9. Dinamizar columnas en Power Query
9. Dinamizar columnas en Power Query
9. Dinamizar columnas en Power Query
En la ventana debemos elegir las valores para las nuevas columnas. En este caso 
seleccionaremos la columna “Valor”
9. Dinamizar columnas en Power Query
Observaremos, entonces, como cada medida se ha convertido en una columna 
dinámica con sus valores correspondientes.
10. Añadir lógicas de negocio condicional
Para el caso utilizaremos el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Clientes”
Enlace: 
https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=101511685610127635770&rtpof=tru
e&sd=true
10. Añadir lógicas de negocio condicional
Aquí podremos configurar desde el nombre de la columna y las condiciones para la nueva columna
10. Añadir lógicas de negocio condicional
Como podremos observar ahora tendremos una nueva columna con el condicionamiento elegido
11. Configurar tipos de datos según configuración regional
En algunas ocasiones, según la configuración regional, se va a considerar la coma o punto decimal, por lo que habrá que 
hacer clic derecho en el encabezado de la columna, para luego seleccionar Cambiar tipo y Usar configuración regional
11. Configurar tipos de datos según configuración regional
En configuración regional podremos elegir el símbolo que corresponderá para el punto o coma decimal según la región
12. Utilizar primera fila como encabezados 
En el caso la tabla no identifique de forma correcta el tipo de datos, tendremos que seleccionar en Transformar, la opción 
de Detectar tipo de datos
13. Limpiar y recortar datos
Para el caso utilizaremos el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Clientes”
Enlace: 
https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=101511685610127635770&rtpof=tru
e&sd=true
13. Limpiar y recortar datos
En algunas ocasiones observaremos que un dato aparece más de 
una vez dentro de la columna. 
Distinguimos diferencias entre minúsculas y mayúsculas. En otros 
casos está igual y aún así se repite. 
Hay que tomar en cuenta que el lenguaje que está detrás del 
editor de consultas es el lenguaje M y es muy sensible a 
mayúsculas y minúsculas.
Esto nos llevar a realizar labores de limpieza.
13. Limpiar y recortar datos
Seleccionando la columna donde queremos realizar la transformación, seleccionaremos la opción Transformar, luego 
Formato y finalmente Poner en Mayúscula Cada Palabra
13. Limpiar y recortar datos
Con ello podremos garantizar limpieza de columna, pues retira espacios en blanco iniciales o finales de cada celda.
14. Eliminar filas duplicadas
Seguimos en la tabla de Clientes. Trabajaremos en este ejemplo seleccionando la columna IdCliente. Luego en Inicio, 
elegiremos la opción Reducir filas, Quitar filas y finalmente Quitar duplicados
DUDAS
/hectorcastillobazan/
hcastillo@metrica23.com

Continuar navegando

Materiales relacionados