Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
POWER BI 2da semana Programa de alfabetización digital skill en alianza con instituciones públicas y privadas. LA TRANSFORMACIÓN 01 ¿Te subirías a este globo aerostático? Proceso ETL Recordemos la semana 1 ¿Qué es Power Query? Power Query es un motor de preparación de datos y transformación de datos. Incluye una interfaz gráfica para obtener datos de orígenes y un Editor para aplicar transformaciones. Corazón de Power Query es: Dejar tablas en formato estándar IMPORTAR VISUALIZAR Algunas transformaciones pueden requerir configuraciones especiales que la interfaz gráfica no admite actualmente. El motor de Power Query usa un lenguaje de scripting en segundo plano para todas las transformaciones de Power Query: el lenguaje de fórmulas M de Power Query, también conocido como M, en el script del Editor avanzado. El lenguaje M es el lenguaje de transformación de datos. Todo lo que sucede en la consulta se escribe en última instancia en M. Lenguaje de fórmulas de Power Query M En este ejemplo, podemos observar como al crear un nuevo paso de transformación mediante la interacción con los componentes de la interfaz de Power Query, se crea automáticamente el código M (lenguaje de funciones) IMPORTANCIA DE POWER QUERY 02 IMPORTANCIA DE POWER QUERY Los usuarios empresariales invierten hasta el 80 % de su tiempo en la preparación de datos, lo que retrasa el trabajo de análisis y toma de decisiones. Varios desafíos contribuyen a esta situación y Power Query ayuda a abordar muchos de ellos. Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query COMPONENTES DE POWER BI POWER BI DESKTOP SERVICIO POWER BI POWER BI MOBILE Aplicación de escritorio Windows 01 02 03 Que funciona como SaaS (Software as a Service) en línea Aplicaciones móviles en Windows Phone, tablets, iOS y dispositivos Android. Para traer datos y crear informes Para compartir informes, crear nuevas visualizaciones y paneles Para consumir los informes y cuadros de mando creados por las 2 anteriores FUNCIONES Los informes se pueden compartir desde el servidor de informes Recordemos la semana 1 EXPERIENCIAS DE POWER QUERY Power Query para escritorio Se encuentra en integraciones como Power Query para Excel y Power BI Desktop. Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query Actualmente, hay disponibles dos experiencias de Power Query: POWER BI DESKTOP Aplicación de escritorio Windows 01 Para traer datos y crear informes EXPERIENCIAS DE POWER QUERY Power Query Online Se encuentra en integraciones como flujos de datos de Power BI, flujos de datos de Microsoft Power Platform, Azure Data Factory flujos de datos de limpieza y transformación, y muchos más que proporcionan la experiencia a través de una página web en línea. Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query Actualmente, hay disponibles dos experiencias de Power Query: SERVICIO POWER BI 02 Que funciona como SaaS (Software as a Service) en línea Para compartir informes, crear nuevas visualizaciones y paneles FUNCIONES DESAFIOS DE POWER QUERY 03 DESAFIOS DE POWER QUERY 2. Las experiencias de conectividad de datos son demasiado fragmentadas 3. A menudo, es necesario volver a dar forma a los datos antes del consumo 4. Cualquier forma es puntual y no repetible 1. Buscar y conectarse a datos es demasiado difícil 5. Volumen (tamaños de datos), velocidad (velocidad de cambio) y variedad (amplitud de orígenes de datos y formas de datos) COMPONENTES DE POWER BI Desafío existente ¿Cómo ayuda Power Query? Buscar y conectarse a datos es demasiado difícil Power Query permite la conectividad a una amplia gama de orígenes de datos, incluidos los datos de todos los tamaños y formas. Las experiencias de conectividad de datos son demasiado fragmentadas Coherencia de la experiencia y paridad de las funcionalidades de consulta en todos los orígenes de datos. A menudo, es necesario volver a dar forma a los datos antes del consumo Experiencia altamente interactiva e intuitiva para crear consultas de forma rápida e iterativa a través de cualquier origen de datos, de cualquier tamaño. Cualquier forma es puntual y no repetible Al usar Power Query para acceder a los datos y transformarlos, se define un proceso repetible (consulta) que se puede actualizar fácilmente en el futuro para obtener datos actualizados. Volumen (tamaños de datos), velocidad (velocidad de cambio) y variedad (amplitud de orígenes de datos y formas de datos) Power Query ofrece la capacidad de trabajar con un subconjunto de todo el conjunto de datos para definir las transformaciones de datos necesarias, lo que le permite filtrar y transformar fácilmente los datos en un tamaño administrable. Power Query proporciona conectividad con cientos de orígenes de datos y más de 350 tipos diferentes de transformaciones de datos para cada uno de estos orígenes. Fuente: https://learn.microsoft.com/es-es/power-query/power-query-what-is-power-query Temario Nivel básico Sesión Temario Semana 1 Introducción, extracción de datos y primeros gráficos Introducción, componentes, fases de trabajo Entorno de trabajo en Power BI Desktop Instalar Power BI Desktop Obtención de datos: Excel Obtención de datos: delimitados (Txt o Csv) Obtención de datos: desde web Obtención de datos: JSON Obtención de datos: Crear tablas Obtención de datos: desde One Drive Desarrollo de gráficos I (Barras, anillos y tablas) Tarjetas y filtros Proyecto I E T L Temario Nivel básico Sesión Temario Semana 2 Transformación de datos Combinar y dividir columnas Crear y utilizar parámetros Importar datos desde carpetas Combinar consultas Integrar datos anexando consultas Referenciar versus duplicar consultas Agrupar filas para crear agregados Dinamizar o anular dinamización en columnas Añadir lógicas de negocio condicional Configurar tipos de datos según configuración regional Utilizar primera fila como encabezados Limpiar y recortar datos Eliminar filas duplicadas Desarrollo de gráficos II (mapas, líneas con proyecciones, textos, embudos) Conexión de gráficos interactivos Proyecto II E T L TRANSFORMACIONES EN POWER QUERY 04 1. Combinar y dividir columnas Para el caso utilizaremos el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Producto” Enlace: https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=101511685610127635770&rtpof=tru e&sd=true Combinar columnas Para ingresar al Editor de Power Query, en Inicio, debemos seleccionar Transformar datos y luego el elemento Transformar datos Combinar columnas Una vez en el editor de Power Query, en el panel superior seleccionamos Transformar y luego Combinar columnas Combinar columnas Elegimos el separador y el nuevo nombre de la columna combinada Combinar columnas Podremos observar la nueva columna; sin embargo, también visualizaremos que las columnas que usamos como insumos han desaparecido. Para evitar esto, antes de la transformación debemos duplicar las columnas que deseamos mantener. Duplicar columnas Para duplicar una columna debemos seleccionar su encabeza y con clic derecho, abrir la ventana de opciones donde seleccionaremos “Duplicar columna” Dividir columnas Para este ejemplo, dentro del archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Producto”, dentro del Editor de Query, seleccionaremos la columna Rango Tamaño. Como podrán observar tiene datos en medida “centímetros” y en “tallas”. Nuestro objetivo será dividir ello para identificar las unidades de medida Dividir columnas Seleccionamos la columna que queremos dividir, le damos clic derecho, seleccionamos Dividir columna y en el desglose que aparecerá, elegimos la opción de Por delimitadorDividir columnas - Elegimos como delimitador Espacio - Seleccionamos como división en: Delimitador situado más a la izquierda Dividir columnas La columna se ha dividido en 2 y ha renombrado ambas columnas como: - RangoTamaño.1 - RangoTamaño.2 Dando doble clic en cualquiera de los encabezados podremos renombrar la nueva columna a “Unidad de medida” o lo que sea más conveniente. 2. Crear y utilizar parámetros C:\Power BI\Archivos_PowerBI\1 Ventas Adventure Works.xlsx parámetro Archivo Ruta de acceso 2. Crear y utilizar parámetros Es común que nuestros archivos se muevan de lugar por múltiples razones. El problema está en que si sucede esto y actualizamos nuestro modelo en Power BI, se romperá la conexión ya que Power BI no encontrará los archivos y esperará que conectemos uno por uno C:\Power BI\Archivos_PowerBI\Ventas.xlsx C:\Power BI\Archivos_PowerBI\Finanzas.xlsx C:\Power BI\Archivos_PowerBI\Clientes.xlsx C:\Power BI\Archivos_PowerBI\Campañas_publicitarias.xlsx 2. Crear y utilizar parámetros \Ventas.xlsx \Finanzas.xlsx \Clientes.xlsx \Campañas_publicitarias.xlsx Parámetro 1 Para evitar esto, podemos configurar parámetros, y simplemente se editaría el “parámetro” con la nueva ruta de acceso inicial, sabiendo que los archivos seguirán teniendo el mismo nombre. 2. Crear y utilizar parámetros En el editor de Query, dentro de Pasos aplicados podemos hacer clic dos veces en “Origen” y podremos observar la Ruta de acceso de archivo. Podremos copiar y pegar dicha ruta (sin seleccionar al archivo) 2. Crear y utilizar parámetros Una vez tengamos claro cuál es nuestra ruta de acceso, dentro de Inicio, seleccionaremos Administrar parámetros y luego Parámetro nuevo 2. Crear y utilizar parámetros Aquí podremos darle un nombre al nuevo parámetro y una descripción (opcional). En Tipo debemos seleccionar Texto y en Valores sugeridos Cualquier valor. Finalmente, en valor actual, debemos copiar la ruta de acceso. Es muy importante que aquí no se coloque el nombre del archivo y que se cierre la ruta con el símbolo “ \ ” 2. Crear y utilizar parámetros Automáticamente, al lado derecho observaremos que en la sección de consultas ahora puedes observarse el Parámetro que hemos creado. 2. Crear y utilizar parámetros Si regresamos a nuestro archivo original ahora en la barra de Inicio seleccionaremos: Configuración de origen de datos 2. Crear y utilizar parámetros Observaremos que aquí está la ruta de origen de nuestro archivo, por lo que seleccionaremos “Cambiar origen” 2. Crear y utilizar parámetros De forma predeterminada nos encontraremos en la opción de cambio Básico. Aquí podemos reajustar la ruta simplemente dando copiar y pegar; sin embargo, nuestro interés es dejar configurado un parámetro, por lo que vamos seleccionar Uso avanzado 2. Crear y utilizar parámetros Una vez que hemos elegido el Uso avanzado, al seleccionar el botón de ABC, podremos elegir el Parámetro que habíamos creado y de esa forma, repetir el proceso con cada archivo para que si hay algún cambio de datos con el origen, simplemente se tenga que actualizar el Parámetro 2. Crear y utilizar parámetros Debajo del parámetro elegido, colocaremos el nombre del archivo y al dar aceptar, nuestro parámetro ya estará configurado Parámetro Nombre de archivo 2. Crear y utilizar parámetros En adelante, si queremos actualizar el parámetro, solo debemos ir a Inicio, seleccionar Administrar parámetros y Editar parámetros. 3. Combinar consultas Dentro del Editor de Query, en inicio, seleccionaremos Combinar, luego Combinar consultas y finalmente Combinar consultas para crear una nueva Para el caso utilizaremos del archivo Excel “1 Ventas Adventure Works” las pestañas “Producto” y “subproducto” 3. Combinar consultas Primero, elegimos las 2 tablas que vamos a combinar. A continuación seleccionamos las cabeceras de columna que van a generar el puente entre ambas tablas. Finalmente, elegimos el tipo de combinación, dependiendo de qué deseamos observar en la nueva tabla (en este caso, migrar todos los datos de la tabla 1 y colocarles el nombre de la subcategoría) 3. Combinar consultas Dentro de la nueva tabla, vamos a observar que hay una columna con un botón de flechas a ambos lados, debemos seleccionarlo para expandir los nuevos datos. 3. Combinar consultas Elegimos Expandir y luego seleccionamos el campo Subcategoría 3. Combinar consultas Finalmente, tendremos la replica de la tabla Productos5 en una nueva tabla llamada Combinar1. Esta tabla va a indicar el nombre de la subcategoría cada vez que corresponda, debido a la combinación efectuada. 4. Importar datos desde carpetas Copiamos la ruta de la carpeta con 5 archivos TXT: C:\Power BI\Semana 2\1 Productos TXT 4. Importar datos desde carpetas Para este ejemplo, vamos a importar 5 archivos TXT al mismo tiempo, desde la carpeta 1 Productos TXT Enlace: https://drive.google.com/drive/folders/1qQPgZaupHX5nR5mpHM222VGmw8yx8B__?usp=sharing 4. Importar datos desde carpetas Copiamos la ruta de la carpeta 4. Importar datos desde carpetas Observamos los 5 archivos TXT que contiene la carpeta. Seleccionaremos: Combinar y transformar datos 4. Importar datos desde carpetas Configuraremos la combinación de los 5 archivos TXT según las características del primer archivo y seleccionaremos Aceptar 4. Importar datos desde carpetas Podremos observar en la columna Source.Name que la combinación es exitosa al observar que están las 5 líneas de productos. 5. Integrar datos anexando consultas en Power Query Para este ejercicio vamos a conectar 3 archivos TXT: Productos_M Productos_R Productos_T Como podremos observar en la columna ProductLine solo hay una letra por cada consulta En esta ocasión vamos a aprender a unir los 3 archivos, pero no buscando coincidencias (como en la combinación de datos) sino anexando filas 5. Integrar datos anexando consultas en Power Query Dentro de consultas, seleccionaremos Productos_M y luego en Inicio elegiremos combinar, anexar consultas y Anexar consultas para crear una nueva 5. Integrar datos anexando consultas en Power Query Es muy importante haber seleccionado primero al archivo inicial del anexo para que en base a ello, podamos anexar el resto de tablas. En caso tengamos más de 2 tablas por anexar, elegiremos la opción Tres o más tablas y seleccionando las tablas disponibles, elegiremos cuales Anexar 5. Integrar datos anexando consultas en Power Query Una vez hayamos seleccionado las 3 tablas podremos seleccionar Aceptar 5. Integrar datos anexando consultas en Power Query Observaremos que se habrá creado una nueva tabla llamada Anexar1 y que en la columna ProductLine ahora están los 3 productos anexados 6. Referenciar versus duplicar consultas En la sección de consultas, al hacer clic derecho en cada tabla, podremos seleccionar las opciones de Duplicar o Referencia. Duplicar: Crea una tabla idéntica al momento de la copia, inclusive, incluyendo las transformaciones y pasos aplicados al momento de la duplicidad. No tiene dependencia, por lo que si se continúan haciendo cambios en la tabla original, la tabla duplicada no cambiará. Referencia: Es una copia con dependencia al origen del que se referencia. Si se hacen cambios en los pasos aplicados de la tabla madre, las tablas referenciadas también cambiarán 7. Agrupar filas para crear agregados Luego, seleccionaremos la nueva consulta y elegiremos la opción de Agrupar por Primero vamos a crear una referencia a la tabla Ventas1 y la llamaremos Productos vendidos 7. Agrupar filas para crear agregados Para la agrupación, seleccionaremos las casillas con CodProducto, elegiremos como nombre total ventas y colocaremos Operación Suma, basado en la columna Ventas 7. Agrupar filas para crear agregadosAhora tendremos una tabla con el nombre Productos vendidos donde podremos observar por cada CodProducto el total de sus ventas Cabe resaltar que al ser una tabla referenciada, al actualizarse su tabla de origen, esta tabla conectada también actualizará sus totales. 8. Anular dinamización en columnas en Power Query Tablas pueden estar dinamizadas o apiladas (es decir, que pueden dinamizarse) Caso: Población Mundial - Wikipedia Enlace: https://es.wikipedia.org/wiki/Poblaci%C3%B3n_mundial Modelo no es conveniente para el modelo de datos de Power BI. La única columna estática debería ser la columna de “Año”, por lo que haremos clic derecho sobre cabecera de columna “Año” Al hacer clic derecho en Año seleccionaremos la opción de Anulación de dinamización de otras columnas 8. Anular dinamización en columnas en Power Query Al hacerlo, todas las columnas van a desglosarse en Atributo y Valor, donde el atributo contendrá a cada continente y el valor a la población que corresponde por Año y continente. Gracias a ello, podremos trabajar esta tabla con un modelo apropiado para Power BI. 8. Anular dinamización en columnas en Power Query Para este ejemplo, trabajaremos con la tabla de Ventas desde el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Producto”. Una vez en la tabla, para efectos del ejercicio, vamos a elegir solo las columnas que observamos en la imagen. 9. Dinamizar columnas en Power Query Enlace: https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=1015116856101276357 70&rtpof=true&sd=true Vamos a anular la dinamización de las columnas: Precio, Coste, Venta e IVA 9. Dinamizar columnas en Power Query Imaginemos que recibimos el archivo de este modo, con las medidas y valores en columnas. En este caso lo que necesitamos hacer es dinamizar las columnas para que cada medida tenga su propia columna. Para ello, seleccionaremos la columna que tenga los atributos y en transformar, buscaremos la opción columna dinámica. 9. Dinamizar columnas en Power Query 9. Dinamizar columnas en Power Query 9. Dinamizar columnas en Power Query En la ventana debemos elegir las valores para las nuevas columnas. En este caso seleccionaremos la columna “Valor” 9. Dinamizar columnas en Power Query Observaremos, entonces, como cada medida se ha convertido en una columna dinámica con sus valores correspondientes. 10. Añadir lógicas de negocio condicional Para el caso utilizaremos el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Clientes” Enlace: https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=101511685610127635770&rtpof=tru e&sd=true 10. Añadir lógicas de negocio condicional Aquí podremos configurar desde el nombre de la columna y las condiciones para la nueva columna 10. Añadir lógicas de negocio condicional Como podremos observar ahora tendremos una nueva columna con el condicionamiento elegido 11. Configurar tipos de datos según configuración regional En algunas ocasiones, según la configuración regional, se va a considerar la coma o punto decimal, por lo que habrá que hacer clic derecho en el encabezado de la columna, para luego seleccionar Cambiar tipo y Usar configuración regional 11. Configurar tipos de datos según configuración regional En configuración regional podremos elegir el símbolo que corresponderá para el punto o coma decimal según la región 12. Utilizar primera fila como encabezados En el caso la tabla no identifique de forma correcta el tipo de datos, tendremos que seleccionar en Transformar, la opción de Detectar tipo de datos 13. Limpiar y recortar datos Para el caso utilizaremos el archivo Excel “1 Ventas Adventure Works” conectando la pestaña “Clientes” Enlace: https://docs.google.com/spreadsheets/d/15x3l3xyYrffsDAkUqDGP5My_21aJ9OVg/edit?usp=sharing&ouid=101511685610127635770&rtpof=tru e&sd=true 13. Limpiar y recortar datos En algunas ocasiones observaremos que un dato aparece más de una vez dentro de la columna. Distinguimos diferencias entre minúsculas y mayúsculas. En otros casos está igual y aún así se repite. Hay que tomar en cuenta que el lenguaje que está detrás del editor de consultas es el lenguaje M y es muy sensible a mayúsculas y minúsculas. Esto nos llevar a realizar labores de limpieza. 13. Limpiar y recortar datos Seleccionando la columna donde queremos realizar la transformación, seleccionaremos la opción Transformar, luego Formato y finalmente Poner en Mayúscula Cada Palabra 13. Limpiar y recortar datos Con ello podremos garantizar limpieza de columna, pues retira espacios en blanco iniciales o finales de cada celda. 14. Eliminar filas duplicadas Seguimos en la tabla de Clientes. Trabajaremos en este ejemplo seleccionando la columna IdCliente. Luego en Inicio, elegiremos la opción Reducir filas, Quitar filas y finalmente Quitar duplicados DUDAS /hectorcastillobazan/ hcastillo@metrica23.com
Compartir