Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Machine Translated by Google manuel quintana Devin Caballero Cree paneles y visualizaciones para que sus datos cobren vida Microsoft Power BI Rápido mitchell pearson brian caballero Guía de inicio Machine Translated by Google BIRMINGHAM - BOMBAY Machine Translated by Google Editora de adquisiciones: Reshma Raman Editor de desarrollo de contenido: Mohammed Yusuf Imaratwale Primera publicación: julio de 2018 Editor encargado: Amey Varangaonkar Coordinador de producción: Aparna Bhagat Packt Publishing se ha esforzado por proporcionar información de marcas registradas sobre todas las empresas y productos mencionados en este libro mediante el uso apropiado de capitales. Sin embargo, Packt Publishing no puede garantizar la exactitud de esta información. Gráficos: Jason Monteiro Indexador: Rekha Nair Se ha hecho todo lo posible en la preparación de este libro para garantizar la exactitud de la información presentada. Sin embargo, la información contenida en este libro se vende sin garantía, ya sea expresa o implícita. Ni los autores, ni Packt Publishing ni sus comerciantes y distribuidores serán responsables de los daños causados o presuntamente causados directa o indirectamente por este libro. Corrector: Safis Editing Todos los derechos reservados. Ninguna parte de este libro puede reproducirse, almacenarse en un sistema de recuperación o transmitirse de ninguna forma ni por ningún medio sin el permiso previo por escrito del editor, excepto en el caso de citas breves incrustadas en artículos críticos o reseñas. Copyright © 2018 Packt Publishing Coordinador del proyecto: Hardik Bhinde ISBN 978-1-78913-822-1 Editor de textos: Safis Editing Livery Place 35 Livery Street Birmingham B3 2PB, Reino Unido. Editor técnico: Sushmeeta Jena Referencia de producción: 1280718 Publicado por Packt Publishing Ltd. Guía www.packtpub.com Inicio rápido de Microsoft Power BI Machine Translated by Google http://www.packtpub.com Mapt es una biblioteca digital en línea que le brinda acceso completo a más de 5000 libros y videos, así como herramientas líderes en la industria para ayudarlo a planificar su desarrollo personal y avanzar en su carrera. Para obtener más información, por favor visite nuestro sitio web. mapt.io Machine Translated by Google https://mapt.io/ Mejore su aprendizaje con Planes de habilidades creados especialmente para usted Mapt se puede buscar por completo Pase menos tiempo aprendiendo y más tiempo codificando con libros electrónicos y videos prácticos de más de 4000 profesionales de la industria Obtenga un libro electrónico o video gratis todos los meses Copie y pegue, imprima y marque contenido ¿Por qué suscribirse? Machine Translated by Google ¿Sabía que Packt ofrece versiones de libros electrónicos de cada libro publicado, con archivos PDF y ePub disponibles? Puede actualizar a la versión de libro electrónico en www.Pa cktPub.com y, como cliente del libro impreso, tiene derecho a un descuento en la copia del libro electrónico. Póngase en contacto con nosotros en service@packtpub.com para obtener más detalles. En www.PacktPub.com, también puede leer una colección de artículos técnicos gratuitos, suscribirse a una variedad de boletines gratuitos y recibir descuentos y ofertas exclusivos en libros y libros electrónicos de Packt. PacktPub.com Machine Translated by Google http://www.PacktPub.com http://www.PacktPub.com http://www.packtpub.com Este libro comienza muy bien con la introducción del paso más importante en el uso de Power BI: Obtener datos. Sin datos y el formato adecuado, las visualizaciones son inútiles. Los ejemplos son de las estructuras de datos más populares que se usan con Power BI. El segundo capítulo se centra en el Query Editor (Power Query) con ejemplos claros. El lenguaje R se explora a través de un ejemplo interesante. Hay una explicación simple del lenguaje M que ayuda a que el capítulo fluya hacia las consultas nativas. Este increíble equipo ha desarrollado un libro maravilloso para ayudar a los usuarios de Power BI a navegar por un producto que cambia con frecuencia. Sin embargo, han formateado el libro para ayudar a los usuarios más experimentados a saltar a cualquier capítulo para conocer una nueva característica de Power BI. El flujo es muy intuitivo y destaca la orientación necesaria para todo tipo de usuarios de Power BI. El libro sigue un método paso a paso para aprender sobre Power BI con ejemplos a lo largo del camino. Me gusta mucho cuando le dan crédito a un miembro de la comunidad de la plataforma de datos por el trabajo realizado y los enlaces a su información. La siguiente sección, sobre el modelado de datos, llega en el momento perfecto. El modelado de datos tiene que ser una de las áreas más importantes para los nuevos usuarios. Al explicar las relaciones, los escritores hacen un buen trabajo al relacionar estos temas complejos con Los equipos de Pragmatic Works que he conocido durante la última década han estado al tanto de las últimas tendencias en el mundo de Microsoft Business Intelligence. Mirando alrededor de mi oficina y mi casa, localicé cuatro libros que compré y que fueron escritos por empleados de Pragmatic Works. Han producido empleados de Microsoft y consultores independientes, así como algunos de los oradores más populares en conferencias de datos. Brian Knight fundó Pragmatic Works, y nunca me he aburrido en ninguna de sus sesiones a lo largo de los años. Devin Knight lidera un equipo de productores de contenido en línea que es insuperable. Mitchell Pearson tiene una manera brillante de presentar temas de BI con su aprendizaje e instrucciones en línea. Manual Quintana tiene una fuerte personalidad que le permite ser un orador eficaz. Prefacio Machine Translated by Google novatos Me gustan mucho los ejemplos de la sección de usabilidad para limpiar el modelo, como crear jerarquías y ordenar por una columna diferente. Arquitecto de almacén de datos y MVP de Microsoft Data Platform, Data on the Aprovechar DAX es una excelente continuación del modelado de datos. Aquí aprendemos algunas funciones básicas que casi siempre se usan; además, tenemos la sección de inteligencia de tiempo para rebanar y cortar en cubitos avanzados. Geaux Por supuesto, no se detiene allí. Las implementaciones en la nube se analizan en el siguiente capítulo. Esta es el área donde los usuarios finales pueden interactuar con los datos pero no modificar el tablero. El último capítulo concluye con Power BI Report Services. Esto ayuda a los usuarios de Power BI que necesitan implementar en un entorno local. Tener este capítulo directamente después del anterior les da a los lectores una comprensión de la flexibilidad que Microsoft nos ha brindado tan gentilmente. Después de todo eso, llegamos a lo divertido: las visualizaciones. El libro divide las visualizaciones en secciones que explican dónde es más útil cada visualización. Esto es lo correcto. Haytantos tipos de gráficos que alguien nuevo puede confundirse. Disfruté los comienzos de los capítulos, donde el espacio de trabajo de la aplicación está etiquetado con explicaciones. El capítulo de stroytelling toma las imágenes y las coloca en un formato para ayudar al usuario final a comprender los datos que se visualizan. El libro hace un gran trabajo al expandir los conceptos de la utilidad de los datos, una vez formateados. Los autores han hecho un trabajo A+ con este libro. Si eres un principiante, comienza en el primer capítulo. Si es un usuario intermedio, vaya al capítulo con el tema sobre el que necesita más información o ejemplos. Si es gerente, vaya a los dos últimos capítulos para averiguar dónde se pueden implementar estas visualizaciones en su empresa. Al proporcionar datos y el uso paso a paso de esos datos en un solo paquete, este libro es imprescindible para los usuarios de Power BI. Thomas Le Blanc Machine Translated by Google Colaboradores Machine Translated by Google Devin Knight , MVP de Microsoft Data Platform y director de capacitación en Pragmatic Works. En Pragmatic Works, Devin determina qué cursos se crean, entregan y actualizan para los clientes, incluidos más de 10 cursos de Power BI. Este es el séptimo libro de SQL Server y Business Intelligence que ha escrito. Devin suele hablar en conferencias como PASS Summit, PASS Business Analytics Conference, SQL Saturdays y Code Camps. También es miembro colaborador de varios capítulos virtuales de PASS. Con su hogar en Jacksonville, FL, Devin es el vicepresidente del grupo de usuarios de Power BI local y del grupo de usuarios de SQL Server (JSSUG). Su blog personal se puede encontrar en el sitio web de Devin Knight. Brian Knight es el propietario y fundador de Pragmatic Works, y es un emprendedor en serie que también ha puesto en marcha otras empresas. Brian es columnista colaborador de varias revistas técnicas. Es autor de 16 libros técnicos. Brian ha hablado en conferencias como PASS Summit, SQL Connections, TechEd, SQLSaturdays y Code Camps. Ha recibido una serie de premios del estado de Florida, tanto del gobernador como de la prensa, incluido el premio Business Ambassador (gobernador) y Top CEO (Jacksonville Magazine). Su blog se puede encontrar en el sitio web de Pragmatic Works. Mitchell Pearson ha trabajado para Pragmatic Works durante seis años como consultor de inteligencia comercial y gerente de contenido de capacitación. Mitchell tiene Sobre los autores debo dar gracias a Dios; sin Dios en mi vida, no sería tan bendecido como lo soy todos los días. Gracias por el increíble equipo de autores: Brian, Mitchell y Manuel han dedicado tiempo después de horas lejos de sus familias para crear este gran libro. A mi esposa, Erin, y mis tres hijos, Collin, Justin y Lana, quienes fueron todos pacientes durante las noches que papá tuvo que pasar escribiendo. Finalmente, me gustaría agradecer a Dirk Kalinowski, el mejor entrenador de ajedrez y boxeo que una estrella en ascenso como yo podría pedir. Sé que este será el año en que ganemos el título de campeón mundial de peso pesado. Gracias a todos los que hicieron posible este libro. Como siempre, tengo una gran deuda con mi esposa, Jenn, por aguantar mis trasnochadas, y con mis hijos, Colton, Liam, Camille y John, por ser tan pacientes con su padre cansado que siempre se ha esforzado demasiado. Finalmente, me gustaría agradecer a Shawn Trautman, mi instructor de baile en línea. Este será el año en que completaremos la meta del Consejo de Danza Occidental de United Country de hacer del baile en línea un deporte competitivo en todo el mundo. Machine Translated by Google Quisiera agradecer a Dios por los dones y oportunidades que me brindó y sobre todo por enviar a su hijo Jesucristo. Quisiera agradecer a mi esposa e hijos por su paciencia y apoyo mientras trabajaba en este libro. También me gustaría agradecer a Brian Knight por la oportunidad de aprender y crecer en el campo de Business Intelligence. Finalmente, me gustaría agradecer a Anthony Martin, Dustin Ryan, Bradley Schacht, Devin Knight, Jorge Segarra y Bradley Ball, cada una de estas personas me brindó orientación y orientación a lo largo de los años y tuvo un profundo impacto en mi carrera. Gracias a toda mi familia y amigos que me apoyan en todos mis esfuerzos. Debo agradecer especialmente a mi esposa por apoyarme durante las horas de trabajo y algunos fines de semana dedicados a escribir este libro, sin ella no sería la persona que estoy orgullosa de ser hoy. Además, debo dar las gracias a todos mis compañeros de Pragmatic Works; cada uno de ellos me ha guiado de una forma u otra, y todo mi éxito se remonta a ellos. Espero que todos los que se mencionan aquí se sientan orgullosos de lo que he hecho y de lo que lograré. Manuel Quintana es Gerente de Contenidos de Capacitación en Pragmatic Works. experiencia en el desarrollo de soluciones de BI de nivel empresarial utilizando el conjunto completo de productos ofrecidos por Microsoft (SSRS, SSIS, SSAS y Power BI). Mitchell es muy activo en la comunidad presentando en grupos de usuarios locales, eventos de sábado de SQL, capítulos virtuales de PASS y brindando seminarios web gratuitos para Pragmatic Works. Mitchell también se puede encontrar blogueando en el sitio web de Mitchellsql. Mitchell también es presidente del grupo de usuarios de Power BI local en Jacksonville, Florida. En su tiempo libre, Mitchell lo pasa con su esposa y sus tres hijos. Para divertirse, a Mitchell le gusta jugar juegos de mesa con amigos. Cuando no está trabajando en la creación de contenido nuevo para Pragmatic Works, probablemente lo encuentres jugando juegos de mesa o viendo partidos de fútbol. Anteriormente, se desempeñó como gerente sénior en la industria hotelera. Se unió al equipo de Pragmatic Works en 2014 sin ningún conocimiento en el espacio de Business Intelligence, pero ahora habla en los sábados de SQL y en los grupos de usuarios de SQL Server de forma local y virtual. También enseña varias tecnologías de BI a muchas empresas Fortune 500 diferentes en nombre de Pragmatic Works. Desde 2014, ha llamado hogar a Jacksonville y antes a Orlando, pero nació en la isla de Puerto Rico y le encanta volver y visitar a su familia. Machine Translated by Google Nick Lee es consultor de inteligencia empresarial y formador del equipo de formación de Pragmatic Works. Proviene de un entorno de servicio al cliente y tiene una amplia experiencia en presentaciones e interacción con grandes organizaciones. Su enfoque en Pragmatic Works es crear contenido de Power BI y brindar clases de Power BI a nuestros clientes. Sobre el revisor Machine Translated by Google Si está interesado en convertirse en autor de Packt, visite authors.packtp ub.com y presente su solicitud hoy. Hemos trabajado con milesde desarrolladores y profesionales de la tecnología, como usted, para ayudarlos a compartir sus conocimientos con la comunidad tecnológica mundial. Puede hacer una solicitud general, postularse para un tema candente específico para el que estamos reclutando un autor o enviar su propia idea. Packt está buscando autores como tú Machine Translated by Google http://authors.packtpub.com http://authors.packtpub.com Tabla de contenido Machine Translated by Google Conexión en vivo Importación de datos Resumen ¿Por qué suscribirse? Lo que cubre este libro Descargue los archivos de código de ejemplo Prefacio SQL Server como fuente Pagina del titulo Sobre el revisor Limitaciones Ponerse en contacto 1. Introducción a las opciones de importación de datos Guía de inicio rápido de Microsoft Power BI Prefacio Limitaciones PacktPub.com Para aprovechar al máximo este libro Excel como fuente para quien es este libro Empezando ¿Cual deberia elegir? Web como fuente Colaboradores Descarga las imágenes a color Sobre los autores DirectQuery Convenciones utilizadas Venta adicional de paquetes Packt está buscando autores como tú Derechos de autor y créditos Reseñas Machine Translated by Google Opciones avanzadas de transformación de datos Columnas condicionales Lenguaje de fórmula M Agregar columna de ejemplos La transformación R Script Cambiar tipo Instalacion y configuracion Eliminar columnas Adición de consultas Aprovechando R Usar la primera fila como encabezados Conceptos básicos de transformación Combinar consultas El editor de consultas de energía no pivotar Llenar hacia abajo #compartido Resumen 2. Estrategias de transformación de datos Machine Translated by Google Importación de la tabla de fechas Mesas de juego de rol Resumen Habilitar el filtrado desde el lado múltiple de una relación Crear jerarquías Dirección de filtrado cruzado Categorización de datos Relaciones de muchos a muchos Resumen predeterminado Cómo mostrar una columna pero ordenar por otra Trabajar con relaciones complejas Creando una nueva relación  Renombrar tablas y columnas Edición de relaciones Ocultar tablas y columnas 3. Construcción del modelo de datos Construcción de relaciones Mejoras de usabilidad Machine Translated by Google Medida calculada – agregaciones basicas Ventas totales Inteligencia del tiempo Medidas calculadas – los basicos Porcentaje del cálculo total Funciones de navegación – RELACIONADOS Calcular INTERRUPTOR() – desglose por edad Parámetros opcionales Filtro de contexto Cálculo de la edad Margen de beneficio Función de formato – Mes año Resumen Funciones de cadena – Mes año Ganancia Ventas del año anterior  Coste total Ventas del año hasta la fecha Ventas YTD (Calendario Fiscal) 4. Aprovechar las columnas calculadas de DAX Building Machine Translated by Google Consejos y trucos de visualización de datos Visualización de datos geográficos El filtro Top N La imagen de Slicer Visualización de datos de tendencia Gráficos combinados la mesa visual El mapa relleno visual Gráficos de barras y columnas El gráfico de embudo Aprovechar los objetos visuales personalizados de Power BI Resumen El indicador visual El mapa de árbol visual Visuales para filtrar Editar interacciones Visualización de datos tabulares Gráficos de líneas y áreas El mapa visual El gráfico de dispersión El KPI visual El panel de análisis El mapa de forma visual La matriz visual El gráfico de la cinta Mostrar valor como Visualización de datos categóricos El gráfico de la cascada El mapa de ArcGIS visual Filtrado interactivo Gráficos circulares y de anillos Conceptos básicos de visualización de datos Visualización de datos de KPI 5. Visualización de datos Machine Translated by Google Configuración de filtros de obtención de detalles panel de marcadores 6. Narración digital con Power BI Narración con el panel de selección y los marcadores Panel de selección Resumen Machine Translated by Google CUADERNOS Suscripción a informes y paneles Resumen CONJUNTOS DE DATOS Programación de actualizaciones de datos Hacer una pregunta a su tablero Configurar la seguridad a nivel de fila Implementación en el servicio Power BI Creando tu primer tablero espacios de trabajo Creación e interacción con tableros Compartiendo sus tableros 7. Uso de una implementación en la nube con el servicio Power BI Machine Translated by Google Otros libros que puede disfrutar Resumen Implementación en el servidor de informes de Power BI Deje un comentario: deje que otros lectores sepan lo que piensa Programación de actualizaciones de datos Protección de informes 8. Soluciones locales con Power BI Report Server Machine Translated by Google Como profesional de BI con experiencia, es posible que, en algún momento, haya considerado que sus habilidades son insustituibles. Sin embargo, mientras usted creaba incansablemente las soluciones de almacenamiento de datos más elegantes, Microsoft estaba ocupado creando un nuevo conjunto de herramientas de análisis e inteligencia empresarial de autoservicio llamado Power BI. Rápidamente, Power BI se ha convertido en una de las herramientas más populares del mercado, y los usuarios buscan su consejo sobre cómo deben implementar las mejores prácticas y escalar su propio uso de la herramienta. Si bien sus soluciones de BI corporativas siempre serán el estándar de oro para la estrategia de datos empresariales de su empresa, ya no puede ignorar el hambre de su empresa por disputar datos de autoservidor. En este libro, aprenderá cómo cerrar la brecha de su conjunto de habilidades de BI corporativo existente en lo que es posible con Power BI. Comprenderá cómo conectarse a las fuentes de datos mediante las opciones de importación y consulta directa. Luego, aprenderá a usar de manera efectiva el Editor de consultas de Power BI para realizar transformaciones y procesos de limpieza de datos en sus datos. Esto incluirá el uso de secuencias de comandos R y transformaciones de consulta M avanzadas. A continuación, aprenderá a diseñar correctamente su modelo de datos para navegar por las relaciones de tablas y usar fórmulas DAX para mejorar su usabilidad. La visualización de sus datos es otro elemento clave de este libro, ya que aprenderá estilos adecuados de visualización de datos y técnicas mejoradas de narración digital. Finalmente, al final de este libro, comprenderá cómo administrar el entorno Power BI de su empresa para que la implementación se pueda realizar sin problemas, las actualizaciones de datos se puedan ejecutar correctamente y la seguridad se pueda implementar por completo. Prefacio Machine Translated by Google Este libro está dirigido a profesionales de inteligencia empresarial que tienen experiencia con herramientas de BI empresarial tradicionales en el pasado y ahora necesitan una guía para impulsar su conocimiento de Power BI. Las personas nuevas en inteligencia comercial también ganarán mucho con la lectura de este libro, pero se asumirá elconocimiento de alguna terminología de la industria. Los conceptos tratados en este libro también pueden ser útiles para los gerentes de BI que inician la implementación de BI de autoservicio en sus empresas. El conocimiento previo de Power BI es útil, pero ciertamente no es un requisito para este libro. para quien es este libro Machine Translated by Google Específicamente, este capítulo le enseñará a la audiencia cómo establecer relaciones entre tablas, cómo lidiar con diseños de relaciones complejos y cómo implementar mejoras de usabilidad para los consumidores de informes. En este capítulo, los lectores aprenderán que mientras diseñan un modelo de datos, realmente se están preparando para el éxito cuando se trata de crear informes. El Capítulo 1, Primeros pasos con la importación de datos, comienza orientando a la audiencia con Power BI Desktop. A continuación, aprenderán a conectarse a varias fuentes de datos comunes en Power BI. Una vez que se elige una fuente de datos, se explorarán las opciones dentro, incluida la elección entre importación de datos, consulta directa y conexión en vivo. El Capítulo 4, Aprovechamiento de DAX, enseña que el lenguaje de expresión de análisis de datos (DAX) dentro de Power BI es fundamental para crear modelos de datos que sean valiosos para los consumidores de datos. Si bien DAX puede resultar intimidante al principio, los lectores aprenderán rápidamente que sus raíces provienen del motor de fórmulas de Excel. Esto puede ser útil al principio, pero a medida que encuentre la necesidad de desarrollar cálculos cada vez más complejos, los lectores aprenderán que tener experiencia en fórmulas de Excel solo los llevará hasta cierto punto. Este capítulo comenzará con una comprensión de los conceptos básicos de DAX, pero se acelerará rápidamente hacia ideas más complejas, como Time Intelligence y Filter Context. El Capítulo 5, Visualización de datos, describe cómo tomar un modelo de datos finamente ajustado El Capítulo 3, Creación del modelo de datos, analiza una de las partes más importantes de la creación de una solución de Power BI exitosa: el diseño de un modelo de datos eficaz. El Capítulo 2, Estrategias de transformación de datos, explora las capacidades del Editor de Power Query dentro de Power BI Desktop. Con este editor de consultas de Power BI, el lector primero aprenderá a realizar transformaciones básicas y aprenderá rápidamente prácticas más avanzadas de limpieza de datos. Al final de este capítulo, la audiencia sabrá cómo combinar consultas, usar parámetros y leer y escribir consultas M básicas. Lo que cubre este libro Machine Translated by Google y cree informes que transmitan correctamente un mensaje que cuente una historia sobre los datos de manera clara y concisa. El Capítulo 7, Uso de una implementación en la nube con el servicio Power BI, examina la implementación de su solución en el servicio Power BI para compartir lo que ha desarrollado con su organización. Una vez implementado, puede crear paneles, compartirlos con otros y programar actualizaciones de datos. Este capítulo cubrirá las habilidades esenciales que un profesional de BI necesitaría saber para complementar una solución de Power BI que haya desarrollado. El Capítulo 8, Soluciones locales con Power BI Report Server, explora cuántas organizaciones han decidido que aún no están listas para migrar a la nube. Al usar la nube de Power BI Report Server, las organizaciones cautelosas obtienen el beneficio de los informes de Power BI sin comprometer sus sentimientos acerca de la nube. Este capítulo cubrirá la implementación en la nube de Power BI Report Server, el uso compartido de informes con otros y la actualización de datos. El Capítulo 6, Narración digital con Power BI, cubre la capacidad que tiene Power BI para ser mucho más que una simple herramienta de generación de informes de arrastrar y soltar. Con las funciones de narración de los filtros de obtención de detalles, los marcadores y el panel de selección, tiene la capacidad de diseñar informes que no solo muestran datos, sino que también cuentan historias atractivas que hacen que los usuarios anhelen más. Machine Translated by Google Después de descargar e instalar Power BI Desktop, podrá seguir la mayoría de los ejemplos de este libro. Al suscribirse a la licencia de Power BI Pro, puede seguir todos los ejemplos de este libro. También hay archivos complementarios que puede descargar para seguir los ejemplos del libro. Para aprovechar al máximo este libro Machine Translated by Google El paquete de códigos para el libro también está alojado en GitHub en https://github.com/Pac ktPublishing/Microsoft-Power-BI-Quick-Start-Guide/. En caso de que haya una actualización del código, se actualizará en el repositorio de GitHub existente. Una vez descargado el archivo, asegúrese de descomprimir o extraer la carpeta con la última versión de: 2. Seleccione la pestaña SOPORTE. WinRAR/7-Zip para Windows 3. Haga clic en Descargas de códigos y erratas. Puede descargar los archivos de código de ejemplo para este libro desde su cuenta en www.packtpub.com. Si compró este libro en otro lugar, puede visitar www.packtpu b.com/support y registrarse para recibir los archivos directamente por correo electrónico. Zipeg/iZip/UnRarX para Mac 4. Introduzca el nombre del libro en el cuadro de búsqueda y siga las instrucciones en pantalla. Puede descargar los archivos de código siguiendo estos pasos: 7-Zip/PeaZip para Linux instrucciones. Descargue los archivos de código de ejemplo 1. Inicie sesión o regístrese en www.packtpub.com. También tenemos otros paquetes de códigos de nuestro rico catálogo de libros y videos disponibles en https://github.com/PacktPublishing/. ¡Échales un vistazo! Machine Translated by Google https://github.com/PacktPublishing/Microsoft-Power-BI-Quick-Start-Guide/ https://github.com/PacktPublishing/Microsoft-Power-BI-Quick-Start-Guide/ http://www.packtpub.com http://www.packtpub.com/support http://www.packtpub.com/support http://www.packtpub.com/support https://github.com/PacktPublishing/ t/files/downloads/ Microsoft PowerBIQuickStartGuide_ColorImages.pdf. Descarga las imágenes a color También proporcionamos un archivo PDF que tiene imágenes en color de las capturas de pantalla/ diagramas utilizados en este libro. Puede descargarlo aquí: http://www.packtpub.com/sites/defaul Machine Translated by Google http://www.packtpub.com/sites/default/files/downloads/ http://www.packtpub.com/sites/default/files/downloads/ CodeInText: indica palabras de código en texto, nombres de tablas de bases de datos, nombres de carpetas, nombres de archivos, extensiones de archivos, nombres de rutas, direcciones URL ficticias, entrada de usuario y identificadores de Twitter. Aquí hay un ejemplo: "Monte el archivo de imagen de disco WebStorm-10*.dmg descargado como otro disco en su sistema". Hay una serie de convenciones de texto utilizadas a lo largo de este libro. Negrita: indica un nuevotérmino, una palabra importante o palabras que ve en pantalla. Por ejemplo, las palabras en los menús o cuadros de diálogo aparecen en el texto de esta manera. Este es un ejemplo: "Seleccione Información del sistema en el panel de administración". Las advertencias o notas importantes aparecen así. Los consejos y trucos aparecen así. Convenciones utilizadas Machine Translated by Google Errata: Aunque hemos tomado todas las precauciones para garantizar la precisión de nuestro contenido, los errores ocurren. Si ha encontrado un error en este libro, le agradeceríamos que nos lo informara. Visite www.packtpub.com/submit-errata , seleccione su libro, haga clic en el enlace Formulario de envío de erratas e ingrese los detalles. Comentarios generales: envíe un correo electrónico a feedback@packtpub.com y mencione el título del libro en el asunto de su mensaje. Si tiene preguntas sobre cualquier aspecto de este libro, envíenos un correo electrónico a question@packtpub.com. Si está interesado en convertirse en autor: si hay un tema en el que tiene experiencia y está interesado en escribir o contribuir a un libro, visite authors.packtpub.com. Piratería: si encuentra copias ilegales de nuestros trabajos en cualquier forma en Internet, le agradeceríamos que nos proporcionara la dirección de la ubicación o el nombre del sitio web. Póngase en contacto con nosotros en copyright@packtpub.com con un enlace al material. Los comentarios de nuestros lectores es siempre bienvenido. Ponerse en contacto Machine Translated by Google http://www.packtpub.com/submit-errata http://www.packtpub.com/submit-errata http://authors.packtpub.com/ Por favor, deje una reseña. Una vez que haya leído y usado este libro, ¿por qué no deja una reseña en el sitio donde lo compró? Los lectores potenciales pueden ver y usar su opinión imparcial para tomar decisiones de compra, nosotros en Packt podemos entender lo que piensa sobre nuestros productos y nuestros autores pueden ver sus comentarios sobre su libro. ¡Gracias! Reseñas Para obtener más información sobre Packt, visite packtpub.com. Machine Translated by Google https://www.packtpub.com/ Sin embargo, desde su perspectiva, lo realmente emocionante puede ser que los problemas de desarrollo que antes le tomaban semanas resolver en una solución de BI corporativa ahora se pueden resolver en solo unas horas. El uso de la aplicación Power BI Desktop le permite definir sus pasos de descubrimiento y preparación de datos, organizar su modelo de datos y diseñar visualizaciones de datos atractivas en sus informes. En este primer capítulo, se presentará el entorno de desarrollo y se explorará en profundidad el proceso de descubrimiento de datos. Los temas detallados en este capítulo incluyen lo siguiente: Power BI puede muy bien ser una de las herramientas mejor nombradas jamás desarrolladas por Microsoft, brindando a los analistas y desarrolladores un potente campo de análisis e inteligencia comercial al mismo tiempo que lo empaqueta en una aplicación sorprendentemente liviana. Con Microsoft Power BI, los procesos de descubrimiento de datos, modelado de datos, visualización de datos y uso compartido se simplifican elegantemente con un solo producto. Estos procesos son tan comunes cuando se desarrollan soluciones de Power BI que este libro ha adoptado secciones que siguen este patrón. Power BI es una oferta de software como servicio (SaaS) en la nube de Azure y, como tal, el equipo de productos de Microsoft sigue una estrategia de nube primero a medida que desarrollan y agregan nuevas funciones al producto. Sin embargo, esto no significa que Power BI solo esté disponible en la nube. Microsoft presenta dos opciones para compartir sus resultados con otros. El primer método, el más utilizado, es el servicio Power BI alojado en la nube, que está disponible para los usuarios por una tarifa de suscripción mensual baja. La segunda opción es el Power BI Report Server local, que se puede obtener a través de su licencia de SQL Server con Software Assurance o un nivel de suscripción conocido como Power BI Premium. Ambas soluciones requieren una herramienta de desarrollo llamada Power BI Desktop, que está disponible de forma gratuita, y es donde debe comenzar a diseñar sus soluciones. Primeros pasos con la importación Opciones de datos Machine Translated by Google Empezando Importación de datos Conexión en vivo Consulta directa Machine Translated by Google Una vez que descargue, instale e inicie Power BI Desktop, es probable que la pantalla Inicio le dé la bienvenida, que está diseñada para ayudar a los nuevos usuarios a encontrar su camino. Cierra esta pantalla de inicio para que podamos revisar algunas de las funciones más utilizadas de la aplicación: Power BI Desktop está disponible de forma gratuita y se puede encontrar a través de un enlace de descarga directa en Power BI (https://powerbi.microsoft.com/), o instalándolo como una aplicación desde la Tienda Windows. Hay varios beneficios en el uso de la aplicación Windows Store Power BI, incluidas las actualizaciones automáticas, no se requieren privilegios de administrador y facilita la implementación planificada de TI de Power BI. Si está utilizando el Power BI Report Server local para su estrategia de implementación, debe descargar un Power BI Desktop diferente, que está disponible haciendo clic en las opciones de descarga avanzadas en https:// powerbi.microsoft.com/ en- us/ report-server/. Se requiere una instalación independiente porque las actualizaciones se publican con más frecuencia para Power BI en la nube. Este libro se escribirá principalmente bajo la suposición de que el lector está utilizando el servicio Power BI alojado en la nube como su estrategia de implementación. Empezando Machine Translated by Google https://powerbi.microsoft.com/ https://powerbi.microsoft.com/en-us/report-server/ Machine Translated by Google Siguiendo las figuras numeradas, conozcamos los nombres y propósitos de algunas de las características más importantes de Power BI Desktop: Editar consultas: inicia Power Query Editor, que se utiliza para aplicar transformaciones de datos a los datos entrantes. Esta es la vista predeterminada que se abre cuando se inicia Power BI Desktop. Obtener datos: se utiliza para seleccionar y configurar fuentes de datos. Vista de informe: el lienzo del informe utilizado para diseñar visualizaciones de datos. Vista de datos: proporciona una vista de los datos en su modelo. Esto se parece a una hoja de cálculo típica de Excel, pero es de solo lectura. Vista de relaciones: se usa principalmente cuando su modelo de datos tiene varias tablas y es necesario definir relaciones entre ellas. Escritorio de Power BI Machine Translated by Google Power BI es mejor conocido por las impresionantes visualizaciones de datos y las capacidades de tablero que tiene. Sin embargo, antes de que pueda comenzar a crear informes, primero debe conectarsea las fuentes de datos necesarias. Dentro de Power BI Desktop, un desarrollador tiene más de 80 conectores de datos únicos para elegir, que van desde tipos de archivos tradicionales, motores de bases de datos, soluciones de big data, fuentes en la nube, datos almacenados en una página web y otros proveedores de SaaS. Este libro no cubrirá los 80 conectores disponibles, pero destacará algunos de los más populares. Elegir importar datos, que es la opción más común y el comportamiento predeterminado, significa que Power BI extraerá físicamente filas de datos del origen seleccionado y las almacenará en un motor de almacenamiento en memoria dentro de Power BI. Power BI Desktop utiliza un método especial para almacenar datos, conocido como xVelocity, que es una tecnología en memoria que no solo aumenta el rendimiento de los resultados de su consulta, sino que también puede comprimir en gran medida la cantidad de espacio que ocupa su solución Power BI. En algunos casos, la compresión que tiene lugar puede incluso reducir el espacio en disco necesario hasta una décima parte del tamaño de la fuente de datos original. El motor xVelocity utiliza una instancia local invisible de SQL Server Analysis Services (SSAS) para proporcionar estas capacidades en memoria. ¿Cómo se actualizan los datos que se han importado a Power BI? Al establecer una conexión a una fuente de datos, es posible que se le presente una de tres opciones diferentes sobre cómo deben tratarse sus datos: Importación, DirectQuery o Conexión en vivo. Esta sección se centrará específicamente en la opción Importar. El uso de la opción de importación dentro de Power BI tiene consecuencias que también debe considerar. Estas consecuencias se discutirán más adelante en este capítulo, pero a medida que siga leyendo, considere lo siguiente: ¿Qué pasa si necesito un tablero para mostrar análisis casi en tiempo real? Importación de datos Machine Translated by Google ¿Cuántos datos se pueden importar realmente a un sistema de almacenamiento en memoria? Machine Translated by Google Lo crea o no, Excel continúa siendo la aplicación más popular del mundo y, como tal, debe esperar que en algún momento lo use como fuente de datos: si aparece automáticamente. 3. Navegue y abra el archivo llamado AdventureWorksDW.xlsx de los recursos del libro. Esto abrirá el cuadro de diálogo Navegador, que se utiliza para seleccionar los objetos en el libro de Excel del que desea tomar datos: 1. Para comenzar, abra Power BI Desktop y cierre la pantalla de inicio 2. Debajo de la cinta Inicio, encontrará el botón Obtener datos, que ya aprendió que se usa para seleccionar y configurar fuentes de datos. Si selecciona la flecha hacia abajo junto al botón, verá los conectores más comunes, pero si selecciona el centro del botón, se abrirá la lista completa de todos los conectores disponibles. Independientemente de la forma en que seleccione el botón, encontrará Excel en la parte superior de ambas listas. Excel como fuente Machine Translated by Google Machine Translated by Google 5. Al seleccionar Cargar, se tomarán inmediatamente los datos del seleccionado. 4. En este ejemplo, verá seis hojas de cálculo separadas entre las que puede elegir. Como aprenderá más sobre esto más adelante, simplemente seleccione Cargar para finalizar este ejemplo. hojas de cálculo e importarlas como tablas separadas en su modelo de datos de Power BI. Al elegir Editar, se abrirá una ventana completamente nueva llamada Power Query Editor que le permite aplicar reglas comerciales o transformaciones antes de importarlo. Aprenderá mucho más sobre Power Query Editor en el Capítulo 2, Estrategias de transformación de datos. Al hacer clic una vez en el nombre de la hoja de cálculo, obtendrá una vista previa de los datos que almacena, mientras que al hacer clic en la casilla de verificación junto al nombre, se incluirán como parte de la importación de datos. Para este ejemplo, seleccione las casillas de verificación junto a todos los objetos disponibles, luego observe las opciones disponibles en la parte inferior derecha. Otro tema sobre el que obtendrá más información en el Capítulo 7, Uso de una implementación en la nube con el servicio Power BI, es el concepto de actualización de datos. Esto es importante porque, cuando importa datos a Power BI, esos datos permanecen estáticos hasta que se inicia otra actualización. Esta actualización puede iniciarse manualmente o configurarse de forma programada. Esto también requiere la instalación de una puerta de enlace de datos, la aplicación a cargo de enviar datos de forma segura al servicio Power BI. Siéntase libre de pasar al Capítulo 7, Uso de una implementación en la nube con el servicio Power BI, si la configuración de una actualización de datos es un tema que necesita saber. ahora. Machine Translated by Google Otra fuente común diseñada para bases de datos relacionales es Microsoft SQL 1. Para conectarse a SQL Server, seleccione el botón Obtener datos nuevamente, pero esta vez seleccione SQL Server. Aquí, debe proporcionar el servidor, pero la base de datos es opcional y se puede seleccionar más adelante: Servidor: 2. Por primera vez, se le pedirá que elija el tipo de modo de conectividad de datos que le gustaría. Como se mencionó anteriormente, Importar es el modo predeterminado, pero opcionalmente puede seleccionar DirectQuery. DirectQuery se analizará con mayor detalle más adelante en este capítulo. Expandir las opciones Avanzadas proporciona una forma de insertar una instrucción SQL que puede usarse como su fuente. Para el siguiente ejemplo, en el servidor es la única propiedad que se completa antes de hacer clic en Aceptar: SQL Server como fuente Machine Translated by Google 4. Haga clic en Conectar después de proporcionar las credenciales adecuadas para iniciar el mismo cuadro de diálogo Navegador que puede recordar cuando se conectó a Excel. Aquí, seleccionará las tablas, vistas o funciones dentro de su base de datos de SQL Server que desea importar a su solución Power BI. Una vez más, el paso final de este cuadro de diálogo le permite elegir Cargar o Editar los resultados. 3. A continuación, se le pedirá que proporcione las credenciales que está utilizando para conectarse al servidor de la base de datos que proporcionó en la pantalla anterior. Machine Translated by Google Para este ejemplo, imagine que está trabajando para un importante fabricante de automóviles en los Estados Unidos. Ya ha diseñado una solución de Power BI utilizando datos disponibles internamente dentro de su organización que muestra patrones históricos en las tendencias de ventas. Sin embargo, le gustaría determinar si existen correlaciones en períodos de precios de combustible históricamente más altos y ventas de automóviles más bajas. Afortunadamente, descubrió que el Departamento de Trabajo de los EstadosUnidos publica públicamente los precios promedio históricos al consumidor de muchos artículos comprados comúnmente, incluidos los precios del combustible. 1. Ahora que comprende el escenario dentro de Power BI Desktop, seleccione el botón Obtener datos y elija Web como fuente. Luego se le pedirá que proporcione la URL donde se pueden encontrar los datos. En este ejemplo, los datos se pueden encontrar buscando en el sitio web Data.Gov (https://www.data.gov/) o, para ahorrar tiempo, use el enlace directo: https://download.bls.gov/pub/time.series/ap/ ap.data.2.Gasoline. Una vez que proporcione la URL, haga clic en Aceptar: Una agradable sorpresa para muchos desarrolladores de Power BI es la disponibilidad de un conector web. El uso de este tipo de conexión le permite obtener datos de archivos almacenados en un sitio web o incluso datos que se han incrustado en una tabla HTML en la página web. El uso de este tipo de conector a menudo puede ser útil cuando desea complementar sus fuentes internas de datos corporativos con información que se puede encontrar públicamente en Internet. Web como fuente Machine Translated by Google https://www.data.gov/ https://download.bls.gov/pub/time.series/ap/ap.data.2.Gasoline Observe en la siguiente pantalla que Power BI Desktop reconoce la URL proporcionada como un archivo delimitado por tabulaciones que ahora se puede agregar fácilmente a cualquier modelo de datos existente que haya diseñado. 2. A continuación, es probable que se le solicite un cuadro de diálogo Acceder al contenido web. Esto es importante cuando está utilizando una fuente de datos que requiere un inicio de sesión para acceder. Dado que esta fuente de datos no requiere un inicio de sesión para encontrar los datos, simplemente puede seleccionar el acceso anónimo, que es el predeterminado, y luego hacer clic en Conectar: Machine Translated by Google Todas estas son excelentes preguntas que tendrían muchas respuestas negativas si la única forma de conectarse a sus datos fuera importando su fuente a Power BI. Afortunadamente, hay otra manera. Con DirectQuery, Power BI le permite conectarse directamente a una fuente de datos para que no se importen ni copien datos en Power BI Desktop. Es probable que muchos de ustedes hayan estado tratando de imaginar cómo pueden implementar estas importaciones de datos en su entorno. Usted puede hacerse preguntas como las siguientes: ¿Cómo manejo el requisito de mostrar los resultados en tiempo real desde la fuente? ¿Por qué es esto algo bueno? Considere las preguntas que se hicieron al comienzo de esta sección. Dado que no se importan datos a Power BI Desktop, eso significa que es menos importante cuán poderosa es su computadora portátil personal porque todos los resultados de las consultas ahora se procesan en el servidor de origen en lugar de su computadora portátil. También significa que no es necesario actualizar los resultados en Power BI porque cualquier informe que diseñe siempre apunta a una versión activa de la fuente de datos. ¡Eso es un gran beneficio! Se puede habilitar esta característica simplemente seleccionando DirectQuery durante la configuración de una fuente de datos. La siguiente captura de pantalla muestra una conexión a una base de datos de SQL Server con la opción DirectQuery seleccionada: Si los datos importados a Power BI usan una tecnología en memoria, ¿mi empresa me proporcionó una máquina que tiene suficiente memoria para manejar esto? ¿Realmente voy a importar mi tabla de origen con decenas de miles de millones de filas en la memoria? DirectQuery Machine Translated by Google Anteriormente en este capítulo, la aplicación Data Gateway se mencionó como un requisito para programar actualizaciones de datos para fuentes que usaron la opción de importación. Esta misma aplicación también se necesita con DirectQuery si sus datos son una fuente local. Aunque no hay una actualización de datos programada, aún se requiere Data Gateway para enviar datos locales a la nube. Nuevamente, esto se analizará con mayor profundidad en el Capítulo 7, Uso de una implementación en la nube con el servicio Power BI. Machine Translated by Google SQL Server Teradata Database Vertica Entonces, si DirectQuery es tan bueno, ¿por qué no elegirlo siempre? Bueno, con cada gran característica también encontrarás limitaciones. La primera limitación evidente es que no todas las fuentes de datos admiten DirectQuery. En el momento en que se escribió este libro, las siguientes fuentes de datos admiten DirectQuery en Power BI: Servidor de aplicaciones SAP Business Warehouse Servidor de mensajes SAP Business Warehouse SAP HANA Snowflake Spark (Versión 0.9 y superior) Según la fuente de datos que elija, existe la posibilidad de que el rendimiento de las consultas sea más lento al usar DirectQuery en comparación con la opción de importación de datos predeterminada. Tenga en cuenta que cuando se selecciona la opción de importación, se aprovecha un motor de almacenamiento en memoria altamente sofisticado. Al seleccionar DirectQuery, el rendimiento dependerá del tipo de fuente que haya elegido de la lista anterior. Otra limitación que vale la pena señalar es que no todas las características de Power BI son compatibles cuando elige DirectQuery. Por ejemplo, dependiendo de la fuente seleccionada, algunas funciones de Power Query Editor están deshabilitadas y podrían Amazon Redshift Azure HDInsight Spark Azure SQL Database Azure SQL Data Warehouse Google BigQuery IBM Netezza Impala (Versión 2.x) Base de datos Oracle (versión 12 y superior) Limitaciones Machine Translated by Google Puede activar las funciones que bloquea DirectQuery yendo a Archivo | Opciones y configuraciones | Opciones | DirectQuery | Permitir medidas sin restricciones en modo DirectQuery. Cuando se selecciona esta opción, se puede usar cualquier expresión DAX que sea válida para una medida. Sin embargo, debe saber que seleccionar esto puede resultar en un rendimiento de consulta muy lento cuando se utilizan estas funciones bloqueadas. resultado en el siguiente mensaje: Este paso da como resultado una consulta que no se admite en el modo DirectQuery. Otro ejemplo es que algunas funciones DAX no están disponibles cuando se usa DirectQuery. Por ejemplo, varias funciones de Time Intelligence como TotalYTD generarían el siguiente tipo de error al usar DirectQuery: El motivo de esta limitación es que DirectQuery intenta convertir automáticamente funciones DAX como esta en una consulta en el idioma nativo del origen de datos. Por lo tanto, si el origen de esta solución fuera SQL Server, Power BI intentaría convertir esta función DAX en un script T SQL comparable. Una vez que Power BI se da cuenta de que la función DAX utilizada no es compatible con la fuente, se genera el error. Machine Translated by Google Al igual que DirectQuery, cuando usa una conexión en vivo,en realidad no se importan datos a Power BI. En cambio, su solución apunta directamente a la fuente de datos subyacente y aprovecha Power BI Desktop simplemente como una herramienta de visualización de datos. Entonces, si estas dos cosas son tan similares, ¿por qué darles nombres diferentes? La respuesta es porque aunque el concepto básico es el mismo, DirectQuery y Live Connection varían mucho. Tabla de servicios de análisis de SQL Server La razón por la que el rendimiento no se ve afectado por estas fuentes de datos es que utilizan el mismo motor xVelocity que Power BI u otro motor de almacenamiento de alto rendimiento. Para configurar su propia conexión en vivo a una de estas fuentes, puede elegir la base de datos de SQL Server Analysis Services de la lista de fuentes después de seleccionar Obtener datos. Aquí, puede especificar que la conexión debe ser activa: Una diferencia que debería notarse rápidamente es la experiencia de rendimiento de las consultas. Se mencionó en la última sección que DirectQuery a menudo puede tener un rendimiento deficiente según el tipo de fuente de datos. Con Live Connection, generalmente no tendrá ningún problema de rendimiento porque solo es compatible con los siguientes tipos de fuentes de datos: El concepto básico de Live Connection es muy similar al de DirectQuery. SQL Server Analysis Services Multidimensional Servicio Power BI Conexión en vivo Machine Translated by Google Si un conjunto de datos está configurado para Live Connection o DirectQuery, puede esperar que se produzcan actualizaciones automáticas aproximadamente cada hora o cuando se produzca una interacción con los datos. Puede ajustar manualmente la frecuencia de actualización en la opción Actualización de caché programada en el servicio Power BI. Machine Translated by Google Lo que encontrará con Live Connections son limitaciones que generalmente son el resultado del hecho de que Analysis Services es una herramienta de BI empresarial. Las funciones de modelado, como la definición de relaciones, no están disponibles porque se diseñarían en un modelo de Analysis Services. Además, Power Query Editor no está disponible en absoluto en una fuente de Live Connection. Si bien a veces esto puede ser frustrante, tiene sentido que funcione de esta manera porque cualquiera de los cambios que desee realizar con las relaciones o en el editor de consultas debe realizarse en Analysis Services, no en Power BI. Por lo tanto, si va a conectarse a él, es probable que su equipo de TI ya haya realizado una importante limpieza y modelado de datos. Hasta ahora, ¡esto suena genial! Ahora ha aprendido que puede conectarse directamente a sus fuentes de datos, sin importar datos a su modelo, y no tendrá consecuencias significativas en el rendimiento. Por supuesto, estos beneficios no se obtienen sin renunciar a algo, entonces, ¿cuáles son las limitaciones de Live Connection? Limitaciones Machine Translated by Google XDisponibilidad de fuentes de datos data, usted debe preguntarse cuál es la mejor opción para usted. Es justo decir que el DirectQuery sobre qué opción es mejor para usted. incluido con este libro. En este archivo, puede clasificar (del 1 al 10) el Datos X La mejor experiencia de diseño Vivir X proyecto que tienes. Para resumir, algunas de las consideraciones que se X Más escalable Consideración Ahora que ha aprendido acerca de las tres formas diferentes de conectarse a su la elección que haga dependerá realmente de los requisitos de cada individuo X importancia de cada una de estas consideraciones para ayudarle a orientarse Lo mejor para mantener los datos actualizados Importar Entonces, para hacer esto más personal, intente usar el archivo Decision Matrix que es Algunos de estos elementos a considerar pueden ser más importantes que otros para usted. Conexión X Mejor actuacion mencionados en este capítulo se enumeran en la siguiente tabla: X X ¿Cual deberia elegir? Machine Translated by Google Dado que la opción Importación de datos presenta la mayoría de las funciones disponibles, en adelante, este libro utiliza principalmente esta opción. En el Capítulo 2, Estrategias de transformación de datos, aprenderá cómo implementar estrategias de transformación de datos para garantizar que se apliquen todas las reglas comerciales necesarias a sus datos. Machine Translated by Google Power BI proporciona a los usuarios una variedad de métodos para conectarse a orígenes de datos con conectores de datos integrados de forma nativa. El conector que elija para su solución dependerá de dónde se encuentren sus datos. Una vez que se conecta a una fuente de datos, puede decidir qué tipo de modo de consulta se adapta mejor a sus necesidades. Algunos conectores permiten una latencia cero en sus resultados con las opciones de Consulta directa o Conexión en vivo. En este capítulo, aprendió sobre las ventajas y desventajas de cada modo de consulta y se le proporcionó un método para ponderar estas opciones mediante una matriz de decisión. En el próximo capítulo, obtendrá más información sobre cómo se pueden aplicar las transformaciones de datos a su proceso de importación de datos para que los datos entrantes se limpien correctamente. Resumen Machine Translated by Google El editor de consultas de energía Dentro de cualquier proyecto de BI, es esencial que los datos con los que está trabajando se hayan limpiado correctamente para obtener resultados precisos en sus informes y paneles. La aplicación de reglas comerciales de limpieza de datos, también conocidas como transformaciones, es el método para corregir datos inexactos o con formato incorrecto, pero el proceso a menudo puede ser la parte que consume más tiempo de cualquier solución de BI corporativa. Sin embargo, las capacidades de transformación de datos integradas en Power BI son muy potentes y fáciles de usar. Con el editor de Power Query, las tareas que normalmente serían difíciles o llevarían mucho tiempo en una herramienta de BI empresarial son tan simples como hacer clic con el botón derecho en una columna y seleccionar la transformación adecuada para el campo. Mientras interactúa con la interfaz de usuario en este editor, un lenguaje llamado M se escribe automáticamente detrás de escena. Opciones avanzadas de transformación de datos A lo largo de este capítulo, explorará algunas de las características más comunes del Editor de Power Query que lo hacen tan apreciado por sus usuarios. Dado que un conjunto de datos de muestra no puede proporcionar todos los problemas con los que se encontrará, se le proporcionarán varios pequeños ejemplos dispares para mostrarle lo que es posible. En este capítulo se detallarán los siguientes temas: Conceptos básicos de transformación Aprovechando R Lenguaje de fórmula M Estrategias de transformación de datos Machine Translated by Google Antes de profundizar en las capacidadesdel Editor de Power Query, primero comencemos haciendo una descripción general de las áreas clave que son más importantes: Power Query Editor es la herramienta principal que utilizará para aplicar transformaciones de datos y procesos de limpieza a su solución. Este editor se puede iniciar como parte del establecimiento de una conexión con sus datos, o simplemente haciendo clic en Editar consultas en la cinta Inicio de Power BI Desktop. Cuando se abre el editor de Power Query, notará que tiene su propio entorno separado para que trabaje. El entorno encapsula un método fácil de usar para trabajar con todas las consultas que definirá. El editor de consultas de energía Machine Translated by Google Machine Translated by Google Editor avanzado: al iniciar el Editor avanzado, puede ver la consulta M que el Editor de Power Query escribe automáticamente para usted. Siguiendo las figuras numeradas, repasemos algunas de las características más importantes del Editor de Power Query: Configuración de consulta: dentro de este panel, puede cambiar el nombre de la consulta, pero lo que es más importante, puede ver y cambiar la lista de pasos o transformaciones que se han aplicado a su consulta. Cerrar y aplicar: al elegir esta opción, se cerrará el editor de Power Query y se cargarán los resultados en el modelo de datos. Nueva fuente: esto inicia la misma interfaz que el botón Obtener datos que aprendió en el Capítulo 1, Primeros pasos con las opciones de importación de datos. Panel de consultas: una lista de todas las consultas a las que se ha conectado. Desde aquí, puede cambiar el nombre de una consulta, deshabilitar las capacidades de carga y actualización y organizar sus consultas en grupos. Escritorio de Power BI Machine Translated by Google Modificación de transformaciones: esto se puede hacer con cualquier paso que tenga un icono de engranaje al lado. Aplicar transformaciones de datos dentro del Power Query Editor puede ser algo sorprendentemente simple. Sin embargo, hay algunas cosas a considerar al comenzar este proceso. La primera es que hay múltiples formas de resolver un problema. A medida que avanza en este libro, los autores han tratado de mostrarle los métodos más rápidos y fáciles para resolver los problemas que se presentan, pero estas soluciones ciertamente no serán las únicas formas de alcanzar sus metas. Eliminación de transformaciones: si comete un error y necesita deshacer un paso, puede hacer clic en el botón Eliminar junto a un paso. Cambiar el orden de las transformaciones: si se da cuenta de que es mejor que un paso se ejecute antes que otro, puede cambiar el orden en que se ejecutan los pasos. Al hacer clic en cualquier paso anterior al actual, podrá ver cómo serían los resultados de su consulta antes en el proceso. Lo siguiente que debe entender es que cada clic que hace dentro del Editor de Power Query se convierte automáticamente en un lenguaje de fórmula llamado M. Prácticamente todas las transformaciones básicas que necesitará se pueden lograr simplemente interactuando con la interfaz de usuario del Editor de Power Query, pero para problemas comerciales más complejos, es muy probable que tenga que modificar al menos las consultas M que el editor escribe para usted. Aprenderá más sobre M más adelante en este capítulo. Finalmente, la última consideración importante que debe comprender es que todas las transformaciones que se crean dentro del editor se almacenan en el panel Configuración de consulta en una sección denominada Pasos aplicados. ¿Por qué es importante saber esto? La sección de Pasos aplicados tiene muchas funciones, pero estas son algunas de las más importantes que debe conocer por ahora: Conceptos básicos de transformación Machine Translated by Google Con este entendimiento, ahora se familiarizará con la aplicación de varias transformaciones básicas dentro del Editor de Power Query. El objetivo de estos primeros conjuntos de ejemplos es que se sienta cómodo con la interfaz de usuario de Power Query antes de que se cubran los casos de uso más complejos. Machine Translated by Google 3. En la ventana Navegador, seleccione la tabla llamada Datos y luego elija Editar. Organizar los nombres de las columnas o los encabezados suele ser una primera tarea importante al organizar su conjunto de datos. Proporcionar nombres de columna relevantes hace que muchos de los procesos posteriores, como la creación de informes, sean mucho más fáciles. A menudo, los encabezados de columna se importan automáticamente desde su origen de datos, pero a veces puede estar trabajando con un origen de datos más exclusivo que dificulta que Power BI capture la información del encabezado de columna. Este tutorial le mostrará cómo lidiar con tal escenario: 2. Elija Excel, luego navegue y seleccione Abrir en el archivo Failed Bank List.xlsx que está disponible en los archivos de origen del libro. Cuando se inicia Power Query Editor, debe notar que los encabezados de las columnas no se importan automáticamente. De hecho, los encabezados de las columnas están en la primera fila de los datos. 4. Para enviar los nombres de las columnas que se encuentran en la primera fila de datos a la sección de encabezado, seleccione la transformación denominada Usar la primera fila como encabezados en la cinta Inicio: 1. Inicie Power BI Desktop y haga clic en Obtener datos en Inicio. cinta. Usar la primera fila como encabezados Machine Translated by Google 2. Con estas cuatro columnas seleccionadas, haga clic derecho en cualquiera de las columnas seleccionadas y elija Quitar otras columnas. Una vez que se completa esta transformación, debe quedar solo con las columnas que necesita: A menudo, las fuentes de datos a las que se conectará incluirán muchas columnas que no son necesarias para la solución que está diseñando. Es importante eliminar estas columnas innecesarias de su conjunto de datos porque estas columnas no utilizadas ocupan espacio innecesariamente dentro de su modelo de datos. Hay varios métodos diferentes para eliminar columnas en el Editor de Power Query. Este ejemplo mostrará uno de estos métodos utilizando el mismo conjunto de datos de la demostración anterior: 1. Seleccione varias veces (Ctrl + clic) los encabezados de columna de las columnas que desea conservar como parte de su solución. En este escenario, seleccione las columnas Nombre del banco, Ciudad, ST y Fecha de cierre. Eliminar columnas Machine Translated by Google Otro método popular para eliminar columnas es hacer clic en el botón Elegir columnas en la cinta Inicio del Editor de Power Query. Esta opción proporciona una lista de todas las columnas y puede elegir las columnas que desea conservar o excluir. Opción para eliminar otras columnas También puede seleccionar las columnas que desea eliminar; haga clic derecho en una de las columnas seleccionadas y haga clicen Eliminar. Este parece ser el método más obvio. Sin embargo, esto Machine Translated by Google La opción no es tan fácil de usar a largo plazo porque no proporciona una opción para editar la transformación en la sección Pasos aplicados como lo permiten los dos primeros métodos. Machine Translated by Google Definir correctamente los tipos de datos de columna al principio del proceso de depuración de datos puede ayudar a determinar el tipo de valores con los que está trabajando. El editor de Power Query tiene varios tipos de datos numéricos, de texto y de fecha y hora entre los que puede elegir. En nuestro ejemplo actual, el editor de Power Query interpretó automáticamente todos los tipos de datos correctamente, pero veamos dónde podría cambiar esto si fuera necesario: nombre de la columna 1. Localice el indicador de tipo de datos en el encabezado de la columna a la derecha del 2. Haga clic en el icono de tipo de datos y se abrirá un menú que le permitirá elegir el nuevo tipo de datos que desee: Otro método que puede usar para cambiar los tipos de datos de las columnas es hacer clic con el botón derecho en la columna que desea cambiar, luego seleccionar Cambiar tipo y elegir el Cambiar tipo Elegir el tipo de datos Machine Translated by Google Si desea cambiar varios tipos de datos de columna a la vez, puede realizar una selección múltiple de las columnas necesarias y luego seleccionar el nuevo tipo de datos en la propiedad Tipo de datos en la cinta Inicio. nuevo tipo de datos que desee. Muchas de las transformaciones que encontrará en el futuro se basan contextualmente en los tipos de datos de columna con los que está trabajando. Por ejemplo, si tiene una columna que es una fecha, se le proporcionarán transformaciones especiales que solo se pueden ejecutar en un tipo de datos de fecha, como extraer el nombre del mes de una columna de fecha. Machine Translated by Google 2. Seleccione el botón Columna del ejemplo y, si se le solicita, elija De todas las columnas. Esto lanzará una nueva interfaz Agregar columna desde ejemplos. 1. Busque y seleccione la pestaña Agregar columna en la cinta de Power Query Editor. 4. Una vez que haga clic en Aceptar, la transformación finaliza y se agrega automáticamente a la consulta M general que se ha creado a través de la interfaz de usuario: 3. Nuestro objetivo es aprovechar esta función para combinar las columnas City y ST . En la primera celda vacía, escriba Chicago, IL y luego presione Enter. Debe notar que debajo del texto que escribió, Power BI tradujo automáticamente lo que escribió en una transformación que se puede aplicar para cada fila del conjunto de datos. Una opción que puede hacer que las transformaciones de datos complejas parezcan simples es la característica llamada Agregar columna a partir de ejemplos. Con Agregar columna a partir de ejemplos, puede proporcionar al Editor de Power Query una muestra de cómo le gustaría que se vieran sus datos, y luego puede determinar automáticamente qué transformaciones se requieren para lograr su objetivo. Continuando con el mismo ejemplo de bancos fallidos, veamos un ejemplo simple de cómo usar esta característica: Agregar columna de ejemplos Machine Translated by Google A veces, puede encontrar escenarios en los que la función Agregar columna de ejemplos necesita más de un ejemplo para traducir correctamente su ejemplo en una función de consulta M que logre su objetivo. Si esto sucede, simplemente proporcione ejemplos adicionales de cómo le gustaría que aparecieran los datos, y el Editor de Power Query debería ajustarse para tener en cuenta los valores atípicos. Adición de columnas a partir de ejemplos Machine Translated by Google Ahora que debería sentirse más cómodo trabajando en el Editor de Power Query, demos el siguiente paso para trabajar con él. A menudo, encontrará la necesidad de ir más allá de estas transformaciones básicas cuando se trata de datos que requieren más cuidado. En esta sección, aprenderá acerca de algunas de las transformaciones avanzadas más comunes que puede necesitar, que incluyen Columnas condicionales, Rellenar, Desanclar, Fusionar consultas y Agregar consultas. Opciones avanzadas de transformación de datos Machine Translated by Google El uso de la funcionalidad de columnas condicionales de Power Query es una excelente manera de agregar nuevas columnas a su consulta que siguen declaraciones lógicas si/entonces/si no. Actual. Este concepto de if/then/else es común en muchos lenguajes de programación, incluidas las fórmulas de Excel. Revisemos un escenario del mundo real en el que se le pedirá que realice una limpieza de datos en un archivo antes de que pueda usarse. En este ejemplo, se le proporcionará un archivo de todos los condados de los Estados Unidos y debe crear una nueva columna que extraiga el nombre del estado de la columna del condado y lo coloque en su propia columna: 3. Ahora, en la Columna 2, filtre Estados Unidos del campo para eliminar esto valor de la columna. 1. Comience conectándose al archivo FIPS_CountyName.txt que se encuentra en los archivos del libro mediante el conector Text/CSV. 4. Elimine la abreviatura de estado de la Columna 2 haciendo clic con el botón derecho en el encabezado de la columna y seleccionando Dividir columna | Por delimitador. Elija -- Personalizado -- para el tipo de delimitador y escriba , luego haga clic en Aceptar: 2. Inicie Power Query Editor y comience cambiando el tipo de datos de Column1 a Texto. Cuando haga esto, se le pedirá que reemplace una conversión de tipo existente. Puede aceptar esto haciendo clic en Reemplazar Columnas condicionales Machine Translated by Google Código, nombre del condado y abreviatura del estado, respectivamente. 5. A continuación, cambie el nombre de las columnas Columna 1, Columna 2.1 y Columna 2.2 a Condado . 6. Para aislar el nombre completo del estado en su propia columna, deberá implementar una columna condicional. Vaya al botón Agregar columna en la cinta y seleccione Columna condicional. 7. Cambie la propiedad Nuevo nombre de columna a Nombre del estado e implemente la lógica. Si la abreviatura del estado es igual a nulo, devuelva el nombre del condado. De lo contrario, devuelva el valor nulo como se muestra en la siguiente captura de pantalla. Para devolver el valor de otra columna, debe seleccionar el ícono debajo del texto Salida, luego elija Seleccionar una columna. Una vez que esto esté completo, haga clic en Aceptar: Machine Translated by Google Esto da como resultado una nueva columna llamada Nombre del estado, que tiene el nombre del estado completamente escrito y solo aparece en las filas donde la Abreviatura del estado es nula. Esto solo está preparando el escenario para limpiar completamente este conjunto de datos. Para completar el proceso de limpieza de datos para este archivo, lea la siguiente
Compartir