Logo Studenta

Grafica de caja

¡Estudia con miles de materiales!

Vista previa del material en texto

Gráfica de caja
Una gráfica de caja proporciona un resumen gráfico de la distribución de una muestra. La gráfica de caja muestra la forma, tendencia central y variabilidad de los datos.
Interpretación
Utilice una gráfica de caja para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de caja funcionan mejor cuando el tamaño de la muestra es mayor que 20.
La gráfica de caja con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos son largos.
Histograma
Un histograma divide los valores de la muestra en muchos intervalos y representa la frecuencia de los valores de datos en cada intervalo con una barra
Datos multimodales
Los datos multimodales tienen múltiples picos, también denominados modas. Los datos multimodales suelen indicar que aún no se han considerado variables importantes.
Q1
Los cuartiles son los tres valores –el primer cuartil en 25% (Q1), el segundo cuartil en 50% (Q2 o mediana) y el tercer cuartil en 75% (Q3)– que dividen una muestra de datos ordenados en cuatro partes iguales.
El primer cuartil es el percentil 25 e indica que 25% de los datos es menor que o igual a este valor.
Para estos datos ordenados, el primer cuartil (Q1) es 9.5. Es decir, 25% de los datos es menor que o igual a 9.5.
IQR
El rango intercuartil (IQR) es la distancia entre el primer cuartil (Q1) y el tercer cuartil (Q3). El 50% de los datos está dentro de este rango.
Para estos datos ordenados, el rango intercuartil es 8 (17.5–9.5 = 8). Es decir, el 50% intermedio de los datos está entre 9.5 and 17.5.
Máximo
El máximo es el valor más grande de los datos
Mediana
La mediana es el punto medio del conjunto de datos. El valor de este punto medio es el punto en el cual la mitad de las observaciones está por encima del valor y la otra mitad está por debajo del valor
Para estos datos ordenados, la mediana es 13. Es decir, la mitad de los valores es menor que o igual a 13 y la otra mitad de los valores es mayor que o igual a 13.
Mínimo
El mínimo es el valor más pequeño de los datos
Rango
El rango es la diferencia entre los valores más grande y más pequeño de los datos. El rango representa el intervalo que contiene todos los valores de los datos.
Media
La media es el promedio de los datos, que es la suma de todas las observaciones dividida entre el número de observaciones.
En promedio, un cliente espera 2.4 minutos para ser atendido en el ban
Curtosis
La curtosis indica la manera en que las colas de una distribución difieren de la distribución normal.
Interpretación
Utilice la curtosis para lograr entender inicialmente las características generales de la distribución de los datos.
CoefVar
El coeficiente de variación (CoefVar) es una medida de dispersión que describe la variación en los datos en relación con la media. El coeficiente de variación se ajusta de manera que los valores estén en una escala sin unidades
Desv.Est.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra
Utilice la desviación estándar para determinar qué tan dispersos están los datos con respecto a la media. Un valor de desviación estándar más alto indica una mayor dispersión de los datos.
Los administradores dan seguimiento al tiempo de egreso de los pacientes que son tratados en las áreas de urgencia de dos hospitales. Aunque los tiempos de egreso promedio son aproximadamente iguales (35 minutos), las desviaciones estándar son significativamente diferentes. La desviación estándar del hospital 1 es de aproximadamente 6. En promedio, el tiempo para dar de alta a un paciente se desvía de la media (línea discontinua) aproximadamente 6 minutos. La desviación estándar del hospital 2 es de aproximadamente 20. En promedio, el tiempo para dar de alta a un paciente se desvía de la media (línea discontinua) aproximadamente 20 minutos
Varianza
La varianza mide qué tan dispersos están los datos alrededor de su media. La varianza es igual a la desviación estándar elevada al cuadrado
Mientras mayor sea la varianza, mayor será la dispersión de los datos.
Puesto que la varianza (σ2) es una cantidad elevada al cuadrado, sus unidades también están elevadas al cuadrado, lo que puede dificultar el uso de la varianza en la práctica. La desviación estándar generalmente es más fácil de interpretar porque utiliza las mismas unidades que los datos. Por ejemplo, una muestra del tiempo de espera en una parada de autobuses puede tener una media de 15 minutos y una varianza de 9 minutos2. Debido a que la varianza no está en las mismas unidades que los datos, la varianza suele mostrarse con su raíz cuadrada, la desviación estándar. Una varianza de 9 minutos2 es equivalente a una desviación estándar de 3 minutos.
Moda
La moda es el valor que ocurre con más frecuencia en un conjunto de observaciones. Minitab también muestra cuántos puntos de los datos son iguales a la moda.
La media y la mediana requieren un cálculo, pero la moda se determina contando el número de veces que cada valor ocurre en un conjunto de datos.
EE de la media
El error estándar de la media (EE de la media) estima la variabilidad entre las medias de las muestras que usted obtendría si tomara muestras repetidas de la misma población. Mientras que el error estándar de la media estima la variabilidad entre las muestras, la desviación estándar mide la variabilidad dentro de una misma muestra.
Utilice el error estándar de la media para determinar el grado de precisión con el que la media de la muestra estima la media de la población.
Un valor del error estándar de la media más bajo indica una estimación más precisa de la media de la población. 
VARIANZA MUESTRAL (N-1)
Normalmente manejamos muestras de una población, no la población entera. El ejemplo más claro es cuando realizamos una encuesta. Pero como suelen decir los estadísticos, con una cucharadita se sabe cómo está el guiso, si esta cucharadita está bien cogida, es decir si la muestra es representativa de la población, sin sesgos.
Ocurre que si estamos en este caso, que tenemos una muestra de 𝑛n elementos de una población más grande (pongámonos en el caso de la encuesta), se demuestra que el mejor estimador para la varianza de la población a partir de los datos de la muestra
SSC
ESPACIO MUESTRAL (S).- Es un conjunto de todos los resultados posibles que se pueden obtener al realizar un experimento aleatorio. Ejemplo: sea el experimento E: lanzar un dado y el espacio muestral correspondiente a este experimento es: S = (1, 2, 3, 4, 5, 6(.
Consiste en el conjunto de todos los posibles resultados de un experimento aleatorio, junto con una estructura sobre el mismo

Otros materiales