Logo Studenta

Estadistica descriptiva

¡Este material tiene más páginas!

Vista previa del material en texto

PROBABILIDAD Y ESTADÍSTICA
Estadística DESCRIPTIVA
M.M. RODRIGO M.C.
DEFINICIÓN DE ESTADÍSTICA
1. Conceptos Básicos de estadística
(Lind, Marchal y Wathen, 2008)
Fuente: https://www.espn.com.mx/basquetbol/nba/estadisticas
Población de 18 años y más por sexo y grupos de edad, según interés en desarrollos científicos y tecnológicos
ESTADÍSTICA
E. DESCRIPTIVA
E. INFERENCIAL
	
	La Estadística es la ciencia encargada de recoger, analizar e interpretar los datos relativos a un conjunto de elementos.
Población es el conjunto de elementos sobre los cuales se va a estudiar una determinada característica.
Muestra es una parte de la población.
Variable estadística el aspecto que se va a estudiar. Si se puede medir se llama variable cuantitativa si no se pueden medir se llama variable cualitativa (categórica o atributo).
Si la variable estadística toma un número determinado de valores se llama discreta.
Si la variable estadística puede tomar cualquier valor entre dos valores dados se llama continua.
	Ejercicio: Escriba dos ejemplos de variables cuantitativa discreta, cuantitativa continua y cualitativa. 
2. Recopilación y Descripción de Datos
Fuente: Johnson R.;Kuby P. (2012). Estadística elemental. 11ª. Edic. México: CENGAGE Learning
Distribución de frecuencias
Definición
Una distribución de frecuencias (o tabla de frecuencias) lista valores de los datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes.
Datos agrupados en intervalos
Datos no agrupados
Datos obtenidos de la recopilación que aún no tienen ningún tratamiento estadístico u organización.
Vida útil (en años) de las laptop de 20 personas
3, 4, 3, 2, 2, 3, 4, 2, 5, 3, 
3, 5, 6, 2, 5, 3, 4, 1, 3, 1
Un primer tratamiento estadístico, sería ordenar los datos de menor a mayor o viceversa.
Gráficos
MEDIDAS DE TENDENCIA CENTRAL 
PARA UN CONJUNTO DE DATOS SIN AGRUPAR
3. Medidas de Tendencia Central
Después de la recolección de los datos, comienza el tratamiento estadístico desde el análisis hasta la interpretación de los resultados. Las técnicas empleadas dependerán de la cantidad de datos que se requieren trabajar ya sea utilizando una computadora o agrupando los datos. La lista de los datos obtenidos o recolectados al inicio de la investigación son llamados datos crudos o sin procesar. El proceso estadístico puede consistir en el ordenamiento de los datos.
ORDENAMIENTO
ASCENDENTE
DESCENDENTE
Ejemplo: Ordenar los siguientes datos 1.23, 1.56, 1.20, 1.19, 1.45, 1.32, 1.46,1.20
1.19
1.20
1.20
1.23
1.32
1.45
1.46
1.56
1.56
1.46
1.45
1.32
1.23
1.20
1.20
1.19
Datos no agrupados
Se utilizan para indicar un valor que tiende a tipificar o ser el más representativo de un conjunto de números.
LA MEDIA O PROMEDIO
Ejemplo: Un alumno presentó cuatro exámenes y obtuvo calificaciones de 83, 94, 95 y 86, la calificación promedio del alumno es 
x: valor de cada uno de los datos u observación
n: total de observaciones o tamaño de la muestra
Para calcular la media de la población los símbolos que se usan son:
x: valor de cada uno de los datos u observación
N: total de la población
Medidas de tendencia central para datos no agrupados
LA MEDIANA
Divide al grupo en dos partes iguales. La mitad del conjunto de datos será menor y la otra mitad será mayor a la mediana.
Procedimiento para obtener la mediana:
Ordenar los datos
Verificar si el total de los datos es 
Par: la mediana será el promedio de los dos valores centrales
Impar: la mediana será el valor intermedio
Se puede utilizar la siguiente fórmula para encontrar la posición de la mediana en un conjunto de datos:
Por ejemplo, si tenemos un total de 5 datos (número impar) , la mediana será el dato que se encuentre en la posición 3; (5+1)/2=3.
Si tenemos un total de 8 datos (número par), la mediana será el promedio de los dos datos centrales que ocupan la posición 4 y 5; (8+1)/2=4.5.
Ejemplo 1. Encuentre la mediana del conjunto de datos siguiente 4, 5, 2, 6, 1
1	2	4	5	6
Número de datos impar
Indica la posición del dato
El 50% de los datos son menores a 4 y el otro 50% son mayores a 4.
Ejemplo 2. Encuentre la mediana del conjunto de datos siguiente 4, 5, 10, 2, 6, 1
1	2	4	5	6	10	
Número de datos par
La mediana será el promedio de los valores centrales 4 y 5:
El 50% de los datos son menores a 4.5 y el otro 50% son mayores a 4.5.
se toman los datos que ocupan la posición 3 y 4
LA MODA
Es el dato que con más frecuencia se presenta en un conjunto de datos. La moda es indicativa del valor “típico” en términos del valor que se presenta con mayor frecuencia
Ejemplo 1. Obtenga la moda del siguiente grupo de datos 3, 4, 3, 5 ,6
La moda es 3
Ejemplo 1. Obtenga la moda del siguiente grupo de datos 6, 4, 3, 5 ,6,4,2,4,6,1,4,6
Existen dos modas el 4 y 6 (bimodal) 
EJERCICIO 1.2. Se inspeccionaron 15 radios antes de enviarlos para su venta. El número de defectos por radio es
1, 0, 3, 4, 2, 1, 0, 3, 1, 2, 0, 1, 1, 0, 1
Obtenga la media, la mediana y la moda para el número de defectos.
EJERCICIO 1.3. Su firma está introduciendo un nuevo chip de computadora del cual se promociona que realiza cálculos estadísticos mucho más rápidamente que los que actualmente se encuentran en el mercado. Se hacen veinte cálculos diferentes, produciendo los tiempos en segundos que se ven más adelante. Aunque usted no puede tergiversar su producto, usted desea presentar los resultados de la manera más favorable para su empresa. Determine la media, la mediana y la moda.
	3.2	4.1	6.3	1.9	0.6
	5.4	5.2	3.2	4.9	6.2
	1.8	1.7	3.6	1.5	2.6
	4.3	6.1	2.4	2.2	3.3
MEDIDAS DE DISPERSIÓN
PARA UN CONJUNTO DE DATOS SIN AGRUPAR
Para describir en forma adecuada un conjunto de datos, son necesarios dos tipos de medidas de resumen. Además, para obtener información respecto a la parte media de un conjunto de números, es conveniente también tener un método para expresar la cantidad de dispersión o difusión que hay entre los números. Por ejemplo, las medidas de dispersión indican si los valores están relativamente cercanos uno del otro o si se encuentran dispersos. Vea las figuras.
BAJA DISPERSIÓN
ALTA DISPERSIÓN
La Dispersión mide cuán próximos están los valores de un grupo entre sí
Medidas de dispersión o variación para datos no agrupados
RANGO
El rango de un conjunto de datos es la diferencia entre el valor máximo y el valor mínimo
EJEMPLO: Halle el rango de la muestra 3, 3, 5, 6, 8 
El rango 5 indica que todos estos valores caen en un intervalo de 5 unidades.
3
8
5
6
3
Mínimo
Máximo
Rango(“distancia”)
Es conveniente considerar cuatro variables de dispersión: la amplitud de variación (rango), la desviación media, la varianza y la desviación estándar.
VARIANZA
La varianza de una muestra es la desviación promedio de valores obtenidos a partir de la media, elevada al cuadrado y calculada mediante n-1 en lugar de n.
EJEMPLO: Calcule la varianza para esta muestra: 2, 4, 6, 8, 10
				
	2	6	-4	16
	4	6	-2	4
	6	6	0	0
	8	6	2	4
	10	6	4	16
	Suma		0	40
Calculamos la varianza
DESVIACIÓN ESTÁNDAR
Se define como la raíz cuadrada de la varianza.
EJEMPLO: Calcule la desviación estándar para esta muestra: 2, 4, 6, 8, 10
El valor de la varianza en el ejercicio anterior fue 10, para obtener la desviación estándar solo obtenemos la raíz cuadrada de 10:
EJERCICIO 1.5.: A 15 estudiantes universitarios, elegidos aleatoriamente, se les solicitó mencionar el número de horas que durmieron la noche anterior. Los datos resultantes fueron 5, 6, 6, 8, 7, 7, 9, 5, 4, 8, 11, 6, 7, 8, 7. Encuentre todas las medidas de dispersión. 
EJERCICIO 1.6.: A los reclutas de una academia de policía se les solicitó presentar un examen que mide su capacidad para hacer ejercicio. Esta capacidad medida en minutos, se obtuvo para cada uno de los 20 reclutas.
25	27	30	33	30	32	30	34	30	27
 25	29	31	31	32	34	32	33	30
Calcule todas las medidas de tendencia central y de dispersión.
MEDIDAS DE TENDENCIA CENTRALY MEDIDAS DE DISPERSIÓN
PARA DATOS AGRUPADOS EN UNA DISTRIBUCIÓN DE FRECUENCIAS
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA UNA DISTRIBUCIÓN DE FRECUENCIAS
FÓRMULAS: MEDIDAS DE TENDENCIA CENTRAL
FÓRMULAS: DISPERSIÓN O VARIACIÓN
	6	9	2	7	0	8	2	5	4	2
	5	4	4	4	4	2	5	6	3	7
	3	8	8	4	4	4	7	7	6	5
	4	7	5	3	7	1	3	8	0	6
	5	1	2	3	6	0	5	6	6	3
Número de accidentes que ocurren diariamente (durante 50 días) en un enorme estacionamiento (Fuente: Stevenson)
	Accidentes (x)	Número de días(f)
	0	3
	1	2
	2	5
	3	6
	4	9
	5	7
	6	7
	7	6
	8	4
	9	1
	Total	f = n =50
Distribución de frecuencias
f = frecuencia
n = tamaño de la muestra
Media o promedio
La moda se obtiene por definición
La mediana se obtiene por definición. Localice la posición del elemento.
Rango se obtiene por definición
Varianza
Desviación estándar

Nombre de rango
Funciones contar.si, suma, promedio
Ficha: Datos -> Análisis de datos
Medidas de tendencia central
Medidas de dispersión
Tablas de frecuencias

1.- Datos sobre el número de artículos defectuosos por lote en el caso de 40 de ellos. Calcule las medidas de tendencia central y de dispersión. Interprete los resultados.
2.- Recopile al menos 25 datos sobre una característica de interés y obtenga las medidas de tendencia central y de variación. Interprete los resultados.
	5	12	9	1	10	11	8	7
	7	3	8	0	9	8	2	3
	8	4	4	3	3	4	5	4
	0	7	5	6	5	3	0	1
	10	8	3	7	2	6	2	5
EJERCICIOS
REFERENCIAS
Lind, D.; Marchal, W. y Wathen, S. (2008). Estadística aplicada a los negocios y la economía. McGraw Hill. 
n
x
x
å
=
-
5
.
89
4
86
95
94
83
=
+
+
+
N
x
å
=
m
2
1
+
=
n
Posición
3
2
1
5
=
+
=
Posición
5
.
3
2
1
6
=
+
=
Posición
5
.
4
2
5
4
=
+
=
mediana
RangovalorMáximovalorMenor
=-
835
Rango
=-=
(
)
2
2
1
i
xX
s
n
-
=
-
å
i
x
X
(
)
i
xX
-
(
)
2
i
xX
-
(
)
2
40
10
51
s
==
-
2
ss
=
103.1622
s
==

Continuar navegando