Logo Studenta

Estadistica-Tema-1

¡Este material tiene más páginas!

Vista previa del material en texto

Tema 1 
 Pg. nº 1/11 
ESTADÍSTICA DESCRIPTIVA 
 
1.- DISTRIBUCIONES UNIDIMENSIONALES. 
CONCEPTOS GENERALES. 
 
La estadística se puede dividir en dos partes: 
 
 Estadística descriptiva o deductiva. 
 Estadística inferencial o inductiva. 
 
La estadística descriptiva o deductiva trata del recuento, ordenación y clasificación de los 
datos obtenidos por las observaciones. Se construyen tablas y se representan gráficos que 
permiten simplificar en gran medida, la complejidad de todos los datos que intervienen en la 
distribución. Asimismo se calculan parámetros estadísticos que caracterizan la distribución. En 
esta parte de la estadística no se hace uso del cálculo de probabilidades, y únicamente se 
limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos. 
 
La estadística inferencial o inductiva plantea y resuelve el problema de establecer 
previsiones y conclusiones generales sobre una población a partir de los resultados obtenidos 
de una muestra. Utiliza resultados obtenidos mediante la estadística descriptiva y se apoya 
fuertemente en el cálculo de probabilidades. 
 
La población es el conjunto de todos los elementos, que cumpliendo una condición, 
deseamos estudiar (por ejemplo: los habitantes de una ciudad, los alumnos de un colegio, las 
gallinas de una granja, etc.). 
 
Un individuo es cada uno de los elementos de la población. 
 
Una muestra es cualquier subconjunto de la población (por ejemplo: 100 alumnos del colegio, 
1.000 habitantes de una ciudad, 300 gallinas de una granja, etc.). El saber seleccionar una 
muestra suficientemente representativa de la población a estudiar es fundamental para que los 
resultados del estudio sean fiables. Sobre cómo seleccionar una muestra existen todo un 
tratado llamado “Teoría de las muestras”, al cual haremos una aproximación más adelante. 
 
Cada una de las propiedades que se pueden estudiar se llama carácter estadístico (por 
ejemplo: talla, peso, sexo, estado civil, etc). 
 
Pueden ser cuantitativos si se pueden medir numéricamente (por ejemplo: la talla, el peso, 
etc) o cualitativo si no se puede medir numéricamente (por ejemplo: sexo, estado civil, etc). 
 
Al conjunto de valores que toma un carácter se le llama variable estadística que podrá ser 
cualitativa o cuantitativa, dependiendo de si el carácter es cualitativo o cuantitativo, 
respectivamente. 
Una variable será discreta si sólo puede tomar determinados valores (ej: número de 
hermanos, número de aprobados, etc). 
Una variable será continua si puede tomar todos los valores posibles de un intervalo (ej: altura 
de una persona, peso, etc). 
 
Tablas de frecuencias: Son tablas donde se reflejan los datos obtenidos y las diferentes 
frecuencias: 
 
La frecuencia absoluta ( fi ) es el número de veces que se repite un valor (si están agrupados 
en intervalos de clase, la frecuencia absoluta del intervalo será el número de veces que 
aparece un valor cualquiera de ese intervalo). 
 
 Tema 1 
 Pg. nº 2/11 
La frecuencia relativa (
ih ) de un valor es el cociente entre la frecuencia absoluta del valor y 
el número total de datos 
N
f
h ii  
 
La frecuencia absoluta acumulada ( Fi ) de un valor es la suma de todas las frecuencias 
absolutas de los valores menores o iguales al valor. 
 
La frecuencia relativa acumulada (
iH ) de un valor es la suma de todas las frecuencias 
relativas de los valores menores o iguales al valor. 
 
 Propiedades de la frecuencia relativa: 
 
 
1 .2
10 .1
n
1=i


 i
i
h
h
 
 
 
 
A continuación vamos a estudiar el tratamiento de la información, es decir, cómo debemos 
proceder para analizar ordenadamente una muestra. 
 
 
 
Los pasos a seguir son: 
 
1. Recogida de datos. Consiste en la toma de datos numéricos procedente de la muestra. 
 
2. Ordenación de datos. Una vez recogidos los datos los colocaremos en orden creciente. 
 
3. Agrupación de los datos en clase. En caso de que la variable sea continua o bien 
discreta pero con número muy elevado de datos, es necesario agrupar los datos en 
intervalos, a los cuales llamaremos intervalos de clases. Respecto a cómo agruparlos 
y qué número de intervalos elegir, podemos decir que no existe una contestación 
tajante y hay varios criterios para dar respuesta a esta cuestión. Una de las teorías 
establece que debemos hacer un número de intervalos aproximadamente igual a la raíz 
cuadrada del número de datos, pero nosotros vamos a seguir otros criterios. 
Intentaremos hacer un número de intervalos comprendido entre 8 y 12. Llamaremos 
marca de clase al punto medio del cada intervalo. Una vez elegido el número, es 
aconsejable escoger los límites de los intervalos, de modo que sean múltiplos, pares, 
divisibles, etc., para lograr que la marca de clase no nos dé un número fraccionario o 
con muchos decimales. Esto nos facilitará luego el trabajo de cálculo. También 
tenemos que lograr que los intervalos sean de la misma amplitud y que el límite 
superior de uno coincida con el inferior del siguiente. Y por último adoptaremos el 
criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha, 
esto quiere decir que si un valor de la variable queda justo en el límite de dos 
intervalos, siempre lo pondremos en el superior. 
 
4. Recuento de frecuencia. Efectuaremos el recuento de los datos obtenidos. 
 
5. Construcción de la tabla. Calcularemos las frecuencias absolutas, relativas, 
acumuladas, porcentuales representaciones gráficas y todos aquellos datos que nos 
hagan falta para el estudio estadístico. 
 
 Tema 1 
 Pg. nº 3/11 
Veamos unos ejemplos de tabulación de datos. 
 
 
Ejemplo 1: Un profesor tiene anotadas en su cuaderno las notas de 30 alumnos de una clase. 
Construir la tabla sabiendo que son las siguientes: 
 
 5 3 4 1 2 8 9 8 7 6 6 7 9 8 7 
 7 1 0 1 5 9 9 8 0 8 8 8 9 5 7 
 
 
Xi Recuento fi Fi hi Hi pi Pi 
0 // 2 2 2/30 2/30 2/30*100 2/30*100 
1 /// 3 5 3/30 5/30 3/30*100 5/30*100 
2 / 1 6 1/30 6/30 1/30*100 6/30*100 
3 / 1 7 1/30 7/30 1/30*100 7/30*100 
4 / 1 8 1/30 8/30 1/30*100 8/30*100 
5 /// 3 11 3/30 11/30 3/30*100 11/30*100 
6 // 2 13 2/30 13/30 2/30*100 13/30*100 
7 ///// 5 18 5/30 18/30 5/30*100 18/30*100 
8 ///// // 7 25 7/30 25/30 7/30*100 25/30*100 
9 ///// 5 30 5/30 30/30 5/30*100 30/30*100 
∑ 30 1 100 
 
 
 
 
Ejemplo 2: Construir la tabla estadística de las edades de las personas que acuden a un 
logopeda a lo largo de un mes, sabiendo que son: 
 
 3 2 11 13 4 3 2 4 5 6 7 3 4 5 3 2 5 6 27 
 15 4 21 12 4 3 6 29 13 6 17 6 13 6 5 12 26 
 
 
Clases 
Marcas 
de 
clases 
xi 
fi Fi hi Hi 
[0 5) 2,5 13 13 13/36 13/36 
[5 10) 7,5 11 24 11/36 24/36 
[10 15) 12,5 6 30 6/36 30/36 
[15 20) 17,5 2 32 2/36 32/36 
[20 25) 22,5 1 33 1/36 33/36 
[25 30) 27,5 3 36 3/36 36/36=1 
∑ 36 1 
 
 Tema 1 
 Pg. nº 4/11 
 
2.- DIAGRAMA DE TALLOS Y HOJAS 
 
 
Una moderna técnica de recogida de datos es la que se conoce como diagrama de tallos y 
hojas 
 
Veamos a continuación con un ejemplo en qué consiste. 
 
Las puntuaciones obtenidas por 40 alumnos en un test han sido las siguientes: 
 
41, 53, 72, 62, 81, 93, 81, 74, 56, 62, 45, 47, 62, 58, 88, 76, 77, 63, 43, 56, 
 76, 63, 78, 73, 65, 66, 91, 82, 61, 72, 36, 50, 91, 32, 60, 80, 51, 68, 61, 71. 
 
Para construir el diagrama de tallos y hojas, procedemos del siguiente modo: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Paso 1º 
Se observa entre qué valores están las 
cifras de las decenas de todos los datos, y 
se tiene que van de 3 a 9. 
 
Tallo 
 3 
 4 
 5 
 6 
 7 
 8 
 9 
 
Paso 2º 
Se va leyendo uno a uno cada dato, 
anotando las cifras de las unidades en la 
fila correspondientes. 
 
Tallo 
 3 6 2 
 4 1 5 7 3 
 5 3 6 8 6 0 1 
 6 2 2 2 3 35 6 1 0 8 1 
 7 2 4 6 7 6 8 3 2 1 
 8 1 1 8 2 0 
 9 3 1 1 
 
Así se obtiene una figura como esta. 
Paso 3º 
Por último se vuelve a escribir la tabla 
ordenando de menor a mayor las unidades 
dentro de cada fila. 
 
Tallo 
 3 2 6 
 4 1 3 5 7 
 5 0 1 3 6 6 8 
 6 0 1 1 2 2 2 3 3 5 6 8 
 7 1 2 2 3 4 6 6 7 8 
 8 0 1 1 2 8 
 9 1 1 3 
 
Al final obtenemos el diagrama. 
 Tema 1 
 Pg. nº 5/11 
 
 Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta 
con trazar una línea poligonal que una los últimos números de cada fila. 
 
 Podemos sacar muchas conclusiones a la vista del diagrama: 
 
o Hay dos alumnos con puntuaciones entre 30 y 39, y así sucesivamente. 
o Se puede observar que es una distribución ligeramente asimétrica a la derecha. 
o La clase con mayor frecuencia es la de 60-69 
o Etc. 
 
 
 
3.- GRÁFICOS ESTADÍSTICOS 
 
 
Aun cuando las tablas estadísticas contienen toda la información, es conveniente expresarla 
mediante gráficos adecuados a la variable, con el fin de resaltar los aspectos más 
significativos y hacer la distribución más clara y evidente. 
 
 
Diagramas de barras 
 
Los diagramas de barras o bastones son especialmente útiles cuando se desea comparar 
datos cualitativos o cuantitativos de tipo discreto, no agrupados en intervalos. 
 
Para trazarlos se representan sobre el eje de abscisas los valores de la variable, y sobre el eje 
de ordenadas la frecuencia que se vaya a representar; o viceversa. A continuación, se 
levantan trazos gruesos de longitud igual a la frecuencia correspondiente a cada valor de la 
variable. 
 
Ejemplo. 
 
 
 
 
 
 
 
 
 
Xi fi Fi 
0 2 2 
1 3 5 
2 1 6 
3 1 7 
4 1 8 
5 3 11 
6 2 13 
7 5 18 
8 7 25 
9 5 30 
 Tema 1 
 Pg. nº 6/11 
 
Polígonos de frecuencias 
 
Los polígonos de frecuencia son especialmente útiles cuando se desea comparar datos 
cualitativos o cuantitativos de tipo discreto, no agrupados en intervalos. 
 
Se forman siguiendo el mismo procedimiento que para los diagramas de barras, pero no se 
trazan las barras, sino que se unen los puntos de las frecuencias mediante una línea. Se 
puede representar sobre el mismo diagrama de barras o incluso sobre un histograma (como 
veremos más adelante. 
 
Ejemplo. 
 
 
 
 
 
 
Diagrama de Sectores 
 
Los diagramas de sectores representan las distintas modalidades de un carácter mediante 
sectores circulares. Cada valor viene representado por un sector circular de amplitud 
proporcional a su frecuencia. Normalmente se utilizan tantos por ciento para reflejar las 
frecuencias y la amplitud se calcula mediante una simple regla de tres. 
 
 
Ejemplo. 
 
 
 
 Tema 1 
 Pg. nº 7/11 
Pictogramas 
 
Los pictogramas son dibujos alusivos a las distribuciones que se pretenden estudiar y que 
mediante su forma, tamaño, etc., ofrecen una descripción lo más expresiva posible de la 
distribución. Son gráficos poco precisos pero fáciles de interpretar a simple vista. 
 
Ejemplo. 
 
 
 
 
 
 
Cartogramas 
 
Se llama cartogramas a los gráficos que se realizan sobre un mapa, señalando sobre 
determinadas zonas, con distintos colores o rayados lo que se trate de poner de manifiesto. Se 
suelen utilizar para representar renta per cápita, densidad de población, horas de sol, recursos 
hídricos, etc. 
 
Ejemplo. 
 
 
 
 
 
 
 Tema 1 
 Pg. nº 8/11 
Histogramas 
 
Los histogramas se utilizan para distribuciones de variables agrupadas en intervalos. Se 
construyen representado en el eje de abscisa los límites de cada clase y en el eje de 
ordenadas la frecuencia que queramos representar. Luego se levantan los rectángulos 
correspondientes, con una base igual a las amplitudes de los intervalos y una altura igual a la 
frecuencia. 
 
Ejemplo. 
 
 
 
 
Como se observa, también se puede construir el polígono de frecuencia. 
 
 
Diagramas lineales o series temporales 
 
Los diagramas lineales son muy utilizados para mostrar las fluctuaciones de un determinado 
carácter estadístico con el paso del tiempo. 
 
Lo que interesa en el gráfico es la altura de la línea referida a la base del diagrama. Con frecuencia 
se aprovecha para representar sobre la misma escala varios diagramas lineales. Como por ejemplo 
ingresos y gastos; nacimientos y defunciones; etc. 
 
 
 
 
 
Clases 
Marcas 
de 
clases 
xi 
fi 
[0 5) 2,5 13 
[5 10) 7,5 11 
[10 15) 12,5 6 
[15 20) 17,5 2 
[20 25) 22,5 1 
[25 30) 27,5 3 
∑ 36 
 Tema 1 
 Pg. nº 9/11 
Pirámides de población 
 
Las pirámides de población se utilizan para estudiar conjuntamente la variable edad y el atributo 
sexo. 
 
El gráfico se obtiene representando en la ordenada el grupo de edad, y en la abscisa el sexo. Para 
la modalidad mujer se toma el semieje positivo, y para la modalidad hombre el semieje negativo. 
 
El estudio detallado de las pirámides de población aporta datos sobre aspectos sociológicos 
ligados a dicha población, cómo por ejemplo, catástrofes, guerras, control de natalidad, 
desarrollo de la población. Asimismo se pueden realizar previsiones para el futuro, como es el 
caso del estudio de las necesidades de las futuras pensiones. 
 
 
 
 
 
Ejemplos de distintos tipos de gráficos. 
 
 
 Tema 1 
 Pg. nº 10/11 
Resumen: 
 
 
Estadística: Estadística descriptiva. Estadística inferencial. 
 Población. Muestra. Individuo. 
 
Variables o carácter estadístico. 
 Variables cualitativas. 
 Variables cuantitativas. 
 V. cuantitativas discretas. 
 V. cuantitativas continuas. 
 
Tablas estadísticas. 
 Intervalos o clases. 
 Marcas de clase. 
 Frecuencias absolutas, fi. 
 Frecuencia absoluta acumulada, Fi. 
 Frecuencia relativa, hi. 
 Frecuencia relativa acumulada, Hi. 
 
Diagrama de tallos y hojas 
 
 
Gráficos 
 Para variables cualitativas o cuantitativas discretas. 
 Diagramas de barras. 
 Polígonos de frecuencias. 
 Diagramas de sectores. 
 Pictogramas. 
 
 
Para variables cuantitativas continuas. 
 Histogramas. 
 Polígonos de frecuencias (sobre el histograma). 
 Diagramas de sectores. 
 Pictogramas. 
 
 Otros 
 Cartogramas. 
 Diagramas lineales. 
 Pirámides de población. 
 Tema 1 
 Pg. nº 11/11 
 
Ejercicio. 
 
 
Se ha pasado un test de 80 preguntas a 600 personas. El de respuestas correctas se refleja en la 
siguiente tabla. 
 
 
Se pide: 
1. Elaborar la tabla con todas las frecuencias. 
2. Representar de todas las formas posibles. 
 
 
 
 
Respuestas [0 10) [10 20) [20 30) [30 40) [40 50) [50 60) [60 70) [70 80) 
correctas 
Numero de 40 60 75 90 105 85 80 65 
personas 
 
 
 
 
Respuestas Marca de 
correctas clase xi fi Fi hi Hi pi Pi 
[0 10) 5 40 40 0,06667 0,06667 6,6667 6,6667 
[10 20) 15 60 100 0,10000 0,16667 10,0000 16,6667 
[20 30) 25 75 175 0,12500 0,29167 12,5000 29,1667 
[30 40) 35 90 265 0,15000 0,44167 15,0000 44,1667 
[40 50) 45 105 370 0,17500 0,61667 17,5000 61,6667 
[50 60) 55 85 455 0,14167 0,75833 14,1667 75,8333 
[60 70) 65 80 535 0,13333 0,89167 13,3333 89,1667 
[70 80) 75 65 600 0,10833 1,00000 10,8333 100,0000 
∑ 600 1,00000 100

Continuar navegando