Logo Studenta

Estadistica Resumen teorico

¡Estudia con miles de materiales!

Vista previa del material en texto

ARITMÉTICA ADMISIÓN 2020 - II 
 1 
ESTADÍSTICA 
 
1. DEFINICION 
 
Es aquella que nos proporciona un conjunto de métodos, procedimientos o técnicas para 
recopilar, clasificar, analizar y presentar datos con el fin de describirlos o de realizar 
generalizaciones válidas. 
 
El estudio de la estadística puede dividirse en dos áreas principales: 
 
 Estadística Descriptiva. - que comprenden las técnicas que se emplean para la 
recopilación, organización, resumen y presentación de los datos (o información). 
 
 Estadística Inferencial. - comprende técnicas que con base únicamente en una muestra 
o subconjunto de la población sometida a observación o experimentación, se toma 
decisiones sobre toda la población. La inferencia puede contener conclusiones que 
pueden no ser ciertas en forma absoluta, por lo que es necesario que estas sean dadas 
con una medida de confiabilidad que es la probabilidad. 
 
2. POBLACION Y MUESTRA 
 
Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de 
personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población. 
Las personas o cosas que forman parte de la población se denominan unidad elemental o 
unidad estadística. 
La población puede ser según su tamaño de dos tipos finita o infinita. Normalmente en un 
estudio estadístico, no se puede trabajar con todos los elementos de la población, sino que 
se realiza sobre un subconjunto de la misma al que se le llama muestra, es decir un 
determinado número de elementos de la población. La muestra debe ser seleccionada 
adecuadamente de manera que el tamaño de muestra sea representativo de la población 
para posibles inferencias a realizar. 
 
3. VARIABLES ESTADISTICAS 
 
Al estudiar una población o muestra nos concentramos en una característica de los 
individuos u objetos que le conforman; si esta característica tiene variabilidad o variación se 
denomina variable estadística y el resultado de las observaciones o mediciones de la 
característica se llama dato estadístico. 
 
Cuando la característica o variable en estudio es no numérica o numérica no operable se le 
denomina variable cualitativa o atributo. Así, por ejemplo: el estado civil de una persona, su 
nacionalidad, tipo de automóvil que posee, ciclo en el que se encuentra un alumno, etc. son 
variables cualitativas. 
 
Cuando la variable de estudio se puede expresar numéricamente y se puede hacer 
operaciones con ella, entonces se denomina variable cuantitativa. Así, por ejemplo: el saldo 
de una cuenta bancaria; la estatura de una persona, el número de hijos en una familia, son 
variables cuantitativas, estas variables cuantitativas pueden ser: 
 
a. discretas: Aquellas a las que se les puede asociar un número entero, es decir, aquellas 
que por su naturaleza no admiten fraccionamiento de la unidad, por ejemplo, número de 
hijos, número de empleados de una empresa, número de ruedas de un vehículo, etc. 
 
ARITMÉTICA ADMISIÓN 2020 - II 
 2 
Cuadro de Clasificación de Variables
Cualitativas
Discretas Continuas
Cuantitativas
Variables
b. continuas, Aquellas que por su naturaleza admiten que entre dos valores cualesquiera la 
variable pueda tomar cualquier valor intermedio, por ejemplo, pesos, tiempo de duración 
de en proceso y estaturas de personas, etc.). 
 
 
 
 
 
 
 
 
 
 
 
 
 
4. ORGANIZACIÓN Y PRESENTACION DE DATOS 
 
I. DATOS NO AGRUPADOS. 
 
La información que se ha recopilado pero que aún no se organiza se debe ordenar. Si los 
datos incluyen valores repetidos se puede organizar una distribución de frecuencias que es 
una tabla o lista de los distintos valores de la variable (x). Sean x1,x2, x3,…., xk los distintos 
valores que puede tomar la variable x. 
 
La Frecuencia absoluta (fi), designa el número de veces que el valor correspondiente 
aparece en el conjunto de datos. Por ejemplo, f1,f2, f3,…., fk indican las respectivas 
frecuencias absolutas de los valores x1,x2, x3,…., xk 
 
La Frecuencia relativa (hi), de cada valor, indica la frecuencia expresada como fracción o 
porcentaje del total. Si n es el número de datos, la frecuencia relativa del valor xi sera: 
 , i=1,2,....,k
i
i
f
h
n
 
 
La Frecuencia Absoluta Acumulada (Fi) es la suma de todas las frecuencias absolutas 
f1, f2,……., fi : 
 i21i f...ffF  
 
La Frecuencia Relativa Acumulada (Hi) Es el cociente entre la frecuencia acumulada 
absoluta correspondiente al dato xi , y el número total de datos. 
n
F
H ii  ; h h h   i 1 2 iH ... 
 
Ejemplo 1: Se realizó una encuesta entre los 50 empleados de una empresa, consultando 
sobre el número de hijos en edad escolar que tenía cada empleado, a fin de estimar 
el pago de una bonificación por gastos escolares que proyecta hacer la empresa. 
Estos fueron los resultados: 
 
0 2 1 0 3 2 0 1 1 0 
0 1 1 2 4 1 0 1 1 0 
2 1 0 0 3 0 0 1 2 1 
0 0 2 4 1 1 0 1 2 0 
1 1 0 3 5 1 2 1 3 2 
 
ARITMÉTICA ADMISIÓN 2020 - II 
 3 
 
Organizar los datos en una distribución de frecuencias, enlistando cada valor diferente (x) 
en una columna, luego empleamos marcas para contar el número de veces que aparece 
cada valor de x y al acabar, anotamos la frecuencia absoluta (f) y luego calculamos la 
frecuencia relativa (h). 
 
Tabla 1. Nro de hijos por empleados de una empresa. 
 
No. 
de 
hijos 
X 
Conteo 
Frecuencia 
absoluta (f) 
 
Frecuencia 
 relativa (h) 
Frecuencia 
Absoluta 
Acumulada 
Frecuencia 
Relativa 
Acumulada 
0 \\\\ \\\\ \\\\ \ 16 16/50 = 0.32 = 32% 16 32% 
1 \\\\ \\\\ \\\\ \\\ 18 18/50 = 0.36 = 36% 34 68% 
2 \\\\ \\\\ 9 9/50 = 0.18 = 18% 43 86% 
3 \\\\ 4 4/50 = 0.08 = 8% 47 94% 
4 \\ 2 2/50 = 0.04 = 4% 49 98% 
5 \ 1 1/50 = 0.02 = 2% 50 100% 
 n = 50 Total = 1 = 100% 
 
El total de frecuencias absolutas debe ser el total de datos y el total de frecuencias 
relativas debe ser el 100%. Ambos totales permiten verificar los cálculos realizados. 
 
 
 
II.- DATOS AGRUPADOS 
 
Cuando los datos consisten en solo unos cuantos valores distintos (es el caso de los datos 
del ejemplo anterior que tomaba solo los valores 0, 1, 2, 3, 4 y 5), podemos organizarlos 
fácilmente y determinar cualquier tendencia, sin embargo cuando los datos consisten en 
muchos valores en su mayoría no repetidos es conveniente agrupar los datos y determinar 
las frecuencias absolutas y relativas de cada grupo que llamaremos clase. 
Necesitamos estas definiciones: 
 
 
 
ARITMÉTICA ADMISIÓN 2020 - II 
 4 
a) Rango Recorrido (R). 
Es la diferencia entre el mayor de los datos xmáx y el menor de los datos xmin. 
 
 
 R = xmax – xmin 
 
b) Intervalo de Clase 

 b, a ii 
Son cada una de las categorías excluyentes (o clases) en los que se pueden clasificar los 
datos. Los extremos de un intervalo [ai, bi son ai y bi, donde 
 
 ai = límite inferior del intervalo de clase 
 bi = límite superior del intervalo de clase 
 
Cada intervalo es cerrado por la derecha y abierto por la izquierda. 
 
c) Marca de Clase (x’i) 
Son los puntos medios de cada clase, así en el intervalo 

 b, a ii la marca de clase x’i 
será: 
2
ba
x iii

 
 
d) Número de Intervalos (k) 
No existen reglas fijas para establecer el valor de k. Una regla sugiere que sea un 
número próximo a N y otra dice que el número ideal es 1 + 3,3 log(N) (Regla de 
Sturges), siendo N el total de datos. En muchos casos, desde 5 hasta 20 intervalos 
puede ser el número adecuado. 
 
e) Amplitud del Intervalo (A) 
Es la diferencia entre sus extremos. Por lo general todos los intervalos tienen la misma 
longitud A por lo que se cumplirá para estos casos que:k
R
A  
 
 
f) Frecuencia absoluta (fi) 
 
 Es el número de datos que corresponden al i-ésimo intervalo de clase. 
 
g) Frecuencia absoluta Acumulada (Fi) 
Se define para cada i-ésimo intervalo de clase, como la suma de todas las frecuencias 
absolutas fi desde el primero hasta el i-ésimo intervalo: 
 
 i21i f...ffF  
 
h) Frecuencia relativa (hi) 
Es el cociente entre la frecuencia absoluta del i-ésimo intervalo y el número total de 
datos. 
Es preferible redondear el 
valor de “A” por exceso 
para no perder datos. 
 
ARITMÉTICA ADMISIÓN 2020 - II 
 5 
 
 
n
f
h ii  
 
i) Frecuencia relativa Acumulada (Hi) 
Es el cociente entre la frecuencia acumulada absoluta correspondiente al i-ésimo 
intervalo y el número total de datos. 
 
 
n
F
H ii  
 
 
Organización y presentación de datos para una variable cuantitativa continúa 
 
Ejemplo. Se pesaron a 40 estudiantes y sus pesos en kilogramos fueron: 
60 69 50 79 65 71 48 60 
86 42 86 64 90 81 78 73 
69 64 72 80 65 52 70 47 
54 74 53 77 45 66 75 60 
63 55 62 72 59 61 67 55 
 
Construir la tabla de distribución de frecuencias 
 
SOLUCION: La variable (x) es el peso de los estudiantes. 
 
1. Determinación del rango 
 
Como mayor dato es: 90 ; Menor dato es: 42 
  Rango = 90 - 42 = 48 Kg. 
2. Número de intervalos : 6 40 k 
 
3. Ancho de clase 8 
6
48
 
Tabla 2 
 
Ii xi fi Fi hi Hi 
42 - 50 46 4 4 0.10 0.100 
50 - 58 54 6 10 0.15 0.250 
58 - 66 62 11 21 0.275 0.525 
66 -74 70 9 30 0.225 0.750 
74 -82 78 7 37 0.175 0.925 
82 -90 86 3 40 0.075 1.00 
 
 
 
ARITMÉTICA ADMISIÓN 2020 - II 
 6 
 
Histograma de la frecuencia absoluta con el polígono de frecuencias 
 
 
Histograma de la frecuencia absoluta acumulada y la OJIVA (Menor que) 
 
 
 
 
 
 
 
 
 
 
 
 
OBSERVACIÓN 
 
 Histogramas 
 
Son gráficos específicos para datos agrupados por intervalos. Los histogramas asocian a 
cada intervalo un rectángulo de superficie proporcional a la frecuencia. Los límites de clase 
se marcan en el eje horizontal y determinan las bases de los rectángulos y las frecuencias 
se anotan en el eje vertical y determinan sus alturas. 
 
 Polígono de frecuencias 
 
Es la línea que une los puntos correspondientes a las frecuencias de cada elemento. Si los 
datos están agrupados por intervalos, se construye de modo similar al histograma, pero los 
puntos que se unen son los correspondientes a las marcas de clase. 
 
 Ojivas 
 
Son gráficos de frecuencias acumuladas. En el eje vertical se anotan la frecuencias 
acumuladas asociadas a cada límite superior de clase (acumula frecuencias “menores 
que” un valor dado). En algunos casos se grafican las frecuencias acumuladas de todos 
los valores mayores o iguales al límite inferior de cada intervalo (ojivas “mayor que”). 
Siempre que se mencione una ojiva sin especificar su tipo, se entenderá que es de tipo 
“menor que”. 
 
F 
50 
40 
30 
20 
10 
 0 
42 50 58 66 74 82 90 
X

Continuar navegando