Logo Studenta

TEORIA ESTADISTICA - Matias Morales

¡Este material tiene más páginas!

Vista previa del material en texto

Cátedra: MATEMÁTICA 
 
 
1 
 
 
ESTADÍSTICA 
 
 
 Estadística 
 
Es la ciencia formal que estudia los métodos y procedimientos para recolectar datos, 
clasificarlos, organizarlos, representarlos, analizarlos e inferir conclusiones. Los datos 
pueden referirse a personas, animales, objetos, hechos, etc. La Estadística descriptiva 
realiza la recolección, organización, clasificación, representación y análisis de los datos. 
En cambio, la Estadística inferencial toma decisiones y realiza inferencias sobre los 
mismos. 
 
 Población 
 
Es el conjunto de todos los elementos o datos que se someten a un estudio estadístico. 
 
Ejemplos: 
La población de alumnos que estudian diseño. 
La población de animales que viven en la montaña. 
La población de autos que circulan en una ciudad. 
La población de computadoras de una institución, etc. 
 
 Individuo o unidad estadística 
 
Corresponde a cada uno de los elementos que componen la población. 
 
Ejemplos: 
En la población de alumnos que estudian diseño, los individuos son los alumnos. 
En la población de animales que viven en la montaña, cada individuo es un animal. 
En la población de autos que circulan en una ciudad, cada individuo es un auto. 
 
 Muestra 
 
Es un subconjunto representativo de la población de referencia. El número de 
individuos de una muestra es menor que el de la población y se considera mayor a 800 y 
menor a 2000. 
 
Ejemplo: 
En la población de alumnos que estudian diseño, una muestra estaría formada por 10 
alumnos que cursan primer año, 10 de segundo, 10 de tercero, etc. 
 
¿Cómo elegir una muestra? 
 
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción 
reducida y representativa de la población. Se puede realizar en forma: 
 
- Aleatoria (azarosa o estratificada) 
- No aleatoria (sistemática o deliberada) 
 Cátedra: MATEMÁTICA 
 
 
2 
 
En el muestreo no aleatorio y sistemático se busca el mismo perfil del encuestado; en el 
muestreo no aleatorio y deliberado se busca a quien encuestar. 
 
 Carácter estadístico 
 
Es el atributo que se desea estudiar sobre los individuos de la población o de la muestra. 
Puede ser de tipo cualitativo o cuantitativo; a su vez el cuantitativo puede ser continuo o 
discreto, según recolecte información utilizando números reales o números enteros 
respectivamente. 
 
Ejemplos: 
 
Carácter cualitativo: 
Se desea estudiar el color de ojos de una población. 
 
Carácter cuantitativo discreto: 
Se desea estudiar la edad en años de los alumnos de primer año. 
 
Carácter cuantitativo continuo: 
Se desean estudiar las longitudes en cm de tornillos. 
 
 
Todo carácter estadístico tiene asociado una variable estadística. 
 
 Variable estadística 
 
Es el conjunto de valores que toma el carácter estadístico al cual está asociado. Pueden 
ser de tipo cualitativas o cuantitativas, según el carácter estadístico respectivo. 
 
Ejemplos: 
 
Variable cualitativa: 
En el ejemplo del estudio del color de ojos de una población, la variable cualitativa 
puede tomar los valores: negro, marrón, verde, gris, azul. 
 
Variable cuantitativa discreta: 
En el ejemplo del estudio de la edad en años de los alumnos, la variable cuantitativa 
discreta puede tomar los valores: 17, 18, 19, 20, 21, etc. (recuerda que los valores que 
puede tomar son números enteros). 
 
Variable cuantitativa continua: 
En el ejemplo del estudio de las longitudes en cm de tornillos, la variable cuantitativa 
continua puede tomar los valores: 1,34; 1,32; 1,234; 1,452, etc. (recuerda que los 
valores que puede tomar son números reales). 
 
 
También se pueden clasificar en dicotómicas (toman dos valores) o policotómicas 
(varios valores). 
 
 Cátedra: MATEMÁTICA 
 
 
3 
 
 
Ejemplos: 
 
Variable cualitativa dicotómica: 
Si se desea estudiar la filiación de un grupo de personas, la variable cualitativa 
dicotómica asociada puede tomar los valores: si tiene hijos, no tiene hijos. 
 
Variable cualitativa policotómica: 
Si se desea estudiar el color de autos, la variable cualitativa policotómica asociada 
puede tomar los valores: verde, azul, rojo, amarillo, gris, blanco, etc. 
 
 
Para su estudio, se las considera agrupadas en intervalos o no agrupadas. 
 
Ejemplos: 
 
Variable no agrupada: 
Se ha considerado el peso en kilogramos de un grupo de jóvenes que practican natación. 
Se presentan a continuación: 
 60- 62- 70- 75- 71- 70- 70- 65- 67- 62 
 
Variable agrupada en intervalos: 
En la siguiente tabla se presentan los pesos al nacer de un grupo de bebes: 
 
Pesos(en kilogramos) Cantidad 
de bebes 
[2,0;2,3[ 5 
[2,3;2,6[ 4 
[2,6;2,9[ 8 
[2,9;3,2[ 35 
[3,2;3,5[ 20 
[3,5;3,8[ 18 
[3,8;4,1[ 10 
[4,1;4,4[ 6 
 
 
 Frecuencias 
 
Las frecuencias pueden ser de diferentes tipos: frecuencia absoluta, acumulada, relativa 
o porcentual. 
 
Frecuencia absoluta (f): es el número de veces que se registra cada valor de la 
variable. 
 
Frecuencia acumulada (fa): es la suma de todas las frecuencias absolutas 
correspondientes a los valores que preceden o son iguales al considerado. 
 
Frecuencia relativa (fr): es el cociente entre su frecuencia absoluta y el número total de 
datos de una colección (N). 
 Cátedra: MATEMÁTICA 
 
 
4 
 
 fr = f/N 
Frecuencia porcentual (f%): es el producto entre su frecuencia relativa y 100. 
 
 f% = fr .100 
 
 
 Organización de los valores de la variable y sus frecuencias 
 
Si se realiza un determinado estudio estadístico, los valores obtenidos de la variable en 
cuestión y de sus frecuencias, suelen organizarse en cuadros o tablas denominadas 
tablas de distribución de frecuencias. 
 
Ejemplos: 
 
Para una variable cualitativa 
Se realiza un estudio estadístico sobre los grupos sanguíneos de 40 personas, en la 
siguiente tabla de distribución de frecuencias se presentan los valores obtenidos y las 
frecuencias asociadas: 
 
Estatura (en cm) Cantidad de 
personas ( f) 
Frecuencia 
acumulada (fa) 
Frecuencia 
relativa (fr) 
Frecuencia 
porcentual (f%) 
A 15 15 15/40 40% 
B 12 27 12/40 30% 
O 8 35 8/40 20% 
 AB 5 40 5/40 10% 
Total ( N) 40 1 100 
 
 
Para una variable cuantitativa continua 
Se realiza un estudio estadístico sobre las estaturas (en cm) de 70 personas, en la 
siguiente tabla de distribución de frecuencias se presentan los valores obtenidos y las 
frecuencias asociadas: 
 
Estatura (en cm) Cantidad de 
personas ( f) 
Frecuencia 
acumulada (fa) 
Frecuencia 
relativa (fr) 
Frecuencia 
porcentual (f%) 
[170,0;170,3[ 5 5 5/70 7% 
[170,3;170,6[ 4 9 4/70 5% 
[170,6;170,9[ 8 17 8/70 11% 
[170,9;171,2[ 35 52 35/70 50% 
[171,2;171,5[ 18 70 18/70 25% 
Total ( N) 70 1 100 
 
 
En todos los casos, sean datos agrupados o no agrupados, se cumple que: 
- la suma de las frecuencias absolutas debe ser igual al número total de datos (N). 
- la suma de las frecuencias relativas debe ser igual a 1. 
- la suma de las frecuencias porcentuales debe ser igual a 100. 
 
 
 Cátedra: MATEMÁTICA 
 
 
5 
 
La construcción de las tablas de distribución de frecuencias esta explicada en videos que 
se encuentran en la catedra virtual. 
 
 
 Organización de los valores de la variable y sus frecuencias en 
diferentes tipos de gráficos 
 
Existen diferentes tipos de gráficos que permiten visualizar de otra forma la información 
obtenida al realizar un estudio estadístico, es decir, permiten mostrar de manera gráfica 
los valores obtenidos y sus frecuenciasasociadas. Entre ellos podemos destacar los 
gráficos de bastones, de barras, de sectores o pastel, histograma, pictograma, 
cartograma, poligonal estadística, polígono de frecuencias, etc. 
 
Para utilizarlos de forma adecuada hay que tener en cuenta que deben: 
- ajustarse a la realidad de los datos que representan, 
- ser claros, fáciles de leer y entender, 
- llevar todas las indicaciones necesarias para su fiel interpretación, 
- ser los adecuados para el carácter estadístico que visualizan. 
 
 
Ejemplos: 
 
Diagrama de bastones: 
Es una gráfica que asocia a cada valor de la variable un bastón o segmento, cuya altura 
es proporcional a la frecuencia absoluta correspondiente. Generalmente se utiliza para 
variable cualitativa o también para variable cuantitativa discreta. 
 
 
 
Diagrama de barras: 
Es una gráfica que asocia a cada valor de la variable una barra, cuya altura es 
proporcional a la frecuencia absoluta correspondiente. Generalmente se utiliza para 
variable cualitativa o también para variable cuantitativa discreta. 
 
 
 
 Cátedra: MATEMÁTICA 
 
 
6 
 
Diagrama de sectores: 
Es un diagrama de sectores, en el cual cada sector circular tiene una amplitud que es 
proporcional a la frecuencia que representa, generalmente se utiliza la frecuencia 
porcentual, en cuyo caso el disco entero representa al 100%. Se los utiliza para variable 
cualitativa o también para variable cuantitativa discreta, en estudios en donde 
intervengan poca cantidad de datos. 
 
 
 
Histograma: 
Dada una variable cuantitativa discreta o continua que este agrupada en intervalo. Un 
histograma es una gráfica que asocia a cada intervalo de dicha variable un recinto 
rectangular, siendo el valor de la frecuencia absoluta coincidente con la altura de dicho 
rectángulo. 
 
 
 
 
Poligonal estadística: 
Es la línea poligonal obtenida al unir las extremidades de los puntos medios de las bases 
superiores de los rectángulos en un histograma. 
 
 
 
 Cátedra: MATEMÁTICA 
 
 
7 
 
 
Polígono estadístico: 
Es el polígono determinado por una poligonal asociada a un histograma y una porción 
de la recta de abscisas, agregando en los dos extremos de la distribución de datos, dos 
intervalos ficticios con frecuencia cero. 
 
 
 
 Parámetros estadísticos 
 
Corresponden a los valores numéricos obtenidos al realizar un estudio estadístico y que 
reflejan el comportamiento de los datos, es decir, son números que describen, de manera 
concisa, el comportamiento y las características generales de un conjunto de datos. 
Pueden ser de diversos tipos: de centralización, de dispersión y de posición, entre otros. 
 
 Parámetros de centralización 
 
Los parámetros de centralización o medidas de tendencia central dan un valor típico o 
representativo de un conjunto de datos, es la disposición de éstos para agruparse 
alrededor del centro o de ciertos valores numéricos. Corresponden a la moda (Mo), la 
media ( X ) y la mediana (Me). 
 
 
 Para datos no agrupados en intervalos 
 
MEDIA ARITMÉTICA: X 
 
Se obtiene calculando el cociente entre la sumatoria de los productos de los valores 
numéricos de la variable y sus respectivas frecuencias, y el número total de esos valores, 
es decir: 
 X = 
N
fx
n
i
ii
1
 
 
Es un concepto intuitivamente claro, cada conjunto de datos tiene media y es única, 
además es útil para llevar a cabo procedimientos estadísticos como la comparación de 
datos. Si bien es confiable porque toma en cuenta todos los valores del conjunto, puede 
 Cátedra: MATEMÁTICA 
 
 
8 
 
verse afectada por los valores extremos que no son representativos del resto de los 
datos. 
 
MEDIANA: Me 
 
Es el valor de la variable que ocupa el lugar central en el conjunto ordenado de datos: 
 
 si N (número de datos) es par, se encuentra calculando el promedio de 
los dos valores centrales 
 si N es impar, es el valor central obtenido 
 
Los valores extremos no afectan a la mediana tan intensamente como a la media. 
 
MODA: Mo 
 
Corresponde al valor de la variable que tiene mayor frecuencia. Si el valor modal se 
repite dos veces corresponde a una distribución bimodal, si se repite más de dos veces, 
es multimodal. También puede ocurrir que todos los valores de la variable presenten la 
misma frecuencia, en ese caso no hay moda. La moda no se modifica por los valores 
extremos. 
 
 Para datos agrupados en intervalos 
 
MEDIA ARITMÉTICA: X 
 
Se obtiene calculando el cociente entre la sumatoria de los productos de las marcas de 
clase y sus respectivas frecuencias, y el número total de datos, es decir: 
 X = 
N
fx
n
i
iim
1
 
 
Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del 
intervalo i-ésimo. 
 
MEDIANA: Me 
 
Para calcular la mediana se determina primero el intervalo en donde se encuentra, y 
luego se aplica la siguiente fórmula: 
 Me = h
f
fa
N
e
i
i ).
2(
1
 
 
En donde: ei es el extremo inferior del intervalo donde está la mediana 
 fai-1 es el valor de la frecuencia acumulada del intervalo anterior 
 f es el valor que toma la frecuencia donde está la mediana 
 h es la amplitud del intervalo 
 
 Cátedra: MATEMÁTICA 
 
 
9 
 
 
 
MODA: Mo 
 
Para calcular la moda se determina primero el intervalo modal (corresponde al de mayor 
frecuencia), y luego se aplica la siguiente fórmula: 
 Mo = hei ).(
21
1


 
 
En donde: ei es el extremo inferior del intervalo de mayor frecuencia (intervalo modal) 
 1 es la diferencia entre la mayor frecuencia y la anterior 
 2 es la diferencia entre la mayor frecuencia y la siguiente 
 h es la amplitud del intervalo 
 
 
 Parámetros de dispersión 
 
Los parámetros de dispersión son medidas que representan el alejamiento o 
diseminación de los datos a lo largo del rango de distribución; es decir la variación de 
valores alrededor del punto central, o la tendencia de valores individuales a desviarse de 
los parámetros de centralización. Las más frecuentemente utilizadas son el rango, la 
desviación estándar o típica, la desviación media y la varianza. 
 
 
 Para datos no agrupados en intervalos 
 
 
RANGO: R 
 
Es el valor que se obtiene de la diferencia entre el mayor y el menor valor de la variable. 
Indica la variabilidad existente entre los valores que toma la variable, sin embargo, debe 
usarse con precaución ya que su valor depende únicamente de los valores extremos. 
 
 R = Xmax – X min 
 
 
DESVIACIÓN MEDIA: dm 
 
Indica el promedio de las desviaciones con respecto a la media. 
 
 dm = 
N
fXx
n
i
ii


1
 
 
 
xi - X  es la distancia entre X y xi 
 
 
 Cátedra: MATEMÁTICA 
 
 
10 
 
VARIANZA: 2 
 
La varianza de las observaciones x1, x2,…, xn es el promedio de los cuadrados de las 
distancias entre cada valor de la variable y la media aritmética del conjunto de datos. El 
valor de la varianza puede sufrir un cambio muy desproporcionado por la existencia de 
valores extremos en el conjunto de datos.2 = 
N
fXx
n
i
ii


1
2)(
 
 
 
 
DESVIACION ESTÁNDAR O TIPICA:  
 
La raíz cuadrada de la varianza, es la desviación estándar o típica. A menudo, esta se 
prefiere en lugar de la varianza, porque se expresa en las mismas unidades que la de los 
datos. Permite calcular con un buen grado de precisión, dónde están localizados los 
valores de la variable con respecto a la media. 
 
  = 
N
fXx
n
i
ii


1
2)(
 
 
COEFICIENTE DE VARIACIÓN: CV 
 
Es una medida de dispersión relativa, indica que proporción de la media representa la 
desviación estándar, suele expresarse en forma porcentual. 
 
CV= 
x

 
 
 
 Para datos agrupados en intervalos 
 
RANGO: R 
 
 R = Xmax – X min 
 
 
DESVIACIÓN MEDIA: dm 
 
 dm = 
N
fXx
n
i
iim


1
 
 Cátedra: MATEMÁTICA 
 
 
11 
 
Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del 
intervalo i-ésimo. 
 
 
VARIANZA: 2 
 2 = 
N
fXx
n
i
iim


1
2)(
 
Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del 
intervalo i-ésimo. 
 
 
DESVIACIÓN ESTÁNDAR O TIPICA:  
 
 = 
N
fXx
n
i
iim


1
2)(
 
Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del 
intervalo i-ésimo. 
 
 Parámetros de posición 
 
Para datos agrupados en intervalos 
 
Los parámetros de posición representan el lugar que ocupa un individuo con respecto 
a los demás en el conjunto ordenado de datos. Estos valores solo sirven para realizar 
comparaciones, corresponden entre otros, a los cuartiles y percentiles. 
 
PERCENTILES: Pk 
 
Se divide a la población en 100 partes iguales. 
Para hallar cada percentil se calcula primero la frecuencia acumulada, que permite 
determinar el intervalo donde se encuentra el mismo. Para esto se utiliza la fórmula: 
fa = 
100
kN
. Luego se aplica la siguiente fórmula para calcular el percentil k: 
 Pk = h
f
fa
kN
e
i
i ).
100(
1
 
En donde: ei es el extremo inferior del intervalo donde está el percentil 
 fai-1 es el valor de la frecuencia acumulada del intervalo anterior 
 f es la frecuencia del intervalo donde está el percentil 
 h es la amplitud del intervalo 
 
 Cátedra: MATEMÁTICA 
 
 
12 
 
 
CUARTILES: Qk 
 
Se divide a la población en 4 partes iguales. 
Para hallar cada cuartil, se calcula primero la frecuencia acumulada que permite 
determinar el intervalo donde se encuentra el mismo, utilizando la fórmula: fa = 
4
kN
. 
Luego se aplica la siguiente fórmula para calcular el cuartil k: 
 
 Qk = h
f
fa
kN
e
i
i ).
4(
1
 
En donde: ei es el extremo inferior del intervalo donde está el cuartil 
 fai-1 es el valor de la frecuencia acumulada del intervalo anterior 
 f es el valor que toma la frecuencia donde está el cuartil 
 h es la amplitud del intervalo

Continuar navegando