Logo Studenta

Estadística-RESUMEN_CONCI

¡Este material tiene más páginas!

Vista previa del material en texto

Resumen de estadística 
 
1 
 
Estadística: es una ciencia que estudia la aplicación del método científico en el análisis 
de datos, numéricos o no, con el fin de contribuir a tomar decisiones racionales. 
Población: Es el conjunto de elementos de referencia sobre el que se realizan las 
observaciones. Puede estar constituida por personas, animales, plantas, artículos o cosas. Es 
un conjunto generalmente inaccesible, que reúne unas características determinadas. 
Muestra estudiada: es el grupo de elementos en el que se recogen los datos y se realizan las 
observaciones, siendo realmente un subconjunto representativo de la población y es 
accesible y limitado. 
Parámetro: Es un valor representativo de una población. Es una medida descriptiva de alguna 
característica de una población. 
Estadístico: Es una medida descriptiva que resume una característica de una muestra extraída 
de la población. 
Ramas de la Estadística: 
● Estadística Descriptiva: Se dedica a los métodos de recolección, tabulación, análisis, 
presentación e interpretación de datos originados a partir de los fenómenos en 
estudio, a fin de describir en forma apropiada sus principales y diversas características. 
● Inferencia Estadística: Se dedica a la generación de los modelos y predicciones 
asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las 
observaciones muestrales. Se usa para modelar patrones en los datos y extraer 
conclusiones acerca de la población bajo estudio, analizando sólo una muestra de esa 
población. 
Relevamiento de datos: 
Censo: recuento de individuos que conforman una población estadística. No trabaja 
sobre una muestra, sino sobre la población total. 
Muestra: Es el grupo de sujetos que se utilizarán como objeto de estudio en una 
investigación. Será a ellos a quienes se les aplique el procedimiento experimental 
Tipos de muestreos: 
1. Muestreo aleatorio simple: cada uno de los elementos de una población tiene la 
misma posibilidad de ser elegido. Tiene poca o nula utilidad práctica cuando la 
población objetivo es muy grande y heterogénea. 
Procedimiento: El procedimiento empleado es el siguiente: 1) se asigna un 
número a cada individuo elemento de la población y 2) a través de algún medio mecánico, 
se eligen tantos elementos como sea necesario para completar el tamaño de muestra 
requerido. 
www.concienciauniversitaria.com
Conciencia Universitaria
http://es.wikipedia.org/wiki/Dato
http://es.wikipedia.org/wiki/Observaci%C3%B3n
http://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica
http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva
http://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica
http://es.wikipedia.org/wiki/Muestra_estad%C3%ADstica
http://es.wikipedia.org/wiki/Sujeto
http://es.wikipedia.org/w/index.php?title=Procedimiento_experimental&action=edit&redlink=1
http://es.wikipedia.org/w/index.php?title=Procedimiento_experimental&action=edit&redlink=1
 
Resumen de estadística 
 
2 
 
2. Muestreo aleatorio sistemático: los elementos son seleccionados en una manera 
ordenada. La manera de la selección depende del número de elementos incluidos en la 
población y el tamaño de la muestra. 
Procedimiento: El número de elementos en la población es, primero, 
dividido por el número deseado en la muestra. El cociente indicará si cada décimo, 
cada onceavo, o cada centésimo elemento en la población tendrá que ser 
seleccionado. El primer elemento de la muestra se selecciona al azar. Por lo tanto, 
una muestra sistemática puede dar la misma precisión de estimación acerca de la 
población, que una muestra aleatoria simple cuando los elementos en la población 
están ordenados al azar. 
Este procedimiento exige numerar todos los elementos de la población, pero en 
lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número 
aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra 
son los que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los 
individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el 
tamaño de la muestra: k = N/n. El número i que empleamos como punto de partida 
será un número al azar entre 1 y k. 
3. Muestreo aleatorio estratificado: Una muestra es estratificada cuando los 
elementos de la muestra son proporcionales a su presencia en la población. Consiste 
en considerar categorías típicas diferentes entre sí (estratos) que poseen gran 
homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, 
según la profesión, el municipio de residencia, el sexo, el estado civil, etc). Lo que se 
pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés 
estarán representados adecuadamente en la muestra. Cada estrato funciona 
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple 
o el sistemático para elegir los elementos concretos que formarán parte de la muestra. 
Para la selección de los elementos o unidades representantes, se utiliza el método de 
muestreo aleatorio. 
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y 
puede ser de diferentes tipos: 
- Afijación Simple: a cada estrato le corresponde igual número de elementos 
muestrales. 
- Afijación Proporcional: la distribución se hace de acuerdo con el peso 
(tamaño) de la población en cada estrato. 
- Afijación Óptima: se tiene en cuenta la previsible dispersión de los resultados, 
de modo que se considera la proporción y la desviación típica. 
4. Muestreo de conglomerados: El muestreo por conglomerados consiste en 
seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para 
alcanzar el tamaño muestral establecido) y en investigar después todos los elementos 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
3 
 
pertenecientes a los conglomerados elegidos. Una muestra de conglomerados, 
usualmente produce un mayor error muestral. 
Procedimiento: Primero se divide la población en grupos que son convenientes para el 
muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método 
sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método 
sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque 
no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser 
seleccionado. 
5. Muestreo intencionado o de juicio: También recibe el nombre de sesgado. El 
investigador selecciona los elementos que a su juicio son representativos, lo que exige 
un conocimiento previo de la población que se investiga. 
6. Muestreo por cuotas: También llamado muestreo accidental, se divide a la 
población en estratos o categorías, y se asigna una cuota para las diferentes 
categorías y, a juicio del investigador, se selecciona las unidades de muestreo. 
El muestreo por cuotas se presta a distorsiones, al quedar a criterio del 
investigador la selección de las categorías. 
7. Muestreo bola de nieve: Se localiza a algunos individuos, los cuales conducen a 
otros, y estos a otros, y así hasta conseguir una muestra suficiente. 
8. Muestreo mixto: Se combinan diversos tipos de muestreo. 
Variable: es una característica que varía de un elemento a otro de la población o de la 
muestra. Los datos son los valores que toma la variable en cada caso. 
Clasificación de las variables según su naturaleza: 
● Cualitativas: Aquellas que no son susceptibles de medición numérica. Representan 
cualidades y atributos que se expresan en categorías 
● Cuantitativas: Aquellas susceptibles de medición numérica. Sus valores provienen de 
medir o de contar los elementos de la población o de la muestra. Según que segeneren contando o midiendo, estas variables se clasifican en discretas y continuas. 
- Variables cuantitativas discretas aquellas cuyos valores provienen de contar. 
Sus valores asumen números enteros. 
- Variables cuantitativas continuas las que provienen de efectuar mediciones. 
Se caracterizan porque entre dos valores cualesquiera de la variable, existen 
infinitos otros valores. Sus valores pueden asumir números con cifras 
decimales. 
Escalas de medición de las variables: 
● Para variables cualitativas: 
- Escala nominal: se utiliza cuando las categorías de una variable cualitativa no 
tienen naturalmente un orden establecido. 
www.concienciauniversitaria.com
Conciencia Universitaria
http://www.monografias.com/trabajos11/grupo/grupo.shtml
http://www.monografias.com/trabajos14/dinamica-grupos/dinamica-grupos.shtml
http://es.wikipedia.org/w/index.php?title=Muestreo_accidental&action=edit&redlink=1
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
4 
 
- Escala ordinal, en cambio, es útil cuando las categorías de una variable cualitativa 
tienen naturalmente un orden o jerarquía preestablecidos, 
● Para variables cuantitativas: 
- Escala de intervalo: Se caracteriza por la existencia del cero convencional que no 
significa “ausencia de…”, y porque la escala de intervalo no permite establecer 
proporciones entre los valores de la variable. 
- Escala de razón: Se caracteriza por la existencia del cero natural, que significa 
“ausencia de…”, y porque la escala de razón permite establecer proporciones entre 
los valores de las variables. 
Tabulación de Datos 
Serie simple: es un conjunto de pocos datos (generalmente n < 30 datos). Una forma 
adecuada de representar y ordenar una serie simple es mediante el diagrama de tallo y 
hojas. 
● Diagrama de tallo y hojas: Cada número se divide en dos partes, una que 
llamaremos "Tallo" y la otra denominada "ramas u hojas". 
- Tallo: Formado por uno o más dígitos principales (cifras mas significativas), 
ubicados a la izquierda del número. 
- Hojas: Resto de los números (cifras secundarias) ubicadas a la derecha. 
● Procedimiento: 
1. Se define cómo se van a dividir los números en tallos y ramas, es decir, se 
identifican cuales van a ser los tallos, y cuales va a ser las ramas. 
2. En una columna se listan los tallos en orden ascendente. 
3. Se recorren los datos y se colocan, en la columna siguiente, las hojas de acuerdo al 
tallo que tengan. 
Distribuciones de frecuencia: Es una tabla de resumen en la que los datos se agrupan 
o arreglan en clases o categorías ordenadas en forma numérica, establecidas de modo 
conveniente. 
● Datos agrupados sin intervalos: se utiliza cuando la variable, sea discreta o 
continua, presenta pocos valores diferentes entre sí, repetidos muchas veces 
cada uno. 
● Datos agrupados en intervalos: se utiliza esta forma de distribución de frecuencias, 
cuando la variable, sea discreta o continua, presenta muchos valores diferentes entre 
sí repetidos muchas veces. 
- Procedimiento: 
1. Encontrar el rango de variación de los datos. Para ello se requiere calcular los valores 
mínimo y máximo de la muestra, 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
5 
 
Xmín = Mínimo {xi} 
Xmáx = Máximo {xi} 
Rango = R = xmáx-xmin 
2. Definir el número de intervalos de clase (k). Se recomienda que el número de 
intervalos de clase esté entre 5 y 15, dependiendo del tamaño de la muestra 
disponible. Si se usa un número muy bajo, los valores quedan muy concentrados y se 
pierde mucha precisión, mientras que si se emplea un número muy alto y la muestra 
es muy pequeña, los datos quedan muy dispersos y realmente no se obtiene mucha 
información. 
3. Calcular el tamaño del intervalo de clase o amplitud de clase (a). Para ello se debe 
calcular la relación entre el rango de los datos y el número de intervalos. Se tomará 
como tamaño del intervalo a un valor ligeramente superior a esta relación, es decir, 
a > (xmáx-xmín) / k 
4. Construir los intervalos. cada intervalo de clase i, está definido mediante un límite 
inferior) y por un límite superior. Para el primer intervalo de clase, el límite inferior 
corresponde al valor más pequeño de la muestra o menor, y el límite superior de cada 
intervalo siempre será igual al límite inferior más el ancho del intervalo de clase. 
Para los demás intervalos diferentes al primero, el límite inferior será igual al limite 
superior del intervalo inmediatamente anterior. 
5. Se toman los valores de la muestra, y se define a qué intervalo corresponde. 
Representación gráfica 
Variable cualitativa: Generalmente se usan barras horizontales. 
Variable cuantitativa: 
● Datos agrupados sin intervalos: Gráfico de bastones. 
● Datos agrupados en intervalos: Histograma y polígono de frecuencias. El gráfico de 
barras adyacentes constituye el histograma de frecuencias absolutas, y la línea 
quebrada que une los puntos medios de los lados superiores de los rectángulos es el 
polígono de frecuencias absolutas. 
Otras distribuciones de frecuencias 
Frecuencias relativas: Las frecuencias relativas se utilizan para saber qué proporción o 
porcentaje de observaciones tiene un determinado valor, o están comprendidas en un 
intervalo determinado. Su representación gráfica es igual a la de las frecuencias absolutas, sólo 
cambia la escala del eje de ordenadas, en el cual se representan las frecuencias relativas 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
6 
 
Frecuencias acumuladas: Las Fi ↓ se utilizan cuando se desea averiguar cuántas 
observaciones de la variable son menores o iguales que una de ellas determina, mientras que 
las Fi ↑ son más apropiadas cuando se necesita saber qué cantidad de observaciones de la 
variable son mayores o iguales que alguna de ellas. 
Representación gráfica: 
● En datos agrupados sin intervalos: La representación gráfica es un diagrama 
escalonado, en este caso el escalón más alto le corresponde a una ordenada igual a n. 
Fi ↓ genera un gráfico escalonado creciente, mientras que Fi↑ genera una escalera 
descendente. El punto de intersección de ambas curvas corresponde a la Mediana. 
● En datos agrupado con intervalos: La representación gráfica es un diagrama con una 
línea curva siempre creciente llamado polígono de frecuencias acumuladas u “ojiva”. 
Cuando las frecuencias son acumuladas de la forma “Mayor que” ( Fi ↑ ) la línea es 
decreciente. Si se genera un gráfico con ambos tipos de frecuencias acumulativas, el 
punto de intersección de las ojivas corresponde a la Mediana. 
Medidas Descriptivas 
Medidas de tendencia central: indican los valores centrales de la variable hacia los 
cuales tienden a agruparse las observaciones. Comúnmente se los llama promedios. 
Media aritmética: Es el valor obtenido sumando las observaciones y dividiendo esta suma 
por el número de observaciones que hay en el grupo. La media resume en un valor las 
características de una variable teniendo en cuenta a todos los casos. Solamente puede 
utilizarse con variables cuantitativas. Es el promedio más conocido y de mayor uso. 
● Propiedades de la media aritmética: 
1. Puede ser calculada en distribuciones con escala relativa e intervalar. 
2. Todos los valores son incluidos en el cómputo de la media. 
3. Una serie de datos solo tiene una media. 
4. Es una medida muy útil para comparar dos o más poblaciones. 
5. Es la única medida de tendencia central donde la suma de las desviaciones de cadavalor respecto a la media es igual a cero. 
6. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto 
a la media aritmética, es un mínimo. 
7. Si a todos los valores de la variable se les suma una constante, la media aritmética 
queda aumentada en dicho número. 
8. Si todos los valores de la variable se multiplican por una constante, la media aritmética 
queda multiplicada por dicho número. 
9. Propiedad de linealidad de la media. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
7 
 
● Ventajas de la media aritmética: 
1. Es la medida de tendencia central más usada. 
2. El promedio es estable en el muestreo. 
3. Es sensible a cualquier cambio en los datos (puede ser usado como un detector 
de variaciones en los datos). 
4. Se emplea a menudo en cálculos estadísticos posteriores. 
5. Presenta rigor matemático. 
6. En la gráfica de frecuencia representa el centro de 
gravedad. 
● Desventajas de la media aritmética: 
1. Es sensible a los valores extremos. Si alguno de los valores es extremadamente grande 
o extremadamente pequeño, la media no es el promedio apropiado para representar 
la serie de datos. 
2. No es recomendable emplearla en distribuciones muy asimétricas. 
3. Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede 
no pertenecer al conjunto de valores de la variable. 
La mediana: Es aquel valor que divide al conjunto en dos partes iguales, de forma que 
el número de valores mayor o igual a la mediana es igual al número de valores 
menores o igual a estos. 
● Cálculo de la Mediana: 
- Para serie simple: Lo primero que se requiere es ordenar los datos en forma 
ascendente o descendente. Si el número de valores es impar, la mediana es el 
valor medio, cuando el número de valores en el conjunto es par, no existe un 
solo valor medio, si no que existe dos valores medios, en tal caso, la mediana es 
el promedio de los valores. 
- Para datos agrupados sin intervalos: El valor de la variable al cual le corresponde la 
frecuencia acumulada, de la forma “menor que”, inmediatamente superior a la mitad 
de las observaciones (n/2). 
o Cálculo gráfico: En el gráfico escalonado de frecuencias absolutas o relativas 
acumuladas de la forma “menor que” Se traza una línea paralela al eje de 
abscisas hasta cortar el gráfico escalonado, por esa intersección se baja una 
línea perpendicular al mismo eje, y allí se encuentra la mediana. 
- Para datos agrupados en intervalos: 
o Cálculo gráfico: En el gráfico de frecuencias absolutas o relativas acumuladas 
de la forma “menor que” Se traza una línea paralela al eje de abscisas hasta 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
8 
 
cortar el polígono de frecuencias acumuladas, por esa intersección se baja una 
línea perpendicular al mismo eje, y allí se encuentra la mediana. 
● Propiedades de la mediana: 
1.- Es única y simple. 
2.- Los valores extremos no tienen efectos importantes sobre la mediana, tiene la ventaja 
de no estar afectada por las observaciones extremas. Por ello es adecuado su uso en 
distribuciones asimétricas. 
3.- Es de cálculo rápido y de interpretación sencilla. 
4.- Si una población está formada por 2 subpoblaciones de medianas Med1 y Med2, sólo se 
puede afirmar que la mediana, Med, de la población está comprendida entre Med1 y Med2 
5.- Puede ser calculada aunque el intervalo inferior o el superior no tenga límites. 
6.- La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su 
mediana es menor o igual que cualquier otro valor. 
7.- El mayor defecto de la mediana es que tiene unas propiedades matemáticas 
complicadas, lo que hace que sea muy difícil de utilizar en inferencia estadística. 
Moda: Es el valor más frecuente. Su cálculo es el más simple de los tres 
correspondientes a estadísticos de centralidad pero la moda es el estadístico de mayor 
varianza. La moda puede no existir y cuando existe no es necesariamente única. 
● Cálculo: 
- En una serie simple: Es el valor que se repite mayor cantidad de veces. 
- En datos agrupados sin intervalos: Es el valor de la variable que tiene mayor 
frecuencia absoluta o relativa. 
o Gráficamente: Es el valor al que le corresponde el bastón más alto del gráfico. 
● En datos agrupados con intervalos: 
o Gráficamente: La moda se calcula en el histograma de frecuencias absolutas o 
relativas, como se indica: 
 
 
 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
9 
 
Medidas de dispersión: Muestran la variabilidad de una distribución, indicando por medio 
de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. 
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea 
será. 
Rango: Es la diferencia entre el valor mínimo y el valor máximo en un grupo de números 
aleatorios. 
Varianza: Es una medida estadística que mide la dispersión de los valores respecto a un valor 
central (media). 
● Propiedades 
1. La varianza es siempre positiva o 0. Cuando todos los datos de la distribución son iguales, 
la varianza y la desviación típica son iguales a 0. 
2. Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de 
valor será detectado. 
3. Son índices que describen la variabilidad o dispersión y por tanto cuando los datos 
están muy alejados de la media, el numerador de sus fórmulas será grande y la 
varianza y la desviación típica lo serán. 
4. Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. 
Para reducir a la mitad la desviación típica, la muestra se tiene que multiplicar por 
4. 
5. Si a los datos de la distribución les sumamos una cantidad constante la varianza no 
se modifica. 
6. Si a los datos de la distribución les multiplicamos una constante, la varianza queda 
multiplicada por el cuadrado de esa constante. 
7. Propiedad distributiva: V(X ± Y) = V(X) + V(Y) 
Desviación típica: Informa sobre la dispersión de los datos respecto al valor de la 
media; cuanto mayor sea su valor, más dispersos estarán los datos. Se interpreta 
diciendo que “la dispersión de los datos mayores que la media por encima de la media, 
y de los valores menores que la media por debajo de la media, es de …”. 
Coeficiente de variación: Es una medida de dispersión relativa de los datos y se calcula 
dividiendo la desviación típica muestral por la media y multiplicando el cociente por 
100. Su utilidad estriba en que permite comparar la dispersión o variabilidad de dos o 
más grupos. 
Desviación media y desviación mediana: La desviación media es la media aritmética 
de las desviaciones absolutas de los valores de la variable con respecto a la media. La 
www.concienciauniversitaria.com
Conciencia Universitaria
http://es.wikipedia.org/wiki/Media_estad%C3%ADstica
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
10 
 
desviación mediana es la media aritmética de las desviaciones absolutas de los valores 
de la variable con respecto a la mediana. 
Medidas de distribución: Asimetría y Kurtosis: Permiten identificar la forma en que se 
separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas 
describen la manera como los datos tienden a reunirse de acuerdocon la frecuencia 
con que se hallen dentro de la información. 
Asimetría: Permite identificar si los datos se distribuyen de forma uniforme alrededor 
del punto central (Media aritmética). La asimetría presenta tres estados diferentes, 
cada uno de los cuales define de forma concisa como están distribuidos los datos 
respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de 
los datos se encuentran por encima del valor de la media aritmética, la curva 
es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en 
ambos lados de la media y se conoce como asimetría negativa cuando la mayor 
cantidad de datos se aglomeran en los valores menores que la media. 
● (As = 0): Se acepta que la distribución es Simétrica. 
● (As > 0): La curva es asimétrica positiva. 
● (As < 0): La curva es asimétrica negativa. 
● Curtosis: Esta medida determina el grado de concentración que presentan los valores en la 
región central de la distribución. Por medio del Coeficiente de Curtosis, se puede 
identificar si existe una gran concentración de valores (Leptocúrtica), una concentración 
normal (Mesocúrtica) ó una baja concentración (Platicúrtica). 
- (K ⇒ 0) la distribución es Platicúrtica 
- (K ⇒ 0,5) la distribución es Leptocúrtica 
- (K ⇒ 0,25) la distribución es Mesocúrtica 
Media geométrica: la media geométrica de un conjunto de n números positivos se define 
como la raíz enésima del producto de los n números. Existen dos usos principales de la media 
geométrica: Para promediar porcentajes, índices y cifras relativas y para determinar el 
incremento porcentual promedio en ventas, producción u otras actividades o series 
económicas de un periodo a otro. 
● Propiedades: 
El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos 
de los valores de la variable. 
● Ventajas: 
1. Considera todos los valores de la distribución. 
2. Es menos sensible que la media aritmética a los valores extremos. 
● Desventajas: 
1. Es de significado estadístico menos intuitivo que la media aritmética. 
www.concienciauniversitaria.com
Conciencia Universitaria
http://es.wikipedia.org/wiki/Logaritmo
http://es.wikipedia.org/wiki/Media_aritm%C3%A9tica
http://es.wikipedia.org/wiki/Variable
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
11 
 
2. Su cálculo es más difícil. 
3. En ocasiones no queda determinada; por ejemplo, si un valor xi=0 entonces la media 
geométrica se anula. 
Media armónica: La Media armónica de un conjunto finito de valores es igual 
al recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores. Se 
utiliza para promediar velocidades, tiempos, rendimientos, en general promedios por 
unidad. 
● Propiedades: 
1. La inversa de la media armónica es la media aritmética de los inversos de los valores de la 
variable. 
2. Siempre se puede pasar de una media armónica a una media aritmética transformando 
adecuadamente los datos. 
● Ventajas: 
1. Considera todos los valores de la distribución. 
2. En ciertos casos, es más representativa que la media aritmética. 
● Desventajas: 
1. La influencia de los valores pequeños. 
2. El hecho que no se puede determinar en las distribuciones con algunos valores iguales a 
cero; por eso no es aconsejable su empleo en distribuciones donde existan valores muy 
pequeños. 
 
Diagrama de caja: Es un gráfico mediante el cual se visualiza un conjunto de datos. 
Suministra información sobre la mediana, el cuartil Q1 y Q3, sobre la existencia de 
valores atípicos y la simetría de la distribución. Se usa cuando se necesita la mayor 
información acerca de la distribución de los datos, la ventaja que posee con respecto a 
los demás diagramas es que este gráfico posee características como centro y 
dispersión de los datos, y la principal desventaja que posee es que no presenta 
ninguna información acerca de las frecuencias que presentan los datos. 
● Como dibujarlo: 
1. Ordenar los datos y obtener el valor mínimo, el máximo, y los cuartiles Q1, Q2 y Q3. 
2. Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana 
(Q2) mediante una línea. 
3. Calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos. 
Li = Q1 – 1,5(Q3 – Q1) y Ls = Q3 + 1,5(Q3 – Q1) 
4. Considerar como atípicos los puntos localizados fuera del intervalo (Li, Ls). 
5. Dibujar las líneas que van desde cada extremo del rectángulo central hasta el valor 
más alejado no atípico. 
www.concienciauniversitaria.com
Conciencia Universitaria
http://es.wikipedia.org/wiki/Rec%C3%ADproco
http://es.wikipedia.org/wiki/Media_aritm%C3%A9tica
http://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica)
http://es.wikipedia.org/wiki/Valor_at%C3%ADpico
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
12 
 
6. Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls). 
 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
13 
 
 
Partes de un gráfico: 
1) Título: El Título es una descripción del contenido del gráfico. Debe ser compacto y 
completo. Como para las tablas o cuadros estadísticos, el título del gráfico debe responder 
a las preguntas siguientes : ¿qué?, ¿dónde?, ¿cómo? y ¿cuándo?. 
2) Escalas: La Escala es la relación que existe entre la unidad del dibujo y la unidad en la 
variable que desea representarse. 
3) Diagramas: Los Diagramas son los dibujos que se utilizan para representar gráficamente los 
datos estadísticos; pueden ser líneas, barras, áreas geométricas, símbolos, mapas, etc. 
4) Fuente: La Fuente es una nota que indica de donde provienen los datos tomados como 
base para construir la gráfica. Se colocará en la parte inferior de la gráfica. 
Gráficos de líneas: Se utilizan para graficar la evolución de la variable a través del tiempo. En 
un sistema de ejes coordenados se hace corresponder al eje de abcisas el tiempo, marcando 
continuamente de izquierda a derecha los períodos, empezando por el tiempo más antiguo ; y 
al eje de ordenadas se hace corresponder la variable cuya evolución se estudia. Para construir 
un gráfico de líneas, primero se marcan los datos mediante puntos de acuerdo a las escalas de 
los ejes, y luego se unen entre sí los puntos consecutivos por líneas rectas. Los gráficos de 
líneas también se llaman curvas o poligonales. 
Gráfico de fajas: Este tipo de gráfico se utiliza para representar la evolución de un fenómeno 
y de sus partes componentes. 
Gráficos de barras o bastones: Se utilizan cuando se trata de representar atributos que no 
tienen variación continua. Las barras son rectángulos, cuyo ancho es el mismo para todas las 
barras dibujadas, mientras que la longitud de cada barra indica los datos representados. Hay 
espacios de igual amplitud entre barras individuales, pudiendo ser esa amplitud desde la mitad 
del ancho de las barras hasta el ancho mismo de las barras. 
Comparación entre gráficos de líneas y gráficos de barras: 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
14 
 
a) Las gráficas de barras son efectivas para enfatizar unos pocos ítems de una o dos 
series de datos, mientras que las gráficas de líneas son preferibles para representar 
muchos ítems en una o varias series de datos. 
b) Los gráficos de barras enfatizan las diferencias entre ítems individuales, pero losgráficos de líneas enfatizan los cambios continuos o tendencia general entre los 
ítems. 
c) Las gráficas de barras son usadas frecuentemente para representar datos clasificados 
mediante cualquier base, las gráficas de líneas se usan principalmente para 
representar datos clasificados por tiempo, o sea, series de tiempo o series 
cronológicas. 
d) Se necesita más tiempo para dibujar barras en una gráfica de barras que para marcar 
puntos y conectarlos mediante líneas rectas en una gráfica de líneas. 
Gráficos de siluetas: Son especialmente útiles para representar las variaciones positivas y 
negativas respecto de un valor fijo. 
Gráfico de sectores circulares: Son especialmente utilizados cuando se quiere representar 
la distribución de un atributo en sus partes componentes. También se los llama gráficos de 
pastel. Se divide un círculo en sus partes componentes proporcionales de acuerdo a las cifras 
porcentuales que se quieren representar. El número de grados representativo de cada valor se 
calcula mediante la aplicación de una regla de tres simple directa, haciendo corresponder el 
100 % al total de grados en el arco circular, 360º. 
Gráficos angulares: Estos gráficos se utilizan en casos especiales para representar datos 
mensuales en el transcurso de un año. Se construyen trazando una circunferencia cuyo radio 
es equivalente al promedio aritmético de los valores observados, los cuales se representan 
gráficamente sobre 12 radios vectores correspondientes a cada unos de los meses del año. 
Luego se unen los puntos obtenidos con una línea quebrada. 
Gráfico en Z: El gráfico en Z consiste en representar datos mensuales, conjuntamente con los 
datos acumulados en el año y totales acumulados procedentes de años anteriores. Se 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
15 
 
necesitan dos escalas, una para los datos mensuales y acumulados del año y otra para los 
acumulados totales. Se utiliza el diagrama de líneas para representar cada ítem. 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
16 
 
 
Índice: Es una cifra descriptiva 
del volumen de un agregado dado, o del cambio de él, con el tiempo o de un lugar a 
otro. Los números índices relacionan una o varias variables de un período dado con la 
misma variable o variables en otro período, llamado período base. 
 
 
 
 
Indices univariables: La función principal de un número índice univariable es 
transformar las magnitudes absolutas de una variable (precios o cantidades) en un 
número relativo, para facilitar la comparación de los cambios en la variable con el 
transcurso del tiempo. 
Variacion porcentual: Representa el cambio registrado en una variable entre dos 
períodos, en cifras porcentuales. 
Indices simples: 
Agregados: Un índice de precios agregado simple para el período n, es el cociente 
entre la suma de precios en dicho período y la suma de precios en el período base, 
expresado como un porcentaje. 
● Procedimiento: 
1. Se suman los precios de todos los bienes en el período actual. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
17 
 
2. Se suman los precios de los bienes en el período base. 
3. Se calcula el cociente entre ambos totales. 
● Interpretación: Los precios/cantidades de los tres artículos en conjunto, 
significan en el período actual el …% de los precios/cantidades de los mismos 
artículos en el período base. 
● Desventajas: 
 1. Considera a cada artículo en el grupo como de igual importancia. 
 2. Carece de sentido cuando los precios están referidos a distintas unidades de 
producto. 
 3. Si se tratara de comparar cantidades de bienes cotizados en las mismas 
unidades, este índice, QAS , compararía las cantidades de un período dado con 
respecto a las cantidades de un período base, suponiendo que el precio de cada bien 
es en cada período de 1$ por unidad. Este supuesto carece de realismo, por lo cual 
esta fórmula no suele usarse para calcular índices de cantidad. 
Promedios de relativos: Se construyen calculando promedios de los relativos de 
precios o de cantidades. 
● Media aritmética simple de relativos: 
 1. Se calculan los relativos de precios o de cantidades. 
 2. Se suman los relativos calculados en 1. 
 3. Se divide esa suma por el total de artículos que intervienen. 
● Media geométrica de relativos: 
 1. Calcular los relativos de precios o de cantidades. 
 2. Calcular la media geométrica de los mismos. 
*Los índices geométricos dan resultados numéricos menores que los aritméticos. 
● Interpretación: Tanto el promedio aritmético como el geométrico indican que 
los precios de este conjunto de artículos se han incrementado, en promedio, 
aproximadamente un % en el período actual con respecto del período base. 
● Ventajas: Se evita la dificultad de estar influídos por las unidades en que se 
cotizan los precios, o bien por el nivel absoluto de los precios individuales. Estas 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
18 
 
fórmulas pueden usarse para calcular índices de cantidades para un agregado 
de bienes, que no son cotizados en las mismas unidades. 
● Inconvenientes: 
1. La elección del promedio a utilizar, no siempre es sencillo. 
2. Considera todos los relativos igualmente importantes en el cálculo del índice, y 
esto no es representativo de la realidad económica. 
3. Los promedios simples de precios relativos sufren la influencia excesiva de 
grandes aumentos en porcentaje de los precios, en comparación con el 
período base. 
Indices ponderados: Una ponderación representa la importancia relativa del artículo 
con respecto a los otros artículos incluidos en el cálculo. 
 
 
 
Método de Laspeyres: Estos índices se calculan utilizando como ponderaciones las 
cantidades o los precios del período base. 
● Pasos: 
 1) Multiplicar el precio de cada bien en cada período por la cantidad de dicho bien 
en el período base. 
 2) Calcular las sumas de los productos obtenidos en 1). 
 3) Dividir el total de cada período por el total del período base. 
 4) Multiplicar el resultado por 100. 
● Interpretación: Indica el cambio en el valor agregado de la lista de productos del 
período base, cuando son valuados a precios del período base y del período 
dado. 
● Ventajas: 
 1. Siempre pueden hacerse comparaciones de precios, no sólo desde cada período 
de tiempo con el período base, sino también entre un período y otro. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
19 
 
 2. El denominador es una cantidad que se mantiene constante durante varios 
períodos de tiempo. 
● Inconvenientes: El inconveniente principal es que tiene un patrón estático de 
consumo o de producción, el cual se desactualiza y se vuelve más irreal cuanto 
más tiempo transcurre. 
Método de Paasche: Se calculan utilizando como ponderaciones los precios o las 
cantidades del período dado, o actual. 
● Pasos: 
 1) Multiplicar el precio decada bien en cada período por la cantidad de dicho 
bien en el período dado. 
 2) Sumar los productos obtenidos. 
 3) Dividir el total de cada período por el total del período base. 
 4) Multiplicar el resultado por 100. 
● Interpretación: En general, el índice de precios de Paasche indica el cambio en el 
valor agregado de la lista de productos del período dado, cuando son valuados 
a precios del período base y del período dado. 
● Ventaja: Al cambiar las ponderaciones en cada período, se refleja mejor la 
importancia relativa de los artículos, así como los cambios en las condiciones 
económicas de producción, ventas, compras. 
● Inconvenientes: 
 1. Sólo pueden hacerse comparaciones apropiadas entre cada período y el período 
base, no entre períodos cualesquiera. 
 2. Obtener una lista adecuada y detallada de ponderaciones en cada período sería 
muy laborioso y de gran costo. 
*Los índices de Laspeyres tenderán a exceder a los de Paasche. 
Indices de ponderación fija: Son ponderaciones, establecidas en un punto particular 
en el tiempo o desarrolladas como un promedio de varios períodos de tiempo, 
índices ideales de Fisher: Es el promedio geométrico de los dos índices. 
Indices de valores: La utilidad práctica de este índice, es que permite realizar la prueba 
de consistencia de los índices de precios y de cantidades, la cual significa que el 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
20 
 
producto de precios y de cantidades debe producir un índice de valores. Esto da la 
pauta de la ponderación apropiada para los índices. 
● Conclusión: Si el índice de precios se pondera con las cantidades del período 
base, el de cantidades debe ponderarse con los precios del período actual, y 
viceversa 
Indices de productividad: La productividad es la eficiencia en la producción. Se mide 
por la razón de producción a insumos, es decir : 
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑝
𝑝𝑝𝑝𝑝𝑝𝑝𝑝
 
● Interpretación: Suponiendo que la producción se mantiene constante, el índice 
mide los cambios en las horas-hombre por unidad producida. Por lo tanto, a 
medida que el índice disminuye aumenta la productividad. Si se invierte la 
razón resulta un índice que mide el cambio en la producción por hora-hombre, 
el cual a medida que aumenta indica que aumenta la productividad. 
 
Ajustes de numeros indices: 
Cambio de base: Se debe procurar que el período base elegido sea lo más 
representativo posible, y no muy alejado del período actual. Cuando dicho período 
base pierde representatividad con el tiempo, es necesario cambiarlo por uno más 
reciente. Para obtener los números índices con el período base cambiado, se utiliza el 
método de la regla proporcional, que consiste en: “dividir cada uno de los índices 
anteriores por el índice correspondiente al nuevo período base, y multiplicando por 
100”. 
Empalme de índices: Cuando las ponderaciones de un número índice quedan 
inadecuadas, se puede obtener otro índice con nuevas ponderaciones. Primero se 
debe establecer que la nueva serie de índices tenga un valor de 100 en el período base 
nuevo deseado, y se compara con el valor correspondiente a la serie de índices antigua 
para el mismo período. Se puede reconstruir la nueva serie de índices hacia atrás en el 
tiempo, utilizando la ecuación de cambio de base, y se puede avanzar la serie antigua 
al período de tiempo t , despejando I viejo(t) . 
I viejo(t) = [ I nuevo(t) . Ibase deseado(0) ] / 100 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
21 
 
 
Definiciones de Probabilidad: 
● Definición de Laplace. Teoría Clásica: En el caso de que todos los sucesos 
elementales del espacio muestral E sean equiprobables, la probabilidad de A es 
el cociente entre el número de resultados favorables a que ocurra el suceso A 
en el experimento y el número de resultados posibles del experimento. 
● Teoría de la frecuencia relativa: Probabilidad de un suceso es el número al que 
tiende la frecuencia relativa asociada al suceso a medida que el número de 
veces que se realiza el experimento crece. 
● Teoría personalista: Considera la probabilidad como una medida de la 
confianza personal en la ocurrencia de un suceso. Un subjetivista asigna un 
peso entre cero y uno a un suceso, según su grado de creencia en su posible 
ocurrencia. 
Teoremas: 
● Teorema 1, “Ley de no negatividad”: 0 ≤ 𝑝(𝑝) ≤ 1 
● Teorema 2: P(S)=1 
● Teorema 3, “Ley aditiva especial”: Dados 𝑝 𝑝 𝑝/𝑝(𝑝 ∩ 𝑝) = ∅ → 𝑝(𝑝 ∪ 𝑝) =
𝑝(𝑝) + 𝑝(𝑝). 
● Teorema 4, “Ley aditiva general”: Dados 𝑝 𝑝 𝑝/𝑝(𝑝 ∩ 𝑝) = ∅ → 𝑝(𝑝 ∩ 𝑝) =
𝑝(𝑝) + 𝑝(𝑝) − 𝑝(𝑝 ∩ 𝑝). 
● Teorema 5, “Ley multiplicativa especial”: Dados 
𝑝 𝑝 𝑝,𝑝𝑝 𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 ↔ 𝑝(𝑝 ∩ 𝑝) = 𝑝(𝑝).𝑝(𝑝) 
● Teorema 6, “Ley multiplicativa general”: Dados A y B definidos en S, si 𝑝(𝑝 ∩
𝑝) ≠ 𝑝(𝑝).𝑝(𝑝) ↔ 𝑝𝑝𝑝 𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝 𝑝( 𝑝/𝑝 ) · 𝑝( 𝑝 ) ,𝑝(𝑝/
𝑝).𝑝(𝑝). 
Generalización para tres sucesos multiplicativa: Si A, B y C son tres sucesos definidos 
en el mismo espacio muestral, P( A B C ) = P( A ) · P( B/A ) · P( C/A B ). 
Generalización para tres sucesos aditiva: Si A, B y C son tres sucesos definidos en el 
mismo espacio muestral, 𝑝(𝑝 ∪ 𝑝 ∪ 𝑝) = 𝑝(𝑝) + 𝑝(𝑝) + 𝑝(𝑝) − 𝑝(𝑝 ∩ 𝑝) − 𝑝(𝑝 ∩
𝑝) − 𝑝(𝑝 ∩ 𝑝) 
Probabilidad Condicional: Sean A y B dos sucesos tal que P( A ) 0 → 𝑝(𝑝/𝑝) =
𝑝(𝑝∩𝑝)
𝑝(𝑝)
 
 → 𝑝(𝑝/𝑝) =
𝑝(𝑝∩𝑝)
𝑝(𝑝)
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
22 
 
Teorema de la probabilidad total: Sea A1, A2, ...,An un sistema completo de sucesos 
tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso 
cualquier del que se conocen las probabilidades condicionales P(B/Ai), entonces: 
 
 
 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
24 
 
 
Variables aleatorias: Una variable es aleatoria si toma diferentes valores como 
resultado de un experimento aleatorio. Puede ser discreta o continua. Si puede tomar 
sólo un número limitado de valores, entonces es una variable aleatoria discreta. En el 
otro extremo, si puede tomar cualquier valor dentro de un intervalo dado, entonces se 
trata de una variable aleatoria continua. 
Distribuciones de probabilidad discretas. 
Distribución binomial: Supongamos que un experimento aleatorio tiene las siguientes 
características: 
1. En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y 
su contrario 𝑝 (fracaso). 
2. El resultado obtenido en cada prueba es independiente de los resultados obtenidos 
anteriormente. 
3. La probabilidad del suceso A es constante, la representamos por p, y no varía de una 
prueba a otra. La probabilidad de 𝑝 es 1- p y la representamos por q. 
4. El experimento consta de un número n de 
pruebas. 
● Función de Probabilidad de la v.a. Binomial: 
● Parámetros de la Distribución Binomial: n y p. 
 
Distribución multinomial: La distribución multinomial es esencialmente igual a la binomial 
con la única diferencia de que cada prueba tiene más de dos posibles resultadosmutuamente 
excluyentes. Es una generalización inmediata de la distribución binomial que surge cuando 
cada prueba tiene más de dos resultados posibles. 
 
● Función de probabilidad: 
 
● Parámetros: p1,..., pK y n. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
25 
 
Distribución hipergeométrica: Una variable tiene distribución hipergeométrica si 
procede de un experimento que cumple las siguientes condiciones: 
1) Se toma una muestra de tamaño n, sin reemplazamiento, de un conjunto finito 
de N objetos. 
2) K de los N 
objetos se pueden clasificar como éxitos y N - K como fracasos. 
 
 
 
 
 
● Función de probabilidad: 
 
● Parámetros: n, N y K. 
 
Distribución de poisson: Una variable de tipo Poisson cuenta éxitos (es decir, objetos 
de un tipo determinado) que ocurren en un intervalo del espacio o del tiempo. 
● Condiciones: 
1. El número de éxitos que ocurren en cada región del tiempo o del espacio es 
independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto del 
anterior. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
26 
 
2. La probabilidad de un éxito en un tiempo o espacio pequeño es proporcional al 
tamaño de este y no depende de lo que ocurra fuera de él. 
3. La probabilidad de encontrar uno o más éxitos en una región del tiempo o del 
espacio tiende a cero a medida que se reducen las dimensiones de la región en 
estudio. 
 
*Las variables Poisson típicas son variables en las que se cuentan sucesos raros. 
 
● Función de probabilidad: 
 
● Parámetros: 
Distribuciones de probabilidad continuas. 
Distribución normal: Es la distribución de mayor importancia en el campo de la estadística. 
Una variable es normal cuando se ajusta a la ley de los grandes números, es decir, cuando sus 
valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas 
causas de efecto infinitesimal. 
*Las variables normales tienen una función de densidad con forma de campana a la que se 
llama campana de Gauss. 
● Parámetros: Media y desviación típica, μ y σ, respectivamente. 
● Propiedades de la curva normal: 
1) El máximo de la curva coincide con la media. 
2) Es perfectamente simétrica respecto a la media. 
3) La curva tiene dos puntos de inflexión situados a una desviación típica de la 
media. En esos puntos cambia la curvatura. 
4) Sus colas son asintóticas al eje X. 
5) Un cambio en la media desplaza la curva hacia la derecha o izquierda, mientras 
que un cambio en la varianza o desviación estándar cambia la forma de la 
curva. 
6) La suma de variables normales independientes es otra normal. 
Para calcular probabilidades en intervalos de valores de la variable: Cualquiera que 
sea la variable normal, X, se puede establecer una correspondencia de sus valores con 
los de otra variable con distribución normal, media 0 y varianza 1, a la que se llama 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
27 
 
variable normal tipificada o Z. La equivalencia entre ambas variables se obtiene 
mediante la ecuación: 
 
La transformación de la variable X en la variable Z produce el efecto de reducir 
X a unidades en términos de desviaciones estándares alejadas de la media. 
Esta propiedad de la variable normal estandarizada permite calcular 
probabilidades normales para cualquier n() con una única tabla de probabilidades, la 
de n(0,1). Porque si X es n(), entonces Z = (X-)/ es n(0,1). Y también es posible calcular 
un valor de la variable X dada una probabilidad determinada, mediante la fórmula X = 
Z+ 
Características de la distribución normal tipificada: 
1. No depende de ningún parámetro 
2. Su media es 0, su varianza es 1 y su desviación típica es 1. 
3. La curva f(x) es simétrica respecto del eje OY 
4. Tiene un máximo en este eje 
5. Tiene dos puntos de inflexión en z =1 y z = -1 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
29 
 
 
Teorema central del límite: Indica que, bajo condiciones muy generales, la suma de 
variables aleatorias independientes e idénticamente distribuidas, tiende a una 
distribución normal cuando la cantidad de variables es muy grande. 
Teorema: Sea 𝑝1, 𝑝2, …,𝑝𝑝una muestra aleatoria de una distribución con media µ y 
varianza 𝑝2. Entonces, si n es suficientemente grande, la variable aleatoria suma 𝑝 =
𝑝1 + 𝑝2 + 𝑝3 + … + 𝑝𝑝 tiene distribucion aproximadamente normal y se verifica la 
propiedad de aditividad para la esperanza y la varianza. 
Distribuciones muestrales: Dada una población finita de tamaño N, o infinita, si en ella 
se definen variables, X, Y,… y se extraen muestras aleatorias de igual o distinto tamaño, 
𝑝1, las estadísticas calculadas con las observaciones muestrales varían de una 
muestras a otra, por lo tanto, son variables aleatorias con una determinada 
distribución de probabilidad. 
Distribución muestral de la media: Si de una población con media µ y desviación típica 
𝑝, se extraen aleatoriamente todas las posibles muestras, todas ellas de tamaño n, y se 
obtienen las medias de todas estas muestras, se comprobaría que: 
1. La media de los datos, es la media µ de la población. 
2. Estas medias se distribuyen alrededor de la media de la población, con una 
desviación típica igual a la de la población dividida por la raíz de n. 
3. La distribución de las medias muestrales, es una distribución de tipo normal, 
siempre que la de procedencia lo sea, o siempre que el tamaño de las muestras 
sea 30 o mayor. 
𝑝(𝑝) = 𝑝 
𝑝𝑝 = 
𝑝
√𝑝
 
Distribución 
muestral de la proporción: Si de una población finita de tamaño N se extrae una 
muestra aleatoria de tamaño N, según el esquema siguiente: 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
30 
 
 
● Proporción poblacional: 𝑝 = 𝑝/𝑝 
● Proporción muestral: 𝑝 = 𝑝/𝑝 
𝑝(𝑝) = 𝑝 
𝑝(𝑝) = [𝑝(1 − 𝑝)]/𝑝 
Distribución muestral de la diferencia de dos proporciones: Cuando se deben 
comparar dos proporciones, se extraen dos muestras al azar independientes de dos 
poblaciones binomiales, una con proporción poblacional 𝑝1 y la otra con proporción 
poblacional 𝑝2. El esquema gráfico es el siguiente: 
 
La diferencia de las dos proporciones muestrales se define como ∆𝑝= 𝑝1 − 𝑝2, y es 
también una estadística de muestra. 
𝑝(∆𝑝) = 𝑝1 − 𝑝2 = ∆𝑝 
𝑝∆𝑝 = √[𝑝1(1 − 𝑝1)/𝑝1] + [𝑝2(1 − 𝑝2)/𝑝2] 
*La distribución muestral de ∆𝑝 es aproximadamente normal, y la variable z tiene 
distribución normal cuando n aumenta. 
∆𝑝 − ∆𝑝
𝑝∆𝑝
 ~ 𝑝(0,1) 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝 → ∞ 
Distribucion muestral de a diferencia de dos medias: Se consideran dos poblaciones 
distintas, en las cuales se define una variable con distribución normal. Se extraen 
muestras aleatorias independientes de tamaño 𝑝1 y 𝑝2, y se estiman los parámetros. 
 
 
 
 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNOResumen de estadística 
 
31 
 
Se define una diferenia ∆𝑝 = 𝑝1 − 𝑝2 en la población, que se estima con las 
observaciones muestrales con ∆𝑝= 𝑝1 − 𝑝2 
𝑝 =
(∆𝑝 − ∆𝑝)
𝑝∆𝑝
 ~ 𝑝(0,1) 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝 → ∞ 
Inferencia Estadística 
Estimación puntual: La estimación puntual consiste en estimar el valor del parámetro 
desconocido con un solo número. Un estimador puntual es una función de las 
observaciones muestrales, que no debe incluir al parámetro desconocido ni depender 
de él. 
Propiedades de un buen estimador: 
1. Insesgabilidad: Un estimador es un estimador insesgado del parámetro si el 
valor esperado del estimador es igual al parámetro. 
2. Insesgabilidad de varianza mínima: Un buen estimador es el de varianza mínima 
con respecto a otros estimadores posibles del mismo parámetro. Se refiere a la 
precisión que alcanzan los estadísticos en la estimación de los parámetros. 
3. Distribución asintóticamente normal: Un estimador es asintóticamente normal si, 
además de ser insesgado y consistente, tiene distribución normal cuando 
aumenta el tamaño de la muestra. 
4. Consistencia: Se dice que un estimador es consistente si puede lograrse que la 
probabilidad de que un estimador difiera del valor real del parámetro más que 
cualquier cantidad arbitrariamente elegida, sea tan pequeña como se quiera, 
incrementando suficientemente el tamaño de la muestra. 
5. Suficiencia: Un estimador es suficiente si brinda toda la información posible 
acerca del parámetro, de manera que, ni con otros estimadores, ni con las 
observaciones muestrales, podría obtenerse mayor información. 
Estimación por intervalos de confianza: Es la estimación de un parámetro por un 
intervalo al azar, llamado intervalo de confianza, cuyos límites superior e inferior son 
funciones de las variables aleatorias obervadas tales que la probabilidad de que se 
cumpla la desigualdad 𝑝𝑝 ≤ 𝑝 ≤ 𝑝𝑝, se expresa en términos de un número 
predeterminado, 1-α. 
Esto es: 𝑝(𝑝𝑝 ≤ 𝑝 ≤ 𝑝𝑝) = 1−∝ 
Como se van a obtener I. de c. simétricos, puede escribirse la siguiente expresión: 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
32 
 
𝑝{|�̂� − 𝑝| ≤ 𝑝𝑝�̂�} = 1−∝ 
Trabajando algebráicamente sólo con la desigualdad, 
−𝑝𝑝�̂� ≤ �̂� − 𝑝 ≤ 𝑝𝑝�̂� restando �̂� y multiplicando por (-1) 
�̂� − 𝑝𝑝�̂� ≤ 𝑝 ≤ �̂� + 𝑝𝑝𝑝 Con este resultado se puede formular la 
expresión general de un estimador de I. de 
C. simétrico de 𝑝. 
𝑝(�̂� − 𝑝𝑝�̂� ≤ 𝑝 ≤ �̂� + 𝑝𝑝�̂�) = 1−∝ 
Cuando la distribución muestral del intervalo es normal, el multiplicador de confianza k 
es el valor absoluto de una variable normal estandarizada, ±𝑝∝/2, entonces el 
intervalo de confianza toma la siguiente expresión: 
𝑝{�̂� − |𝑝∝/2|𝑝�̂� ≤ 𝑝 ≤ �̂� + |𝑝∝/2|𝑝�̂�} = 1−∝ 
Parámetr
o 
Intervalo de confianza 
𝑝 𝑝{𝑝 − |𝑝∝/2|𝑝𝑝 ≤ 𝑝 ≤ 𝑝 + |𝑝∝/2|𝑝𝑝} = 1−∝ 
 
𝑝 𝑝{𝑝 − |𝑝∝/2|𝑝𝑝 ≤ 𝑝 ≤ 𝑝 + |𝑝∝/2|𝑝𝑝} = 1−∝ 
 
∆𝑝 𝑝{𝑝1 − 𝑝2 − |𝑝∝/2|𝑝∆𝑝 ≤ 𝑝1 − 𝑝2 ≤ 𝑝1 − 𝑝2 + |𝑝∝/2|𝑝∆𝑝} = 1−
∝ 
 
∆𝑝 𝑝{𝑝1 − 𝑝2 − |𝑝∝/2|𝑝∆𝑝 ≤ 𝑝1 − 𝑝2 ≤ 𝑝1 − 𝑝2 + |𝑝∝/2|𝑝∆𝑝} = 1−
∝ 
 
 
Pruebas de hipótesis: 
Etapas de una prueba de hipótesis: 
1. Formulación de hipótesis: Una hipótesis estadística es un supuesto con respecto 
a la distribución de una variable aleatoria. Según su naturaleza pueden 
clasificarse en simples o compuestas; y tambien pueden clasificarse en 
paramétricas y no paramétricas. 
- Hipótesis nula: Se coloca lo que se supone que es falso y se desea rechazar. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
33 
 
- Hipótesis alternativa: Se coloca lo que se desea probar. 
a) Prueba bilateral o de dos colas: Se utiliza cuando el valor de un parámetro es 
demasiado grande para algún fin específico. 𝑝0:𝑝 = 𝑝0 y 𝑝1:𝑝 ≠ 𝑝0 
b) Prueba unilateral de cola izquierda: Se utiliza cuando el valor de un parámetro 
no es bastante pequeño para algún fin específico. 𝑝0:𝑝 ≥ 𝑝0 y 𝑝1:𝑝 < 𝑝0 
c) Prueba unilateral de cola derecha: Se utiliza cuando se duda de que el valor de 
un parámetro es bastante grande para una meta predeterminada. 𝑝0:𝑝 ≤ 𝑝0 y 
𝑝1:𝑝 > 𝑝0 
 
2. Especificación del nivel de significación: Probar la hipótesis nula contra una 
alternativa puede conducir a dos tipos posibles de error: 
- El error de tipo I, 𝑝𝑝, consiste en rechazar la hipótesis nula cuando en realidad 
es verdadera. 
- El error de tipo II, 𝑝𝑝𝑝, consiste en no rechazar la hipótesis nula cuando en 
realidad es falsa. 
La probabilidad máxima de cometer error de tipo I se llama nivel de significación y 
se representa por α. 
𝑝 = 𝑝á𝑝.𝑝(𝑝𝑝) = 𝑝(𝑝0/𝑝1) 
3. Selección del estadístico de prueba: La estadística de prueba es una función de las 
n observaciones muestrales, tal que su distribución por muestreo sea conocida 
bajo el supuesto de que la hipótesis nula es verdadera. El estadístico de prueba, 
en las pruebas paramétricas, se construirá siempre de la siguiente manera: 
[𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝] − [𝑝𝑝𝑝á𝑝𝑝𝑝𝑝𝑝]
[𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑝 𝑝𝑝𝑝á𝑝𝑝𝑝𝑝 𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝]
 
4. Establecimiento de los criterios de decisión: Establecer un criterio de decisión 
consiste en dividir la amplitud del estimador en dos partes, que son dos 
subconjuntos desunidos: 
- R, región de rechazo o región crítica, que contiene los resultados menos 
favorables a 𝑝0. 
- A, región de no rechazo, que contiene los resultados más favorables a 𝑝0. 
Primer caso: Si 𝑝1𝑝𝑝 𝑝 ≠ 𝑝0 el criterio de decisión es: Rechazar 𝑝0 si y sólo si 
−𝑝 < 𝑝∝/2 ó 𝑝 > 𝑝∝/2 
Segundo caso: Si 𝑝1𝑝𝑝 𝑝 < 𝑝0, el criterio de decisión es: Rechazar 𝑝0 si y sólo si 
𝑝 < −𝑝∝ 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
34 
 
Tercer caso: Si 𝑝1𝑝𝑝 𝑝 > 𝑝0, el criterio de decisión es: Rechazar 𝑝0 si y sólo si 𝑝 >
𝑝∝ 
5. Realización de cálculos: Se calculan los valores de la estadística de prueba y su 
desviación estándar, de manera tal que la estadística de prueba estandarizada 
pueda compararse con el valor o los valores críticos. 
6. Toma de una decisión: 
- Si 𝑝𝑝 ∈ 𝑝, se rechaza 𝑝0 
- Si 𝑝𝑝 ∈ 𝑝, no existen evidencias suficientes para rechazar 𝑝0. 
7. Conclusiones: En esta etapa se debe interpretar la decisión tomada en la etapa 
anterior, en términos del problema particular que se intenta resolver mediante 
una prueba de hipótesis estadísticas. 
Comparación de dos proporciones poblacionales: 𝑝0: 𝑝1 ≤ 𝑝2 y 𝑝1: 𝑝1 > 𝑝2 
Comparación de dos medias poblacionales: 𝑝0:𝑝1 = 𝑝2 
𝑝𝑝 =
∆𝑝−∆𝑝
𝑝∆𝑝
=
𝑝
1
−𝑝
2
𝑝∆𝑝
 𝑝∆𝑝 = √
𝑝1
2
𝑝1
+
𝑝2
2
𝑝2
 
 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
35 
 
 
Según el número de variables que intervienen en el análisis, la asociación se clasifica 
en simple (dos variables) y múltiple (más de dos variables). De acuerdo al tipo de 
relación entre variables, el análisis se clasifica en Lineal (relación lineal) y No lineal 
(relación curvilineal). 
Diagrama de dispersión: Es una herramienta muy eficaz y sencilla. Consiste en una 
representación gráfica de los pares ordenados [𝑝𝑝,𝑝𝑝] en un sistema de coordenadas 
cartesianas, donde en el eje de abcisas se colocan los valores de X, y en el eje deordenadas los valores de Y. Puede ser que el gráfico de dispersión nos diga que existe 
una relación lineal positiva perfecta, relación lineal negativa perfecta, relacion 
curvilínea negativa, relación curvilínea positiva, o que no haya relacion entre X e Y. 
Análisis de Regresión bivariables lineal: El análisis de regresión establece la naturaleza 
de la relación entre las variables, la relación funcional que proporciona un mecanismo 
de predicción. 
Una variable Y, dependiente, se relaciona con una variable X, independiente, por la 
siguiente expresión: 
𝑝1 = (∝ +𝑝𝑝1) + 𝑝𝑝 Donde α y β son los parámetros de regresión desconocidos 
llamados coeficientes de regresión de población, y 𝑝1 es el error o residual. La 
expresión del modelo de regresión consta de dos partes; sistemática (𝑝1 = (∝ +𝑝𝑝1) 
y estocástica (𝑝𝑝). La parte estocástica hace que el modelo sea probabilista y no 
determinista. 
● Supuestos básicos: 
1. La variable independiente X toma los valores fijados por el investigador y 
para cada valor X, 𝑝𝑝, existe una subpoblación de valores de Y con 
distribución normal. 
2. El error 𝑝1 es una variable aleatoria cuya distribución de probabilidades se 
supone que es normal con 𝑝(𝑝𝑝) = 0 
3. La varianza condicional de Y dada X se llama varianza de la regresión y se 
simboliza 𝑝𝑝𝑝
2 . Se supone que es constante para todo X, y es igual a la 
varianza de 𝑝𝑝,𝑝𝑝
2 . 
4. 𝑝𝑝es independiente de 𝑝𝑝, y 𝑝𝑝 es independiente de 𝑝𝑝. 
Estimación de los parámetros de regresión: El modelo de regresión lineal de la 
muestra es: 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
36 
 
𝑝𝑝 = 𝑝 + 𝑝𝑝𝑝 + 𝑝𝑝, y la ecuación de regresión de Y sobre X de la muestra es: 
�̂�𝑝 = 𝑝 + 𝑝𝑝𝑝 
Método de mínimos cuadrados: Busca el mejor estimador insesgado lineal. 
Dada la dependencia lineal entre Y y X y los n pares de de valores observados, método 
de mínimos cuadrados produce estimadores parámetricos a y b tales que 
∑𝑝𝑝=1 𝑝𝑝
2 = ∑𝑝𝑝=1 (𝑝𝑝 − �̂�𝑝)
2
= ∑𝑝𝑝=1 [𝑝𝑝 − (𝑝 + 𝑝𝑝𝑝)]
2, 
 i= 1, 2…,n 
Es un mínimo 
El criterio de mínimos cuadrados selecciona valores para a y b que minimizan la suma 
de cuadrados de las diferencias entre los valores realmente observados,𝑝𝑝, y los 
valores estimados �̂�𝑝. Esto significa que las estimaciones a y b proporcionan la 
ecuación de la recta de regresion de Y sobre X, que “pasa más cerca de todos los 
puntos” del diagrama de dispersión. 
Para demostrar que la expresión anterior es un mínimo se debe aplicar derivación con 
respecto de a y b, y se obtiene un sistema de cuyas ecuaciones se deduce: 
𝑝 = 𝑝 − 𝑝𝑝 
∑𝑝𝑝=1 𝑝𝑝𝑝𝑝 − (∑
𝑝
𝑝=1 𝑝𝑝)(∑
𝑝
𝑝=1 𝑝𝑝)/𝑝
∑𝑝𝑝=1 𝑝𝑝
2 − (∑𝑝𝑝=1 𝑝𝑝)
2
/𝑝
 
Si se transforma la variable X de manera tal que (∑𝑝𝑝=1 𝑝𝑝) = 0, entonces: 
𝑝 = 𝑝 𝑝 = ∑𝑝𝑝=1 𝑝𝑝𝑝𝑝/(∑
𝑝
𝑝=1 𝑝𝑝)
2
 
Prueba de hipótesis para β 
1. Hipótesis: 
𝑝𝑝:𝑝 = 0 (no existe regresion lineal estadísticamente significativa de Y sobre 
X). 
𝑝1:𝑝 ≠ 0 (existe regresión lineal estadísticamente significativa de Y sobre X). 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
37 
 
2. Nivel de significación: 𝑝(𝑝𝑝) =∝ 
3. Estadístico de prueba: 𝑝𝑝 = 𝑝/𝑝𝑝 que tiene distribución aproximadamente 
normal bajo el supuesto de 𝑝0 verdadera. Si n≤30 y 𝑝 es desconocido, a y b 
estan aproximadamente distribuidas como t de student con 𝑝 = 𝑝 − 2 
𝑝 = 𝑝/𝑝𝑝~𝑝(𝑝−2) 
4. Criterios de decisión: Rechazar la hipótesis nula si, y sólo si: 
𝑝 < −𝑝(∝/2),(𝑝−2) ó 𝑝 > 𝑝(∝/2),(𝑝−2) 
5. Cálculos: Se realizan todos los cálculos necesarios para obtener el valor 
numérico de la estadística de prueba. 
6. Decisión: Si t se ubica en la zona crítica, se rechaza 𝑝0, en caso contrario se dice 
que no existen evidencias suficientes para rechazarla. 
7. Conclusión: El rechazo de la hipótesis nula indica que existe regresión lineal 
estadísticamente significativa de Y sobre X; en cambio el no rechazo de la 
𝑝0 indica que no existe. 
*En general la ecuación de regresión de la muestra debe ser considerada como un 
instrumento de predicción, sólo si b es significativa; en caso contrario debe ser 
desechada. 
Análisis de correlación lineal bivariable: El análisis de correlación es aplicable para 
determinar el grado de relación que existe entre las variables de interés. La medida del 
grado de relación entre dos variables se llama coeficiente de correlación, representado 
por 𝑝. 
● Supuestos básicos: 
1. X e Y son variables aleatorias, no es necesario establecer si una es 
independiente y la otra dependiente. 
2. La población bivariable es normal. 
3. La relación entre X e Y es lineal. 
● Propiedades de 𝑝: 
1. La ecuación contiene los cinco parámetros de una población bivariables 
normal: 𝑝𝑝, 𝑝𝑝,𝑝𝑝,𝑝𝑝 𝑝 𝑝 
2. 𝑝 es simétrico con respecto a Y y X. 
3. Cuando Cov(Y,X)=0 𝑝=0 (no hay relación) 
Cuando hay covariabilidad perfecta y las variables varían en el mismo sentido, 𝑝 =
1. Cuando hay covariabilidad perfecta y las variables varían en sentido contrario, 
𝑝 = −1. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
38 
 
*El campo de variación del coeficiente de correlación lineal simple es: −1 ≤ 𝑝 ≤ 1 
Coeficiente de correlación muestral: 
Cuando se cumple el supuesto de una población normal bivariables, el estimador de la 
probabilidad máxima de 𝑝, representado por r, se obtiene por la siguiente expresión: 
𝑝 =
∑𝑝𝑝=1 𝑝𝑝𝑝𝑝 − (∑
𝑝
𝑝=1 𝑝𝑝)(∑
𝑝
𝑝=1 𝑝𝑝)/𝑝
√[∑𝑝𝑝=1 𝑝𝑝
2 − (∑𝑝𝑝=1 𝑝𝑝)
2
/𝑝][∑𝑝𝑝=1 𝑝𝑝
2 − (∑𝑝𝑝=1 𝑝𝑝)
2
/𝑝]
 
*r tiene las mismas características que 𝑝, y valores cercanos a -1 o a 1 indican alta 
correlación lineal entre las variables. 
Inferencia de 𝑝: 
Cuando 𝑝=0, hay una transformación para la cual los valores transformados de r tienen 
distribución 𝑝𝑝−2. 
Entonces, 𝑝𝑝−2 =
𝑝√𝑝−2
√1−𝑝2
~𝑝 𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝 𝑝 = 𝑝 −
2 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 
Esta transformación se aplica en el caso de que 𝑝=0, y por eso puede ser usada como 
estadística de prueba para la hipótesis nula de que 𝑝=0, contra una alternativa 
apropiada. 
 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
39 
 
 
Una serie temporal o conológica es un conjunto de observaciones de una variables, 
ordenadas según transcurre el tiempo. En unas serie de tiempo las observaciones se 
deben ordenar respetando la secuencia temporal de las observaciones. 
Representación gráfica: Para realizar la representación de una serie temporal se debe 
utilizar un gráfico de lineas. 
Componentes de una serie temporal: 
1. Tendencia: El movimiento general a largo plazo de los de la serie de tiempo 
sobre un extenso período de años. 
2. Variaciones estacionales: Movimientos ascendentes y descendentes respecto de 
la tendencia que se consuman en el término de un año y se repiten 
anualmente. Estas variaciones suelen identificarse con bse en datos mensuales 
o trimestrales. 
3. Variaciones cíclicas: Movimientos ascendentes y descendentes recurrentes 
respecto de la tendencia con una duración de varios años. 
4. Variaciones residuales o irregulares: Las variaciones erráticas respecto de la 
tendenciaque no pueden atribuirse a las influencias cíclicas o estacionales. 
Análisis de la tendencia: 
● Método gráfico, libre o de mano alzada: Se determina la tendencia a partir de una 
representación gráfica de la serie. 
1. Se representa gráficamente la serie cronológica. 
2. Se traza una linea que ajuste de la mejor manera la serie de datos. 
3. Se obtiene la ecuación de la linea de tendencia aplicado las siguientes 
fórmulas: 
�̂�𝑝 = 𝑝 + 𝑝𝑝𝑝 
Siendo 𝑝 = 𝑝0 y 𝑝 = (𝑝𝑝 − 𝑝0)/(𝑝 − 1) 
𝑝0= valor de y por donde pasa la recta de tendencia en el primer período de la 
serie. 
𝑝𝑝= valor de y por donde pasa la la recta de tendencia en el último período de 
la serie. 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO
 
Resumen de estadística 
 
40 
 
*La ventaja principal de este método es que resulta muy fácil de aplicar, pero la 
desventaja es que dos personas diferentes pueden trazar distintas lineas de tendencia. 
● Método de medias móviles: 
1. Observar con detenimiento la serie para determinar apróximadamente la 
fluctuación con período más largo; se llama q al número de observaciones 
que forman una oscilacion compleja. 
2. Se procede a calcular una serie de medias. La primera de ellas se calcula a 
partir de las q primeras observaciones de la serie; la segunda se calcula 
eliminando la primera observación y añadiendo la inmediata posterior. Se 
prosigue así hasta calcular la media de las últimas observaciones. 
3. Cada una de las medias obtenidas en el paso anterior se asigna al período 
central del grupo de períodos que promedian. 
4. Uniendo las medias se obtiene la tendencia. 
*La ventaja de este método es que resulta muy fácil de aplicar, pero la desventaja es 
que produce un suavizado de la serie original, que no permite determinar una función 
matemática para realizar predicciones de la variable Y asignándole valores a X. 
 
www.concienciauniversitaria.com
Conciencia Universitaria
TECHNO
Nota adhesiva
None definida por TECHNO
TECHNO
Nota adhesiva
MigrationNone definida por TECHNO
TECHNO
Nota adhesiva
Unmarked definida por TECHNO

Continuar navegando