Estadistica Descriptiva

Fundamentos de Estadística y Epidemiología Estácio

•

SIN SIGLA

Vale Clau

12/7/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Fundamentos de Estadística y Epidemiología Estácio

1486 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

UNIDAD 1- ESTADÍSTICA DESCRIPTIVA
● Estadística→ introducción
➔ EXPERIMENTO O ENCUESTA a la observación planeada de un fenómeno con el
objetivo de conocer su comportamiento, poder describirlo y/o tomar una
decisión.
➔ UNIDAD EXPERIMENTAL es cada uno de los entes que son observados en el
experimento.
Ejemplo:
➢ El directorio de una empresa debe decidir acerca de la realización de una
campaña publicitaria basada en el nivel de ventas mensuales.
El experimento consiste en observar las ventas de cada mes durante un
determinado lapso: la UE es el mes.
➢ Un economista desea realizar una proyección de las exportaciones anuales
de cereales para los próximos cinco años.
El experimento consiste en observar las exportaciones realizadas en cada
año: la UE es el año
➢ Un médico desea analizar el comportamiento de la tensión arterial de los
pacientes a los cuales se les ha suministrado una determinada droga.
El experimento consiste en observar la tensión arterial de cada paciente: la
UE es el paciente.
➔ DATO ESTADÍSTICO es el valor asignado a una de las características de una
UNIDAD EXPERIMENTAL, conforme a la ESCALA DE MEDICIÓN empleada.
➔ DATOS CUALITATIVOS: son aquellos valores correspondientes a los atributos o
propiedades categóricas que sólo se pueden usar para identificar y describir a
una unidad experimental.
❖ ESCALA NOMINAL es el conjunto de símbolos que se usan únicamente
para clasificar a los entes en las distintas categorías. Los valores
correspondientes a esta escala se denominan categorías y son simples
etiquetas.
❖ ESCALA ORDINAL es el conjunto de símbolos que se usan para clasificar
a los entes en las distintas categorías, de acuerdo a su rango de manera
que es posible ordenarlos de acuerdo a un orden preestablecido de sus
valores según el grado que poseen.
➔ DATOS CUANTITATIVOS: son aquellos valores que, además de identificar y
describir a una unidad experimental, establecen las diferencias posibles entre
los valores en cantidad y grado.
❖ ESCALA DE INTERVALO: es el conjunto de números que se usan para
clasificar a los entes de acuerdo a su rango y para poder establecer una
distancia entre dos cualesquiera de ellos. Al punto de origen de esta
escala se le asigna arbitrariamente el valor cero (no necesariamente
indica ausencia de la característica medida). 0ºC, existe.
❖ ESCALA DE RAZÓN: es el conjunto de números que se usan para
clasificar a los entes de acuerdo a su rango, para poder establecer una
distancia entre dos cualesquiera de ellos y además establecer una
proporcionalidad entre cualquiera de ellos. El punto de origen de esta
1
escala es realmente cero ya que indica la ausencia de la característica
medida. 0 KG, no existe.
➔ INFORMACIÓN: Es el resultado de la evaluación de los Datos Estadísticos
cuando se los compara con una referencia adecuada.
➔ UNIVERSO: Es el conjunto de unidades experimentales que poseen
características comunes observables, para obtener información sobre un hecho
particular.
➔ VARIABLE: Es cualquier característica observable que tienen las unidades
experimentales.
➔ RECORRIDO de una VARIABLE: Es el conjunto de los posibles valores que ella
puede asumir.
➔ VARIABLE CUALITATIVA: cuando los valores que puede asumir no constituyen
un espacio métrico.
➔ VARIABLE CUANTITATIVA: cuando los valores que puede asumir si constituyen
un espacio métrico.
➔ VARIABLE CUANTITATIVA DISCRETA: se originan en conteos o cuando se
establecen restricciones al medir magnitudes. El recorrido de una variable
discreta es siempre finito o infinito numerable.
➔ VARIABLE CUANTITATIVA CONTINUA: se originan cuando la característica a
medir es una magnitud y no se establecen restricciones. El recorrido de una
variable continua es siempre infinito no numerable.
ESTADÍSTICA:
Es la disciplina científica que crea, desarrolla y aplica los adecuados métodos de
recopilación de datos, y su evaluación para transformarlos en informaciones con las
cuales se describan objetivamente las situaciones investigadas, se analice el
comportamiento de determinadas características y se tomen decisiones
en condición de incertidumbre.
1. POBLACIÓN: Es el conjunto de los posibles valores de una variable particular
que se estudia a un Universo.
2. MUESTRA: Es un subconjunto de una Población sobre la base de la cual se
puede hacer un juicio acerca de ésta.
➔ REGULARIDAD ESTADÍSTICA: Es la información del comportamiento de una
variable, que proporciona el registro ordenado de sus valores observados.
ETAPAS DE LA TAREA ESTADÍSTICA
1. Enunciación del problema, definición del Universo e identificación de las variables.
Determinación de “qué” se investiga, “para qué” se investiga.
2. Formulación de los instrumentos de medición. Diseño de los Cuestionarios
3. Recopilación de los datos.
2
FUENTES EXTERNAS
→ FUENTE EXTERNA PRIMARIA:CUANDO LOS DATOS PUBLICADOS FUERON
RECOPILADOS POR LOS RESPONSABLES DEL MEDIO QUE LOS REPRODUCE:
PUBLICACIONES DE ORGANISMOS OFICIALES, ETC.
→ FUENTE EXTERNA SECUNDARIA: CUANDO LOS DATOS PUBLICADOS NO
FUERON RECOPILADOS DIRECTAMENTE POR LOS RESPONSABLES DEL MEDIO QUE
LOS REPRODUCE: PUBLICACIONES PERIODÍSTICAS.
4. Presentación de los datos.
PRESENTACIÓN ESCRITA→ Incorporar los datos en un párrafo combinando cifras y
texto.
CUADRO ESTADÍSTICO
→Cuadro Estadístico de Referencia: se usa sólo para publicar los datos.
→Cuadro Estadístico de Análisis: se usa para realizar los cálculos.
GRÁFICO ESTADÍSTICO→ Es la expresión plástica de los datos.
5. Análisis de los datos.
ANÁLISIS ESTADÍSTICO DESCRIPTIVO→ Permite describir el comportamiento empírico
de las variables.
ANÁLISIS ESTADÍSTICO INFERENCIAL→Permite tener información acerca de una
población mediante los datos obtenidos con una muestra.
ANÁLISIS ESTADÍSTICO PROBABILÍSTICO→Permite cuantificar la incertidumbre de los
resultados de ciertos experimentos, también medir el error que pudiera cometerse en
las decisiones tomadas mediante el Análisis inferencial.
6. Interpretación de los resultados (Obtención de Información).
● Cantidades absolutas y relativas
CANTIDADES ABSOLUTAS→ Son aquellos datos cuantitativos (un número) que están
expresados en las unidades de medida correspondientes a la magnitud que se está
midiendo.Para comparar dos cantidades absolutas se hace la diferencia entre ellas y
según el signo, positivo o negativo, se interpreta que hubo un aumento o disminución,
respectivamente, entre ambas situaciones.
3
CANTIDADES RELATIVAS→ Son aquellos datos cuantitativos que surgen del cociente
entre dos cantidades absolutas correspondientes a la misma magnitud y unidad de
medida. Es el cociente entre dos cantidades absolutas, es un número puro que no tiene
unidad de medida y se puede expresar en tanto por uno o en tanto por ciento.
● Presentación de datos: cuadros y gráficos
MÉTODOS DE PRESENTACIÓN DE DATOS CUADROS Y GRÁFICOS: VARIABLES
CUALITATIVAS Y VARIABLES CUANTITATIVAS
➢ Si bien la presentación de los datos puede hacerse por escrito, donde se leen cifras
y texto, a veces no es lo mejor, en particular si es muy extenso.
➢ Los cuadros permiten una presentación más clara y ordenada.
➢ Los gráficos deben estar construidos cuidadosamente:
Según sea la naturaleza de la variable en estudio será el gráfico que habrá que utilizar,
deberá ser el adecuado para representar la información.
Definiciones
- CUADRO ESTADÍSTICO es un arreglo de filas y columnas dispuestas
metódicamente de modo tal que los datos se puedan presentar y organizar para
clasificarlos adecuadamente.
- GRÁFICO es un dibujo metódicamente realizado para presentar los datos y
expresarlos en forma plástica
Es importante, para la vida diaria, saber leer e interpretarlos. Si se tiene información
presentada en un gráfico es conveniente que también esté presentado el cuadro del
cual se originó y tener en cuenta cuál es la naturaleza de la variable que se está
representando.
PARTES ESTRUCTURALES DE UN CUADRO ESTADÍSTICO
➢ TÍTULO: describe concisamente el contenido del cuadro. Tiene que responder a las
siguientes preguntas: ¿Qué datos contiene el cuadro?;¿Dónde se recopilaron? ;
¿Cuándo ocurrieron? (Origen de los datos) ¿Cómo están clasificados? NO puede ser
muy breve ni muy extenso. Tiene que proporcionar una correcta información.
➢ NOTA DE ENCABEZADO: (va debajo del título y entre paréntesis) amplía el título o
clarifica la unidad de medida de los datos.
4
➢ COLUMNA MATRIZ: es la primera columna, donde se ubican las categorías o valores
de la variable más importante.
➢ ENCABEZADO DE LAS COLUMNAS: se presentan los valores de otras variables junto
con la variable más importante o algunas especificaciones de ésta.
➢ CUERPO: (unidad básica de presentación) son las celdas donde se registran los
datos, formadas por la intersección de las filas y columnas
➢ NOTA AL PIE: sirve para clarificar o explicitar algún dato o elemento particular.
➢ FUENTE: consigna el origen y la forma de relevamiento de los datos. Si es una
publicación tiene que mencionar título, número de edición, fecha y página.
➢DIAGRAMA : está formado por trazos (líneas, rectángulos, circunferencias, etc)
EJEMPLO
En el diario Página 12.com - Económica del 30/ 1/2020 se publicó un artículo
referido al aumento del ciberdelito con tarjetas de débito en el Banco Nación argentino.
Así lo revela el Banco Nación en su Revista Anual- económica del año 2019. El informe
fue elaborado a partir del registro de 4000 denuncias recibidas a nivel nacional en la
entidad desde diciembre de 2018 a noviembre de 2019 (ambos meses incluidos). Los
resultados obtenidos por fraude a los clientes en los últimos 12 meses fueron :
“phishing” (crea páginas web falsas para ingresar datos) 32%; páginas de e-commerce
dudosas (piden datos de la tarjeta) 25%; copia de la banda magnética con un lector
(cuando el usuario pierde de vista la tarjeta) 19%, mientras que el Skimming ( copiar
datos a través de dispositivos instalados en cajeros y puertas de bancos) 15% . Y otros
tipos de ciberdelitos, 9%. En otros se incluye el ciberdelito Spamming: (correos
electrónicos con oferta de compras para absorber datos).
La variable en estudio es el tipo de cibercrimen. Es una variable cualitativa.
5
Vertical es igual pero con las barras hacia arriba y los valores sobre el eje de ordenadas.
6
Estoy comparando variables
GRÁFICOS CIRCULARES
Se pueden utilizar tanto para variable cualitativa como cuantitativa. Permiten visualizar
la incidencia de cada una de las partes de un total. También permite mostrar la
evolución de las partes en el tiempo o en el espacio mediante varios círculos,
uno para cada momento de tiempo o lugar. Siguiendo con los datos del ejemplo del
laboratorio, tenemos un círculo para cada método de enseñanza o grupo.
7
gráfico lineal
➢ Los gráficos mostrados no son todos los que existen, hay muchos otros tipos de
gráficos, por ejemplo mapas y pictogramas.
➢ Cuando se lee un gráfico hay que prestar atención a la escala vertical , ya que, los
mismos datos visualmente pueden parecer distintos aunque la información sea la
misma!!!! Supongamos que representamos la variación porcentual del precio de un
producto entre el mes de abril con respecto a marzo y fue del 5% . Según la escala del
eje vertical, visualmente la variación podrá ser más alta o más baja aunque es la misma.
8
Vemos que la línea violeta crece
más rápido que la fucsia, pero la
escala en el eje vertical de la
figura A es más grande que en
la figura B.
Un pictograma es un gráfico que
usa imágenes o símbolos para
presentar información de forma
rápida, clara y atractiva. Debe
incluir una referencia que indique
qué representa cada símbolo o
imagen. A veces se presentan
figuras de distinto tamaño que
están relacionadas con la cantidad
de unidades experimentales
(casos) que involucra cada
tamaño, como una escala.
● DISTRIBUCIÓN DE FRECUENCIAS
ANÁLISIS ESTADÍSTICO DESCRIPTIVO:
Es el que permite describir el comportamiento empírico de las variables, mediante el
cálculo de algunas medidas capaces de resumir la información que contienen los
datos, la construcción de cuadros y gráficos especiales.
Al inicio de cualquier investigación, hay que proceder a la recopilación de los datos.
Al conjunto de datos dispuestos tal como se presentan, se lo denomina Datos no
Agrupados.
Si la cantidad de ellos es grande, veinte o más, y no están agrupados, es muy difícil
poner en evidencia la regularidad estadística.
Hay que ordenarlos agrupándolos en clases de equivalencia para que puedan ser
estudiados convenientemente.
Al conjunto de datos organizados, clasificados y distribuidos se los denomina Datos
Agrupados en una Distribución de Frecuencias.
Las DISTRIBUCIONES DE FRECUENCIAS se presentan en forma tabular y/o gráfica de
modo tal que permitan una organización adecuada de los datos para proceder al
análisis y a la posterior obtención de medidas capaces de brindar la información
requerida.
9
VARIABLES CUALITATIVAS
Se llama FRECUENCIA RELATIVA SIMPLE, fr , al cociente entre la frecuencia absoluta
simple y la cantidad de observaciones.
Las frecuencias relativas, multiplicadas por 100, expresan el porcentaje de casos, sobre
el total, que hay en cada categoría.
VARIABLES CUANTITATIVAS DISCRETAS
Distribución de frecuencias para variables cuantitativas discretas.
❖ Frecuencia absoluta simple f, es la cantidad de veces que se repite un valor de
la variable.
❖ Frecuencia absoluta acumulada F, es la cantidad de unidades experimentales
con un valor de la variable menor o igual a un valor dado.
❖ Frecuencia relativa simple fr, es el cociente entre la frecuencia absoluta simple y
la cantidad de observaciones.
❖ Frecuencia relativa acumulada Fr, es el cociente entre la frecuencia absoluta
acumulada y la cantidad de observaciones.
Las frecuencias relativas muestran la importancia relativa de cada clase.
Para presentar en forma gráfica una
distribución de Frecuencia Absoluta
Simple de una variable discreta se utiliza
un gráfico llamado GRÁFICO DE
BASTONES.
Para presentar en forma gráfica una
distribución de Frecuencia Absoluta
Acumulada de una variable discreta se
utiliza un gráfico llamado GRÁFICO
ESCALONADO o GRÁFICO EN ESCALERA.
VARIABLES CUANTITATIVAS CONTINUAS
Distribución de frecuencias para variables cuantitativas continuas.
Los pasos que se deben seguir sobre los de datos para su presentación son:
10
•Determinación de los valores máximo xM y mínimo xm
•Cálculo de la amplitud total del recorrido de la variable continua: A = xM - xm
•Presentación de los datos en forma de distribución de frecuencias, para ello hay que
clasificar las observaciones en un número relativamente chico de grupos llamados
intervalos de clase, o clases.
•Determinación del número de clases: h = ent(1+ log n / log 2).
No es aconsejable que h sea más grande porque se pierde la regularidad en la
distribución de frecuencias, tampoco es aconsejable que sea muy pequeño porque se
perdería demasiada información al estar tan resumida. Si no se cuenta como mínimo
con 20 valores observados no debería realizarse el agrupamiento en intervalos de
clase.
•Límites de clase. Toda clase tiene un límite inferior Li y otro superior Ls
•Se trata de intervalos semiabiertos a derecha: [Li; Ls).
•Amplitud de clase. Es la diferencia entre los límites clase: a =Ls - Li
•Punto medio del intervalo de clase o marca de clase: Es la semisuma de los límites de
clase: xi=( Li+ Ls )/2.
❖ Se llama FRECUENCIA ABSOLUTA SIMPLE (f) PARA VARIABLE CONTINUA a la
cantidad de unidades experimentales cuyos valores observados de la variable
pertenecen a un mismo intervalo de clase.
❖ Se llama FRECUENCIA ABSOLUTA ACUMULADA (F) PARA VARIABLE CONTINUA a
la cantidad de unidades experimentales que tienen un valor observado de la
variable menor al límite superior de un intervalo.
❖ Se llama FRECUENCIA RELATIVA SIMPLE (fr) al cociente entre la frecuencia
absoluta simple y la cantidad de observaciones.
❖ Se llama FRECUENCIA RELATIVA ACUMULADA (Fr) al cociente entre la frecuencia
absoluta acumulada y la cantidad de observaciones.
REPRESENTACIÓN GRÁFICA DE LA
DISTRIBUCIÓN DE FRECUENCIAS
ABSOLUTAS SIMPLES. HISTOGRAMA
REPRESENTACIÓNGRÁFICA DE LA
DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS
ACUMULADAS. OJIVA
11
AGRUPAMIENTO DE DATOS EN DISTRIBUCIONES DE FRECUENCIAS
Para representar las frecuencias simples , absolutas o relativas, de una variable discreta
se usa el GRÁFICO DE BASTONES
¡¡¡¡¡Los bastones no son barras!!!!!
Los bastones son segmentos de longitud igual a la frecuencia simple. NO TIENEN
SUPERFICIE, CADA BASTÓN ES UNA MEDIDA LINEAL
La representación gráfica de las frecuencias acumuladas, absolutas o relativas de una
variable discreta usamos el GRÁFICO DE ESCALERA O ESCALONADO
PROBLEMA:
Los siguientes datos corresponden a la cantidad de piezas defectuosas encontradas en
una línea de producción en la cual se inspeccionaron 30 cajas con la misma cantidad
de piezas cada una.
Se pide:
a) Identificar la naturaleza de la variable en estudio y
organizar los datos en una distribución de frecuencias
apropiada.
La variable aleatoria en estudio es la cantidad de piezas
defectuosas. Es una variable aleatoria cuantitativa
discreta.
b) Representar gráficamente las frecuencias simples y acumuladas, ambas en
términos absolutos y relativos.
Para poder representar el comportamiento de la variable, en primer lugar debemos
generar la distribución de frecuencias.
Para ello, vemos que la variable puede tomar los valores de 0 a 4 y empezamos a
contar cuántas veces se repite cada uno de ellos.
Así, encontramos que el valor X = 0 se repite 3 veces por lo tanto la frecuencia simple
es 3. Lo mismo haremos con los otros valores y resumimos la información en la tabla 1.
12
c) ¿Qué cantidad de cajas no tienen piezas defectuosas?
3 cajas no contienen piezas defectuosas, 3 es la frecuencia absoluta simple
correspondiente al valor X = 0
d) ¿Qué porcentaje de cajas tienen exactamente 4 piezas defectuosas?
El 6.6% de las cajas tienen exactamente 4 piezas defectuosas. Frecuencia relativa
simple correspondiente a X = 4.
e) ¿Qué cantidad de cajas tienen a lo sumo 2 piezas defectuosas?
23 cajas tienen a lo sumo (como mucho, como máximo) 2 piezas defectuosas.
Frecuencia acumulada correspondiente a X = 2.
f) ¿Qué porcentaje de cajas tiene por lo menos 1 pieza defectuosa?
El 90% de las cajas tiene por lo menos (como mínimo) 1 pieza defectuosa. Si el 10% no
tiene piezas defectuosas, el resto tiene 1 o más piezas defectuosas.
g) ¿Cuál es la cantidad de piezas defectuosas encontrada con mayor frecuencia?
La cantidad de piezas encontradas con mayor frecuencia es 2. La mayoría de las cajas
tiene 2 piezas defectuosas.
● MEDIDAS QUE RESUMEN INFORMACIÓN
Son medidas capaces de extractar la esencia de los datos para caracterizar
y describir las variables en estudio.
1. MEDIDAS DE CONCENTRACIÓN
• Percentil
• Rango Percentilar
2. MEDIDAS DE TENDENCIA CENTRAL
• Promedios: Media Aritmética Geométrica , Armónica
• Mediana
• Modo
3. MEDIDAS DE VARIABILIDAD
• Suma de Cuadrados
• Varianza
• Desvío Típico: Variabilidad Absoluta
• Coeficiente de Variación: Variabilidad Relativa
4. MEDIDAS DE FORMA
• COEFICIENTE DE ASIMETRÍA
• COEFICIENTE DE CURTOSIS
1. MEDIDAS DE CONCENTRACIÓN
Son aquellas medidas con las cuales se puede establecer el porcentaje de datos
que está concentrado dentro de un determinado intervalo
➔ RANGO u ORDEN PERCENTILAR:
Es la frecuencia relativa porcentual que se acumula desde el mínimo valor del
recorrido, hasta un valor dado de la variable.
➔ PERCENTIL DE ORDEN K:
Es aquel valor de la variable hasta donde se acumula, a lo sumo, el k% de los datos.
Es el valor de la variable no superado por el k% de los datos.
13
Cinco maneras de expresar el mismo concepto:
❖ PERCENTIL DE ORDEN k es el valor de la variable hasta donde se acumula el k%
de los datos.
❖ PERCENTIL DE ORDEN k es el valor de la variable no superado por el k% de los
datos.
❖ PERCENTIL DE ORDEN k es el valor de la variable superado por el (100-k) % de
los datos.
❖ PERCENTIL DE ORDEN k es el valor máximo del k% de los datos de menor
cuantía.
❖ PERCENTIL DE ORDEN k es el valor mínimo del (100-k)% de los datos de mayor
cuantía.
Variables continuas: el percentil
de orden k se calcula aplicando la
siguiente fórmula
al renglón de la distribución de
frecuencias que corresponde al
primer valor de
frecuencia acumulada que supera
al ORDEN ABSOLUTO DEL
PERCENTIL:
MEDIDAS DE TENDENCIA CENTRAL
Son aquellos valores destacados con los cuales es posible representar a la totalidad
de los valores observados de la variable.
❖ Modo
❖ Mediana
❖ Promedios simples: Media aritmética.
Media geométrica.
Media armónica.
❖ Promedio aritmético Ponderado
Modo. Mo(x) o Moda
Es el valor más común o sea al que le corresponde la mayor frecuencia. Si los datos no
están agrupados no tiene sentido estadístico.
Si los datos corresponden a una variable discreta bastará con buscar el valor de la
variable al que le corresponde un máximo relativo del valor de la frecuencia absoluta
simple.
14
Si se tratara de una variable continua hay que aplicar la siguiente fórmula al intervalo de
clase al que le corresponde un máximo relativo de f:
Donde Li es el límite inferior de la clase modal, d1= fi – f (i-1) , d2= fi –f (i+1) y a es la
amplitud de la clase.
Mediana. Mna(x)
La mediana es el valor que es precedido por lamitad de los datos: es el valor que está
en el medio si se ordenan los datos de menor a mayor. La mediana tiene las mismas
unidades que la variable en estudio.
Si son n datos, la mediana estará en el puesto (n+1)/2 una vez ordenados los datos de
menor a mayor.
La mediana no se ve afectada por los valores extremos de la serie de datos.
Si los datos están agrupados en clases de equivalencia se deberá aplicar la fórmula.
en el renglón correspondiente al primer valor de F
(frecuencia absoluta acumulada) que supere a n/2. Donde
Li es el límite inferior de dicho intervalo, Fi-1 es la
frecuencia acumulada del intervalo anterior, fi es la
frecuencia del intervalo y a es la amplitud del intervalo.
CARACTERÍSTICAS DE LA MEDIANA
1. El valor de la MEDIANA es igual al Percentil 50.
2. El valor de la MEDIANA no se ve afectado por la presencia de valores extremos de la
variable.
3. La suma del módulo de las desviaciones con respecto de la MEDIANA es mínima:
15
PROMEDIOS SIMPLES→Son los valores que se obtienen mediante la aplicación de
operadores matemáticos, a la TOTALIDAD de los valores observados de la
variable, bajo el supuesto de que todas las unidades experimentales tienen la MISMA
IMPORTANCIA relativa.
Media aritmética o promedio aritmético.
Su cálculo se efectúa sumando todos los valores observados de la variable en
estudio y dividiendo dicho valor por el número total de valores observados.
16
DESVENTAJAS DE LA MEDIA GEOMÉTRICA:
1. Los valores de la variable deben ser NO
NULOS y , en algunos casos
necesariamente POSITIVOS.
2. Su cálculo es muy laborioso.
Se la utiliza cuando es necesario promediar
variables cuyos valores forman una serie y
se originan como cocientes entre otras
dos variables, como por ejemplo las tasas de crecimiento periódicas:
Se la utiliza cuando es necesario promediar
variables que se originan como cocientes entre un
numerador constante y un denominador variable,
como por ejemplo la velocidad de un móvil o
cantidades variables de producto que se pueden
comprar con una determinada suma de dinero.
17
3. MEDIDAS DE VARIABILIDAD
Son aquellas que permiten estudiar cómo se desvían, en su conjunto, los valores
observados de una variable, con respecto a alguna Medida de tendencia Central.
• Suma de Cuadrados
• Varianza
• Desvío Típico: Variabilidad Absoluta
• Coeficiente de Variación: Variabilidad Relativa
Mayor es la VARIANZA, mayor es la
variabilidad que presenta la variable, y
consecuentemente, menor es la
representatividad
de la MEDIA ARITMÉTICA.
18
MOMENTOS EMPÍRICOS
Son operadores matemáticos que se obtienen a partir de los valores observados de la
variable.
Medidas de Forma
Si la distribución de frecuencias tiene “una cola más larga” a la derecha del máximo
central que a la izquierda se dice que la distribución está sesgada a la derecha o que
tiene un sesgo positivo.Son aquellas que permiten estudiar, la forma que presenta la distribución de
frecuencias de los valores observados, con el fin de visualizar el modelo matemático
que mejor se ajusta
para describir el
comportamiento de
una variable.
19
20
● NÚMEROS INDICES
-Las actividades humanas son dinámicas. Necesitamos tener medidas que
reflejen la evolución de las variables que afectan dichas actividades
-Para medir las diferencias en la magnitud de un grupo de variables
relacionadas, se construye indicador o índice (NÚMERO ÍNDICE)
-ÍNDICE es una razón entre dos cantidades, donde el denominador se considera
como referencia
-El número índice mide cuantitativamente variaciones relativas de fenomenos
complejos a través del tiempo, espacio o cualquier otra circunstancia.
-Mide las diferencias en la magnitud de un grupo de variables relacionadas
-INDICAN LA VARIACIÓN PORCENTUAL ENTRE UNA SITUACIÓN INICIAL (BASE
DE LA COMPARACIÓN) Y OTRA SITUACIÓN FINAL (OBJETO DE LA
COMPARACIÓN)
● CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES
-Según la variable
*Índice de precios : Cambio porcentual de precios en el periodo actual con respecto al
período base
*Índice de cantidad: Cambio porcentual de cantidad demandadas en el período actual
con respecto al período base
*Índice de valor: Cambio porcentual de lo gastado en el período actual con respecto al
período base
-Según el método de construcción
*Índice simple: Considera las variaciones relativas sin tener en cuenta la importancia o
peso de cada variable en el contexto, no asignando ninguna ponderación.
*Índice ponderado: Considera las variaciones relativas teniendo en cuenta la
importancia o peso de cada variable en el contexto, asignando una ponderación.
-Según la elección de la base
*Índice de base fija: El periodo de referencia o base, se mantiene fijo a lo largo de toda
la serie.
21
*Índice de base variable o en cadena: La base se renueva constantemente.
Propiedades de un buen número índice
- Reversibilidad con respecto al tiempo
-Circularidad
-Reversibilidad de los factores
-Identidad
-Homogeneidad
-Proporcionalidad
UNIDAD 2-ELEMENTOS DE PROBABILIDAD
● Probabilidad→ Introducción
● MODELO MATEMÁTICO
Es una expresión o ecuación matemática para explicar, describir, en forma
simplificada, un fenómeno real.
Puede ser
-DETERMINÍSTICO
-NO DETERMINÍSTICO O ESTADÍSTICO
Este modelo es un modelo matemático, es la ecuación de una elipse. Dando
valores a X y a Y se obtiene el contorno de una elipsoide, que parece un huevo
de Pascua, que responde a la ecuación escrita en violeta y siempre va a tener la
misma forma.
● Modelo matemático determinístico
Los valores de la variable en estudio quedan exactamente determinados por las
condiciones del experimento que les da origen.
-Ejemplo: Experimento: observar el resultado de la unión de dos átomos de
hidrógeno y uno de oxígeno repitiendo la experiencia 100 veces.
Resultado: H2O = agua
22
(Las 100 veces se obtiene el mismo resultado, está perfectamente determinado.
Es un modelo determinístico. Siempre que repita este modelo (combinación
obtendré agua.
● Modelo estadístico o probabilístico
Los valores de la variable en estudio NO quedan exactamente determinados por
las condiciones del experimento que les da origen. Aunque el experimento sea
repetido en idénticas condiciones no se sabe de antemano cuál será el valor
que tomará la variable. Debido a ello está presente la incertidumbre.
-Ejemplo: Experimento: observar el tiempo de traslado desde el domicilio al
trabajo durante una semana laborable, suponiendo que las condiciones de
traslado se mantienen estables.
Resultados: lunes: 27 minutos, martes: 30 minutos, miércoles: 65 minutos (por
corte de calle imprevisto), jueves: 32 minutos, viernes: 25 minutos. De
antemano, no sabe cuánto tiempo va a tardar en llegar al trabajo, tiene una idea
aproximada pero, el miércoles salió a horario y sin embargo tardó 65 minutos por
un imprevisto, esa es parte de la incertidumbre presente.
“Los modelos estadísticos son descripciones matemáticas que evidencian
cómo se pueden generar los datos.” (Littell et al(1989)
“... Cuando se está interesado en obtener información sobre porqué tal cosa se
comporta de la manera que lo hace, es preferible un modelo que describa
matemáticamente los principales factores que intervienen en el proceso a fin
de facilitar no sólo la comprensión del proceso involucrado sino que también
permita predecir...” Box, Hunter y Hunter (1989)
● La modelización estadística tiene por finalidad dilucidar, objetivamente, los
aspectos principales del fenómeno observado en una investigación. Si bien esta
modelización es una abstracción de la realidad, se convierte en una herramienta
fundamental para lograr conclusiones objetivas, que sean de utilidad tanto para
la descripción del fenómeno, como para la toma de decisiones y para realizar
inferencias y predicciones.
● EXPERIMENTO ALEATORIO: E, Fenómeno empírico que admite dos o más
resultados posibles pero cuya ocurrencia no se puede predecir exactamente,
aún, repetido bajo idénticas condiciones.
● ESPACIO MUESTRAL: U, Conjunto de todos los resultados posibles asociados a
un experimento aleatorio. Según la cantidad de posibles resultados, el espacio
muestral puede ser: FINITO - INFINITO NUMERABLE - INFINITO NO
NUMERABLE.
● SUCESO ALEATORIO: S, es cualquier subconjunto del espacio muestral,
cualquier colección de resultados posibles asociados a un experimento
aleatorio. Dicho subconjunto puede contener sólo uno, algunos, ninguno o todos
los resultados posibles y todos son sucesos aleatorios.
➢Cualquier resultado individual es un suceso aleatorio
➢ El espacio muestral es un suceso aleatorio
➢ El conjunto vacío es un suceso aleatorio
➢ Si dos o más sucesos se combinan se obtiene otro suceso aleatorio
PARA TENER EN CUENTA!
-Los sucesos se simbolizan con letras mayúsculas en imprenta.
-Cualquier suceso que pueda ocurrir implica una acción, un verbo. Los suceso se
23
asocian con hechos, eventos.
-Se representan con diagramas de Venn
-Ejemplo 1:
E1: Se observan tres automóviles en una salida de la autopista para ver si dan
vuelta a la izquierda o a la derecha al final de la rampa de salida.
U1= {III; DII;IDI; IID; IDD;DID; DDI;DDD} donde D representa hacia la derecha y I
hacia la izquierda
E2: Se examina el voltaje de cada una de las baterías que salen de una línea de
ensamble hasta encontrar una que está dentro de los límites especificados
(éxito).
U2= {E, FE, FFE, FFFE,....} tiene un número infinito de posibles resultados
- Ejemplo 2:
Nos interesa saber cuáles son los resultados posibles asociados a los siguientes
sucesos aleatorios relacionados con la tirada de un dado. Cuando tiramos un
dado, de antemano, no sabemos cuál resultado va a ocurrir. Hay incertidumbre
por eso es un experimento aleatorio.
E: tirada de un dado
U = { 1, 2, 3, 4, 5, 6 }
A: que salga un número par = { 2, 4, 6 }
B: que salga un número primo = { 1, 2, 3, 5 }
C: que salga un número menor que 7 = { 1, 2, 3, 4, 5, 6 } = U
D: que salga un número 7 = { Ø }
E: que salga un número 1 = { 1 }
24
25
26
● SUCESOS ALEATORIOS
-INCOMPATIBLES: no se pueden presentar juntos
-COMPATIBLES se pueden presentar juntos , pueden ser dependientes o
independientes.
¿Entendemos la diferencia entre sucesos compatibles e incompatibles? Veamos
en la siguiente página unos ejemplos
● ¿Qué es la probabilidad?
La probabilidad es la medida de la incertidumbre. Es la medida de lo que
ignoramos . La incertidumbre es la falta de certeza, es la falta de conocimiento
total o parcial, sobre algo.
Definiciones de probabilidad: (AXIOMÁTICA, CLÁSICA, FRECUENCIAL Y
SUBJETIVA)
-DEFINICIÓN AXIOMÁTICA: Dado un experimento aleatorio y su correspondiente
espacio muestral
27
-La probabilidad de un suceso es un número real no negativo 𝑃(𝑆) ≥ 0
-El espacio muestral tiene probabilidad igual a 1 𝑆 = 𝑈 ⇒ 𝑃(𝑈) = 1
-El conjunto vacío tiene probabilidad igual a 0 𝑆 =⊘ ⇒ 𝑃(⊘) = 0
-La probabilidad del suceso complemento es igual a uno menos la probabilidad
del suceso contrario 𝑆 𝑒𝑠 𝑒𝑙𝑐𝑜𝑚𝑝𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝑆 ⇒ 𝑃(𝑆) = 1 − 𝑃(𝑆)
𝑃(𝑆) + 𝑃(𝑆) = 1
LA PROBABILIDAD DE UN SUCESO ESTÁ SIEMPRE ENTRE 0 Y 1
NO PUEDE SER NEGATIVA NI MAYOR A 1 0 ≤ 𝑃(𝑆) ≤ 1
-DEFINICIÓN CLÁSICA:
Dado un experimento aleatorio y su correspondiente espacio muestral finito, de
tamaño N, donde todos los elementos tienen la misma oportunidad de
ocurrencia o son igualmente verosímiles, la probabilidad es entonces, el
cociente entre el total de casos favorables al suceso y el total de casos posibles
del experimento.
N = total de casos posibles de E (que tienen la misma oportunidad de ocurrir)
K = total de casos favorables a S
𝑃(𝑆) = 𝐾𝑁
Ejemplo:
¿Cuál es la probabilidad de que en la tirada de un dado salga un número mayor
que 4?
Definimos el suceso y lo simbolizamos por ejemplo con la letra A
A= que salga un número mayor que 4
Cantidad de casos posibles: 6 caras tiene un dado N=6
Cantidad de casos favorables al suceso A: el 5 y el 6 K=2
𝑃(𝑆) = 𝐾𝑁 =
2
6
● Principio de estabilidad de frecuencia relativa
Cuando la cantidad de observaciones de un Experimento Aleatorio crece
indefinidamente la Frecuencia Relativa correspondiente a un Suceso, oscila, con
una convergencia asintótica, alrededor de un número fijo.
-DEFINICIÓN FRECUENCIAL:
𝑛 ∞
lim
→
𝑓𝑟(𝑆) = 𝑃(𝑠)
La frecuencia relativa estabilizada es la probabilidad del suceso
-DEFINICIÓN SUBJETIVA
Valor personal que cada sujeto asigna a la ocurrencia de un suceso según su
mejor saber y entender
Interpretación de los valores extremos de probabilidad
28
En la DEFINICIÓN CLÁSICA el cero y el uno, indican la imposibilidad absoluta y la
certeza absoluta, respectivamente.
¿Cuál es la probabilidad de que salga un 7 en la tirada de un dado?
Es imposible que salga un 7 en la tirada de un dado, la probabilidad es cero !!!!
¿Cuál es la probabilidad de que se moje una baldosa cuando está lloviendo?
Seguro que se va a mojar, la probabilidad es uno!!!
En la DEFINICIÓN FRECUENCIAL el cero y el uno, NO indican la imposibilidad absoluta
y la certeza absoluta, respectivamente.
● Tipos de probabilidades
Conjuntas Condicionales y Marginales
Para definir estas probabilidades nos basaremos en la definición clásica. Pero,
los conceptos son de aplicación general para el cálculo de probabilidad.
-Total conjunto y total marginal
Cómo nos basamos en la definición clásica, N representa la cantidad de casos posible
de un experimento aleatorio, todos igualmente verosímiles. A y B son dos sucesos
compatibles incluidos en el mismo espacio muestral asociados al experimento .
TOTAL CONJUNTO: cantidad de resultados posibles en que dos (o más) sucesos
compatibles se presentan o no se presentan juntos, simultáneamente.
(AB) = total de veces que se presenta el suceso A junto con el suceso B.
Total de casos favorables al suceso conjunto AB
( ) = total de veces que se presenta el suceso A y no se presenta el suceso B.𝐴𝐵
Total de casos favorables al suceso conjunto 𝐴𝐵
(ĀB) = total de veces que no se presenta el suceso A pero se presenta el suceso B.
Total de casos favorables al suceso conjunto ĀB
( ) = total de veces que no se presenta el suceso A y no se presenta el suceso B.𝐴𝐵
Total de casos favorables al suceso conjunto Ā𝐵
TOTAL MARGINAL: cantidad de resultados posibles en que se presenta un solo suceso
(A) = total de veces que se presenta el suceso A. Total de casos favorables al suceso A
(Ā) = total de veces que no se presenta el suceso A. Total de casos favorables al suceso
Ā
(B) = total de veces que se presenta el suceso B. Total de casos favorables al suceso B
( ) = total de veces que no se presenta el suceso B. Total de casos favorables al suceso𝐵
𝐵
Para mayor claridad y comprensión todos estos datos se vuelcan en una tabla de doble
entrada llamada tabla de contingencia , donde se ubican los totales conjuntos y los
marginales
29
● ¿Que es una probabilidad marginal?
Es la probabilidad de que se presente un suceso S
Se define como : P(S) = total marginal / total de datos
Como se identifica: Se refiere a un suceso solo
● ¿Qué es una probabilidad conjunta?
Es la Probabilidad de que se presenten dos sucesos A y B (o más)
simultáneamente, conjuntamente
Se define como : P(AB) = total conjunto / total de datos
Se identifica: Se identifica con: “y”; “ni...ni”; “pero”
● ¿Que es una probabilidad condicional?
Probabilidad de que se presente el suceso A tal que se presentó el suceso B
Se define como : P(A/B) = total conjunto / total marginal B
Probabilidad de que se presente el suceso B tal que se presentó el suceso A
Se define como : P(B/A) = total conjunto / total marginal A
Se identifica con: “si”; “dado que”; “gerundios”; “de los que...”
Cuando tenemos que escribir una probabilidad condicional hay que tener en
cuenta lo siguiente:
¿Cómo se denomina cada una de las partes de la simbología de probabilidad
condicional?
30
A TENER EN CUENTA
Cuando tenemos que escribir una probabilidad condicional hay que tener en
cuenta lo siguiente: ¿Cómo se escribe?
1) se escribe: P ; abro paréntesis , barra de “tal que” dejando espacio
P( /
2) Me pregunto y pienso cuál es el suceso que ocurre primero, cuál es el que
condiciona, cuál es el condicionante. En este caso B, entonces escribo debajo de la
barra B. El suceso que condiciona siempre se escribe debajo de la barra.
P( /B
3) Arriba de la barra escribo el suceso condicionado, en este caso A y cierro paréntesis
P( A /B)
● ¿Cuál es la diferencia entre una probabilidad conjunta y una probabilidad
condicional?
Teniendo en cuenta las respectivas definiciones vemos que una probabilidad conjunta
es el cociente entre un total conjunto y el total de datos , mientras que una
probabilidad condicional es el cociente entre un total conjunto y un total marginal,
según cuál sea
● REGLAS PARA OPERAR CON PROBABILIDAD
-REGLA DE LA SUMA para sucesos compatibles
-REGLA DE LA SUMA para sucesos incompatibles
-REGLA DEL PRODUCTO
-REGLA DE BAYES
-REGLA DE LA SUMA (incluyente, no incluyente)
Sucesos compatibles
La probabilidad de que ocurran A o B es igual a la suma de las probabilidades
marginales menos la probabilidad conjunta
Probabilidad de A o B:
P(AvB)= P(A)+P(B)-P(AB)
La probabilidad de que ocurra o bien A o bien B es igual a la suma de las
probabilidades marginales menos el doble de la probabilidad conjunta
Probabilidad de A o bien B:
P(AvB)= P(A)+P(B)- 2P(AB)
31
Sucesos incompatibles
La probabilidad de que ocurran A o B es igual a la suma de las probabilidades
marginales
Probabilidad de A o B:
P(AvB) = P(A)+P(B)
REGLA DEL PRODUCTO
La probabilidad conjunta de sucesos compatibles es el producto entre una
probabilidad marginal y una condicional
Probabilidad de A y B:
P(AB) = P(A).P(B/A) = P(B).P(A/B)
Regla del producto (consecuencia)
la probabilidad condicional de sucesos compatibles es el cociente entre una
probabilidad conjunta y la probabilidad marginal del suceso condicionante
Probabilidad de A tal que B: Probabilidad de B tal que A:
P(A/B) = P(AB)/P(B) P(B/A) = P(AB)/P(A)
● Sucesos probabilísticamente independientes
La presentación de uno de ellos no modifica el valor de probabilidad de presentación
del otro suceso
Si P(A/B) = P(A) P(B/A) = P(B) Los sucesos A y B son probabilísticamente
independientes
Entonces se cumple que:
P(AB)= P(A).P(B)= P(B).P(A)
REGLA DE BAYES
SISTEMA EXHAUSTIVO: Es todo espacio muestral formado por un conjunto de sucesos
mutuamente excluyentes cuyas probabilidades marginales asociadas (a cada uno de
ellos) suman la unidad.
Los sucesos A1, A2, ... , A6, que en forma general podemos simbolizar Ah, y el suceso B,
están definidos en el mismo espacio muestral. Los Ah son mutuamente excluyentes
entre sí, pero compatibles con el suceso B, como se muestra en la figura
Para aplicar esta regla interesa saber cuál es la probabilidad de
32
que si se presentó B, se presente algún suceso Ah.
Es una probabilidad condicional. Esta fórmula permite calcular la probabilidad de que si
ocurrió el suceso B, la causa sea algún Ah particular, ya que el teorema que origina esta
regla se conoce como teorema deBayes o de probabilidad de las causas.
Debemos calcular la probabilidad condicional, pero a priori no conocemos la
probabilidad marginal del suceso condicionante, B y la calculamos aplicando el
Teorema De La Probabilidad Total
El TEOREMA DE LA PROBABILIDAD TOTAL enuncia que : La probabilidad marginal de B
es igual a la suma de las probabilidades conjuntas de B con cada Ah. Es la suma de las
intersecciones del conjunto B con cada uno de los Ah.
Supongamos que conocemos las probabilidades marginales P(Ah) y las probabilidades
condicionales P(B/Ah) y queremos calcular la probabilidad de que si ocurrió el suceso
B la causa sea el suceso A1. Podemos calcular las probabilidades conjuntas P(AhB) y
sumando obtenemos P(B). Luego calculamos la probabilidad condicional haciendo el
cociente entre la probabilidad conjunta correspondiente y la probabilidad marginal de
B
● DIAGRAMA DE ÁRBOL
El diagrama de árbol es un grafo que permite visualizar la secuencia del cálculo
de una probabilidad conjunta.
● VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD
UNA VARIABLE ES ALEATORIA CUANDO A CADA VALOR DEL RECORRIDO LE
CORRESPONDE UN VALOR DE PROBABILIDAD
33
EL CONJUNTO DE PARES ORDENADOS (VALOR DEL RECORRIDO ; PROBABILIDAD)
ES UNA DISTRIBUCIÓN DE PROBABILIDAD
● VARIABLE ALEATORIA CUALITATIVA : A CADA UNA DE LAS CATEGORÍAS LE
CORRESPONDE UN VALOR DE PROBABILIDAD
● VARIABLE ALEATORIA DISCRETA: A CADA VALOR DEL RECORRIDO FINITO O
INFINITO NUMERABLE LE CORRESPONDE UN VALOR DE PROBABILIDAD
● ¿Que es una función de probabilidad?
ES UN MODELO TEÓRICO QUE ASIGNA A CADA VALOR DEL RECORRIDO UN
NÚMERO REAL Y DEBE CUMPLIR DOS CONDICIONES
-la condición de no negatividad:El número real asignado debe ser no negativo.
Se llama probabilidad puntual y se simboliza P(x).
p(x) 0≥
-condición de cierre: La suma de las probabilidades puntuales a través del
recorrido de la variable debe ser igual a la unidad
Σ𝑃(𝑋) = 1
● Función de probabilidad puntual
Es la probabilidad de que la variable tome exactamente el valor 𝑃(𝑥 = 𝑥
0
= 𝑃(𝑥
0
)
● ¿Que es la función de probabilidad acumulada o función de distribución?
ES LA FUNCIÓN QUE ASIGNA A CADA VALOR DEL RECORRIDO LA SUMA DE LA
PROBABILIDADES PUNTUALES hasta UN VALOR MENOR O IGUAL QUE UN VALOR
DADO DE LA VARIABLE Xo
𝐹(𝑥
𝑜
) = 𝑃(𝑥 ≤ 𝑥
𝑜
)
● ¿Que es la función de distribución complementaria ?
FUNCIÓN QUE ASIGNA A CADA VALOR DEL RECORRIDO LA SUMA DE LA
PROBABILIDADES PUNTUALES desde UN VALOR MAYOR O IGUAL QUE UN VALOR
DADO DE LA VARIABLE Xo
𝐺(𝑥
0
) = 𝑃(𝑥 ≥ 𝑥
0
)
● ¿Qué son los valores esperados?
SON MEDIDAS QUE RESUMEN INFORMACIÓN DE DISTRIBUCIONES DE PROBABILIDAD
O DE POBLACIONES. SE LLAMAN TAMBIÉN, PARÁMETROS O VALORES
POBLACIONALES O VALORES TEÓRICOS.
34
EL MOMENTO ABSOLUTO TEÓRICO DE ORDEN 1 ES LA ESPERANZA MATEMÁTICA O
MEDIA TEÓRICA µ
EL MOMENTO CENTRADO TEÓRICO DE ORDEN 2 ES LA VARIANZA TEÓRICA σ2
● VARIABLES ALEATORIAS DISCRETAS LEYES DE PROBABILIDAD ESPECÍFICAS
● EXPERIMENTO ALEATORIO DICOTÓMICO: Es el experimento cuyo espacio
muestral asociado tiene dos resultados posibles mutuamente excluyentes que
conforman un sistema exhaustivo.
● PERMUTACIONES DE N ELEMENTOS
Dado un conjunto formado por n elementos, se llama permutación de n a
cualquier ordenamiento de los n elementos. Si cambia el orden de alguno de los
elementos, cambia el ordenamiento y es una permutación.
● PERMUTACIONES CON REPETICIÓN
Dado un conjunto formado por n elementos, no todos desiguales, sino que hay r1,r2,...,rk
elementos repetidos se llama permutación de n elementos donde hay r1,r2,...,rk
repetidos a cualquier ordenamiento de los n elementos de modo tal que r1+r2 +...+rk es
igual a n…
.
35
● PERMUTACIONES CON DOS GRUPOS DE ELEMENTOS REPETIDOS
Dado un conjunto formado por n elementos, no todos desiguales, sino que hay r y (n-r)
elementos repetidos se llama permutación de n elementos donde hay r y (n-r)
repetidos a cualquier ordenamiento de los n elementos de modo tal que r + (n-r) =n
● Espacio continuo
Es un recinto de infinitos puntos donde en cualquiera de ellos es posible encontrar un
elemento. Los espacios continuos son magnitudes y los sucesos que ocurren dentro de
ellos son hechos puntuales.
● DISTRIBUCIÓN BINOMIAL
La cantidad de elementos con un determinado atributo que se presentan en n
observaciones independientes de un experimento aleatorio dicotómico es una variable
aleatoria discreta cuya función de probabilidad puntual es
r = cantidad de elementos con atributo A en n observaciones independientes
n = cantidad de observaciones o repeticiones independientes del experimento
p = P(encontrar un elemento con atributo A) = P(A). El valor de p es constante de
repetición en repetición porque son estadísticamente independientes
RECORRIDO DE UNA VARIABLE CON DISTRIBUCIÓN BINOMIAL
● DISTRIBUCIÓN HIPERGEOMÉTRICA
La cantidad de elementos con un determinado atributo que se presentan en n
observaciones dependientes de un experimento aleatorio dicotómico es una variable
36
aleatoria discreta cuya función de probabilidad puntual es
N = tamaño del universo FINITO
R = total de elementos con atributo A en el universo
N - R = total de elementos sin atributo A en el universo
r = cantidad de elementos con atributo A en n observaciones dependientes
n = cantidad de observaciones o repeticiones dependientes del experimento
El valor de p no es constante de repetición en repetición porque son estadísticamente
dependientes ya que las extracciones son sin reposición.
● DISTRIBUCIÓN DE POISSON
La cantidad de elementos que se presentan al azar en un continuo de
extensión t con un promedio o tasa de presentación en el continuo igual a esλ
una variable aleatoria discreta cuya función de probabilidad puntual es
r = cantidad de ocurrencias de un suceso en un espacio continuo de extensión t
t = extensión del continuo (medidas de peso, longitud, capacidad, volumen, tiempo)
b = frecuencia media o tasa media de presentación del suceso por unidad de
continuo
37
= frecuencia media o tasa media de presentación del suceso en todo el continuoλ
= b.tλ
● VARIABLE ALEATORIA CONTINUA
RECORRIDO INFINITO NO NUMERABLE EN UN INTERVALO DE NÚMEROS REALES [a,b]
Y EN [a,b] EXISTE UNA FUNCIÓN REAL f (X) QUE CUMPLE CON LAS DOS CONDICIONES
IMPORTANTE!!!!!
CUANDO LA VARIABLE ALEATORIA ES CONTINUA LA PROBABILIDAD PUNTUAL VALE
CERO PORQUE UN PUNTO NO TIENE SUPERFICIE
● FUNCIÓN DE PROBABILIDAD ACUMULADA FUNCIÓN DE DISTRIBUCIÓN
FUNCIÓN NO DECRECIENTE QUE ASIGNA A CADA VALOR DEL RECORRIDO UN VALOR
DE PROBABILIDAD ACUMULADA DESDE EL LÍMITE INFERIOR DEL RECORRIDO hasta
UN VALOR UN VALOR DADO DE LA VARIABLE 𝑋
0
38
● FUNCIÓN DE DISTRIBUCIÓN COMPLEMENTARIA
FUNCIÓN NO CRECIENTE QUE ASIGNA A CADA VALOR DEL RECORRIDO UN VALOR DE
PROBABILIDAD ACUMULADA desde UN VALOR DE LA VARIABLE HASTA EL LÍMITE
SUPERIOR DEL RECORRIDO 𝑋
0
● DISTRIBUCIÓN NORMAL
39
● PARA QUÉ SIRVE LA VARIABLE ESTANDARIZADA
La variable estandarizada es una transformación de la variable original, es una
reducción de los valores de la variable original. De los valores de X pasamos a los
valores de Z, mediante la tipificación. Las variables tipificadas están expresadas en
unidades de desvío típico , o sea, a cuántas desviaciones tipificadas se encuentran los
valores de la variable original con respecto a su media y en qué posición relativa , a la
izquierda (signo menos) o a la derecha (signo más). Esto nos permite establecer una
equivalencia en el sentido que la función de distribución, o sea la probabilidad
acumulada hasta x es la misma que la probabilidad acumulada hasta z. Los valores de z
están tabulados y permiten calcular probabilidades y percentiles. F(x)=F(z)
40
● PROPIEDADES DE LA ESPERANZA Y LA VARIANZA
41
● SUMA DE VARIABLES ALEATORIAS NORMALES INDEPENDIENTES
La Esperanza matemática de una suma (diferencia) de variables aleatorias
independientes es igual a la suma (diferencia) de las esperanzas matemáticas
individuales de cada una de las variables.
La varianza de la suma o diferencia de variables aleatorias independienteses igual a la
suma de las varianzas individuales de cada una de las variables
42
TODA COMBINACIÓN LINEAL DE VARIABLES ALEATORIAS NORMALES TIENE
DISTRIBUCIÓN NORMAL
-PRIMER CASO
TODAS LAS VARIABLES ESTÁN MULTIPLICADAS POR UNA CONSTANTE NO NULA Y
CADA UNA DE LAS VARIABLES TIENE DISTINTA MEDIA Y DISTINTA VARIANZA
-SEGUNDO CASO
TODAS LAS CONSTANTES SON IGUALES A UNO Y CADA UNA DE LAS VARIABLES
43
TIENE DISTINTA MEDIA Y DISTINTA VARIANZA
-TERCER CASO
TODAS LAS CONSTANTES SON IGUALES A UNO Y CADA UNA DE LAS VARIABLES
TIENE LA MISMA MEDIA Y LA MISMA VARIANZA
44