Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIDAD 1- ESTADÍSTICA DESCRIPTIVA ● Estadística→ introducción ➔ EXPERIMENTO O ENCUESTA a la observación planeada de un fenómeno con el objetivo de conocer su comportamiento, poder describirlo y/o tomar una decisión. ➔ UNIDAD EXPERIMENTAL es cada uno de los entes que son observados en el experimento. Ejemplo: ➢ El directorio de una empresa debe decidir acerca de la realización de una campaña publicitaria basada en el nivel de ventas mensuales. El experimento consiste en observar las ventas de cada mes durante un determinado lapso: la UE es el mes. ➢ Un economista desea realizar una proyección de las exportaciones anuales de cereales para los próximos cinco años. El experimento consiste en observar las exportaciones realizadas en cada año: la UE es el año ➢ Un médico desea analizar el comportamiento de la tensión arterial de los pacientes a los cuales se les ha suministrado una determinada droga. El experimento consiste en observar la tensión arterial de cada paciente: la UE es el paciente. ➔ DATO ESTADÍSTICO es el valor asignado a una de las características de una UNIDAD EXPERIMENTAL, conforme a la ESCALA DE MEDICIÓN empleada. ➔ DATOS CUALITATIVOS: son aquellos valores correspondientes a los atributos o propiedades categóricas que sólo se pueden usar para identificar y describir a una unidad experimental. ❖ ESCALA NOMINAL es el conjunto de símbolos que se usan únicamente para clasificar a los entes en las distintas categorías. Los valores correspondientes a esta escala se denominan categorías y son simples etiquetas. ❖ ESCALA ORDINAL es el conjunto de símbolos que se usan para clasificar a los entes en las distintas categorías, de acuerdo a su rango de manera que es posible ordenarlos de acuerdo a un orden preestablecido de sus valores según el grado que poseen. ➔ DATOS CUANTITATIVOS: son aquellos valores que, además de identificar y describir a una unidad experimental, establecen las diferencias posibles entre los valores en cantidad y grado. ❖ ESCALA DE INTERVALO: es el conjunto de números que se usan para clasificar a los entes de acuerdo a su rango y para poder establecer una distancia entre dos cualesquiera de ellos. Al punto de origen de esta escala se le asigna arbitrariamente el valor cero (no necesariamente indica ausencia de la característica medida). 0ºC, existe. ❖ ESCALA DE RAZÓN: es el conjunto de números que se usan para clasificar a los entes de acuerdo a su rango, para poder establecer una distancia entre dos cualesquiera de ellos y además establecer una proporcionalidad entre cualquiera de ellos. El punto de origen de esta 1 escala es realmente cero ya que indica la ausencia de la característica medida. 0 KG, no existe. ➔ INFORMACIÓN: Es el resultado de la evaluación de los Datos Estadísticos cuando se los compara con una referencia adecuada. ➔ UNIVERSO: Es el conjunto de unidades experimentales que poseen características comunes observables, para obtener información sobre un hecho particular. ➔ VARIABLE: Es cualquier característica observable que tienen las unidades experimentales. ➔ RECORRIDO de una VARIABLE: Es el conjunto de los posibles valores que ella puede asumir. ➔ VARIABLE CUALITATIVA: cuando los valores que puede asumir no constituyen un espacio métrico. ➔ VARIABLE CUANTITATIVA: cuando los valores que puede asumir si constituyen un espacio métrico. ➔ VARIABLE CUANTITATIVA DISCRETA: se originan en conteos o cuando se establecen restricciones al medir magnitudes. El recorrido de una variable discreta es siempre finito o infinito numerable. ➔ VARIABLE CUANTITATIVA CONTINUA: se originan cuando la característica a medir es una magnitud y no se establecen restricciones. El recorrido de una variable continua es siempre infinito no numerable. ESTADÍSTICA: Es la disciplina científica que crea, desarrolla y aplica los adecuados métodos de recopilación de datos, y su evaluación para transformarlos en informaciones con las cuales se describan objetivamente las situaciones investigadas, se analice el comportamiento de determinadas características y se tomen decisiones en condición de incertidumbre. 1. POBLACIÓN: Es el conjunto de los posibles valores de una variable particular que se estudia a un Universo. 2. MUESTRA: Es un subconjunto de una Población sobre la base de la cual se puede hacer un juicio acerca de ésta. ➔ REGULARIDAD ESTADÍSTICA: Es la información del comportamiento de una variable, que proporciona el registro ordenado de sus valores observados. ETAPAS DE LA TAREA ESTADÍSTICA 1. Enunciación del problema, definición del Universo e identificación de las variables. Determinación de “qué” se investiga, “para qué” se investiga. 2. Formulación de los instrumentos de medición. Diseño de los Cuestionarios 3. Recopilación de los datos. 2 FUENTES EXTERNAS → FUENTE EXTERNA PRIMARIA:CUANDO LOS DATOS PUBLICADOS FUERON RECOPILADOS POR LOS RESPONSABLES DEL MEDIO QUE LOS REPRODUCE: PUBLICACIONES DE ORGANISMOS OFICIALES, ETC. → FUENTE EXTERNA SECUNDARIA: CUANDO LOS DATOS PUBLICADOS NO FUERON RECOPILADOS DIRECTAMENTE POR LOS RESPONSABLES DEL MEDIO QUE LOS REPRODUCE: PUBLICACIONES PERIODÍSTICAS. 4. Presentación de los datos. PRESENTACIÓN ESCRITA→ Incorporar los datos en un párrafo combinando cifras y texto. CUADRO ESTADÍSTICO →Cuadro Estadístico de Referencia: se usa sólo para publicar los datos. →Cuadro Estadístico de Análisis: se usa para realizar los cálculos. GRÁFICO ESTADÍSTICO→ Es la expresión plástica de los datos. 5. Análisis de los datos. ANÁLISIS ESTADÍSTICO DESCRIPTIVO→ Permite describir el comportamiento empírico de las variables. ANÁLISIS ESTADÍSTICO INFERENCIAL→Permite tener información acerca de una población mediante los datos obtenidos con una muestra. ANÁLISIS ESTADÍSTICO PROBABILÍSTICO→Permite cuantificar la incertidumbre de los resultados de ciertos experimentos, también medir el error que pudiera cometerse en las decisiones tomadas mediante el Análisis inferencial. 6. Interpretación de los resultados (Obtención de Información). ● Cantidades absolutas y relativas CANTIDADES ABSOLUTAS→ Son aquellos datos cuantitativos (un número) que están expresados en las unidades de medida correspondientes a la magnitud que se está midiendo.Para comparar dos cantidades absolutas se hace la diferencia entre ellas y según el signo, positivo o negativo, se interpreta que hubo un aumento o disminución, respectivamente, entre ambas situaciones. 3 CANTIDADES RELATIVAS→ Son aquellos datos cuantitativos que surgen del cociente entre dos cantidades absolutas correspondientes a la misma magnitud y unidad de medida. Es el cociente entre dos cantidades absolutas, es un número puro que no tiene unidad de medida y se puede expresar en tanto por uno o en tanto por ciento. ● Presentación de datos: cuadros y gráficos MÉTODOS DE PRESENTACIÓN DE DATOS CUADROS Y GRÁFICOS: VARIABLES CUALITATIVAS Y VARIABLES CUANTITATIVAS ➢ Si bien la presentación de los datos puede hacerse por escrito, donde se leen cifras y texto, a veces no es lo mejor, en particular si es muy extenso. ➢ Los cuadros permiten una presentación más clara y ordenada. ➢ Los gráficos deben estar construidos cuidadosamente: Según sea la naturaleza de la variable en estudio será el gráfico que habrá que utilizar, deberá ser el adecuado para representar la información. Definiciones - CUADRO ESTADÍSTICO es un arreglo de filas y columnas dispuestas metódicamente de modo tal que los datos se puedan presentar y organizar para clasificarlos adecuadamente. - GRÁFICO es un dibujo metódicamente realizado para presentar los datos y expresarlos en forma plástica Es importante, para la vida diaria, saber leer e interpretarlos. Si se tiene información presentada en un gráfico es conveniente que también esté presentado el cuadro del cual se originó y tener en cuenta cuál es la naturaleza de la variable que se está representando. PARTES ESTRUCTURALES DE UN CUADRO ESTADÍSTICO ➢ TÍTULO: describe concisamente el contenido del cuadro. Tiene que responder a las siguientes preguntas: ¿Qué datos contiene el cuadro?;¿Dónde se recopilaron? ; ¿Cuándo ocurrieron? (Origen de los datos) ¿Cómo están clasificados? NO puede ser muy breve ni muy extenso. Tiene que proporcionar una correcta información. ➢ NOTA DE ENCABEZADO: (va debajo del título y entre paréntesis) amplía el título o clarifica la unidad de medida de los datos. 4 ➢ COLUMNA MATRIZ: es la primera columna, donde se ubican las categorías o valores de la variable más importante. ➢ ENCABEZADO DE LAS COLUMNAS: se presentan los valores de otras variables junto con la variable más importante o algunas especificaciones de ésta. ➢ CUERPO: (unidad básica de presentación) son las celdas donde se registran los datos, formadas por la intersección de las filas y columnas ➢ NOTA AL PIE: sirve para clarificar o explicitar algún dato o elemento particular. ➢ FUENTE: consigna el origen y la forma de relevamiento de los datos. Si es una publicación tiene que mencionar título, número de edición, fecha y página. ➢DIAGRAMA : está formado por trazos (líneas, rectángulos, circunferencias, etc) EJEMPLO En el diario Página 12.com - Económica del 30/ 1/2020 se publicó un artículo referido al aumento del ciberdelito con tarjetas de débito en el Banco Nación argentino. Así lo revela el Banco Nación en su Revista Anual- económica del año 2019. El informe fue elaborado a partir del registro de 4000 denuncias recibidas a nivel nacional en la entidad desde diciembre de 2018 a noviembre de 2019 (ambos meses incluidos). Los resultados obtenidos por fraude a los clientes en los últimos 12 meses fueron : “phishing” (crea páginas web falsas para ingresar datos) 32%; páginas de e-commerce dudosas (piden datos de la tarjeta) 25%; copia de la banda magnética con un lector (cuando el usuario pierde de vista la tarjeta) 19%, mientras que el Skimming ( copiar datos a través de dispositivos instalados en cajeros y puertas de bancos) 15% . Y otros tipos de ciberdelitos, 9%. En otros se incluye el ciberdelito Spamming: (correos electrónicos con oferta de compras para absorber datos). La variable en estudio es el tipo de cibercrimen. Es una variable cualitativa. 5 Vertical es igual pero con las barras hacia arriba y los valores sobre el eje de ordenadas. 6 Estoy comparando variables GRÁFICOS CIRCULARES Se pueden utilizar tanto para variable cualitativa como cuantitativa. Permiten visualizar la incidencia de cada una de las partes de un total. También permite mostrar la evolución de las partes en el tiempo o en el espacio mediante varios círculos, uno para cada momento de tiempo o lugar. Siguiendo con los datos del ejemplo del laboratorio, tenemos un círculo para cada método de enseñanza o grupo. 7 gráfico lineal ➢ Los gráficos mostrados no son todos los que existen, hay muchos otros tipos de gráficos, por ejemplo mapas y pictogramas. ➢ Cuando se lee un gráfico hay que prestar atención a la escala vertical , ya que, los mismos datos visualmente pueden parecer distintos aunque la información sea la misma!!!! Supongamos que representamos la variación porcentual del precio de un producto entre el mes de abril con respecto a marzo y fue del 5% . Según la escala del eje vertical, visualmente la variación podrá ser más alta o más baja aunque es la misma. 8 Vemos que la línea violeta crece más rápido que la fucsia, pero la escala en el eje vertical de la figura A es más grande que en la figura B. Un pictograma es un gráfico que usa imágenes o símbolos para presentar información de forma rápida, clara y atractiva. Debe incluir una referencia que indique qué representa cada símbolo o imagen. A veces se presentan figuras de distinto tamaño que están relacionadas con la cantidad de unidades experimentales (casos) que involucra cada tamaño, como una escala. ● DISTRIBUCIÓN DE FRECUENCIAS ANÁLISIS ESTADÍSTICO DESCRIPTIVO: Es el que permite describir el comportamiento empírico de las variables, mediante el cálculo de algunas medidas capaces de resumir la información que contienen los datos, la construcción de cuadros y gráficos especiales. Al inicio de cualquier investigación, hay que proceder a la recopilación de los datos. Al conjunto de datos dispuestos tal como se presentan, se lo denomina Datos no Agrupados. Si la cantidad de ellos es grande, veinte o más, y no están agrupados, es muy difícil poner en evidencia la regularidad estadística. Hay que ordenarlos agrupándolos en clases de equivalencia para que puedan ser estudiados convenientemente. Al conjunto de datos organizados, clasificados y distribuidos se los denomina Datos Agrupados en una Distribución de Frecuencias. Las DISTRIBUCIONES DE FRECUENCIAS se presentan en forma tabular y/o gráfica de modo tal que permitan una organización adecuada de los datos para proceder al análisis y a la posterior obtención de medidas capaces de brindar la información requerida. 9 VARIABLES CUALITATIVAS Se llama FRECUENCIA RELATIVA SIMPLE, fr , al cociente entre la frecuencia absoluta simple y la cantidad de observaciones. Las frecuencias relativas, multiplicadas por 100, expresan el porcentaje de casos, sobre el total, que hay en cada categoría. VARIABLES CUANTITATIVAS DISCRETAS Distribución de frecuencias para variables cuantitativas discretas. ❖ Frecuencia absoluta simple f, es la cantidad de veces que se repite un valor de la variable. ❖ Frecuencia absoluta acumulada F, es la cantidad de unidades experimentales con un valor de la variable menor o igual a un valor dado. ❖ Frecuencia relativa simple fr, es el cociente entre la frecuencia absoluta simple y la cantidad de observaciones. ❖ Frecuencia relativa acumulada Fr, es el cociente entre la frecuencia absoluta acumulada y la cantidad de observaciones. Las frecuencias relativas muestran la importancia relativa de cada clase. Para presentar en forma gráfica una distribución de Frecuencia Absoluta Simple de una variable discreta se utiliza un gráfico llamado GRÁFICO DE BASTONES. Para presentar en forma gráfica una distribución de Frecuencia Absoluta Acumulada de una variable discreta se utiliza un gráfico llamado GRÁFICO ESCALONADO o GRÁFICO EN ESCALERA. VARIABLES CUANTITATIVAS CONTINUAS Distribución de frecuencias para variables cuantitativas continuas. Los pasos que se deben seguir sobre los de datos para su presentación son: 10 •Determinación de los valores máximo xM y mínimo xm •Cálculo de la amplitud total del recorrido de la variable continua: A = xM - xm •Presentación de los datos en forma de distribución de frecuencias, para ello hay que clasificar las observaciones en un número relativamente chico de grupos llamados intervalos de clase, o clases. •Determinación del número de clases: h = ent(1+ log n / log 2). No es aconsejable que h sea más grande porque se pierde la regularidad en la distribución de frecuencias, tampoco es aconsejable que sea muy pequeño porque se perdería demasiada información al estar tan resumida. Si no se cuenta como mínimo con 20 valores observados no debería realizarse el agrupamiento en intervalos de clase. •Límites de clase. Toda clase tiene un límite inferior Li y otro superior Ls •Se trata de intervalos semiabiertos a derecha: [Li; Ls). •Amplitud de clase. Es la diferencia entre los límites clase: a =Ls - Li •Punto medio del intervalo de clase o marca de clase: Es la semisuma de los límites de clase: xi=( Li+ Ls )/2. ❖ Se llama FRECUENCIA ABSOLUTA SIMPLE (f) PARA VARIABLE CONTINUA a la cantidad de unidades experimentales cuyos valores observados de la variable pertenecen a un mismo intervalo de clase. ❖ Se llama FRECUENCIA ABSOLUTA ACUMULADA (F) PARA VARIABLE CONTINUA a la cantidad de unidades experimentales que tienen un valor observado de la variable menor al límite superior de un intervalo. ❖ Se llama FRECUENCIA RELATIVA SIMPLE (fr) al cociente entre la frecuencia absoluta simple y la cantidad de observaciones. ❖ Se llama FRECUENCIA RELATIVA ACUMULADA (Fr) al cociente entre la frecuencia absoluta acumulada y la cantidad de observaciones. REPRESENTACIÓN GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS SIMPLES. HISTOGRAMA REPRESENTACIÓNGRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS ACUMULADAS. OJIVA 11 AGRUPAMIENTO DE DATOS EN DISTRIBUCIONES DE FRECUENCIAS Para representar las frecuencias simples , absolutas o relativas, de una variable discreta se usa el GRÁFICO DE BASTONES ¡¡¡¡¡Los bastones no son barras!!!!! Los bastones son segmentos de longitud igual a la frecuencia simple. NO TIENEN SUPERFICIE, CADA BASTÓN ES UNA MEDIDA LINEAL La representación gráfica de las frecuencias acumuladas, absolutas o relativas de una variable discreta usamos el GRÁFICO DE ESCALERA O ESCALONADO PROBLEMA: Los siguientes datos corresponden a la cantidad de piezas defectuosas encontradas en una línea de producción en la cual se inspeccionaron 30 cajas con la misma cantidad de piezas cada una. Se pide: a) Identificar la naturaleza de la variable en estudio y organizar los datos en una distribución de frecuencias apropiada. La variable aleatoria en estudio es la cantidad de piezas defectuosas. Es una variable aleatoria cuantitativa discreta. b) Representar gráficamente las frecuencias simples y acumuladas, ambas en términos absolutos y relativos. Para poder representar el comportamiento de la variable, en primer lugar debemos generar la distribución de frecuencias. Para ello, vemos que la variable puede tomar los valores de 0 a 4 y empezamos a contar cuántas veces se repite cada uno de ellos. Así, encontramos que el valor X = 0 se repite 3 veces por lo tanto la frecuencia simple es 3. Lo mismo haremos con los otros valores y resumimos la información en la tabla 1. 12 c) ¿Qué cantidad de cajas no tienen piezas defectuosas? 3 cajas no contienen piezas defectuosas, 3 es la frecuencia absoluta simple correspondiente al valor X = 0 d) ¿Qué porcentaje de cajas tienen exactamente 4 piezas defectuosas? El 6.6% de las cajas tienen exactamente 4 piezas defectuosas. Frecuencia relativa simple correspondiente a X = 4. e) ¿Qué cantidad de cajas tienen a lo sumo 2 piezas defectuosas? 23 cajas tienen a lo sumo (como mucho, como máximo) 2 piezas defectuosas. Frecuencia acumulada correspondiente a X = 2. f) ¿Qué porcentaje de cajas tiene por lo menos 1 pieza defectuosa? El 90% de las cajas tiene por lo menos (como mínimo) 1 pieza defectuosa. Si el 10% no tiene piezas defectuosas, el resto tiene 1 o más piezas defectuosas. g) ¿Cuál es la cantidad de piezas defectuosas encontrada con mayor frecuencia? La cantidad de piezas encontradas con mayor frecuencia es 2. La mayoría de las cajas tiene 2 piezas defectuosas. ● MEDIDAS QUE RESUMEN INFORMACIÓN Son medidas capaces de extractar la esencia de los datos para caracterizar y describir las variables en estudio. 1. MEDIDAS DE CONCENTRACIÓN • Percentil • Rango Percentilar 2. MEDIDAS DE TENDENCIA CENTRAL • Promedios: Media Aritmética Geométrica , Armónica • Mediana • Modo 3. MEDIDAS DE VARIABILIDAD • Suma de Cuadrados • Varianza • Desvío Típico: Variabilidad Absoluta • Coeficiente de Variación: Variabilidad Relativa 4. MEDIDAS DE FORMA • COEFICIENTE DE ASIMETRÍA • COEFICIENTE DE CURTOSIS 1. MEDIDAS DE CONCENTRACIÓN Son aquellas medidas con las cuales se puede establecer el porcentaje de datos que está concentrado dentro de un determinado intervalo ➔ RANGO u ORDEN PERCENTILAR: Es la frecuencia relativa porcentual que se acumula desde el mínimo valor del recorrido, hasta un valor dado de la variable. ➔ PERCENTIL DE ORDEN K: Es aquel valor de la variable hasta donde se acumula, a lo sumo, el k% de los datos. Es el valor de la variable no superado por el k% de los datos. 13 Cinco maneras de expresar el mismo concepto: ❖ PERCENTIL DE ORDEN k es el valor de la variable hasta donde se acumula el k% de los datos. ❖ PERCENTIL DE ORDEN k es el valor de la variable no superado por el k% de los datos. ❖ PERCENTIL DE ORDEN k es el valor de la variable superado por el (100-k) % de los datos. ❖ PERCENTIL DE ORDEN k es el valor máximo del k% de los datos de menor cuantía. ❖ PERCENTIL DE ORDEN k es el valor mínimo del (100-k)% de los datos de mayor cuantía. Variables continuas: el percentil de orden k se calcula aplicando la siguiente fórmula al renglón de la distribución de frecuencias que corresponde al primer valor de frecuencia acumulada que supera al ORDEN ABSOLUTO DEL PERCENTIL: MEDIDAS DE TENDENCIA CENTRAL Son aquellos valores destacados con los cuales es posible representar a la totalidad de los valores observados de la variable. ❖ Modo ❖ Mediana ❖ Promedios simples: Media aritmética. Media geométrica. Media armónica. ❖ Promedio aritmético Ponderado Modo. Mo(x) o Moda Es el valor más común o sea al que le corresponde la mayor frecuencia. Si los datos no están agrupados no tiene sentido estadístico. Si los datos corresponden a una variable discreta bastará con buscar el valor de la variable al que le corresponde un máximo relativo del valor de la frecuencia absoluta simple. 14 Si se tratara de una variable continua hay que aplicar la siguiente fórmula al intervalo de clase al que le corresponde un máximo relativo de f: Donde Li es el límite inferior de la clase modal, d1= fi – f (i-1) , d2= fi –f (i+1) y a es la amplitud de la clase. Mediana. Mna(x) La mediana es el valor que es precedido por lamitad de los datos: es el valor que está en el medio si se ordenan los datos de menor a mayor. La mediana tiene las mismas unidades que la variable en estudio. Si son n datos, la mediana estará en el puesto (n+1)/2 una vez ordenados los datos de menor a mayor. La mediana no se ve afectada por los valores extremos de la serie de datos. Si los datos están agrupados en clases de equivalencia se deberá aplicar la fórmula. en el renglón correspondiente al primer valor de F (frecuencia absoluta acumulada) que supere a n/2. Donde Li es el límite inferior de dicho intervalo, Fi-1 es la frecuencia acumulada del intervalo anterior, fi es la frecuencia del intervalo y a es la amplitud del intervalo. CARACTERÍSTICAS DE LA MEDIANA 1. El valor de la MEDIANA es igual al Percentil 50. 2. El valor de la MEDIANA no se ve afectado por la presencia de valores extremos de la variable. 3. La suma del módulo de las desviaciones con respecto de la MEDIANA es mínima: 15 PROMEDIOS SIMPLES→Son los valores que se obtienen mediante la aplicación de operadores matemáticos, a la TOTALIDAD de los valores observados de la variable, bajo el supuesto de que todas las unidades experimentales tienen la MISMA IMPORTANCIA relativa. Media aritmética o promedio aritmético. Su cálculo se efectúa sumando todos los valores observados de la variable en estudio y dividiendo dicho valor por el número total de valores observados. 16 DESVENTAJAS DE LA MEDIA GEOMÉTRICA: 1. Los valores de la variable deben ser NO NULOS y , en algunos casos necesariamente POSITIVOS. 2. Su cálculo es muy laborioso. Se la utiliza cuando es necesario promediar variables cuyos valores forman una serie y se originan como cocientes entre otras dos variables, como por ejemplo las tasas de crecimiento periódicas: Se la utiliza cuando es necesario promediar variables que se originan como cocientes entre un numerador constante y un denominador variable, como por ejemplo la velocidad de un móvil o cantidades variables de producto que se pueden comprar con una determinada suma de dinero. 17 3. MEDIDAS DE VARIABILIDAD Son aquellas que permiten estudiar cómo se desvían, en su conjunto, los valores observados de una variable, con respecto a alguna Medida de tendencia Central. • Suma de Cuadrados • Varianza • Desvío Típico: Variabilidad Absoluta • Coeficiente de Variación: Variabilidad Relativa Mayor es la VARIANZA, mayor es la variabilidad que presenta la variable, y consecuentemente, menor es la representatividad de la MEDIA ARITMÉTICA. 18 MOMENTOS EMPÍRICOS Son operadores matemáticos que se obtienen a partir de los valores observados de la variable. Medidas de Forma Si la distribución de frecuencias tiene “una cola más larga” a la derecha del máximo central que a la izquierda se dice que la distribución está sesgada a la derecha o que tiene un sesgo positivo.Son aquellas que permiten estudiar, la forma que presenta la distribución de frecuencias de los valores observados, con el fin de visualizar el modelo matemático que mejor se ajusta para describir el comportamiento de una variable. 19 20 ● NÚMEROS INDICES -Las actividades humanas son dinámicas. Necesitamos tener medidas que reflejen la evolución de las variables que afectan dichas actividades -Para medir las diferencias en la magnitud de un grupo de variables relacionadas, se construye indicador o índice (NÚMERO ÍNDICE) -ÍNDICE es una razón entre dos cantidades, donde el denominador se considera como referencia -El número índice mide cuantitativamente variaciones relativas de fenomenos complejos a través del tiempo, espacio o cualquier otra circunstancia. -Mide las diferencias en la magnitud de un grupo de variables relacionadas -INDICAN LA VARIACIÓN PORCENTUAL ENTRE UNA SITUACIÓN INICIAL (BASE DE LA COMPARACIÓN) Y OTRA SITUACIÓN FINAL (OBJETO DE LA COMPARACIÓN) ● CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES -Según la variable *Índice de precios : Cambio porcentual de precios en el periodo actual con respecto al período base *Índice de cantidad: Cambio porcentual de cantidad demandadas en el período actual con respecto al período base *Índice de valor: Cambio porcentual de lo gastado en el período actual con respecto al período base -Según el método de construcción *Índice simple: Considera las variaciones relativas sin tener en cuenta la importancia o peso de cada variable en el contexto, no asignando ninguna ponderación. *Índice ponderado: Considera las variaciones relativas teniendo en cuenta la importancia o peso de cada variable en el contexto, asignando una ponderación. -Según la elección de la base *Índice de base fija: El periodo de referencia o base, se mantiene fijo a lo largo de toda la serie. 21 *Índice de base variable o en cadena: La base se renueva constantemente. Propiedades de un buen número índice - Reversibilidad con respecto al tiempo -Circularidad -Reversibilidad de los factores -Identidad -Homogeneidad -Proporcionalidad UNIDAD 2-ELEMENTOS DE PROBABILIDAD ● Probabilidad→ Introducción ● MODELO MATEMÁTICO Es una expresión o ecuación matemática para explicar, describir, en forma simplificada, un fenómeno real. Puede ser -DETERMINÍSTICO -NO DETERMINÍSTICO O ESTADÍSTICO Este modelo es un modelo matemático, es la ecuación de una elipse. Dando valores a X y a Y se obtiene el contorno de una elipsoide, que parece un huevo de Pascua, que responde a la ecuación escrita en violeta y siempre va a tener la misma forma. ● Modelo matemático determinístico Los valores de la variable en estudio quedan exactamente determinados por las condiciones del experimento que les da origen. -Ejemplo: Experimento: observar el resultado de la unión de dos átomos de hidrógeno y uno de oxígeno repitiendo la experiencia 100 veces. Resultado: H2O = agua 22 (Las 100 veces se obtiene el mismo resultado, está perfectamente determinado. Es un modelo determinístico. Siempre que repita este modelo (combinación obtendré agua. ● Modelo estadístico o probabilístico Los valores de la variable en estudio NO quedan exactamente determinados por las condiciones del experimento que les da origen. Aunque el experimento sea repetido en idénticas condiciones no se sabe de antemano cuál será el valor que tomará la variable. Debido a ello está presente la incertidumbre. -Ejemplo: Experimento: observar el tiempo de traslado desde el domicilio al trabajo durante una semana laborable, suponiendo que las condiciones de traslado se mantienen estables. Resultados: lunes: 27 minutos, martes: 30 minutos, miércoles: 65 minutos (por corte de calle imprevisto), jueves: 32 minutos, viernes: 25 minutos. De antemano, no sabe cuánto tiempo va a tardar en llegar al trabajo, tiene una idea aproximada pero, el miércoles salió a horario y sin embargo tardó 65 minutos por un imprevisto, esa es parte de la incertidumbre presente. “Los modelos estadísticos son descripciones matemáticas que evidencian cómo se pueden generar los datos.” (Littell et al(1989) “... Cuando se está interesado en obtener información sobre porqué tal cosa se comporta de la manera que lo hace, es preferible un modelo que describa matemáticamente los principales factores que intervienen en el proceso a fin de facilitar no sólo la comprensión del proceso involucrado sino que también permita predecir...” Box, Hunter y Hunter (1989) ● La modelización estadística tiene por finalidad dilucidar, objetivamente, los aspectos principales del fenómeno observado en una investigación. Si bien esta modelización es una abstracción de la realidad, se convierte en una herramienta fundamental para lograr conclusiones objetivas, que sean de utilidad tanto para la descripción del fenómeno, como para la toma de decisiones y para realizar inferencias y predicciones. ● EXPERIMENTO ALEATORIO: E, Fenómeno empírico que admite dos o más resultados posibles pero cuya ocurrencia no se puede predecir exactamente, aún, repetido bajo idénticas condiciones. ● ESPACIO MUESTRAL: U, Conjunto de todos los resultados posibles asociados a un experimento aleatorio. Según la cantidad de posibles resultados, el espacio muestral puede ser: FINITO - INFINITO NUMERABLE - INFINITO NO NUMERABLE. ● SUCESO ALEATORIO: S, es cualquier subconjunto del espacio muestral, cualquier colección de resultados posibles asociados a un experimento aleatorio. Dicho subconjunto puede contener sólo uno, algunos, ninguno o todos los resultados posibles y todos son sucesos aleatorios. ➢Cualquier resultado individual es un suceso aleatorio ➢ El espacio muestral es un suceso aleatorio ➢ El conjunto vacío es un suceso aleatorio ➢ Si dos o más sucesos se combinan se obtiene otro suceso aleatorio PARA TENER EN CUENTA! -Los sucesos se simbolizan con letras mayúsculas en imprenta. -Cualquier suceso que pueda ocurrir implica una acción, un verbo. Los suceso se 23 asocian con hechos, eventos. -Se representan con diagramas de Venn -Ejemplo 1: E1: Se observan tres automóviles en una salida de la autopista para ver si dan vuelta a la izquierda o a la derecha al final de la rampa de salida. U1= {III; DII;IDI; IID; IDD;DID; DDI;DDD} donde D representa hacia la derecha y I hacia la izquierda E2: Se examina el voltaje de cada una de las baterías que salen de una línea de ensamble hasta encontrar una que está dentro de los límites especificados (éxito). U2= {E, FE, FFE, FFFE,....} tiene un número infinito de posibles resultados - Ejemplo 2: Nos interesa saber cuáles son los resultados posibles asociados a los siguientes sucesos aleatorios relacionados con la tirada de un dado. Cuando tiramos un dado, de antemano, no sabemos cuál resultado va a ocurrir. Hay incertidumbre por eso es un experimento aleatorio. E: tirada de un dado U = { 1, 2, 3, 4, 5, 6 } A: que salga un número par = { 2, 4, 6 } B: que salga un número primo = { 1, 2, 3, 5 } C: que salga un número menor que 7 = { 1, 2, 3, 4, 5, 6 } = U D: que salga un número 7 = { Ø } E: que salga un número 1 = { 1 } 24 25 26 ● SUCESOS ALEATORIOS -INCOMPATIBLES: no se pueden presentar juntos -COMPATIBLES se pueden presentar juntos , pueden ser dependientes o independientes. ¿Entendemos la diferencia entre sucesos compatibles e incompatibles? Veamos en la siguiente página unos ejemplos ● ¿Qué es la probabilidad? La probabilidad es la medida de la incertidumbre. Es la medida de lo que ignoramos . La incertidumbre es la falta de certeza, es la falta de conocimiento total o parcial, sobre algo. Definiciones de probabilidad: (AXIOMÁTICA, CLÁSICA, FRECUENCIAL Y SUBJETIVA) -DEFINICIÓN AXIOMÁTICA: Dado un experimento aleatorio y su correspondiente espacio muestral 27 -La probabilidad de un suceso es un número real no negativo 𝑃(𝑆) ≥ 0 -El espacio muestral tiene probabilidad igual a 1 𝑆 = 𝑈 ⇒ 𝑃(𝑈) = 1 -El conjunto vacío tiene probabilidad igual a 0 𝑆 =⊘ ⇒ 𝑃(⊘) = 0 -La probabilidad del suceso complemento es igual a uno menos la probabilidad del suceso contrario 𝑆 𝑒𝑠 𝑒𝑙𝑐𝑜𝑚𝑝𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝑆 ⇒ 𝑃(𝑆) = 1 − 𝑃(𝑆) 𝑃(𝑆) + 𝑃(𝑆) = 1 LA PROBABILIDAD DE UN SUCESO ESTÁ SIEMPRE ENTRE 0 Y 1 NO PUEDE SER NEGATIVA NI MAYOR A 1 0 ≤ 𝑃(𝑆) ≤ 1 -DEFINICIÓN CLÁSICA: Dado un experimento aleatorio y su correspondiente espacio muestral finito, de tamaño N, donde todos los elementos tienen la misma oportunidad de ocurrencia o son igualmente verosímiles, la probabilidad es entonces, el cociente entre el total de casos favorables al suceso y el total de casos posibles del experimento. N = total de casos posibles de E (que tienen la misma oportunidad de ocurrir) K = total de casos favorables a S 𝑃(𝑆) = 𝐾𝑁 Ejemplo: ¿Cuál es la probabilidad de que en la tirada de un dado salga un número mayor que 4? Definimos el suceso y lo simbolizamos por ejemplo con la letra A A= que salga un número mayor que 4 Cantidad de casos posibles: 6 caras tiene un dado N=6 Cantidad de casos favorables al suceso A: el 5 y el 6 K=2 𝑃(𝑆) = 𝐾𝑁 = 2 6 ● Principio de estabilidad de frecuencia relativa Cuando la cantidad de observaciones de un Experimento Aleatorio crece indefinidamente la Frecuencia Relativa correspondiente a un Suceso, oscila, con una convergencia asintótica, alrededor de un número fijo. -DEFINICIÓN FRECUENCIAL: 𝑛 ∞ lim → 𝑓𝑟(𝑆) = 𝑃(𝑠) La frecuencia relativa estabilizada es la probabilidad del suceso -DEFINICIÓN SUBJETIVA Valor personal que cada sujeto asigna a la ocurrencia de un suceso según su mejor saber y entender Interpretación de los valores extremos de probabilidad 28 En la DEFINICIÓN CLÁSICA el cero y el uno, indican la imposibilidad absoluta y la certeza absoluta, respectivamente. ¿Cuál es la probabilidad de que salga un 7 en la tirada de un dado? Es imposible que salga un 7 en la tirada de un dado, la probabilidad es cero !!!! ¿Cuál es la probabilidad de que se moje una baldosa cuando está lloviendo? Seguro que se va a mojar, la probabilidad es uno!!! En la DEFINICIÓN FRECUENCIAL el cero y el uno, NO indican la imposibilidad absoluta y la certeza absoluta, respectivamente. ● Tipos de probabilidades Conjuntas Condicionales y Marginales Para definir estas probabilidades nos basaremos en la definición clásica. Pero, los conceptos son de aplicación general para el cálculo de probabilidad. -Total conjunto y total marginal Cómo nos basamos en la definición clásica, N representa la cantidad de casos posible de un experimento aleatorio, todos igualmente verosímiles. A y B son dos sucesos compatibles incluidos en el mismo espacio muestral asociados al experimento . TOTAL CONJUNTO: cantidad de resultados posibles en que dos (o más) sucesos compatibles se presentan o no se presentan juntos, simultáneamente. (AB) = total de veces que se presenta el suceso A junto con el suceso B. Total de casos favorables al suceso conjunto AB ( ) = total de veces que se presenta el suceso A y no se presenta el suceso B.𝐴𝐵 Total de casos favorables al suceso conjunto 𝐴𝐵 (ĀB) = total de veces que no se presenta el suceso A pero se presenta el suceso B. Total de casos favorables al suceso conjunto ĀB ( ) = total de veces que no se presenta el suceso A y no se presenta el suceso B.𝐴𝐵 Total de casos favorables al suceso conjunto Ā𝐵 TOTAL MARGINAL: cantidad de resultados posibles en que se presenta un solo suceso (A) = total de veces que se presenta el suceso A. Total de casos favorables al suceso A (Ā) = total de veces que no se presenta el suceso A. Total de casos favorables al suceso Ā (B) = total de veces que se presenta el suceso B. Total de casos favorables al suceso B ( ) = total de veces que no se presenta el suceso B. Total de casos favorables al suceso𝐵 𝐵 Para mayor claridad y comprensión todos estos datos se vuelcan en una tabla de doble entrada llamada tabla de contingencia , donde se ubican los totales conjuntos y los marginales 29 ● ¿Que es una probabilidad marginal? Es la probabilidad de que se presente un suceso S Se define como : P(S) = total marginal / total de datos Como se identifica: Se refiere a un suceso solo ● ¿Qué es una probabilidad conjunta? Es la Probabilidad de que se presenten dos sucesos A y B (o más) simultáneamente, conjuntamente Se define como : P(AB) = total conjunto / total de datos Se identifica: Se identifica con: “y”; “ni...ni”; “pero” ● ¿Que es una probabilidad condicional? Probabilidad de que se presente el suceso A tal que se presentó el suceso B Se define como : P(A/B) = total conjunto / total marginal B Probabilidad de que se presente el suceso B tal que se presentó el suceso A Se define como : P(B/A) = total conjunto / total marginal A Se identifica con: “si”; “dado que”; “gerundios”; “de los que...” Cuando tenemos que escribir una probabilidad condicional hay que tener en cuenta lo siguiente: ¿Cómo se denomina cada una de las partes de la simbología de probabilidad condicional? 30 A TENER EN CUENTA Cuando tenemos que escribir una probabilidad condicional hay que tener en cuenta lo siguiente: ¿Cómo se escribe? 1) se escribe: P ; abro paréntesis , barra de “tal que” dejando espacio P( / 2) Me pregunto y pienso cuál es el suceso que ocurre primero, cuál es el que condiciona, cuál es el condicionante. En este caso B, entonces escribo debajo de la barra B. El suceso que condiciona siempre se escribe debajo de la barra. P( /B 3) Arriba de la barra escribo el suceso condicionado, en este caso A y cierro paréntesis P( A /B) ● ¿Cuál es la diferencia entre una probabilidad conjunta y una probabilidad condicional? Teniendo en cuenta las respectivas definiciones vemos que una probabilidad conjunta es el cociente entre un total conjunto y el total de datos , mientras que una probabilidad condicional es el cociente entre un total conjunto y un total marginal, según cuál sea ● REGLAS PARA OPERAR CON PROBABILIDAD -REGLA DE LA SUMA para sucesos compatibles -REGLA DE LA SUMA para sucesos incompatibles -REGLA DEL PRODUCTO -REGLA DE BAYES -REGLA DE LA SUMA (incluyente, no incluyente) Sucesos compatibles La probabilidad de que ocurran A o B es igual a la suma de las probabilidades marginales menos la probabilidad conjunta Probabilidad de A o B: P(AvB)= P(A)+P(B)-P(AB) La probabilidad de que ocurra o bien A o bien B es igual a la suma de las probabilidades marginales menos el doble de la probabilidad conjunta Probabilidad de A o bien B: P(AvB)= P(A)+P(B)- 2P(AB) 31 Sucesos incompatibles La probabilidad de que ocurran A o B es igual a la suma de las probabilidades marginales Probabilidad de A o B: P(AvB) = P(A)+P(B) REGLA DEL PRODUCTO La probabilidad conjunta de sucesos compatibles es el producto entre una probabilidad marginal y una condicional Probabilidad de A y B: P(AB) = P(A).P(B/A) = P(B).P(A/B) Regla del producto (consecuencia) la probabilidad condicional de sucesos compatibles es el cociente entre una probabilidad conjunta y la probabilidad marginal del suceso condicionante Probabilidad de A tal que B: Probabilidad de B tal que A: P(A/B) = P(AB)/P(B) P(B/A) = P(AB)/P(A) ● Sucesos probabilísticamente independientes La presentación de uno de ellos no modifica el valor de probabilidad de presentación del otro suceso Si P(A/B) = P(A) P(B/A) = P(B) Los sucesos A y B son probabilísticamente independientes Entonces se cumple que: P(AB)= P(A).P(B)= P(B).P(A) REGLA DE BAYES SISTEMA EXHAUSTIVO: Es todo espacio muestral formado por un conjunto de sucesos mutuamente excluyentes cuyas probabilidades marginales asociadas (a cada uno de ellos) suman la unidad. Los sucesos A1, A2, ... , A6, que en forma general podemos simbolizar Ah, y el suceso B, están definidos en el mismo espacio muestral. Los Ah son mutuamente excluyentes entre sí, pero compatibles con el suceso B, como se muestra en la figura Para aplicar esta regla interesa saber cuál es la probabilidad de 32 que si se presentó B, se presente algún suceso Ah. Es una probabilidad condicional. Esta fórmula permite calcular la probabilidad de que si ocurrió el suceso B, la causa sea algún Ah particular, ya que el teorema que origina esta regla se conoce como teorema deBayes o de probabilidad de las causas. Debemos calcular la probabilidad condicional, pero a priori no conocemos la probabilidad marginal del suceso condicionante, B y la calculamos aplicando el Teorema De La Probabilidad Total El TEOREMA DE LA PROBABILIDAD TOTAL enuncia que : La probabilidad marginal de B es igual a la suma de las probabilidades conjuntas de B con cada Ah. Es la suma de las intersecciones del conjunto B con cada uno de los Ah. Supongamos que conocemos las probabilidades marginales P(Ah) y las probabilidades condicionales P(B/Ah) y queremos calcular la probabilidad de que si ocurrió el suceso B la causa sea el suceso A1. Podemos calcular las probabilidades conjuntas P(AhB) y sumando obtenemos P(B). Luego calculamos la probabilidad condicional haciendo el cociente entre la probabilidad conjunta correspondiente y la probabilidad marginal de B ● DIAGRAMA DE ÁRBOL El diagrama de árbol es un grafo que permite visualizar la secuencia del cálculo de una probabilidad conjunta. ● VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD UNA VARIABLE ES ALEATORIA CUANDO A CADA VALOR DEL RECORRIDO LE CORRESPONDE UN VALOR DE PROBABILIDAD 33 EL CONJUNTO DE PARES ORDENADOS (VALOR DEL RECORRIDO ; PROBABILIDAD) ES UNA DISTRIBUCIÓN DE PROBABILIDAD ● VARIABLE ALEATORIA CUALITATIVA : A CADA UNA DE LAS CATEGORÍAS LE CORRESPONDE UN VALOR DE PROBABILIDAD ● VARIABLE ALEATORIA DISCRETA: A CADA VALOR DEL RECORRIDO FINITO O INFINITO NUMERABLE LE CORRESPONDE UN VALOR DE PROBABILIDAD ● ¿Que es una función de probabilidad? ES UN MODELO TEÓRICO QUE ASIGNA A CADA VALOR DEL RECORRIDO UN NÚMERO REAL Y DEBE CUMPLIR DOS CONDICIONES -la condición de no negatividad:El número real asignado debe ser no negativo. Se llama probabilidad puntual y se simboliza P(x). p(x) 0≥ -condición de cierre: La suma de las probabilidades puntuales a través del recorrido de la variable debe ser igual a la unidad Σ𝑃(𝑋) = 1 ● Función de probabilidad puntual Es la probabilidad de que la variable tome exactamente el valor 𝑃(𝑥 = 𝑥 0 = 𝑃(𝑥 0 ) ● ¿Que es la función de probabilidad acumulada o función de distribución? ES LA FUNCIÓN QUE ASIGNA A CADA VALOR DEL RECORRIDO LA SUMA DE LA PROBABILIDADES PUNTUALES hasta UN VALOR MENOR O IGUAL QUE UN VALOR DADO DE LA VARIABLE Xo 𝐹(𝑥 𝑜 ) = 𝑃(𝑥 ≤ 𝑥 𝑜 ) ● ¿Que es la función de distribución complementaria ? FUNCIÓN QUE ASIGNA A CADA VALOR DEL RECORRIDO LA SUMA DE LA PROBABILIDADES PUNTUALES desde UN VALOR MAYOR O IGUAL QUE UN VALOR DADO DE LA VARIABLE Xo 𝐺(𝑥 0 ) = 𝑃(𝑥 ≥ 𝑥 0 ) ● ¿Qué son los valores esperados? SON MEDIDAS QUE RESUMEN INFORMACIÓN DE DISTRIBUCIONES DE PROBABILIDAD O DE POBLACIONES. SE LLAMAN TAMBIÉN, PARÁMETROS O VALORES POBLACIONALES O VALORES TEÓRICOS. 34 EL MOMENTO ABSOLUTO TEÓRICO DE ORDEN 1 ES LA ESPERANZA MATEMÁTICA O MEDIA TEÓRICA µ EL MOMENTO CENTRADO TEÓRICO DE ORDEN 2 ES LA VARIANZA TEÓRICA σ2 ● VARIABLES ALEATORIAS DISCRETAS LEYES DE PROBABILIDAD ESPECÍFICAS ● EXPERIMENTO ALEATORIO DICOTÓMICO: Es el experimento cuyo espacio muestral asociado tiene dos resultados posibles mutuamente excluyentes que conforman un sistema exhaustivo. ● PERMUTACIONES DE N ELEMENTOS Dado un conjunto formado por n elementos, se llama permutación de n a cualquier ordenamiento de los n elementos. Si cambia el orden de alguno de los elementos, cambia el ordenamiento y es una permutación. ● PERMUTACIONES CON REPETICIÓN Dado un conjunto formado por n elementos, no todos desiguales, sino que hay r1,r2,...,rk elementos repetidos se llama permutación de n elementos donde hay r1,r2,...,rk repetidos a cualquier ordenamiento de los n elementos de modo tal que r1+r2 +...+rk es igual a n… . 35 ● PERMUTACIONES CON DOS GRUPOS DE ELEMENTOS REPETIDOS Dado un conjunto formado por n elementos, no todos desiguales, sino que hay r y (n-r) elementos repetidos se llama permutación de n elementos donde hay r y (n-r) repetidos a cualquier ordenamiento de los n elementos de modo tal que r + (n-r) =n ● Espacio continuo Es un recinto de infinitos puntos donde en cualquiera de ellos es posible encontrar un elemento. Los espacios continuos son magnitudes y los sucesos que ocurren dentro de ellos son hechos puntuales. ● DISTRIBUCIÓN BINOMIAL La cantidad de elementos con un determinado atributo que se presentan en n observaciones independientes de un experimento aleatorio dicotómico es una variable aleatoria discreta cuya función de probabilidad puntual es r = cantidad de elementos con atributo A en n observaciones independientes n = cantidad de observaciones o repeticiones independientes del experimento p = P(encontrar un elemento con atributo A) = P(A). El valor de p es constante de repetición en repetición porque son estadísticamente independientes RECORRIDO DE UNA VARIABLE CON DISTRIBUCIÓN BINOMIAL ● DISTRIBUCIÓN HIPERGEOMÉTRICA La cantidad de elementos con un determinado atributo que se presentan en n observaciones dependientes de un experimento aleatorio dicotómico es una variable 36 aleatoria discreta cuya función de probabilidad puntual es N = tamaño del universo FINITO R = total de elementos con atributo A en el universo N - R = total de elementos sin atributo A en el universo r = cantidad de elementos con atributo A en n observaciones dependientes n = cantidad de observaciones o repeticiones dependientes del experimento El valor de p no es constante de repetición en repetición porque son estadísticamente dependientes ya que las extracciones son sin reposición. ● DISTRIBUCIÓN DE POISSON La cantidad de elementos que se presentan al azar en un continuo de extensión t con un promedio o tasa de presentación en el continuo igual a esλ una variable aleatoria discreta cuya función de probabilidad puntual es r = cantidad de ocurrencias de un suceso en un espacio continuo de extensión t t = extensión del continuo (medidas de peso, longitud, capacidad, volumen, tiempo) b = frecuencia media o tasa media de presentación del suceso por unidad de continuo 37 = frecuencia media o tasa media de presentación del suceso en todo el continuoλ = b.tλ ● VARIABLE ALEATORIA CONTINUA RECORRIDO INFINITO NO NUMERABLE EN UN INTERVALO DE NÚMEROS REALES [a,b] Y EN [a,b] EXISTE UNA FUNCIÓN REAL f (X) QUE CUMPLE CON LAS DOS CONDICIONES IMPORTANTE!!!!! CUANDO LA VARIABLE ALEATORIA ES CONTINUA LA PROBABILIDAD PUNTUAL VALE CERO PORQUE UN PUNTO NO TIENE SUPERFICIE ● FUNCIÓN DE PROBABILIDAD ACUMULADA FUNCIÓN DE DISTRIBUCIÓN FUNCIÓN NO DECRECIENTE QUE ASIGNA A CADA VALOR DEL RECORRIDO UN VALOR DE PROBABILIDAD ACUMULADA DESDE EL LÍMITE INFERIOR DEL RECORRIDO hasta UN VALOR UN VALOR DADO DE LA VARIABLE 𝑋 0 38 ● FUNCIÓN DE DISTRIBUCIÓN COMPLEMENTARIA FUNCIÓN NO CRECIENTE QUE ASIGNA A CADA VALOR DEL RECORRIDO UN VALOR DE PROBABILIDAD ACUMULADA desde UN VALOR DE LA VARIABLE HASTA EL LÍMITE SUPERIOR DEL RECORRIDO 𝑋 0 ● DISTRIBUCIÓN NORMAL 39 ● PARA QUÉ SIRVE LA VARIABLE ESTANDARIZADA La variable estandarizada es una transformación de la variable original, es una reducción de los valores de la variable original. De los valores de X pasamos a los valores de Z, mediante la tipificación. Las variables tipificadas están expresadas en unidades de desvío típico , o sea, a cuántas desviaciones tipificadas se encuentran los valores de la variable original con respecto a su media y en qué posición relativa , a la izquierda (signo menos) o a la derecha (signo más). Esto nos permite establecer una equivalencia en el sentido que la función de distribución, o sea la probabilidad acumulada hasta x es la misma que la probabilidad acumulada hasta z. Los valores de z están tabulados y permiten calcular probabilidades y percentiles. F(x)=F(z) 40 ● PROPIEDADES DE LA ESPERANZA Y LA VARIANZA 41 ● SUMA DE VARIABLES ALEATORIAS NORMALES INDEPENDIENTES La Esperanza matemática de una suma (diferencia) de variables aleatorias independientes es igual a la suma (diferencia) de las esperanzas matemáticas individuales de cada una de las variables. La varianza de la suma o diferencia de variables aleatorias independienteses igual a la suma de las varianzas individuales de cada una de las variables 42 TODA COMBINACIÓN LINEAL DE VARIABLES ALEATORIAS NORMALES TIENE DISTRIBUCIÓN NORMAL -PRIMER CASO TODAS LAS VARIABLES ESTÁN MULTIPLICADAS POR UNA CONSTANTE NO NULA Y CADA UNA DE LAS VARIABLES TIENE DISTINTA MEDIA Y DISTINTA VARIANZA -SEGUNDO CASO TODAS LAS CONSTANTES SON IGUALES A UNO Y CADA UNA DE LAS VARIABLES 43 TIENE DISTINTA MEDIA Y DISTINTA VARIANZA -TERCER CASO TODAS LAS CONSTANTES SON IGUALES A UNO Y CADA UNA DE LAS VARIABLES TIENE LA MISMA MEDIA Y LA MISMA VARIANZA 44
Compartir