Logo Studenta

RESUMEN DE ESTADISTICA MODULO 1-2

¡Este material tiene más páginas!

Vista previa del material en texto

CONCEPTOS ÚTILES
ESTADÍSTICA:
La estadística actual reúne dos disciplinas que evolucionaron de forma independiente hasta que en el siglo XIX se unificaron:
· Cálculo de probabilidades, que nace cuando se sistematizaron los juegos de azar en el siglo XVII.
· Estadística, como ciencia del Estado, que estudia los datos de los censos de población ya bastante antes de la era cristiana (Egipcios, griegos y mesopotámicos).
· La Estadística es una ciencia que analiza las diferentes maneras de procesar, ordenar y sistematizar los datos.
· Nos brinda las instrucciones y los medios para recoger los datos y analizarlos de forma tal que sean apropiados a los fines de nuestro negocio, empresa, o actividad.
“Es el conjunto de métodos y técnicas que permiten determinar, de una muestra debidamente representativa de una población, los valores estadísticos, a fin de poder inferir sobre los parámetros poblacionales con un cierto grado de bondad".
La Estadística Descriptiva: “El conjunto de métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente sus características”.
La Estadística Inferencial: “Conjunto de métodos que hacen posible la estimación de una característica de la población o la toma de una decisión referente a una población basándose solo en los resultados de una muestra” 
ETAPAS QUE DEFINEN UN ANÁLISIS ESTADÍSTICO
A. Planteamiento del problema: se comienza en reconocer el problema y plantear la pregunta a la que se quiere dar respuesta con el análisis estadístico, es decir ¿Qué se quiere investigar? y ¿Por qué se debe investigar?
B. Fijación de objetivos: en este punto, una vez que hemos definido el problema debemos presupuestar el alcance de nuestra investigación que necesariamente debe ser claro y preciso y definir sus metas en el corto, mediano y largo plazo.
C. Formulación de hipótesis: es una proposición para responder posiblemente a un problema, es decir la respuesta al ¿Qué? del paso anterior, y según nuestro análisis, va a ser puesta a prueba en cuanto a su validez.
D. Definición de la unidad de observación y la unidad de medida: la unidad de observación es cada uno de los integrantes de la población sujeta a estudio, que debe ser definida previamente y establecidas sus características. Pueden ser uno o varios objetos de observación. En cuanto a la unidad de medida debe definirse y comunicarse a todo el equipo de trabajo y bajo qué sistema de medición se va a trabajar.
E. Determinación de la población y muestra: como veremos más adelante, la población o universo, son individuos u objetos que tienen una o varias características comunes y no necesariamente deben ser seres con vida y pueden tomar valores finitos o infinitos. En cambio, la muestra, al ser una porción de la población, solo puede tomar valores finitos. Debe ser tomada al azar y ser representativa, para que la investigación sea lo más objetiva posible.
F. Recolección de datos: para recoger la información se cuentan diversos medios:
· Por observación directa
· Por encuestas
· Por fuentes externas confiables
· Por encuestas online
· Por publicaciones de renombre científico
En esta etapa se deben establecer los criterios para realizar las preguntas. Estas pueden ser políticas, demográficas, culturales,
Sociales, o económicas. Según sea el aspecto a relevar y a continuación a diseñar, según el criterio elegido, el tipo de preguntas a realizar.
G. Análisis, selección y clasificación de la información: una vez que se cuenta con toda la información, se la revisa y se descarta la información confusa, viciada o sin valor, y a partir de la información restante se procede a clasificarla y ordenarla para lo cual se pueden aplicar diferentes modelos de tabulación.
H. Tabulación: es expresar los resultados a través de una tabla que resume la información recolectada. Esta tabla debe tener título (claro y legible), subtítulos (cuando sea necesario), unidades de medida de las observaciones según cada variable analizada y toda nota al pie de la misma que ayude a la lectura e interpretación de la información.
La presentación de los resultados del estudio deben ser lo más claros, precisos y entendibles posibles. La utilización de cuadros, tablas, gráficos y cualquier otro método de representación de los resultados, tiene que elegirse en función de las variables a representar y del posible destinatario del informe.
I. El análisis de la información: En este punto, es cuando a partir de la determinación de los parámetros y estadísticos muéstrales y su confiabilidad permiten ser usados para las estimaciones y las inferencias respecto de la población total y ajustar los modelos previstos y confirmar o rechazar las hipótesis planteadas para que nos conduzcan a las conclusiones correctas.
J. Publicación: los resultados deben presentarse adecuadamente para que cumplan con los objetivos prefijados. Según la importancia del trabajo realizado es el tipo de presentación que se realizará, pudiendo ser en auditorios, en conferencia de prensa o en ámbitos privados, en reuniones de Directorio o bien a través de informes personalizados.
CONCEPTO DE POBLACIÓN Y MUESTRA:
Población:
Es el conjunto de datos que se puede medir o contar del objeto en estudio. Son ejemplos de poblaciones:
La cantidad de personas u obreros que trabajan en determinada rama de la industria en la Provincia de Córdoba, la cantidad de pernos de pistón que entran en un contenedor, la cantidad de animales de una especie que se encuentran en un Parque Nacional, o la cantidad de infecciones en las vías respiratorias que existen en determinado sector de la ciudad.
¿Qué es el elemento de la población?
Es la unidad de la población; o sea cada una de las personas, cosas, animales y hechos que se van a medir de la población a considerar. En los ejemplos anteriores, los elementos de las poblaciones son: cada uno de los obreros, cada uno de los pernos de pistón, cada uno de los animales y cada una de las infecciones en las vías respiratorias.
¿Qué es variable de la población?
Es la característica en estudio que se observa en cada uno de los elementos de la población y que varía de un elemento con respecto a otro. En los ejemplos anteriores, podríamos tener como variable de estudio en los obreros de la industria si son solteros, casados, divorciados o viudos; en los pernos de pistón si tienen cabeza cuadrada o hexagonal, en los animales del parque nacional si son herbívoros, carnívoros o frugívoros y en la infecciones respiratorias diferentes tipos de influenza.
Con el objeto de seleccionar las medidas más adecuadas para corregir alguna anomalía o realizar alguna acción deberíamos contar con la mayor información posible, y lo más conveniente sería tener los que provienen del estudio de toda la población, ya que nos evitaría tener que realizar alguna inferencia, en este caso decimos que se ha efectuado un censo de la población.
Pero en este caso, la mayor exactitud va acompañada por un mayor costo y tiempo que evidentemente encarece el proceso.
Por lo tanto, los resultados que puede entregarnos un censo tienen el carácter de ser exactos, pero los costos que determinan los mismos pueden no justificar dicha exactitud cuándo, con muestras debidamente seleccionadas y representativas se determinan esos valores con un cierto grado de error que se puede regular y controlar.
En algunas situaciones especiales, el censo se presenta impracticable o puede ser inconveniente en cuanto a su realización. Solamente imagine que se realiza un estudio sobre saneamientos de hormigueros en una obra vial en el Norte del
País, la población tendría el carácter de infinita y por lo tanto sería poco más que imposible censarla.
Supongamos que se desata un Tsunami en la población costera de un país intensamente poblado y debemos analizar las ubicaciones para los evacuados. Pretender estudiar la cantidad exacta de la población afectada llevaría un tiempo enorme tal que, al cumplirse tal vez no tendría sentido la evacuación de los afectados.
Esto que hemos analizado sonsolo unos casos donde nos revela que no siempre el análisis de las características de una población es lo más conveniente y que en esos casos deberíamos poder tomar decisiones, en base a las inferencias que sobre una población podemos hacer, de resultado del análisis y estudio de una muestra de la misma.
Muestra
Según lo acabado de analizar, estudiar el comportamiento de una población a través de un censo, se torna en la mayoría de las veces impracticable, es por las razones dadas anteriormente que el análisis se efectúa por medio de una muestra, que esté constituida por una porción de todos los valores poblacionales.
¿Qué entendemos por muestra?
Una muestra estará constituida por una porción de la población por lo tanto es un subconjunto de la misma. Cada uno de los elementos que forman parte de la muestra se denominan observación. Cuando se trabaja con toda la población, la obtención de los datos se denomina censo, en cambio cuando los datos se obtienen sobre una muestra, se dice que estamos realizando un muestreo.
¿Qué es una muestra representativa?
Si bien es cierto que una muestra está constituida por elementos pertenecientes a la población, tenemos que entender que no todo subconjunto de la población se constituye en una muestra representativa.
Y se dice que es debidamente representativa de una población cuando presenta sus mismas características, cuestión que es tal, si el 40% de la población cumple con una determinada propiedad, se espera que el 40% de la muestra cumpla con esa misma propiedad.
Esto permite disminuir los errores que se cometen cuando se efectúa la inferencia de los parámetros poblacionales a partir de los valores determinados en la muestra.
VARIABLE EN ESTUDIO:
Mediante la aplicación de métodos y técnicas estadísticas se estudian estas observaciones sobre la variable que estamos considerando y se determinan los estadísticos. 
La variable cuantitativa discreta es la que resulta de un conteo y sólo puede tomar valores definidos y no puede tomar ningún valor comprendido entre dos valores consecutivos, por esa razón, toma valores del conjunto de números enteros.
Son ejemplos de ellas:
· Número de conejos en una jaula.
· Cantidad de obreros con título profesional en una fábrica.
· Número de casos de cáncer en una localidad; etc.
Como verán no se podría contar 3 conejos y medio en una jaula, ni 35 obreros y medio en la empresa y mucho menos
150,2 casos de cáncer en una ciudad.
La variable cuantitativa continua Es la que puede tomar infinitos valores posibles dentro de un cierto intervalo, es decir, toma valores dentro del conjunto de números reales. Además, tiene la característica que, para su medición, se utilizan generalmente instrumentos de medición.
Son ejemplos de ellas:
· La altura de los brotes de una oleaginosa en un almácigo.
· Los pesos de los deportistas de una cierta especialidad.
· El volumen de líquido escurrido en un ensayo de permeabilidad.
La variable cualitativa nominal es aquella variable en estudio, en la cual los valores que adopta pueden ser clasificados de acuerdo a categorías, pero sin orden jerárquico.
Son ejemplos de ellas:
· Clasificar una población por su estado civil: solteros, casados, viudos, o divorciados.
· Realizar una encuesta sobre los grupos sanguíneos de un sector de nuestra empresa.
· Ubicar la procedencia de los empleados de un sector específico de la Construcción.
La variable cualitativa jerarquizada es aquella variable en estudio, que se presenta cuando es necesario otorgarle a ella una cierta jerarquía de orden.
Son ejemplos de ellas:
· Clasificar una población por su nivel de instrucción: analfabetos, nivel primario, nivel secundario, nivel terciario o universitario.
· Realizar una encuesta sobre los niveles de glucemia de los empleados de una confitería.
· Datos esperados y datos observados:
· Los datos esperados son los datos que un investigador espera si la hipótesis que se planteó al iniciar la investigación fuera cierta.
· Los datos observados son aquellos que se encuentran en la muestra sujeta a análisis y que reciben el nombre de estadísticos de la muestra.
VALORES ESTADÍSTICOS
Los estudios sobre una muestra permiten determinar valores que se los denomina estimadores (también llamados valores estadísticos), a través de los se podrá efectuar una correcta estimación sobre los valores de la población.
Parámetros
Los valores en estudio, que en la muestra toman el nombre de Estadísticos, en la población se los denominan Parámetros.
Si necesitásemos determinar el salario de los docentes del País, deberíamos tomar una muestra constituida por docentes de distintas escuelas, distintas provincias y distintos niveles, el salario promedio obtenido en la muestra se denomina estadístico, mientras que el salario promedio de toda la población docente se constituye en parámetro.
Se define como bondad al margen de seguridad con que se realiza la inferencia de acuerdo a los estudios realizados sobre la o las muestras.
Indicar que tal encuesta sobre un hecho marca una tendencia determinada no tiene peso como información si no se lo acompaña con un grado de seguridad.
VALORES ESTADÍSTICOS: DE POSICIÓN Y DE DISPERSIÓN
VALORES DE POSICIÓN Y DE DISPERSION:
Valores o medidas de tendencia central o de posición: “Es la medida que describe cómo todos los valores de los datos se agrupan en torno a un valor central.” 
· Media aritmética o promedio: Es el cociente entre las sumas de todas las observaciones y el número total de las mismas. La media poblacional la representamos con la letra μ y el tamaño de la población con N, por lo que la media poblacional se expresa como:
Y en notación abreviada:
En cambio, la media muestral, la representamos con 𝐗 y el tamaño de la muestra o número de observaciones lo representaremos con n.
Y en notación abreviada:
Ejemplo N°1:
En un brote de gripe invernal, 8 personas que desarrollaron la enfermedad tardaron la siguiente cantidad de días en curarse completamente: 8, 8, 9, 10, 7, 7, 7, 9, y para calcular la media de esta población, procedemos de la siguiente manera:
Es viable notar que si bien la media no coincide con ninguna medición nos representa el valor medio de duración de la enfermedad.
Ahora bien, tratándose de un grupo de datos muy grande, en que alguno de ellos se presenta con distinta frecuencia, se puede modificar la ecuación anterior:
Llamando 𝑓1, 𝑓2,…, 𝑓𝑛, a las distintas frecuencias en que aparecen los datos.
Ejemplo N°2:
En la siguiente tabla se representa el número de hermanos de cada alumno de 4° año de la carrera de Abogacía:
	N° De Hermanos
	Frecuencia
	1
	30
	2
	20
	3
	15
	4
	5
	5
	2
En el caso que estamos analizando, vemos que la media cuenta con la ventaja de la facilidad del cálculo, pero la desventaja es que es un parámetro muy sensible a los valores extremos, lo cual le hace perder representatividad en esos casos y convendría utilizar otra de las medidas de tendencia central.
Ejemplo N°3:
Si en un curso de Postgrado de la Universidad asisten 10 alumnos y se hace una encuesta de las edades de los mismos:
24, 23, 25, 27, 30, 26, 28, 29, 30, 65. Se verifica que la media aritmética es 30,7 años, valor que no sería representativo, dado que solo un alumno superaría ese valor (65 años) afectando demasiado al promedio. Si analizamos el resto de los 9 alumnos y calculamos su media, esta toma un valor de 26,9. Veremos más adelante que para este caso la mediana sería una opción más conveniente.
· Mediana:
Es el valor que divide en partes iguales a los datos ordenados de una distribución. La mediana, en una distribución ordenada, deja a uno de sus lados los valores menores o iguales a ella y hacia el otro lado los mayores o iguales a ella en igual número de observaciones.
Para calcularla, se procede de las siguientes dos maneras, según si el número de observaciones fuera par o impar: Si n es impar es el valor central al ordenar la distribución, por ejemplo:
	Valores ordenados de una Observación
	22
	23
	25
	29
	30
	Orden de la distribución
	1
	2
	3
	4
	5
	ME=25
En cambio, si n es pares el promedio de los valores centrales al ordenar la distribución, por ejemplo:
	Valores ordenados de una Observación
	32
	35
	37
	40
	42
	83
	Orden de la distribución
	1
	2
	3
	4
	5
	6
	ME= 
En este último ejemplo, observamos que la mediana es insensible a los valores extremos, por lo que describe con más exactitud las distribuciones con valores extremos despegados de la mayoría.
· Moda:
Es el valor que más se repite en una distribución. Tomando el mismo ejemplo N°2:
	N° De Hermanos
	Frecuencia
	1
	30
	2
	20
	3
	15
	4
	5
	5
	2
Observamos que la cantidad de hermanos que más se repite es el 1, con 30 alumnos, por lo tanto, la moda es:
Si contamos con el caso en que más de un valor de la distribución se repite el mismo máximo número de veces, puede tener más de una moda; por ejemplo, si existen dos valores en esas condiciones recibe el nombre de bimodal, si fueran tres, trimodal y así sucesivamente.
En cambio si todos los valores de la distribución tienen el mismo número de repeticiones se dice que no tiene moda.
Valores o medidas de variación o dispersión: En la figura siguiente, mostramos dos conjuntos de datos con la misma posición central, pero uno con mayor dispersión que el otro.
La media de las dos curvas es toma el mismo valor, pero la curva de la serie 2 tiene menor separación (o variabilidad) que la curva de la serie 3, si medimos sólo la media de estas dos distribuciones, estaremos pasando por alto una distinción importante que existe entre las dos curvas. Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos muestran parte de la información que debemos conocer acerca de las características de los eventos.
DISTRIBUCIONES CON IGUAL MEDIA
Para mejorar nuestra comprensión del conjunto de datos de cada distribución, debemos medir también su dispersión, separación o variabilidad.
Serie simple: Los datos en bruto, tal cual fueron obtenidos, sin agrupar constituyen una serie simple. Están dados, entonces, por una cantidad finita de datos estén éstos ordenados o no. Como ejemplo de serie simple: 2 4 5 1 7
Serie de frecuencia: Cuando se realiza un estudio de cada uno de los elementos que componen la población o muestra bajo análisis, observamos que en general, hay un número de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo.
Este número de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.
El procedimiento mediante el cual se realiza el conteo, para así determinar el número de veces que cada dato se repite, recibe el nombre de tabulación.
Al agrupar los resultados de las observaciones en término de las veces que éstos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias.
Frecuencia relativa: La frecuencia relativa de un valor, expresada como fri, es el cociente entre su frecuencia absoluta y la suma de todas las frecuencias absolutas.
La suma de todas las frecuencias es igual al número de elementos de la distribución.
Frecuencia acumulada: La frecuencia acumulada de una clase y se la denota como, a la suma de su frecuencia absoluta y la suma de las frecuencias absolutas de los valores que le anteceden.
Frecuencia desacumulada: La frecuencia desacumulada de un valor, y se denota de una distribución, a la diferencia entre el número total de observaciones y su frecuencia acumulada. Para un valor cualquiera, i, se verifica:
VALORES DE DISPERSIÓN
Podemos tener también distribuciones de igual número de elementos o conformadas por los mismos elementos, que, no obstante, son distintas. Deberíamos, entonces, considerar valores que nos determinen cuán dispersas están dichas distribuciones. Estos valores se denominan valores de dispersión.
· AMPLITUD O RANGO
Es la diferencia entre el valor más grande y el más pequeño del conjunto de datos.
El rango no toma en cuenta cómo se distribuyen los datos entre el valor más grande y el más pequeño.
· Desvío medio
Lo podemos expresar como la media aritmética de los valores absolutos de los desvíos respecto a la media del agrupamiento de datos. Se simboliza por las siglas DM y se calcula como sigue:
· Varianza
Es la sumatoria de los cuadrados de las diferencias con respecto a la media de la población relevada. Se simboliza por Var(x) o σ2 y se calcula de la siguiente manera:
· Desvío estándar
Es la raíz cuadrada de la varianza; por lo tanto, es la raíz cuadrada de la sumatoria de los cuadrados de las diferencias con respecto a la media de la población relevada. Su mayor ventaja es que permite trabajar con las unidades lineales y no al cuadrado como ocurre con la varianza. Se simboliza por σ(x) y se calcula así:
· Coeficiente de variación
Es una medida de dispersión relativa que relaciona la desviación estándar con la media, expresándola como un por ciento de ella. Es un porcentaje, que se denota mediante el símbolo CV e indica la dispersión de los datos con respecto a la media aritmética. Se simboliza por CV y se calcula:
· CUARTILES Y PERCENTILES
Un fractil es una fracción o proporción dada de los datos de una distribución de frecuencias. Estos fractiles toman denominaciones según el número de partes iguales en que se subdividen los datos, como por ejemplo, cuando se dividen en
10 partes iguales, cada una de ellas es un decil. Los cuartiles son aquellos que surgen de dividir los datos en cuatro partes iguales, es decir que cada una es un cuartil. De la misma manera, los percentiles son los que surgen de dividir al agrupamiento de datos en 100 partes iguales y cada una de ellas es un percentil.
· Regla empírica
La mediana y la media son iguales en conjuntos de datos simétricos, donde los valores tienden a agruparse alrededor de ella y así generan una distribución con forma de campana. En las distribuciones de este tipo, se puede utilizar la regla empírica, que observamos a continuación, para calcular su dispersión.
· Empíricamente el 68 % de la población se encuentra a una distancia de ±1 desvío estándar respecto de la media.
· Del mismo modo, el 95 % de la población se encuentra a una distancia de ±2 desvíos estándar respecto de la media.
· De la misma manera anterior, se comprobó que el 99,7 % de la población se encuentra a una distancia de ±3 desvíos estándar de la media de distribución.
DIAGRAMAS Y GRÁFICOS
GRÁFICOS
A fin de poder realizar una lectura rápida de la distribución de datos y sacar conclusiones inmediatas de ella, es muy conveniente graficar los valores estadísticos. Sin embargo, bastaría con abrir una hoja de cálculo para identificar la gran variedad de gráficos que existen para representar una distribución. Como ejemplos citaremos los diagramas de líneas, de barras, de barras acumuladas, de sectores, de torta o circular, diagramas cartesianos x-y, de bastones, etcétera.
Diagramas circulares o de sectores
En este tipo de gráfico, consideraremos que el ángulo central del círculo es de 360 °, que representa el 100 % de los datos relevados y que cada una de las clases estará dada por un sector cuyo ángulo será proporcional a su frecuencia porcentual. Por eso, con una regla de tres simple directa se procede a graficarlas.
DIAGRAMA DE SECTORES
Usualmente, es más interesante plantear este mismo diagrama, pero con sus valores expresados en porcentajes.
Diagrama de barras
Estos diagramas proporcionan información en un gráfico de dos dimensiones. En el eje horizontal, podemos mostrar los valores de la variable (la característica que estamos midiendo), como las calificaciones en una evaluación o los diferentes deportes practicados en un club social; y, en el eje vertical, señalamos las frecuencias de las clases mostradas en el eje horizontal. De esta manera, la altura de las barras mide el número de observaciones que hay en cada clase señalada en el eje horizontal. En este ejemplo, observamos las barras separadas.
BARRAS SEPARADAS
BARRAS UNIDAS
 
En este caso, también están unidas según la procedencia, pero separadas entre diferentes orígenes.
Existeuna gran variedad de tipos de diagramas de barras; por ejemplo, barras horizontales, en tres dimensiones, con diferentes colores según lo que necesitamos resaltar, etcétera.
Histograma
Es un gráfico en el cual se representan las variables con rectángulos, en el que su ancho está preestablecido según la cantidad de intervalos de clase que existan y cuya altura es dependiente de la cantidad valores que pertenecen a cada clase.
Si en lugar de frecuencias absolutas, para construir un histograma, utilizamos las frecuencias relativas, sus ordenadas serán más estables y se lo reconocerá como histograma de frecuencias relativas.
Polígono de frecuencias
Los polígonos de frecuencias representan otra manera de representar gráficamente distribuciones, tanto de frecuencias como de frecuencias relativas.
En el eje vertical, ubicamos las frecuencias y, en el eje horizontal, los datos de la variable que estamos analizando de la misma forma en que se hizo el histograma. Una vez realizado esto, graficamos cada frecuencia de clase trazando un punto sobre su punto medio en la parte superior del rectángulo y vinculamos los puntos sucesivos con una línea recta para formar un polígono (una figura de muchos lados), denominado polígono de frecuencias.
Su principal característica es que el área encerrada por el polígono de frecuencias es igual al área encerrada por el histograma de frecuencias; ya que, en cada barra, se compensan entre sí áreas en exceso con áreas en defecto. Si a un polígono como el que hemos construido le aumentamos el número de clases y de datos puntuales, se suaviza su forma; esto da lugar a una curva de frecuencias.
Polígono de frecuencias relativas
Del mismo modo en que construimos el polígono de frecuencias, se grafica también el polígono de frecuencias relativas. Tanto la superficie encerrada por el polígono de frecuencias relativas como el del histograma de esas mismas frecuencias son iguales entre sí por las razones mostradas gráficamente y, adicionalmente, en este caso, iguales a 1.
Este polígono tiene la misma forma que el polígono de frecuencias obtenido a partir del mismo conjunto de datos, pero se utiliza una escala distinta en los valores del eje de las ordenadas. La escala representa el número de observaciones de cada clase, expresadas como una fracción del total de observaciones (frecuencia relativa) en lugar del número absoluto de observaciones.
Graficación de frecuencias acumulada y desacumulada
Para poder identificar rápidamente la cantidad de observaciones que se encuentran debajo de determinados valores, se construye un gráfico de distribución de frecuencias acumuladas que es más eficiente que una tabla de registros.
La gráfica se conoce como ojiva y se utiliza para representar las frecuencias acumuladas.
De la misma manera que el polígono de frecuencia, se grafica uniendo los puntos centrales del lado más alto de cada barra, no ya de un histograma de frecuencias absolutas o relativas sino de un histograma de frecuencias acumuladas.
Lo cual nos permite observar el número de observaciones registradas debajo de cierto valor de nuestro interés.
 
Del mismo modo, podemos graficar la frecuencia desacumulada (columna de la tabla en la que cada renglón se forma restando del total de observaciones la frecuencia acumulada). Esta gráfica permite ver cuántas observaciones se encuentran por encima de ciertos valores.
Se pueden ubicar ambas ojivas en el mismo diagrama, y señalar la intersección de ambas curvas en la mitad exacta de los números de observaciones. Debe considerarse que, para cualquier valor observado, la suma de la frecuencia acumulada y la desacumulada siempre debe ser igual al número total de observaciones. 
Relación entre la media, la mediana y la moda en un diagrama de polígono de frecuencias relativas. Si observamos la figura 12, la curva es simétrica y como tal, tiene una gráfica en la que una línea paralela al eje de ordenadas desde el punto más alto de la curva dividirá su superficie en dos partes iguales.
En la figura 12, las curvas A y B se llaman curvas sesgadas.
Al estar concentrados los valores de distribución de frecuencias, ya sea hacia la parte creciente o decreciente del eje de abscisas, se dice que la curva es sesgada a la derecha o bien sesgada a la izquierda. En este caso, la moda (el valor más alto de la escala vertical), se encuentra desplazada a la izquierda; le sigue hacia la derecha la mediana (divide al gráfico en dos áreas iguales) y, más alejada aún, la media. En este caso, la moda está desplazada hacia la izquierda, ya que el mayor valor en escala vertical así lo está. A la derecha, ubicamos primero la mediana (divide al gráfico en dos áreas iguales) y, más cerca del eje vertical, la media.
DISTRIBUCIÓN DE FRECUENCIAS
DISTRIBUCIÓN DE INTERVALOS DE CLASE
· Números de intervalos
Amplitud de cada intervalo
Hay oportunidades en que un ordenamiento de datos no resulta útil. Por ejemplo, en una lista de todos los valores, por ser una forma incómoda de mostrar gran cantidad de datos.
Para estas situaciones, necesitamos resumir la información sin que pierda su calidad al momento de utilizarla en su interpretación y en la evaluación de decisiones.
Una alternativa a la hora de resumir datos es a partir de una tabla de frecuencias o de distribución de frecuencias.
Una tabla de distribución de frecuencias se utiliza para ubicar datos distribuidos en clases, es decir, en agrupamientos de valores que describen una característica particular de dichos datos.
Para poder construir una distribución de intervalos de clase, se debe tener en cuenta:
a) El número de intervalos: La determinación del número de intervalos (k) está relacionada con la cantidad de datos que tenemos (n). Algunos técnicos definen:
En cambio, otros se inclinan por la expresión del método Sturges:
Pero, en un plano aún más general, se puede definir el valor de k teniendo en cuenta que:
Es decir, el número de intervalos debe estar comprendido entre 6 y 15. Menos de 6 intervalos da lugar a una distribución con información insuficiente y frecuencias muy altas, y más de 15 intervalos generan una distribución que resulta complicado operar.
b) A la amplitud de intervalo ∆𝑥 la podremos calcular con:
c) No puede existir un intervalo con frecuencia cero; si esa situación se presentara, sería necesario modificar la cantidad de intervalos o la amplitud de cada intervalo.
d) Al fijar los extremos de los intervalos, debe atenderse a la posibilidad de que uno de ellos pueda ser cerrado y el otro abierto.
e) Es necesario que todos los intervalos tengan el mismo tamaño y, cuando esto no sea posible, los intervalos de diferente amplitud deben ubicarse en los extremos.
f) Hay que tratar de evitar que las observaciones coincidan con los extremos de cada intervalo, así desaparece la duda en cuanto a la pertenencia de una observación a un intervalo o a su adyacente.
Tipos de intervalos finitos:
Son aquellos intervalos de números que se relacionan con segmentos de recta.
Intervalo abierto: Se trata de un intervalo cuyos extremos no participan del conjunto que está describiendo. En el ejemplo a continuación, se representan todos los números reales inferiores a b y superiores a a pero no incluyen ni a a ni a b.
En este tipo de intervalo, se representan a través de los valores extremos separándose por un punto y coma y entre paréntesis. Ejemplo: (a; b).
Intervalo cerrado: Sus extremos si forman parte del conjunto solución al que representa. Este intervalo involucra, entre de sus extremos a y b, todos los números reales que sean iguales o mayores que a y los que sean iguales o menores que b. Estos valores se colocan entre corchetes y separados por un punto y coma. En nuestro ejemplo: [a; b].
Intervalo semiabierto a la izquierda: Se llama también intervalo semicerrado a la derecha. Esto ocurre cuando su lado izquierdo se encuentra abierto, es decir que no incluye al punto a y su lado derecho se encuentra cerrado, por lo que si incluye al punto b. Se representa con un paréntesis a la izquierda, los extremos separadoscon punto y coma, y con un corchete a la derecha. Ejemplo: (a;b].
Intervalos semiabiertos por la derecha: incluyen a los números reales menores que b y a los iguales o mayores que a por lo que se encuentran cerrados a la izquierda. Estos intervalos se escriben con un corchete a la izquierda, los extremos separados por punto y coma y un paréntesis a la derecha. Ejemplo: [a; b).
Tipos de intervalos infinitos:
Los valores en este tipo de intervalos son encerrados por paréntesis y separados por punto y coma. Ejemplo: (–; +)
INTERVALO INFINITO
 
INTERVALO NFINITO ABRIERTO A LA IZQUIERDA (a; +).
INTERVALO INFINITO CERRADO A LA IZQUIERDA [a, +).
INTERVALO INFINITO ABIERTO A LA DERECHA (–; b)
INTERVALO INFINITO CERRADO A LA DERECHA (–; b].
Determinación de la media:
Para poder determinar la media aritmética de una distribución de frecuencias, consideramos que todos los valores pertenecientes a cada intervalo están uniformemente distribuidos por dicho intervalo. De esta manera, la suma de todos ellos estará dada por el producto entre la marca de clase y la frecuencia de ese intervalo.
Determinación de la mediana para datos agrupados
La mediana estará ubicada en el intervalo cuya frecuencia acumulada contenga la observación X(n/2); es, por lo tanto, conveniente determinar, en la tabla de frecuencias, las columnas que contengan las frecuencias acumuladas y desacumuladas. De acuerdo con la tabla, la mediana deberá ubicarse en el intervalo al que denominaremos intervalo medial. Para su determinación en una distribución de intervalos de clase, contamos con dos métodos.
a) Método gráfico: Trazaremos los diagramas correspondientes con la frecuencia acumulada y desacumuladas. Combinemos, en un mismo diagrama, las representaciones gráficas de un ejemplo cualquiera.
Como ambas frecuencias se representan en el eje vertical a la misma escala, en el punto intersección ambas son iguales y su suma es: 
Debe verificarse que el valor de esas frecuencias, en ese punto, es igual a N/2. Como la mediana es el valor que ocupa el punto medio, la abscisa correspondiente con el punto de intersección tendrá su valor. Por lo tanto, las coordenadas del punto intersección serán (Me, N/2).
b) Método analítico: analizaremos el intervalo medial.
Esa variación de frecuencia acumulada de fas - fai es justamente la frecuencia correspondiente con el intervalo medial (fm = 6). Consideramos que el total de observaciones es 21, por lo que la mediana se encontrará en el intervalo que incluye a N/2 = 10,5. Esos triángulos que se ven en el gráfico son semejantes y, por lo tanto, sus lados homólogos son proporcionales. Por tal razón, tendremos:
Despejando Me, tendremos: 
Determinación de la moda para datos agrupados 
Se define como intervalo modal al intervalo de mayor frecuencia; para la determinación de la moda, consideremos, en el histograma de frecuencia, el intervalo modal y los intervalos adyacentes. Si definimos a d1 = (frecuencia del intervalo modal) - (frecuencia del intervalo que le antecede) y d2 = (frecuencia del intervalo modal) - (menos la frecuencia del intervalo que le sucede), como Li se define al inicio del intervalo modal, el valor de la moda de una distribución de intervalos de clase está dada por la expresión:
HISTOGRAMA DE FRECUENCIAS:
Es un gráfico de barras para datos numéricos agrupados, en el que la frecuencia o el porcentaje de cada grupo está representado por una barra individual. No hay separación entre las barras adyacentes, por lo que tenemos un diagrama de barras sin discontinuidades. La variable (por ejemplo, las calificaciones) que nos interesa se coloca a lo largo del eje de las abscisas. El eje (Y) vertical representa la frecuencia o el porcentaje de los valores de cada intervalo de clase. El intervalo entre dos clases sucesivas se denomina “amplitud de intervalo”; en este caso, es la unidad y se la expresa como Δx = 1.
La superficie de cada una de las barras está dada por el producto entre la base Δx por la altura, que está determinada por la frecuencia. Si a ∆x lo asimilamos con la unidad, entonces cada barra tendrá una superficie igual a su frecuencia, y el área total del diagrama será la suma de todas las frecuencias e igual a N. ΣSi = Σfi = N.
HISTOGRAMA DE FRECUENCIAS RELATIVAS: 
Este histograma se diferencia del histograma de frecuencias absolutas, en que en el eje de las ordenadas, se ubican las frecuencias relativas de los datos de cada una de las clases. Este histograma tiene una gráfica similar al de un histograma de frecuencias absolutas del mismo agrupamiento de datos. Se debe a que el tamaño relativo de cada bastón es la frecuencia absoluta de esa clase dividida por el número total de observaciones.
Habiendo recordado esto último, la diferencia entre el histograma de frecuencias relativas y absolutas es la escala del eje de las ordenadas. Muy ventajoso es poder mostrar los datos en función de frecuencias relativas debido a que los valores absolutos pueden alterarse individualmente, las frecuencias relativas permanecen relativamente estables. Este hecho nos ayudará comparar datos de muestras con diferentes tamaños muestrales.
En los diagramas que anteceden, se puede observar, en un ejemplo cualquiera, las formas similares de ambos diagramas y el cambio de escala citado.
Frecuencias acumuladas 
Recuerda que la frecuencia acumulada (fa) indica el número de valores que son menores o iguales que el valor dado. Su representación gráfica es similar a la estudiada en el punto 2.3, pero, en cuanto a datos agrupados en el eje de las abscisas, se ubican las marcas de cada clase (la marca clase de una distribución de datos agrupados en intervalos corresponde con la media aritmética de los extremos de cada uno de dichos intervalos). 
Frecuencias acumuladas y desacumuladas para datos agrupados 
Hacemos las mismas consideraciones que en el punto anterior, lo hemos explicado en el punto 2.3 considerando que, en los datos agrupados, trabajamos con la marca de la clase.
CLASIFICACIÓN DE PROBABILIDADES
PROBABILIDAD
Se la define como la factibilidad de ocurrencia de cada manera en que puede presentarse un fenómeno determinado.
La probabilidad de un evento E, denotada por P(E), es un número comprendido entre 0 y 1 incluso o 0 ≤ P (E) ≤ 1.
Los casos de los valores de los extremos de la ecuación anterior son P(E) = 0 y P(E) = 1. Si P(E) = 0, es seguro que el evento E no ocurra. Por ejemplo, si una moneda tiene dos lados con cruz, P(cara)= 0; cuando la arrojemos, obviamente no va a salir cara. Si P(E) = 1, es seguro que ocurra el evento E. Con la misma moneda, P(cruz) = 1, cada vez que la arrojemos, saldrá cruz. Si 0 < P(E) < 1, hay incertidumbre ante el resultado del evento E. Por ejemplo, si P(E) = 0,4, puede afirmarse que existe una probabilidad de 40 % de que ocurra el evento E.
CLASIFICACIÓN DE LA PROBABILIDAD: CLÁSICA, OBJETIVA Y SUBJETIVA
Hay tres formas básicas para clasificar planteando conceptos muy diferentes para el estudio de la teoría de probabilidad.
1. Probabilidad clásica
La probabilidad de éxito se basa en el conocimiento previo del proceso; así, el planteamiento clásico define la probabilidad de que un evento suceda como sigue.
Es necesario tener en cuenta que, para que esta expresión sea válida, todas las formas en que puede presentarse el fenómeno deben ser igualmente posibles. Este tipo de probabilidad se utiliza en juegos de azar como juegos de naipes, dados, monedas o bolas de un bolillero, sin embargo es muy complicado utilizar este tipo de probabilidad en problemas de decisiones menos previsibles y más riesgosas, como los problemas de administración.
2. Probabilidad a partir del concepto de frecuencia relativa
Cuando un fenómeno toma valores distintos, la frecuencia relativa de ocurrencia de cada uno de ellos tiende a coincidir con su probabilidad de ocurrencia cuando el número de veces en que se presenta el evento es lo apreciablemente grande. Esta forma de cálculo utiliza este concepto de frecuencia relativa de situaciones previas como probabilidad. De esta manera, se analizaqué tan frecuente ha ocurrido una situación en el pasado y esos datos los utilizaremos para prever con qué probabilidad dicha
situación podrá ocurrir en el futuro. Dicho esto, la probabilidad es calculada como:
· La frecuencia relativa de un hecho, cuando éste ocurre en un número lo muy grande de veces;
· La cantidad de veces, respecto del total, que un hecho ocurre durante un largo tiempo cuando las circunstancias son estables.
Estos valores que logremos como probabilidad cobrarán mayor precisión en tanto y en cuanto aumenten la cantidad de observaciones. Un inconveniente que ocurre a menudo en este tipo de probabilidad es que los responsables de tomar decisiones, lo aplican sin exigir un número apropiado de resultados previos.
3. Probabilidad enfatizando el aspecto subjetivo:
Sostenida en las opiniones o presunsiones de los encargados a realizar el estudio de probabilidad. Así, la probabilidad basada en el aspecto subjetivo, se puede considerar como la probabilidad sobre la ocurrencia de un hecho que un individuo le otorga, sostenida en la evidencia que, sobre el mismo hecho, disponga de oportunidades anteriores. La probabilidad basada en el aspecto subjetivo nos otorga un mayor flexibilidad, que las otras probabilidades estudiadas no logran. Los responsables de asumir decisiones podrán usar cualquier evidencia, pertinente o no, con que cuenten y combinarla con las opiniones personales sobre el hecho. Este tipo de probabilidad es más común en los eventos que ocurren una vez o con poca frecuencia.
CLASIFICACIÓN DE EVENTOS
EVENTOS
Se denomina así a cada una de las distintas formas en que puede presentarse el fenómeno o experimento.
Un experimento es una actividad que produce un evento.
Podemos llamar espacio muestral del experimento al conjunto formado por todos los posibles resultados del mismo.
CLASIFICACIÓN DE EVENTOS:
· Eventos simples: a aquel que solo puede asumir un solo resultado en el espacio muestral.
· Eventos compuestos: cuando puede asumir más de un resultado en el espacio muestral
RELACIÓN ENTRE EVENTOS
Los eventos compuestos pueden estar formados por dos o más eventos que pueden combinarse, y esos tipos de combinaciones se pueden representar gráficamente por una unión de eventos o por una intersección de ellos.
Matemáticamente, a la unión se la relaciona por una disyunción o, es decir, la probabilidad de ocurrencia de uno de ellos al menos. Esta probabilidad está determinada por la regla aditiva.
En cambio, a la intersección le corresponde el conectivo lógico y, es una conjunción e indica la ocurrencia simultánea de los eventos considerados, y su probabilidad es denominada probabilidad conjunta. Esta probabilidad es satisfecha por la regla multiplicativa.
· Eventos complementarios: Dos eventos A y B son complementarios cuando la suma de sus probabilidades es igual a 1: P (A) + P (B) = 1. 
Cuando existen dos resultados posibles para un evento, cada uno de ellos es complementario al otro.
CONJUNTO COMPLEMENTARIO
Donde A y Ᾱ (complemento de A) son eventos complementarios.
· Eventos mutuamente excluyentes: Dos eventos son mutuamente excluyentes cuando la ocurrencia de uno de ellos implica la no ocurrencia del otro.
CONJUNTO MUTUAMENTE EXCLUYENTES
En el gráfico, A y B no presentan ningún punto en común. A modo de ejemplo, observamos que todos los eventos simples en que puede presentarse un fenómeno son mutuamente excluyentes. La imposibilidad de ocurrencia simultánea implica que la probabilidad de ocurrencia simultánea de dichos eventos es igual a cero. Y, generalizando más aún, dados dos eventos A y B, si son mutuamente excluyentes, debería cumplirse que:
(𝐴 ∩ 𝐵) = 0.
Cuando los eventos son mutuamente excluyentes, la probabilidad de ocurrencia de por lo menos uno de ellos será igual a la suma de sus probabilidades:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵).
Como conclusión, si encontramos que dos eventos son complementarios, indefectiblemente son mutuamente excluyentes.
· Eventos independientes
Dos eventos son independientes cuando la ocurrencia de uno de ellos no modifica la probabilidad de ocurrencia del otro. Por ejemplo, dados dos eventos independientes A y B, la probabilidad de que ocurra A es independiente de que ocurra B, y viceversa. Y se expresan: 
P(A⁄B) = P(A); P(B⁄A) = P(B).
CONJUNTOS MUTUAMENTE EXCLUYENTES E INTERSECCIÓN DE CONJUNTOS
En ambos casos, deberá cumplirse que 𝐴 ∩ 𝐵 = ∅ para que sean eventos independientes; y, en dicho, caso se cumplirá: 
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴⁄𝐵). 𝑃(𝐵) ; 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴). 𝑃(𝐵).
Los eventos independientes ocurren cuando: 
 El evento no elimina ningún posible resultado; 
 El evento elimina un posible resultado, pero es sustituido antes del siguiente evento, es decir, es reemplazado
REGLAS ADITIVAS Y MULTIPLICATIVAS
REPRESENTACIÓN GRÁFICA. DIAGRAMAS DE VENN 
Se pueden representar las probabilidades a través de diagramas que permiten visualizar y apreciar las características que adquieren los diferentes casos y alternativas. Estos diagramas son los llamados Diagramas de Venn.
En ellos se pueden ubicar los eventos y el espacio muestral a través de figuras geométricas simples.
El espacio conformado por todos los puntos muestrales se denomina espacio muestral. Y el diagrama de Venn es una forma distinta y a veces más clara de representar un espacio muestral por ejemplo, a través de un rectángulo. Estos diagramas permiten representar graficamente los distintos eventos como uniones o intersecciones de círculos o elipses, y es un medio muy adecuado para visualizar las relaciones entre conjuntos. A modo de ilustración, en la figura se muestra un conjunto universo U, dentro del cual se ubica otro conjunto A, representado por un área eliptica.
CONJUNTO A DENTRO DEL CONJUNTO UNIVERSO
La figura siguiente muestra al conjunto A y a su complemento, Ᾱ.
CONJUNTO Y SU COMPLEMENTO
Dos conjuntos A y B son iguales si y solo si todos los elementos del conjunto A son elementos del conjunto B, y todos los elementos del conjunto B son elementos del conjunto A. Expresamos esto con símbolos: A = B sii A ⊂ B y B ⊃ A. La unión entre dos conjuntos A y B se representa como A ∪ B, y es un conjunto formado por todos los elementos que pertenecen a ambos conjuntos.
UNIÓN DE CONJUNTOS
Nota: la unión de cualquier conjunto A y su complemento Ᾱ da como resultado el conjunto universo U, o bien: A ∪ Ᾱ = U. También, A ∪ ∅ = A. La intersección de dos conjuntos A y B, denotada por A ∩ B, es un conjunto que cuenta con todos los elementos pertenecientes a A y B conjuntamente.
INTERSECCIÓN DE CONJUNTOS
REGLA ADITIVA
Esta expresión nos entrega la probabilidad de la unión de eventos. Lleva el nombre de regla aditiva:
P(A o B) = P(A) + P(B) - P(A y B).
Deberíamos determinar qué expresión es la que nos determina la intersección de eventos; para ello, usaremos el siguiente ejemplo. ¿Cuál es la probabilidad de que, habiendo extraído del mazo una carta ≥ 6, esta sea par?
Este es un ejemplo de probabilidad condicional, y se la expresa como: P(A/B). La expresión anterior se lee como probabilidad de ocurrencia de A según B. Si la carta obtenida es un número mayor o igual que 6, tendrá que ser el 6, 7, 8, 9, 10, 11, 12 o 13; solo ocho casos posibles y, de los cuales, solo cuatro cumplen con la condición de ser pares. Por lo tanto, si nos ajustamos a la definición clásica de probabilidades:
Por otro lado, la condición que deberían cumplir los casos favorables es la de ser mayores o iguales que 6 y, adicionalmente, deberían cumplir con la condición de ser pares. O sea, deberían cumplir simultáneamente los eventos A y B, mientras que los casos posibles serán los eventos simples que constituyen a B, es decir, los valores mayores o iguales que 6.
Podemos formular el caso anterior como sigue:
La expresión señala que la probabilidad de ocurrencia de A según B es el cociente entre la probabilidad de ocurrencia conjunta de A y B y la probabilidad de B.
Si recordamos que:
y que:
reemplazando, tendremos:
Resultado al que habíamos llegado originalmente por razonamiento y aplicación del planteamiento clásico.Regla de adición para eventos mutuamente excluyentes
Hay circunstancias en que necesitamos saber si la probabilidad de que un evento u otro sucedan. Para ello debemos identificar previamente si son mutuamente excluyentes o no, si lo llegan a ser entonces aplicaremos la regla de adición para eventos mutuamente excluyentes.
Esta regla es: P(A o B) = P(A) + P(B).
EVENTOS MUTUAMENTE EXCLUYENTES
La probabilidad de que sucedan A o B cuando los dos eventos son mutuamente excluyentes es igual a la suma de la probabilidad de que suceda el evento A y la probabilidad de que suceda el evento B.
Regla de adición para eventos no mutuamente excluyentes 
Cuando dos eventos no son mutuamente excluyentes, pueden presentarse simultáneamente, de esta manera deberíamos considerar que los elementos que participan de la intersección de ambos conjuntos los contaríamos dos veces, cuando en realidad solo lo hacen en una sola oportunidad. Para que no ocurra eso, modificaremos la regla de adición anteriormente citada para eventos mutuamente excluyentes: P(A o B) = P(A) + P(B) - P(AB).
EVENTOS NO MUTUAMENTE EXCLUYENTES
La regla de adición para eventos que no son mutuamente excluyentes muestra que la probabilidad de que sucedan A o B es igual a la probabilidad de ocurrencia del evento A más la probabilidad de ocurrencia del evento B, menos la probabilidad de que A y B se presenten juntos, simbolizada como P(AB).
Regla multiplicativa
La anterior expresión de la regla aditiva nos entrega la probabilidad condicionada de ocurrencia de A según B y, también, nos brinda la posibilidad de obtener la regla multiplicativa trasponiendo el denominador del segundo miembro y multiplicando al primero:
𝑃(𝐴⁄𝐵). 𝑃(𝐵) = 𝑃(𝐴 ∩ 𝐵).
Intercambiando los eventos, podemos llegar a:
𝑃(𝐵⁄𝐴). 𝑃(𝐴) = 𝑃(𝐵 ∩ 𝐴);
y, si consideramos que:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵 ∩ 𝐴),
podemos concluir en:
𝑃(𝐴⁄𝐵).𝑃(𝐵) = 𝑃(𝐵⁄𝐴) . 𝑃(𝐴).
PROBABILIDADES MARGINALES
Es la probabilidad incondicional de que se presente un evento; es decir, no existe ningún otro evento que lo afecte. Probabilidades marginales: P(A) = probabilidad de que suceda el evento A. Cuando una probabilidad simple está referida a la probabilidad de que se presente un hecho en particular, toma el nombre de probabilidad marginal. 
P(A o B) = probabilidad de que el evento A o el evento B ocurran. Esta notación representa la probabilidad de que se presenten un evento o el otro. 
P(A o B) = P (A) + P (B).
INTERSECCIÓN VACÍA ENTRE DOS CONJUNTOS MUTUAMENTE EXCLUYENTES
INTERSECCIÓN VACÍA ENTRE DOS CONJUNTOS
La probabilidad de que sucedan A o B cuando los dos eventos son mutuamente excluyentes es igual a la suma de la probabilidad de que suceda el evento A y la probabilidad de que suceda el evento B. Esta es la regla de adición para eventos mutuamente excluyentes. P(A o B) = P(A) + P(B) - P(AB)
INTERSECCIÓN NO VACÍA ENTRE DOS CONJUNTOS NO MUTUAMENTE EXCLUYENTES
La regla de adición para eventos que no son mutuamente excluyentes muestra que la probabilidad de que sucedan A o B cuando los dos eventos son mutuamente excluyentes es igual a la suma de la probabilidad marginal del evento A y la probabilidad marginal del evento B, menos la probabilidad de que el evento A y el evento B ocurran juntos, simbolizada como P(AB).
En la expresión anterior, cada término representa lo siguiente: 
P(AB) = probabilidad conjunta de que se presenten los eventos A y B simultáneamente o en sucesión; 
P(A) = probabilidad marginal de que se presente el evento A; 
P(B)= probabilidad marginal de que se presente el evento B. 
Ejemplo n.° 1: Se realizó una encuesta en 500 de los hogares en los que realmente se compró el equipo de aire acondicionado. En la tabla se indican las respuestas del consumidor a si el equipo comprado era un Split o uno tradicional, y si también compró un ventilador de techo en los últimos 12 meses.
	Compra
	SI
	NO
	TOTALES
	Split
	125
	250
	375
	Tradicional
	75
	50
	125
	Totales
	200
	300
	500
Encuentra la probabilidad de que, si en el hogar seleccionado al azar adquirieron un equipo de aire acondicionado, el equipo comprado sea un Split. 
Solución: Usamos las siguientes definiciones: 
A = compró un equipo de aire acondicionado Split; 
A' = no compró un equipo de aire acondicionado Split; 
B = compró un ventilador de techo; 
B' = no compró un ventilador de techo. 
Hay una probabilidad del 75 % de que el equipo de aire acondicionado comprado, seleccionado al azar, sea un Split.
TEOREMA DE BAYES
Este teorema debe su importancia al permitir modificar las probabilidades de ocurrencia de un evento cuando se ha recabado información más actualizada sobre el mismo. Las probabilidades se modificaron una vez que se consiguió información actualizada que permitió modificar las primeras estimaciones y mejorar de esta manera su exactitud. Para este caso, la aplicación del Teorema de Bayes es el procedimiento más apropiado. Las probabilidades que se calcularon luego de haber contado con la nueva información, reciben el nombre de probabilidades posteriores o probabilidades revisadas.
 En la toma de decisiones en las empresas, éstas deben modificarse a medida que se cuenta con información adicional sobre el evento en consideración, y es aquí que la Teoría de probabilidad cobra gran importancia, ya que tanto con el árbol de decisiones como con el Teorema de Bayes, las inferencias van a ser más precisas. Si partimos de la fórmula para la probabilidad condicional en para dependencia estadística: 
 Utilizando la nueva información y sustituyendo, llegamos a su expresión más conocida: 
El teorema de Bayes nos brinda una herramienta estadística para considerar nueva información y modificar nuestras estimaciones previas para poder mejorar la exactitud de nuestros resultados. Si se utiliza de manera correcta y eficiente, hace innecesario recolectar gran cantidad de datos en un periodo de tiempo determinado con el fin de tomar mejores decisiones, ya que este Teorema, basado en probabilidades, puede proveer más confiabilidad con menor esfuerzo, y por supuesto, en menor tiempo.
Los responsables de las decisiones en las empresas utilizan este procedimiento brindado por el Teorema de Bayes ya que partiendo de la probabilidad clásica, y haciendo uso de nueva información, infieren con mayor exactitud lo que pueda ocurrir. La importancia del teorema de Bayes no reside únicamente en el cálculo sino en la capacidad de los operadores para predecir el futuro con la nueva información obtenida. 
Uso del teorema de bayes en un problema de diagnostico medico: 
La probabilidad de que una persona tenga una determinada enfermedad es de 0.03. 
Existen pruebas de diagnóstico médico disponibles para determinar si una persona tiene realmente la enfermedad. Si la enfermedad realmente está presente, la probabilidad de que la prueba de diagnóstico médico de un resultado positivo (indicando la presencia de la enfermedad) es de 0.90. 
Si la enfermedad no está presente, la probabilidad de obtener un resultado positivo (indicando la presencia de la enfermedad) es de 0.02. Suponga que la prueba de diagnóstico médico dio un resultado positivo (indicando la presencia de la enfermedad).
· ¿Cuál es Ia probabilidad de que Ia enfermedad esté realmente presente? 
· ¿Cuál es Ia probabilidad de un resultado positivo? 
Evento D = tiene Ia enfermedad P(D) =0.03
Evento D' = no tiene Ia enfermedad P(D') =0.97
Evento T = la prueba es positiva P(T/D) = 0.90
Evento T' = la prueba es negativa P(T/D') = 0.02
Al emplear Ia ecuación de Ia pagina anterior: 
La probabilidad de que Ia enfermedad esté realmente presente dado que un resultado positivo ha ocurrido (indicando Ia presencia de Ia enfermedad) es de 0.582.
	
	Prob. Previa
	Prob. Condicional
	Prob. Conjunta
	Prob. Revisada
	Evento Di
	P(Di)
	P(T/Di)
	P(T/Di).P(Di)
	P(Di/T)
	D
	0.03
	0.90
	0.270
	0.582
	D´
	0.97
	0.02
	0.0194
	0.418
	
	
	
	0.0464
	
El denominador en el teorema de Bayes representa P(T), la probabilidad de un resultado positivo en la prueba, el cual en este caso es de 0.0464 o un 4.64%Valores Estadisticos
De tendencia central o de posición 
Medida aritmetica
Mediana
De Dispersion 
Rango
Moda
Desvio medio
Varianza
Desvio estandard
Coeficiente de Variacion
Valores de dispersion
Desvio Medio
Varianza
Desvio estandar
Dispersion relativa, Coeficiente de variacion
Cuartiles y Percentiles
Regla empirica
Amplitud o Rango
Tipos de Variables
Cuantitativas
Discretas
Continuas
Cualitativas
Nominales
Jerarquizadas

Otros materiales