Logo Studenta

Estadística y bioestadística

¡Estudia con miles de materiales!

Vista previa del material en texto

Estadística y bioestadística
Distribuciones de probabilidad. Variables contínuas
Una variable es continua cuando puedo tomar cualquier valor en un intervalo. hace referencia a que en medio de dos valores tenemos una infinita cantidad de valores más. Por ejemplo si pesamos dos personas, una puede pesar 56 kg y la otra 57kg, pero en el medio de esos valores podemos encontrarnos con el peso de 56,00001; 56,00002; y asi en adelante y nunca terminaremos de contar.
FUNCIÓN DE DENSIDAD DE UNA VARIABLE CONTINUA
X= Variable aleatoria contínua
f (x): Función de densidad de probabilidad. Se utiliza para describir la probabilidad de que la variable aleatoria caiga en un rango particular.
La probabilidad de que mi espacio muestral ocurra está definida por el área debajo de la curva:
Espacio Muestral= 1
μ= media
f(x)= R+ (la probabilidad es siempre +)
 ≥ 0 
P (X=x) = 0 La probabilidad de que mi variable tome un valor exacto entre ∞ posibilidades es 0. Ej si tengo 10 caramelos y los quiero repartir entre ∞ personas, la probabilidad de que a una le toque un caramelo es 0. 
σ= Desviación estándar
σ2= Varianza
Para sacar el valor de un área bajo la curva utilizamos integrales:
 
 Si tomamos el rango entre -∞ y +∞ de las probabilidades voy a obtener un valor de 1. este valor va a ser mi espacio muestral. 
La probabilidad de que mi variable tome alguno de los valores dentro de un rango dado es igual al área debajo de esa curva.
P (x1 > x > x2 ): Probabilidad de que mi variable sea mayor a x1 y menor a x2 esta es igual al área debajo de la curva. La cual se determina mediante una integral:
DISTRIBUCIÓN NORMAL O DE GAUSS
La μ y σ son parámetros que nos pueden ayudar a determinar si un valor es normal o no. La desviación estándar nos indica que tan alejados están los valores de la curva con respecto a la μ . (Siendo la media el valor “normal”)
Una variable aleatoria contínua “X” tiene distribución normal o de Gauss si su distribución está dada por la función de densidad la cual nos ayuda a calcular la probabilidad de que la variable asuma un valor dentro de un intervalo.
X~N (μ,σ2) →X se distribuye como una normal
Características
· X es una variable aleatoria contínua
· Es simétrica respecto a su media 
· Tiene un máximo en X=μ 
· La distribución es unimodal, es decir tiene una única moda
· E(x)= μ El valor esperado es la media
· La mediana, la moda y la media coinciden μ=Mo=mediana
· Una variable aleatoria es “normal” si la mayoría de sus valores están concentrados alrededor de la μ y menos frecuente a medida que se va alejando.
· El 68,27% de sus datos se encuentran entre una σ a la izquierda y una σ a la derecha de la μ
· El 95,45% de los datos se encuentran entre 2σ a la izquierda y 2σ a la derecha de la μ
· El 99,7% de los datos encuentran entre 3σ a la izquierda y 3σ a la derecha de la μ
DISTRIBUCIÓN NORMAL ESTANDARIZADA
Este recurso se utiliza para estandarizar los datos obtenidos con el objetivo de poder comparar las desviaciones con respecto de una μ de valor 0 y una σ de valor 1. permite estandarizar cualquier variable aleatoria normal, lo que facilita la comparación de diferentes conjuntos de datos.
Para estandarizar un valor X de una distribución normal con μ y σ estándar utilizamos la siguiente fórmula
Ej: supongamos que tengo una puntuación en un examen con media de μ de 70 y σ de 1. Si obtuve 80, estandarizando: indicando que mi puntuación está a 1 desviación estándar por encima de la media
Interpretación: un valor Z positivo indica estar por encima de la μ y un valor negativo indica estar por debajo de la μ . 
Características
· La μ=0 y la σ =1
· El 68,27% de los datos se encuentra entre Z=-1 y Z=+1
· El 95,45% de los datos se encuentran entre Z=-2 y Z=+2
· El 99,7% de los datos se encuentran entre Z=-3 y Z=+3
· El área total bajo la curva sigue siendo 1
· Cumple todas las propiedades de la distribución normal 
Unidad 4 muestras aleatorias
NÚCLEO FUNDAMENTAL DE LA ESTADÍSTICA
 Es tomar muestras representativas de una población y hacer inferencias sobre características desconocidas de una población a partir de la información contenida en la muestra.
Se basa en la recopilación, análisis e interpretación de datos para obtener información significativa sobre un fenómeno o población. 
 INFERENCIA ESTADÍSTICA
La inferencia es el proceso de derivar conclusiones lógicas a partir de premisas o evidencia. En estadística, los inferencia implica hacer afirmaciones o tomar decisiones sobre una población basándose en información recopilada de una muestra de esa población. En términos más generales, se refiere a la capacidad de deducir o concluir algo basándose en indicios, pruebas o razonamiento.
Es el salto de lo particular a lo general.
En toda inferencia estadística está presente el azar, es decir incertidumbre. Esta puede ser medida mediante probabilidades. La estadística se ocupa de desarrollar métodos para realizar inferencias sobre una población a partir de observaciones realizadas sobre un subconjunto de esa población.
· Población: Está formada por todos los elementos sobre los cuales se quiere obtener información. El número de observaciones en la población se define como tamaño de la población. La población puede ser finita o infinita.
· Muestra: Es un subconjunto de la población. La finalidad de tomar una muestra es la representación a escala de la población, por lo que el procedimiento seguido para obtener la muestra debe garantizar esta representación “perfecta”.
MUESTRA ALEATORIA
Cuando queremos elegir un grupo de cosas (una muestra) que sea representativo de un grupo más grande (una población), es importante seleccionar esas cosas de manera justa y sin influencias personales (objetivamente). Hacer esto al azar, sin un patrón predecible, se llama muestreo aleatorio o probabilístico. La idea es que cada cosa tenga la misma oportunidad de ser elegida, para que la muestra refleje realmente la diversidad de la población. Esto ayuda a que nuestras conclusiones basadas en la muestra sean más confiables y aplicables a toda la población.Esto se puede lograr de dos maneras: con reemplazo y sin reemplazo.
· Con reemplazo: En el muestreo con reemplazo, seleccionamos elementos de la población y los devolvemos después de cada elección. Esto significa que cada elemento tiene la misma probabilidad de ser seleccionado en cada extracción, ya que la población no cambia entre selecciones.
· Sin reemplazo: En cambio, en el muestreo sin reemplazo, seleccionamos elementos sin devolverlos a la población antes de la siguiente elección. Aunque cada elemento sigue teniendo la misma probabilidad de ser elegido en cada extracción, la población disminuye con cada selección, ya que los elementos elegidos no vuelven a estar disponibles.
A toda muestra aleatoria seleccionada con reemplazo la llamamos muestras aleatoria simple (muestra aleatoria)
Una muestra aleatoria de tamaño n, extraída de una población caracterizada por la variable aleatoria X que tiene una densidad f(x), es un conjunto de n variables aleatorias independientes y cada una con la misma distribución que tiene la variable aleatoria X
En resumen, estamos eligiendo al azar n elementos, cada uno independiente del otro, y todos siguen las mismas reglas de probabilidad que el grupo más grande del cual fueron seleccionados. Esto asegura que nuestra muestra sea una representación justa de la población total.
ESTADÍSTICO
Un estadístico es una función de las variables aleatorias observables tal que el mismo es una variable aleatoria y que no depende de ningún parámetro desconocido.
En términos sencillos, un estadístico es como una regla matemática que aplicamos a datos que podemos observar. Para ser considerado un estadístico, esta regla debe cumplir dos condiciones:Es una función de variables aleatorias observables y Es una variable aleatoria. 
Un ejemplo común de estadista es la media muestral. porque es una regla matemática (promedio) aplicada a datos observables (X). Además es una variablealeatoria, ya que su valor puede variar según la muestra específica que tengas.
· Se anotan con letras mayúsculas T,..., Z. 
· La notación utilizada para los estadísticos es la que corresponde a variables aleatorias ya que estos son casos de variables aleatorias. 
· Todo estadístico tiene una distribución de probabilidad llamada DISTRIBUCIÓN MUESTRAL.
Estadísticos particulares:
· Media muestral 
· Varianza muestral
· Xmin - Xmax
· mediana
· distribución estándar
· rango
Propiedades: 
· E(x̄)= μ La media de todas las medias muestrales es la media poblacional
· La varianza de la media muestral es igual a la varianza poblacional dividida por el tamaño de la muestra
· La desviación estándar de la media muestral es igual a la desviación estándar poblacional dividida por la raíz cuadrada del tamaño de la muestra. La desviación estándar de la media muestral indica cuánto se alejan en promedio, los valores de las medias muestrales respecto de la media poblacional. 
DISTRIBUCIÓN DE LA MEDIA MUESTRAL - POBLACIÓN NORMAL CON VARIANZA CONOCIDA
CASO 1: Si la población de donde proviene la muestra es normal, y la varianza conocida, entonces la media muestral se distribuye de manera normal:
 
 
EJEMPLO CASO 1
Si de una población NORMAL con media igual a 170 y desviación estándar igual 12; se extrae una muestra de tamaño 25. ¿Cuál es la probabilidad de que la media muestral sea mayor a 172.4?
 
sacamos la probabilidad de que z (=x) sea mayor que 1 en la tabla de la aplicación teniendo en cuenta que (=0 y = 1)
DISTRIBUCIÓN DE LA MEDIA MUESTRAL -POBLACIÓN NORMAL CON VARIANZA DESCONOCIDA 
CASO 2 : Suele suceder que la varianza de la población es desconocida, en este caso deberemos estimar la varianza poblacional con la varianza muestral. Tendremos la variable aleatoria T con n-1 g.l (distribución T student)
EJEMPLO CASO 2
Si de una población NORMAL con media igual a 20 y desviación estándar desconocida; se extrae una muestra de tamaño 9 y se encuentra que la desviación estándar muestral es 3,6 ¿Cuál es la probabilidad de que la media muestral sea mayor a 22,76 ?
sacamos en la aplicación (distribución t) la probabilidad de que x sea mayor que 2.3, teniendo en cuenta que t= n-1, en este caso 8
POBLACIÓN NO NORMAL TEOREMA DEL LÍMITE CENTRAL
· se puede aplicar para una muestra aleatoria de cualquier distribución siempre que μ y sean finitos y el tamaño de la muestra sea grande. 
· En general, la aproximación será buena si n ≥ 30
· Si n < 30, la distribución muestral de será normal sólo si la distribución de X es normal.
CASO 3: Sea X una variable aleatoria con función densidad de media μ y varianza finitas, si se toma una muestra aleatoria de tamaño n , entonces resulta ser una variable aleatoria con distribución aproximadamente normal . 
se puede definir: 
si estandarizamos n, obtendremos una variable Z:
EJEMPLO CASO 3
Si de una población cuya distribución se desconoce, con media igual a 7 y desviación estándar igual a 2; se extrae una muestra de tamaño 100. ¿Cuál es la probabilidad de que la media muestral sea a lo sumo de 6,6?
UNIDAD 5 Intervalos de confianza
 OBJETIVOS DEL PROCESO INFERENCIAL 
La estadística inferencial busca construir un modelo para entender y predecir el comportamiento de variables de interés. Suponemos que este comportamiento sigue un modelo probabilístico, pero como no conocemos los valores exactos, utilizamos métodos estadísticos para inferir o estimar estos valores desconocidos. En resumen, el objetivo es encontrar los valores clave para comprender mejor el fenómeno, y hay diferentes enfoques para lograrlo:
· estimación puntual
· estimación por intervalos
· prueba de hipótesis
ESTIMADOR PUNTUAL
Dada una muestra aleatoria un estimador puntual de un parámetro θ es la función de las variables aleatorias de la muestra, es decir un estadístico y sus valores se usan utilizados para estimar θ
Ej: X muestras es un estimador de μ
si 3,4,5,6 es una muestra aleatoria . la media muestral = 4,5 es una estimación puntual de μ.
ESTIMACIÓN POR INTERVALO
En estadísticas, cuando queremos averiguar un número sobre una población, usamos un "estimador" que es como una suposición educada. Pero, no sabemos exactamente cuán cerca o lejos está de la verdad. Para obtener una estimación más confiable, creamos un "intervalo de confianza". Es como decir: "Creemos que el número real está probablemente en algún lugar entre X e Y". La "confianza" es cuánto confiamos en que este intervalo atrapa el número real. Cuanto más alto sea el nivel de confianza, más seguro estamos, pero el intervalo puede volverse más grande. Es una forma de ser honestos sobre lo que sabemos y lo que no sabemos.
INTERVALO DE CONFIANZA BILATERAL PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA 🔗
α= Nivel de significación: probabilidad de quedar fuera del intervalo
%= Nivel de confianza: probabilidad de que dar dentro del intervalo
ej: si tengo un 80% de confianza, me queda un 20% de significación repartido 10% hacia un lado y 10% hacia el otro
La probabilidad de que Z sea mayor a y menor a es igual al espacio muestral menos el nivel de significación.
también podemos definir a Z como y 
 
Error de estimación: es una medida de cuánto podría variar la media muestral con respecto a la verdadera media poblacional. 
 
 Tamaño de la muestra
· Cuando la confianza n
· Cuando la variabilidad n
· Cuando el error de estimación, n
· Cuando el error de estimación, la precisión
Simulación de intervalos de confianza para la media de una población normal
· Si se extraen 50 muestras aleatorias de una población normal con μ= 1 y una σ = 2
· para cada muestra IC 98% para la 
· es decir el 98% de 50= 49 por lo que se espera que 49 intervalos contendrán a la media
INTERVALO DE CONFIANZA BILATERAL PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA DESCONOCIDA
Sea X una variable aleatoria con distribución normal, con y ambas desconocidas, entonces se toma una muestra aleatoria de tamaño n:
despejando…
INTERVALO DE CONFIANZA BILATERAL PARA LA DIFERENCIA DE MEDIAS

Continuar navegando