Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
MAGNITUD = NÚMERO POR UNIDAD 1- MAGNITUDES DE BASE 2- MAGNITUDES DERIVADAS MAGNITUD SÍMBOLO UNIDADES Longitud m Metro, Masa Kg Kilogramo, Tiempo s Segundo, Corriente eléctrica A Ampere, Temperatura K Kelvin, Intensidad luminosa Cd Candela Cantidad de sustancia Mol Mol. ALGUNAS MAGNITUDES DERIVADAS Son la que se forman a partir de dos ó más unidades de base por operaciones matemáticas elementales (multiplicación, división, potenciación) MAGNITUD SÍMBOLO UNIDADES Fuerza F N = kg. m. s-2 Presión p Pa = N m-2 Trabajo w J Potencia P W = J s-2 Presión osmótica Π Pa Resistencia R Ohm = V A-1 Conductancia G Ohm-1 = A V-1 Fuente: San Martín H. Salud y enfermedad, La Prensa Médica El curso de una enfermedad o las características de un hombre sano son hechos en extremo variables sin embargo es posible establecer estadísticamente criterios pronósticos aplicables a grupos de enfermos o determinar los límites de variaciones de determinadas características del hombre normal para reconocer los casos patológicos. DATOS Todo conocimiento tiene su origen en algún proceso de observación Tales observaciones en su conjunto se denominan DATOS Datos Cuantitativos Cualitativos Continuos Admiten cualquier valor Ej: peso, talla, glucemia Discretos Valor entero Ej: Nº hermanos Nominales De nombre, sin orden Ej: sexo, SI/NO Ordinales Con orden Ej: Escala dolor, estadios Ca 5 Variables cuantitativas continuas: admiten tomar cualquier valor dentro de un rango numérico determinado (edad, peso, talla). Variables cuantitativas discretas: no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (Nº hijos, números de partos, de hermanos). Escalas nominales: datos que se ajustan por categorías que no mantienen una relación de orden entre sí (color de ojos, sexo, profesión, presencia o ausencia de un factor de riesgo o enfermedad). Escalas ordinales: existe un cierto orden o jerarquía entre las categorías (grados de disnea, estadificación de cáncer). 5 ESTADISTICA CIENCIA QUE INTERPRETA NUMERICAMENTE LOS FENOMENOS DE UN CAMPO DEL CONOCIMIENTO LA ESTADISTICA SIRVE PARA DISEÑAR LOS EXPERIMENTOS Y ANALIZAR LOS RESULTADOS OBTENIDOS, POR LO QUE CONSTITUYE UN ELEMENTO FUNDAMENTAL DEL METODO EXPERIMENTAL 1- DESCRIPCION DE LOS FENOMENOS 2- COMPARACION TIENE UN CARACTER PREDICTIVO Definiciones La estadística se ocupa de los métodos y procedimientos para recolectar, clasificar, resumir, y analizar los datos, así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. Bioestadística: Aplicación de la estadística a los procesos biológicos, incluyendo los de salud. Clasificación Estadística descriptiva Estadística inferencial Describir, organizar, resumir y presentar datos. Muestreo de datos para sacar conclusiones sobre poblaciones más grandes. 8 Estadística descriptiva: Cuando los resultados del análisis no pretenden ir más allá del conjunto de datos Estadística inferencial. Cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio. 8 Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Puede ser: Aritmética Tabular Gráfica Estadística inferencial Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Puede ser: Estimación Prueba de hipótesis Estadística inferencial Dada la imposibilidad material para trabajar con todos los elementos que componen la población, trabajamos con muestras. La información que suministra la muestra se puede inferir a la población con mayor o menos exactitud. El objetivo de la inferencia estadística es ponernos en condiciones para generalizar a la población basándonos en el estudio de la muestra. De lo adecuada que sea la muestra dependerá la exactitud de la inferencia. La base matemática de la inferencia es la probabilidad Concepto de probabilidad p = N° casos favorables N° total de casos probables Ejemplo: ¿Cuál es la probabilidad que tiene un fumador de desarrollar cáncer de pulmón??? Estudiamos por ejemplo 100 fumadores y determinamos cuántos desarrollaron Ca de pulmón. ----- 7 p= 7 /100--- 0.07 ESTADÍSTICA ANALISIS DATOS SELECCIONAR DATOS DESCRIBIR DATOS EXTRAER CONCLUSIONES DE LOS DATOS ESTADÍSTICA INFERENCIAL DESCRIPTIVA ORGANIZAR Y RESUMIR LA INFORMACION DE DATOS EMPÍRICOS ATRIBUIR DATOS EMPÍRICOS DE LA MUESTRA A LA POBLACION DESCRIBIR DATOS GENERALIZAR DATOS PROCEDIMIENTOS METODO ESTADISTICO 1- Observación del fenómeno 2- Establecimiento de un conjunto de variables suficiente para analizarlo 3- Ordenamiento de los valores en series 4- Selección de datos 5- Representación gráfica de los datos 6- Ajuste y eliminación de errores 7- Procedimiento estadístico 8- Establecimiento de una ley 1- PLANIFICACION 2- RECOLECCION DE LA MUESTRA 3- ELABORACION (clasif., comput., tabulación y graficación) 4- INFERENCIA 15 Inferencia: conclusiones derivadas de la elaboración RECOLECCION DE LA MUESTRA POBLACION: CONJUNTO DE TODOS LOS INDIVIDUOS QUE PRESENTAN UNA O VARIAS CARACTERISTICAS SUSCEPTIBLES DE SER OBSERVADAS MUESTRA: ES UNA PARTE DEL UNIVERSO EN LA QUE SE ESTUDIAN SUS CARACTERISTICAS DE TAL MANERA QUE LOS RESULTADOS OBTENIDOS PUEDAN SER GENERALIZADOS AL MISMO, SIN OLVIDAR QUE A ESTA GENERALIZACION NO SE LE PUEDE DAR UNA VALIDEZ ABSOLUTA CARACTERISTICAS DE LA MUESTRA 1- REPRESENTATIVA (probabilística o de azar) Método probabilístico ------ aleatorio simple aleatorio estratificado 2- TAMAÑO ADECUADO 3- ESTRATIFICACION (calidad de la muestra) ---- estratificado proporcional estratificado de igual tamaño 16 El concepto de población se puede extender al Universo. La simbología del universo es N. La muestra se representa con n. Características de las muestras: el método probabilístico aleatorio implica que todos los individuos integrantes de la población estudiada o del universo poseen la misma posibilidad de formar parte de la muestra. En los métodos aleatorios estratificados esta condición se reproduce para cada uno de los estratos que componen a la población (por ejemplo varones y mujeres, niños adolescentes y adultos etc) VARIABILIDAD DE LA MUESTRA CUALITATIVAS (atributos) LAS CARACTERISTICAS PUEDEN SER: CUANTITATIVAS (magnitudes) 1- CUALITATIVAS ---- DISCONTINUAS ----- color de ojos DISCONTINUAS -- comida/día 2- CUANTITATIVAS (numéricas) CONTINUAS ------ P. arterial VARIABILIDAD VARIABLES: son características que pueden tomar un determinado valor. Las variables que pueden adoptar solamente un valor se llaman discretas (cualitativas). Las que pueden adquirir cualquier valor entre 2 dados se denominan continuas (cuantitativas). 17 Variables cualitativas discretas: color de ojos, sexo, color de piel etc Variables numéricas o cuantitativas: discontinuas como la cantidad de comidas ingeridas diariamente, la cantidad de deposiciones diarias, etc. Las variables cuantitativascontinuas comprenden al peso, la altura la p arterial etc. Población Un conjunto de elementos que poseen uno o más atributos comunes Atributos Comunes (definen la población) Variables (subconjuntos o clases dentro de la población) Variables NO numéricas Numéricas Discretas Continuas Frecuencia de una clase Absoluta (nº de individuos en una clase) Relativa = FA/total de individuos Porcentual = FR 100 Distribución de frecuencias es el conjunto de frecuencias correspondiente a una clase 18 18 VARIABLES BIOLÓGICAS NO NUMÉRICAS NUMÉRICAS CONTINUA DISCRETAS presión arterial glucosa creatinina Color de ojos color de piel Pilosidad cutánea Nro de hijos Nro de pulsaciones/min Nro de micciones La Normalidad y la variabilidad biológica: ¿Cuál es el valor normal de estas variables biológicas si provienen de individuos no idénticos? ¿normal es lo más frecuente? 19 19 No existe un único valor normal sino un intervalo de valores que pueden ser considerados normales. No es correcto hablar de “normalidad” sino de “distribución normal”, ya que lo que indica un gráfico es la distribución y no la “normalidad”. Histograma Pulsaciones /min Frecuencia absoluta Frecuencia relativa Frecuencia relativa % Intervalo 43-50 3 0,0028 0,28 1 51-58 28 0,0264 2,64 2 59-66 131 0,1235 12,35 3 67-74 283 0,267 26,70 4 75-82 351 0,3311 33,11 5 83-90 185 0,1745 17,45 6 91-98 64 0,0604 6,04 7 99-106 14 0,0132 1,32 8 107-114 1 0,0009 0.09 9 Total 1060 1 100 Distribución de una variable discreta numérica: 20 20 COMPOSICION DE LA MUESTRA En todo trabajo de investigación existen en general dos grupos de muestras: 1- Las obtenidas del grupo control o testigo 2- Las extraídas del grupo a investigar COMPOSICION del GRUPO CONTROL En función del tiempo de obtención de la muestra 1- Testigos históricos 2- Testigos simultáneos En función de la forma de obtención de la muestra 1- Un solo grupo: Auto testigos 2- Dos grupos: Testigos secretos: simple ciego doble ciego 21 En algunos casos se puede trabajar con un solo grupo que actúa como su propio testigo (estudios antes-después) Simple ciego: el investigador desconoce los grupos en los que se desarrolla la experiencia Doble ciego: el investigador y el sujeto investigado desconocen si son sujetos experimentales o controles. MEDIDAS de POSICION y DISPERSION Las medidas de posición son: Media aritmética, Mediana, Modo Medidas de dispersión Desvío estándar Error estándar Variancia MEDIDAS DE POSICION MEDIANA: es el valor central de una serie, una vez que se han ordenado los valores en forma creciente. En el caso de la existencia de dos valores centrales, se la calcula a partir de la media aritmética de los mismos. La mediana es una medida que se deja influenciar poco por los valores extremos. MODO: es el valor que se repite con una mayor frecuencia (valor más común). El modo puede no existir o puede no ser único. En el caso de existir dos valores la serie se denomina bimodal. 22 Mediana: dada una serie: 2, 3, 3, 4, 5, 6, 7, 8, 9 el valor central es el 5 Modo: es el 3 Media (media aritmética) Si x1, x2,.., xn representan una muestra de tamaño n de la población, la media aritmética se calcula: Sumando todas las observaciones y dividiendo entre el número de observaciones Xi= valor de cada observación n= número de observaciones Propiedades La media aritmética es la medida tendencia central que posee menor varianza. Engloba en ella toda la información de la muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas la afectan. La mediana Es un medida de posición Es el valor que es mayor o igual que el 50% de las observaciones de la muestra y menor o igual que el otro 50%. Para calcularla se ordenan los datos de menor a mayor. Si n es impar, la mediana es la observación central. Si n es par, la mediana se define como la media de las dos observaciones centrales. Propiedades La mediana es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas. Sin embargo tiene mayor varianza que la media y sólo toma en cuenta la información de los valores centrales de la muestra. El modo Es el valor más frecuente. Su cálculo es el más simple de los tres correspondientes a estadísticos de centralidad Es el estadístico de mayor varianza El Modo II El modo puede no existir y cuando existe no es necesariamente único. Ejemplo, en los valores: 10, 21, 33, 53 y 54 no hay modo porque todos los valores son diferentes No tiene sentido en muestras pequeñas en las que la aparición de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa. Medidas de Dispersión La variancia: el promedio de los cuadrados de las diferencias entre cada valor y la media. A la raíz cuadrada de la variancia se lo denomina desvío estándar (DS). El DS se utiliza como unidad de medida de la diferencia entre un valor individual y la media. Al número de DS que separan un dato individual de la media de la población () se lo denomina Z DISTRIBUCION DE FRECUENCIAS CONCEPTO DE DISTRIBUCION DE LA MUESTRA: los valores de la variable en estudio que forma parte de la muestra tienden a tener una distribución alrededor del valor promedio o media que es igual a ambos lados (simétrica). Esta forma de ordenar los datos se denomina normal. Cuanto mayor sea el numero de datos tanto mayor será la confiabilidad de la distribución de los mismos. CARACTERISTICAS DE LA DISTRIBUCION NORMAL CONCEPTO DE PROMEDIO O MEDIA: se la conoce como media aritmética, y se la obtiene sumando los datos de una serie y al valor obtenido se lo divide por el número de datos. CONCEPTO DE DESVIO ESTANDAR: indica como se distribuyen los datos o valores alrededor del promedio. Se calcula como la raíz cuadrada de las desviaciones de las medidas alrededor del promedio: 30 Variables cualitativas discretas: color de ojos, sexo, color de piel etc Variables numéricas o cuantitativas: discontinuas como la cantidad de comidas ingeridas diariamente, la cantidad de deposiciones diarias, etc. Las variables cuantitativas continuas comprenden al peso, la altura la p arterial etc. Distribución simétrica (Normal) Distribución asimétrica positiva (izquierda) Distribución asimétrica negativa (derecha) CURVA DE FRECUENCIA DE DISTRIBUCION NORMAL: los valores de la variable en estudio que forma parte de la muestra tienden a tener una distribución simétrica alrededor del valor promedio. En este tipo de distribución la mediana, el modo y el promedio son iguales y se encuentra definido por una ecuación matemática llamada función de Gauss. Un desvío estándar es el valor que sumado y restado al promedio define un intervalo dentro del cual se encuentran el 68 % de los valores que integran la muestra. ( ± 1DS) = 0,683 (68.3%) ( ± 2DS) = 0,954 (95.4%) (± 3DS) = 0,997 (99.7%) 68.3% 95.4% 99.7% Aceptado como intervalo normal 33 33 +/- 1 s delimita al 68.3% de la población; +/- 2 s delimita al 95.4% de la población; +/- 3 s delimita al 99.7% de la población. Además, estos intervalos se asocian con un área determinada bajo la curva de Gauss. Ejemplo Datos de glucemiacorrespondientes a una muestra de 384 personas sanas ----- X = 89.6 mg/dl DE=10.2 mg/dl X± DE = 89.6 ± 10.2 -- 79.4 – 99.8 mg/dl contienen 68% de los valores individuales X ± 2DE = 89.6 ± 20.4 mg/dl -- 69.2 – 110 mg/dl contienen 95% de los valores individuales X ± 3DE = 89.6 ± 30.6 mg/dl -- 59 – 120.2 mg/dl contienen 99 % de los valores individuales Media y 2 SD en las Glucemias 89.6 ± 20.4 35 Ejemplo Paciente X GLUCEMIA 115 mg/dl Es un valor patológico????? Si ???? 115 mg/dl se encuentra fuera del intervalo X ± 2DE = 89 ± 20.4 mg/dl -- 69.2 – 110 mg/dl contienen 95% de los valores individuales Sospecho patología PARAMETRO Z (desviación relativa): indica la distancia entre uno de los valores que integran la muestra y el promedio, medido en desviaciones estándar. Por lo tanto para cada valor de desviación relativa muestra el porcentaje de casos comprendido entre ese valor y el promedio. Se calcula obteniendo la diferencia entre el valor considerado y el valor promedio y dividiendo este resultado por la desviación estándar. Una vez obtenido el valor Z, en la Tabla de probabilidad para Z se puede encontrar la probabilidad de hallar valores comprendidos entre el obtenido y el promedio. Cuando Z = a p + 1 0.3413 ------------- 1 Desvío Estándar + 2 0.4772 ------------- 2 Desvíos Estándar 0.05 + 3 0.4987 ------------- 3 desvíos Estándar 0.01 37 Como sería muy difícil calcular para cada caso, el área bajo la curva normal, se utiliza en la práctica una Tabla que nos indica directamente el área entre el centro de la curva normal y el valor de Z (o desviación relativa) calculado para nuestro caso en particular. Como sería muy difícil calcular para cada caso, el área bajo la curva normal, se utiliza en la práctica una Tabla que nos indica directamente el área entre el centro de la curva normal y el valor de Z (o desviación relativa) calculado para nuestro caso en particular. Parámetro Z o desviación relativa Da idea de la distancia que existe entre un dato individual de la muestra considerada y la media de dicha muestra. Z = (Xi – X) / DS 0,5 - a 0 0,16 0,025 0,01 a = probabilidad de encontrar el valor en el área considerada 38 Xi: valor dado X: media La tabla de distribución de los valores Z nos permite conocer, para cada valor de Z, el porcentaje de casos comprendidos entre el dato individual considerado y el valor medio de la muestra. 38 z z = 1 0.3413 0.4772 z = 2 z = 3 0.4987 PARAMETRO t: cuando la muestra posee menos de 30 casos la probabilidad depende cada vez más del número de casos y no sólo del promedio y del Desvío Estándar. Por lo tanto en estas situaciones la Curva de Gauss presentará los extremos cada vez más altos al disminuir el tamaño de la muestra. El valor de t para 30 casos es igual al valor de Z. Para n-1 grados de libertad la probabilidad de hallar valores alejados de la media, hacia uno u otro lado, en igual grado o mayor que el analizado se muestra con el valor de t. Probabilidad tanto en + como en - de la media t t 1 caso 1 caso 30 casos 30 casos p m1 m2 m3 mj m1 m2 m3 mj población SEM = SD n Xp = media de la población SEM= desvío estándar de los valores medios ¿Qué es el error estándar de la media (SEM)? 41 41 Es la desviación estándar de la media de las medias. Es el desvío estándar de la distribución de las medias de la muestra. Es lo que representa a la población y no a una muestra en particular. La media es sobre una muestra, cuando uso muchas muestras, saco la media de las media y obtengo el error estándar. Como utilizo mayor número en el ES, los valores son siempre menores que los DE. La realidad es que la desviación estándar de la media de muestras es un valor hipotético, ya que en la práctica nosotros tomamos una sola muestra. El término error estándar se utiliza porque da a entender un significado específico. La variabilidad en las estadísticas de muestras proviene de un error de muestreo debido al azar. Es decir, hay diferencias entre cada muestra y la población, y entre las diversas muestras, debido únicamente a los elementos que decidimos escoger para las muestras. Nos dice cómo se distribuyen los valores medios de distintas muestras alrededor de la media de la población. Significado del error estándar de la media El SEM de la media indica cómo se distribuyen los valores medios de distintas muestras alrededor de la media de la población ± 1SEM = 68.3% ± 2 SEM = 95.4% ± 3 SEM = 99.7% -2SEM +2SEM 0 Z = -2 Z = +2 Intervalo de confianza 42 42 El nivel de significación (NS) estadística depende del nivel de exigencia que requerimos cuando se hace una afirmación. Cuando decimos que el NS es > 95% estamos aceptando que la probabilidad de error (PE) es < del 5%. Si el NS es > 99%, la PE es < 1% (más exigente). Si esto ocurre … Diferencias significativas (p < 0.05 o p < 0.01) NO fueron al azar El p valor me permite concluir que la probabilidad de que la diferencia obtenida haya sido por azar de muestreo es muy baja. 43 Cuando el NS es < 95%, la PE de la afirmación es > del 5% o sea que las diferencias NO fueron significativas (p > 0.05 o p > 0.01). Las diferencias existentes fueron debidas al azar. El p valor es la probabilidad de obtener datos iguales o más extremos a los nuestros si la hipótesis nula es verdadera. Si el p valor es bajo, la hipótesis nula es poco probable, mientras que si es alto, la hipótesis nula es bastante probable. No es nada más ni nada menos que concluir que la probabilidad de que esa diferencia haya sido por azar de muestreo es muy baja, y por lo tanto rechazamos la hipótesis nula de no diferencia y concluimos que hay un efecto. 43 valores Xi frecuencia fi n X Xi fi SD = = - - = å 1 ) ( 2 n X X i å = SD X Xi Z Muestra - = ES X i X Z Población - =
Compartir