Logo Studenta

Bioestadística-Variables

¡Este material tiene más páginas!

Vista previa del material en texto

MAGNITUD = NÚMERO POR UNIDAD
1- MAGNITUDES DE BASE
2- MAGNITUDES DERIVADAS
 
MAGNITUD
 
SÍMBOLO
 
UNIDADES
Longitud
m
Metro, 
Masa
Kg
Kilogramo, 
Tiempo
s
Segundo, 
Corriente eléctrica
A
Ampere,
Temperatura
K
 Kelvin, 
Intensidad luminosa
Cd
Candela 
Cantidad de sustancia
Mol
Mol.
 ALGUNAS MAGNITUDES DERIVADAS
Son la que se forman a partir de dos ó más unidades de base por operaciones matemáticas elementales
 (multiplicación, división, potenciación)
 
MAGNITUD
 
SÍMBOLO
 
UNIDADES
Fuerza
F
N = kg. m. s-2 
Presión
p
Pa = N m-2
Trabajo
w
J 
Potencia
P
W = J s-2
Presión osmótica
Π
 Pa 
Resistencia
R
Ohm = V A-1
Conductancia
G
Ohm-1 = A V-1
Fuente: San Martín H. Salud y enfermedad, La Prensa Médica
El curso de una enfermedad o las características de un hombre sano son hechos en extremo variables sin embargo es posible establecer estadísticamente criterios pronósticos aplicables a grupos de enfermos o determinar los límites de variaciones de determinadas características del hombre normal para reconocer los casos patológicos.
DATOS 
Todo conocimiento tiene su origen en algún proceso de observación
 Tales observaciones en su conjunto se denominan DATOS
Datos
Cuantitativos
Cualitativos
Continuos
Admiten cualquier valor
Ej: peso, talla, glucemia
Discretos
Valor entero
Ej: Nº hermanos
Nominales
De nombre, sin orden
Ej: sexo, SI/NO
Ordinales
Con orden
Ej: Escala dolor, estadios Ca
5
Variables cuantitativas continuas: admiten tomar cualquier valor dentro de un rango numérico determinado (edad, peso, talla).
Variables cuantitativas discretas: no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (Nº hijos, números de partos, de hermanos).
Escalas nominales: datos que se ajustan por categorías que no mantienen una relación de orden entre sí (color de ojos, sexo, profesión, presencia o ausencia de un factor de riesgo o enfermedad).
Escalas ordinales: existe un cierto orden o jerarquía entre las categorías (grados de disnea, estadificación de cáncer).
5
ESTADISTICA
CIENCIA QUE INTERPRETA NUMERICAMENTE LOS FENOMENOS DE UN CAMPO DEL CONOCIMIENTO
LA ESTADISTICA SIRVE PARA DISEÑAR LOS EXPERIMENTOS Y ANALIZAR LOS RESULTADOS OBTENIDOS, POR LO QUE CONSTITUYE UN ELEMENTO FUNDAMENTAL DEL METODO EXPERIMENTAL
1- DESCRIPCION DE LOS FENOMENOS
2- COMPARACION
TIENE UN CARACTER PREDICTIVO 
Definiciones
La estadística se ocupa de los métodos y procedimientos para recolectar, clasificar, resumir, y analizar los datos, así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. 
Bioestadística: Aplicación de la estadística a los procesos biológicos, incluyendo los de salud.
Clasificación 
Estadística descriptiva
Estadística inferencial
Describir, organizar, resumir y presentar datos.
Muestreo de datos para sacar conclusiones sobre poblaciones más grandes.
8
Estadística descriptiva: Cuando los resultados del análisis no pretenden ir más allá del conjunto de datos
Estadística inferencial. Cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio.
8
Estadística descriptiva:
Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Puede ser:
Aritmética
Tabular
Gráfica
Estadística inferencial
Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Puede ser:
Estimación 
Prueba de hipótesis
Estadística inferencial
Dada la imposibilidad material para trabajar con todos los elementos que componen la población, trabajamos con muestras. 
La información que suministra la muestra se puede inferir a la población con mayor o menos exactitud.
El objetivo de la inferencia estadística es ponernos en condiciones para generalizar a la población basándonos en el estudio de la muestra. 
De lo adecuada que sea la muestra dependerá la exactitud de la inferencia.
La base matemática de la inferencia es la probabilidad 
Concepto de probabilidad
p = 
 N° casos favorables 
N° total de casos probables 
Ejemplo: ¿Cuál es la probabilidad que tiene un fumador de desarrollar cáncer de pulmón???
Estudiamos por ejemplo 100 fumadores y determinamos cuántos desarrollaron Ca de pulmón. ----- 7
p= 7 /100--- 0.07
 ESTADÍSTICA
ANALISIS DATOS
SELECCIONAR
DATOS
DESCRIBIR
DATOS
EXTRAER CONCLUSIONES
DE LOS DATOS
ESTADÍSTICA
INFERENCIAL
DESCRIPTIVA
ORGANIZAR Y RESUMIR LA INFORMACION DE DATOS EMPÍRICOS
ATRIBUIR DATOS EMPÍRICOS DE LA MUESTRA A LA POBLACION
DESCRIBIR DATOS
GENERALIZAR DATOS
PROCEDIMIENTOS
METODO ESTADISTICO
1- Observación del fenómeno
2- Establecimiento de un conjunto de variables suficiente para analizarlo
3- Ordenamiento de los valores en series
4- Selección de datos
5- Representación gráfica de los datos
6- Ajuste y eliminación de errores
7- Procedimiento estadístico 
8- Establecimiento de una ley
1- PLANIFICACION
2- RECOLECCION DE LA MUESTRA
3- ELABORACION (clasif., comput., tabulación y graficación)
4- INFERENCIA 
15
Inferencia: conclusiones derivadas de la elaboración 
RECOLECCION DE LA MUESTRA
POBLACION: CONJUNTO DE TODOS LOS INDIVIDUOS QUE PRESENTAN UNA O VARIAS CARACTERISTICAS SUSCEPTIBLES DE SER OBSERVADAS
MUESTRA: ES UNA PARTE DEL UNIVERSO EN LA QUE SE ESTUDIAN SUS CARACTERISTICAS DE TAL MANERA QUE LOS RESULTADOS OBTENIDOS PUEDAN SER GENERALIZADOS AL MISMO, SIN OLVIDAR QUE A ESTA GENERALIZACION NO SE LE PUEDE DAR UNA VALIDEZ ABSOLUTA
CARACTERISTICAS DE LA MUESTRA 
1- REPRESENTATIVA (probabilística o de azar)
 Método probabilístico ------ aleatorio simple
 aleatorio estratificado 
2- TAMAÑO ADECUADO
3- ESTRATIFICACION (calidad de la muestra) ---- estratificado proporcional
 estratificado de igual tamaño
16
El concepto de población se puede extender al Universo. La simbología del universo es N. La muestra se representa con n. 
Características de las muestras: el método probabilístico aleatorio implica que todos los individuos integrantes de la población estudiada o del universo poseen la misma posibilidad de formar parte de la muestra. En los métodos aleatorios estratificados esta condición se reproduce para cada uno de los estratos que componen a la población (por ejemplo varones y mujeres, niños adolescentes y adultos etc)
VARIABILIDAD DE LA MUESTRA
 CUALITATIVAS (atributos) 
LAS CARACTERISTICAS PUEDEN SER:
 CUANTITATIVAS (magnitudes)
1- CUALITATIVAS ---- DISCONTINUAS ----- color de ojos
 DISCONTINUAS -- comida/día
2- CUANTITATIVAS (numéricas)
 CONTINUAS ------ P. arterial
VARIABILIDAD
VARIABLES: son características que pueden tomar un determinado valor. Las variables que pueden adoptar solamente un valor se llaman discretas (cualitativas). Las que pueden adquirir cualquier valor entre 2 dados se denominan continuas (cuantitativas).
 
17
Variables cualitativas discretas: color de ojos, sexo, color de piel etc
Variables numéricas o cuantitativas: discontinuas como la cantidad de comidas ingeridas diariamente, la cantidad de deposiciones diarias, etc. Las variables cuantitativascontinuas comprenden al peso, la altura la p arterial etc.
Población
Un conjunto de elementos que poseen uno o más atributos comunes
Atributos
Comunes (definen la población)
Variables (subconjuntos o clases dentro de la población)
Variables
NO numéricas 
Numéricas
Discretas
Continuas
Frecuencia de una clase
Absoluta (nº de individuos en una clase)
Relativa = FA/total de individuos
Porcentual = FR  100
Distribución de frecuencias es el conjunto de frecuencias correspondiente a una clase
18
18
VARIABLES BIOLÓGICAS
NO NUMÉRICAS
NUMÉRICAS
CONTINUA
DISCRETAS
presión arterial glucosa 
creatinina
Color de ojos 
color de piel 
Pilosidad cutánea
Nro de hijos
Nro de pulsaciones/min
Nro de micciones
La Normalidad y la variabilidad biológica:
¿Cuál es el valor normal de estas variables biológicas si provienen de individuos no idénticos?
¿normal es lo más frecuente?
19
19
No existe un único valor normal sino un intervalo de valores que pueden ser considerados normales.
No es correcto hablar de “normalidad” sino de “distribución normal”, ya que lo que indica un gráfico es la distribución y no la “normalidad”.
Histograma
	Pulsaciones
/min	Frecuencia absoluta	Frecuencia relativa	Frecuencia relativa %	Intervalo
	43-50	3	0,0028	0,28	1
	51-58	28	0,0264	2,64	2
	59-66	131	0,1235	12,35	3
	67-74	283	0,267	26,70	4
	75-82	351	0,3311	33,11	5
	83-90	185	0,1745	17,45	6
	91-98	64	0,0604	6,04	7
	99-106	14	0,0132	1,32	8
	107-114	1	0,0009	0.09	9
	Total	1060	1	100	
Distribución de una variable discreta numérica:
20
20
COMPOSICION DE LA MUESTRA
En todo trabajo de investigación existen en general dos grupos de muestras:
1- Las obtenidas del grupo control o testigo
2- Las extraídas del grupo a investigar 
 
COMPOSICION del GRUPO CONTROL
En función del tiempo de obtención de la muestra
1- Testigos históricos 
2- Testigos simultáneos
En función de la forma de obtención de la muestra
1- Un solo grupo: Auto testigos 
2- Dos grupos: Testigos secretos: simple ciego
 doble ciego 
 
21
En algunos casos se puede trabajar con un solo grupo que actúa como su propio testigo (estudios antes-después)
Simple ciego: el investigador desconoce los grupos en los que se desarrolla la experiencia
Doble ciego: el investigador y el sujeto investigado desconocen si son sujetos experimentales o controles.
MEDIDAS de POSICION y DISPERSION
 
Las medidas de posición son: Media aritmética, 
 Mediana, 
 Modo
  
Medidas de dispersión	 	 Desvío estándar
 Error estándar					 Variancia
MEDIDAS DE POSICION 
MEDIANA: es el valor central de una serie, una vez que se han ordenado los valores en forma creciente. En el caso de la existencia de dos valores centrales, se la calcula a partir de la media aritmética de los mismos. La mediana es una medida que se deja influenciar poco por los valores extremos. 
MODO: es el valor que se repite con una mayor frecuencia (valor más común). El modo puede no existir o puede no ser único. En el caso de existir dos valores la serie se denomina bimodal. 
22
Mediana: dada una serie: 2, 3, 3, 4, 5, 6, 7, 8, 9 el valor central es el 5
Modo: es el 3
Media (media aritmética)
Si x1, x2,.., xn representan una muestra de tamaño n de la población, la media aritmética se calcula:
Sumando todas las observaciones y dividiendo entre el número de observaciones 
Xi= valor de cada observación 
n= número de observaciones 
Propiedades
La media aritmética es la medida tendencia central que posee menor varianza.
Engloba en ella toda la información de la muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas la afectan.
La mediana 
Es un medida de posición
Es el valor que es mayor o igual que el 50% de las observaciones de la muestra y menor o igual que el otro 50%.
Para calcularla se ordenan los datos de menor a mayor. 
Si n es impar, la mediana es la observación central.
Si n es par, la mediana se define como la media de las dos observaciones centrales.
Propiedades
La mediana es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas. 
Sin embargo tiene mayor varianza que la media y sólo toma en cuenta la información de los valores centrales de la muestra. 
El modo
Es el valor más frecuente.
Su cálculo es el más simple de los tres correspondientes a estadísticos de centralidad 
Es el estadístico de mayor varianza
El Modo II
El modo puede no existir y cuando existe no es necesariamente único. 
Ejemplo, en los valores: 10, 21, 33, 53 y 54 no hay modo porque todos los valores son diferentes
No tiene sentido en muestras pequeñas en las que la aparición de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa.
 
Medidas de Dispersión
La variancia: el promedio de los cuadrados de las diferencias entre cada valor y la media.
A la raíz cuadrada de la variancia se lo denomina desvío estándar (DS).
El DS se utiliza como unidad de medida de la diferencia entre un valor individual y la media.
Al número de DS que separan un dato individual de la media de la población () se lo denomina Z
DISTRIBUCION DE FRECUENCIAS
 
CONCEPTO DE DISTRIBUCION DE LA MUESTRA: los valores de la variable en estudio que forma parte de la muestra tienden a tener una distribución alrededor del valor promedio o media que es igual a ambos lados (simétrica). Esta forma de ordenar los datos se denomina normal. Cuanto mayor sea el numero de datos tanto mayor será la confiabilidad de la distribución de los mismos. 
CARACTERISTICAS DE LA DISTRIBUCION NORMAL
CONCEPTO DE PROMEDIO O MEDIA: se la conoce como media aritmética, y se la obtiene sumando los datos de una serie y al valor obtenido se lo divide por el número de datos. 
CONCEPTO DE DESVIO ESTANDAR: indica como se distribuyen los datos o valores alrededor del promedio. Se calcula como la raíz cuadrada de las desviaciones de las medidas alrededor del promedio: 
30
Variables cualitativas discretas: color de ojos, sexo, color de piel etc
Variables numéricas o cuantitativas: discontinuas como la cantidad de comidas ingeridas diariamente, la cantidad de deposiciones diarias, etc. Las variables cuantitativas continuas comprenden al peso, la altura la p arterial etc.
Distribución simétrica (Normal)
Distribución asimétrica
positiva (izquierda)
Distribución asimétrica
negativa (derecha)
CURVA DE FRECUENCIA DE DISTRIBUCION NORMAL: los valores de la variable en estudio que forma parte de la muestra tienden a tener una distribución simétrica alrededor del valor promedio. En este tipo de distribución la mediana, el modo y el promedio son iguales y se encuentra definido por una ecuación matemática llamada función de Gauss. 
Un desvío estándar es el valor que sumado y restado al promedio define un intervalo dentro del cual se encuentran el 68 % de los valores que integran la muestra.
( ± 1DS) = 0,683 (68.3%)
( ± 2DS) = 0,954 (95.4%)
(± 3DS) = 0,997 (99.7%)
68.3%
95.4%
99.7%
Aceptado como intervalo normal
33
33
 +/- 1 s delimita al 68.3% de la población;  +/- 2 s delimita al 95.4% de la población;  +/- 3 s delimita al 99.7% de la población. Además, estos intervalos se asocian con un área determinada bajo la curva de Gauss.
Ejemplo
Datos de glucemiacorrespondientes a una muestra de 384 personas sanas
 ----- X = 89.6 mg/dl DE=10.2 mg/dl
X± DE = 89.6 ± 10.2 -- 79.4 – 99.8 mg/dl
contienen 68% de los valores individuales
X ± 2DE = 89.6 ± 20.4 mg/dl -- 69.2 – 110 mg/dl
 contienen 95% de los valores individuales
X ± 3DE = 89.6 ± 30.6 mg/dl -- 59 – 120.2 mg/dl
 contienen 99 % de los valores individuales
Media y 2 SD en las Glucemias
89.6 ± 20.4
35
Ejemplo 
Paciente X GLUCEMIA 115 mg/dl
Es un valor patológico?????
Si ???? 
115 mg/dl se encuentra fuera del intervalo
 X ± 2DE = 89 ± 20.4 mg/dl -- 69.2 – 110 mg/dl
 contienen 95% de los valores individuales
 
 Sospecho patología
PARAMETRO Z (desviación relativa): indica la distancia entre uno de los valores que integran la muestra y el promedio, medido en desviaciones estándar. Por lo tanto para cada valor de desviación relativa muestra el porcentaje de casos comprendido entre ese valor y el promedio. Se calcula obteniendo la diferencia entre el valor considerado y el valor promedio y dividiendo este resultado por la desviación estándar. 
Una vez obtenido el valor Z, en la Tabla de probabilidad para Z se puede encontrar la probabilidad de hallar valores comprendidos entre el obtenido y el promedio.
Cuando Z = a p
 + 1 0.3413 ------------- 1 Desvío Estándar
 + 2 0.4772 ------------- 2 Desvíos Estándar 0.05
 + 3 0.4987 ------------- 3 desvíos Estándar 0.01
37
Como sería muy difícil calcular para cada caso, el área bajo la curva normal, se utiliza en la práctica una Tabla que nos indica directamente el área entre el centro de la curva normal y el valor de Z (o desviación relativa) calculado para nuestro caso en particular.
Como sería muy difícil calcular para cada caso, el área bajo la curva normal, se utiliza en la práctica una Tabla que nos indica directamente el área entre el centro de la curva normal y el valor de Z (o desviación relativa) calculado para nuestro caso en particular.
Parámetro Z o desviación relativa
Da idea de la distancia que existe entre un dato individual de la muestra considerada y la media de dicha muestra.
Z = (Xi – X) / DS
0,5 - a
0
0,16
0,025
0,01
a = probabilidad de encontrar el valor en el área considerada
38
Xi: valor dado
X: media
La tabla de distribución de los valores Z nos permite conocer, para cada valor de Z, el porcentaje de casos comprendidos entre el dato individual considerado y el valor medio de la muestra.
38
z
z = 1
0.3413
0.4772
z = 2
z = 3
0.4987
PARAMETRO t: cuando la muestra posee menos de 30 casos la probabilidad depende cada vez más del número de casos y no sólo del promedio y del Desvío Estándar. Por lo tanto en estas situaciones la Curva de Gauss presentará los extremos cada vez más altos al disminuir el tamaño de la muestra. El valor de t para 30 casos es igual al valor de Z. Para n-1 grados de libertad la probabilidad de hallar valores alejados de la media, hacia uno u otro lado, en igual grado o mayor que el analizado se muestra con el valor de t. 
Probabilidad tanto en + como en - de la media
t
t
1 caso
1 caso
30 casos
30 casos
p
m1
m2
m3
mj
m1
m2
m3
mj
población
SEM = 
SD
 n
Xp = media de la población
SEM= desvío estándar de los valores medios 
¿Qué es el error estándar de la media (SEM)?
41
41
Es la desviación estándar de la media de las medias. Es el desvío estándar de la distribución de las medias de la muestra. Es lo que representa a la población y no a una muestra en particular. La media es sobre una muestra, cuando uso muchas muestras, saco la media de las media y obtengo el error estándar. Como utilizo mayor número en el ES, los valores son siempre menores que los DE.
La realidad es que la desviación estándar de la media de muestras es un valor hipotético, ya que en la práctica nosotros tomamos una sola muestra. El término error estándar se utiliza porque da a entender un significado específico. La variabilidad en las estadísticas de muestras proviene de un error de muestreo debido al azar. Es decir, hay diferencias entre cada muestra y la población, y entre las diversas muestras, debido únicamente a los elementos que decidimos escoger para las muestras.
Nos dice cómo se distribuyen los valores medios de distintas muestras alrededor de la media de la población.
Significado del error estándar de la media
El SEM de la media indica cómo se distribuyen los valores medios de distintas muestras alrededor de la media de la población 
 ± 1SEM = 68.3%
 ± 2 SEM = 95.4%
 ± 3 SEM = 99.7%

-2SEM


+2SEM
0
Z = -2
Z = +2
Intervalo de confianza
42
42
El nivel de significación (NS) estadística depende del nivel de exigencia que requerimos cuando se hace una afirmación.
Cuando decimos que el NS es > 95% estamos aceptando que la probabilidad de error (PE) es < del 5%. Si el NS es > 99%, la PE es < 1% (más exigente).
Si esto ocurre …
Diferencias significativas (p < 0.05 o p < 0.01)
NO fueron al azar
El p valor me permite concluir que la probabilidad de que la diferencia obtenida haya sido por azar de muestreo es muy baja.
43
Cuando el NS es < 95%, la PE de la afirmación es > del 5% o sea que las diferencias NO fueron significativas (p > 0.05 o p > 0.01). Las diferencias existentes fueron debidas al azar.
El p valor es la probabilidad de obtener datos iguales o más extremos a los nuestros si la hipótesis nula es verdadera. Si el p valor es bajo, la hipótesis nula es poco probable, mientras que si es alto, la hipótesis nula es bastante probable.
No es nada más ni nada menos que concluir que la probabilidad de que esa diferencia haya sido por azar de muestreo es muy baja, y por lo tanto rechazamos la hipótesis nula de no diferencia y concluimos que hay un efecto.
43
valores
Xi
frecuencia
fi
n
X
Xi
fi
SD
=
=
-
-
=
å
1
)
(
2
n
X
X
i
å
=
SD
X
Xi
Z
Muestra
-
=
ES
X
i
X
Z
Población
-
=

Continuar navegando