Logo Studenta

estadistica 2014

¡Este material tiene más páginas!

Vista previa del material en texto

!
Dr. Cristián Coello	
Fisiología Médica	
UBA	
@cristiancoello	
https://sites.google.com/site/cristiancoello/home
!
⦿Comprender al hombre como un sistema que puede describirse 
mediante variables fisiológicas	
⦿Entender el concepto de variabilidad biológica	
⦿Entender las diferencias entre desviación estándar y error 
estándar	
⦿Comprender el concepto de normalidad estadística, conocer la 
diferencia entre probabilidad teórica y experimental	
⦿Entender las pruebas de significación, interpretar gráficos y 
resultados
⦿ La estadística es una ciencia con base 
matemática referente a la recolección, análisis 
e interpretación de datos, que busca explicar 
condiciones regulares en fenómenos de tipo 
aleatorio
!
⦿ Conjunto de individuos o elementos 
sometidos a una evaluación estadística, 
mediante muestreo.
⦿ Acción de escoger muestras representativas 
de la calidad o condiciones medias de un 
todo.
⦿ Implica que todos los componentes de la 
población tienen la misma probabilidad de 
ser elegidos.
⦿ Conjunto de personas que, por sus 
características genéticas, físicas o sociales, 
son más propensas a padecer una enfermedad 
determinada.
⦿ Magnitud que puede tener un valor 
cualquiera, de los comprendidos en un 
conjunto.
⦿ Media: Es el promedio de un conjunto de 
valores 	
⦿ Mediana: Es el valor de la variable que deja el 
mismo número de datos antes y después que él, 
una vez ordenados estos. 	
Es comparable al percentilo 50	
⦿ Moda: Es el valor con una mayor frecuencia en 
una distribución de datos.
Media: 	
	

 	

 	

 2, 4, 7, 10, 12 	
	

 	

 Media = 7	
!
Problema: Outliers 	
	

 	

 2, 4, 5, 7, 77	
	

 	

 	

 Media = 19
Mediana: 	
	

 	

 	

 2, 4, 7, 10, 12 	
	

 	

 Mediana = 7	
!
 	

 	

 	

 2, 4, 7, 10, 112	
	

 	

 	

 Mediana = 7
Moda: 	
!
Es el valor que ocurre con mas frecuencia	
	

 1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17 	

 	
	

 	

 Moda = 6	
!
 1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 517 	
	

 	

 	

 Moda = 6
La moda puede tener varios valores, incluso puede 
no existir.
⦿ No Numéricas: ( No se objetivan por números) 	
Color de ojos, color de piel, hábito constitucional	
⦿ Numéricas: ( Se asocian a una cuantificación 	
	

 	

 numeral)	
1. Discretas (Siempre se definen por valores enteros) n° 
de hijos, n° de cromosomas	
2. Continuas (Son las más utilizadas)	
	

 Altura, peso, colesterolemia, etc.
Cuantitativas Cualitativas
Continuas
Admiten cualquier valor	
Ej: peso, talla, glucemia
Discretas
Valor entero	
Ej: Nº hermanos, Nº de 
hijos, Nº de partos
Nominales
De nombre, sin orden	
Ej: sexo, SI/NO
Ordinales
Con orden	
Ej: Escala dolor, estadios 
Ca, grados de disnea
Clases FA FR F%
Blancas 1000 0,25 25%
Rojas 1200 0,30 30%
Negras 1800 0,45 45%
Total 4000 1,00 100%
Población de pelotas = 4000
Distribución de las frecuencias
Distribución de frecuencias
Los números indican la cantidad de veces que se 
observaron pelotas blancas, negras o rojas en una 
muestra respecto al total de observaciones.
⦿ Se la define como la relación entre los casos 
“ Favorables” sobre el número de casos 
“Posibles”
Probabilidad
Probabilidad N° de casos favorables
N° de casos posibles
=
Experimental
Teórica
Probabilidad 
⦿ ¿Cuál es la probabilidad que tiene una pareja de 
tener un hijo varón o mujer?	
Hay 2 resultados posibles ( varón o mujer)	
Probabilidad relación entre casos favorables (varón 
o mujer) valor 1 sobre el número de casos 
posibles= 2 	
Entonces = 0,5 o 50% (probabilidad teórica o a 
priori)	
Si realizamos un estudio poblacional analizamos un 
probabilidad experimental
2
1
⦿ Datos del Censo 2010	
⦿ Población total de 0 a 4 años:	
3.337.652	
!
⦿ Población con sexo masculino de 0 a 4 años	
1.697.972 = 0,508 es decir 50,8 %	
⦿ Población con sexo femenino de 0 a 4 años:	
1.639.680= 0,492 es decir 49,2 %
Población y muestra
Universo estadístico
Es el conjunto de datos de la variable en estudio 
realizada sobre toda la población
Es el conjunto de datos de la variable en 
estudio realizada sobre una parte de la 
población. 
Muestra
Cuando todos los componentes de la población han tenido la 
misma probabilidad de ser elegidos. 
Muestra 
Representativa
AL AZAR
Histograma
Pulsaciones	
/min
Frecuencia 
absoluta
Frecuencia 
relativa
Frecuencia 
relativa %
Intervalo
43-50 3 0,0028 0,28 1
51-58 28 0,0264 2,64 2
59-66 131 0,1235 12,35 3
67-74 283 0,267 26,70 4
75-82 351 0,3311 33,11 5
83-90 185 0,1745 17,45 6
91-98 64 0,0604 6,04 7
99-106 14 0,0132 1,32 8
107-114 1 0,0009 0.09 9
Total 1060 1 100
Distribución de una variable numérica
Numero de micciones Numero de personas % del total
2 3 4,5
3 40 59,7
4 15 22,3
5 6 9
6 2 3
8 1 1.5
N = 67	
N de micciones totales 236	
Media de micciones 3	
Presión arterial	
(mm Hg)
Centro del 
intervalo
F	
(individuos)
F%
97,5-102,5 100 1 0,41%
102,5-107,5 105 3 1,22%
107,5-112,5 110 6 2,44%
112,5-117,5 115 9 3,66%
117,5-122,5 120 11 4,47%
122,5-127,5 125 20 8,13%
127,5-132,5 130 31 12,60%
132,5-137,5 135 44 17,89%
137,5-142,5 140 38 15,45%
142,5-147,5 145 29 11,79%
147,5-152,5 150 25 10,16%
152,5-157,5 155 14 5,69%
157,5-162,5 160 9 3,66%
162,5-167,5 165 4 1,63%
167,5-172,5 170 2 0,81%
Total 246 100,00%
Distribución de una variable discreta continua
Histograma
1. Los valores se distribuyen en forma simétrica alrededor de un valor central que se da 
con máxima frecuencia.	
2. Este valor coincide con el promedio o media de los valores observados.	
Distribución normal
X
⦿ Número grandes de casos	
Curva de Gauss	
!
⦿ Número pequeño de casos	
Método de Student
⦿ Hace referencia a como se distribuyen los valores 
individuales alrededor del valor medio 	
!
⦿ Es un valor que sumado y restado al valor medio 
nos da el intervalo dentro del que se halla el 68% 
de los valores individuales.
X
Curva de distribución normal
-1SD +1SDX
=Χ
Σ Χ i
n
SD =
n
Σ (Χ i − Χ)2
(Χ ± 1 SD) = 0,68
(Χ ± 2SD) = 0,95
(Χ± 3SD) = 0,99
La distribución normal corresponde a la función matemática 
denominada función de Gauss
Χ ± SD
(135 ± 15) mmHg
(120-150) mmHg	
(105-165) mmHg	
 
68% valores
95% valoresINTERVALOS
N=500
( )
67,0
500
135120 2
=
−
=
SD
SD
⦿ Esta propiedad resulta especialmente interesante en la 
práctica, ya que para una distribución normal existen 
tablas publicadas a partir de las que se puede obtener 
de modo sencillo la probabilidad de observar un dato 
menor o igual a un cierto valor z, y que permitirán 
resolver preguntas de probabilidad acerca del 
comportamiento de variables de las que se sabe o se 
asume que siguen una distribución aproximadamente 
normal.
⦿ El parámetro Z nos dice cuál es la distancia entre el valor individual y 
el valor medio, medido en desvíos standard. ( por ej 1,3 veces el DS)	
!
⦿ La tabla de distribución de valores Z:	
 Nos permite estimar para cada valor de desviación relativa, el 
porcentaje de casos comprendidos entre el valor considerado y el 
valor medio
⦿ a= probabilidad de 
encontrar el valor en el 
área considerada
0,5 - a
0	
!
0,16	
!
0,025	
!
0,01
( ) SDXxZ /−=
0 ≤ P ≤ 1
Inferencia estadística
Si la muestra es representativa
Por su tamaño adecuado y	
Por su aleatoriedad en la elección de los individuos 
Se infiere que la media de la muestra y el desvío estándar calculado no difieren 
significativamente del valor medio y del desvío estándar de la población a la que pertenece
SDm = SDpΧm Χp=
Ej: Medición de la tensión arterial sistólica 
1000 personas entre 21 y 22 años
Intervalo normal: Χ ± 2 SD
120± 8 mm Hg Intervalo normal: (104-136) mmHg
En la población en estudio, la probabilidad P de encontrar una persona sana con valores de 
tensión arterial entre 104 mm Hg y 136 mm Hg es del 95%.
La probabilidad de encontrar una persona sana con valores de presión arterial por 
debajo de 104 mmHg o por arribade 136 mm Hg es del 5%.
⦿ 1) Puede deberse a una Variabilidad Biológica	
⦿ 2) Tener patologías asociadas
⦿ Cuando se estima la media de la población p a partir de 
la media de la muestra m puede generarse cierto error	
!
⦿ Para evitarlo se realiza el SEM ( Error standard de la 
media)
X
X
Χp
Distribución de valores medios
m1 m2 m3 mj
m1
m2
m3
mj
población
SEM = 
SD
√ n
Xp = media de la población
SEM= desvío estándar de los valores medios 
⦿ Es un valor que sumado o restado al valor 
medio obtenido en una muestra nos da un 
intervalo dentro del cual se halla con un 68% 
de probabilidad la media de la población a la 
cual pertenece la muestra
⦿ Determina si la media de la población p 	
Pertenece a la muestra 	
!
SEM 	
!
SEM + - nos da un intervalo del 68%
X
n
SD
X
Significado del error estándar de la media
El SEM de la media indica cómo se distribuyen los valores medios de distintas 
muestras alrededor de la media de la población 
Χ ± 1SEM = 68%
Χ ± 2SEM = 95%
Χ ± 3SEM = 99%
Χ-2SEMΧ Χ+2SEM
0Z = -2 Z = +2
Intervalo de confianza
Z = 
Χi - Χp
SEM
⦿ Cuando observamos una diferencia entre 
valores medios nos hallamos frente a dos 
posibilidades:	
1. La diferencia sea por fluctuación al azar	
2. La diferencia se debe a que son muestras que no 
pertenecen a la misma población
⦿ Comparando por ej valores medios de dos 
muestras permite establecer la probabilidad que 
pertenezcan al mismo universo estadístico.
⦿ SEM diff 	
!
Permite estimar la probabilidad de que la diferencia sea por 
azar	
Si la probabilidad es mayor al 5% P>0,05 decimos que la 
diferencia no es significativa de esta manera la diferencia se 
debe al azar	
!
Si la probabilidad es menor al 5% decimos que la diferencia es 
significativa, es decir no pertenecen a la misma población
( 22 )2()1 SemSem +
Comparación entre valores medios
Las 2 muestra 
pertenecen a la misma 
población
Hipótesis 
Nula 
Hipótesis 
alternativa 
Las 2 muestra pertenecen 
a poblaciones diferentes
Χ diff = Χ1 − Χ2 SEM diff = (SEM1)2 + (SEM2)2√
Z diff =
Χ diff
SEM diff 
Si Z > 2 aceptamos la hipótesis alternativa	
POBLACION DIFERENTE
Si Z < 2 aceptamos la hipótesis nula	
MISMA POBLACION
⦿ Z: mide la distancia en DS entre un valor dado 
y la media 	
!
!
!
⦿ t: Es homologable al Z pero para muestras 
pequeñas ( menores a 30)
( ) SDXxZ /−=
Estudios de muestras pequeñas. El test de student
 n = 1
 n = 2
 n = 3
n < 30
=Χ Σ Χ in
SDn-1 = n - 1
Σ (Χi − Χ)2i
n-1
SDn-1 SEM = 
√ n
t = 
Χi – Χ
SDn-1
n -1
P
0,40 0,20 0,10 0,05 0,01
1	
2	
3	
4	
5	
6
t1
t2
n -1 son los grados de libertad
0.1 > p > 0.05
⦿ Nos da el valor de probabilidad para valores 
comprendidos a los extremos de la media
0,5 - a
0	
!
0,16	
!
0,025	
!
0,01
n= 35 y z = 2,5 0,025 > p > 0,01
Ejemplos
 0,20 0,10 0,05 0,01
1	
2	
3	
4	
5	
6
3,078	
1,886	
1,638	
1,533	
1,476	
1,440
6.314	
2,920	
2,353	
2,132	
2,015	
1,943
12,70
6	
4,303	
3,182	
2,776	
2,571	
2,447
63,65
7	
9,925	
5,841	
4,604	
4,032	
3,707n= 5 y t = 2,5	

n = 7 y t = 2,5
0,10 > p > 0,05	
0,05 > p > 0,01
⦿ Valores de Z nos hablan de la probabilidad para 
valores comprendidos entre el dado y la media	
!
⦿ Valores de P nos habla de la probabilidad mas 
allá de la media ( a los extremos)
⦿ Sirve para valorar la eficacia o no de un fármaco	
⦿ Calcular las diferencias obtenidas y aplicar una 
suma algebraica de las diferencias	
!
⦿ Las diferencias observadas pueden deberse al	
1. Azar > 5%	
2. Eficacia de un fármaco <5%
Χ = Σ d/n 
Prueba antes-después
PACIEN
TE
ANTE
S
DESPU
ÉS
DIFEREN
CIA	
1 170 140 -30
2 200 120 -80
3 180 180 0
4 164 124 -40
5 178 168 -10
6 165 170 +5
7 190 130 -60
8 159 155 -4
9 183 127 -56
10 174 142 -32
11 205 175 -30
12 167 114 -53
13 194 118 -76
Χ = Σ d/n = -35,8
SD = Σ (Χd – d)2 / (n -1) √
SEM = SD / √n = 7,83
t = Χd / SEM = 4,6
Hipótesis 
alternativa 
Las diferencias se 
deben a la presencia 
de la droga
Grados de libertad: n-1 = 12
P < 0,001
d= 
SUMA 
DE DIF
⦿ Si la P es menor al 5% poco probable que sea 
la diferencia por azar.	
⦿ Es decir el fármaco fue eficaz
PACIENTE Método “A” Método “B” DIFERENCIA
1 250 271 +21
2 348 403 +55
3 652 648 -4
4 432 498 +66
5 227 252 +25
6 703 701 -2
7 645 665 +20
8 434 484 +50
9 182 250 +68
10 522 525 +3
Prueba con datos pareados
Los métodos A y B no son equivalentes
Χ = Σ d/n = 30,2
SEM = SD / √n = 8,73
t = Χd / SEM = 3,46
Grados de libertad: n-1 = 9
P < 0,001
⦿ Si P es menor al 5% significa que la diferencia 
no se debe al azar	
⦿ Los métodos no son equivales
Error de las determinaciones médicas
Error de apreciación Dado por la sensibilidad o precisión del instrumento o método de medida 
Error accidental 
Χ ± 2SEM *
Error sistemático
Asociado a un problema en la adquisición 
de datos. Si se conoce su valor se puede 
corregirlo
Fluctuaciones al azar por infinidad 
de factores
 *Da con 95% de probabilidad el intervalo en el que se 
encuentra el verdadero valor de la medición
Si se usa un tensiómetro de mercurio	
!
⦿ La expresión de la unidad en milímetros de 
mercurio ( puede darnos un error de 
apreciación)	
⦿ La lectura del valor ( error accidental)	
⦿ Si el tensiometro está mal calibrado ( error 
sistemático)

Continuar navegando