Logo Studenta

Final de Estadistica - Psicología UBA, Catedra Muiños

¡Estudia con miles de materiales!

Vista previa del material en texto

La ESTADISTICA sirve para hacer inferencias, generalizaciones de un conjunto pequeño de datos a uno mayor mediante la ordenación y análisis de datos
La ESTADISTICA DESCRIPTIVA sirve para describir mi muestra de la población de individuos para una mejor interpretación. Su objetivos es obtener, resumir y transformar info para su comprensión
ESTADISTICA INFERENCIAL: realiza inferencias de un conjunto menor hacia uno mayor, aporta a toma de decisiones. Me permite inferir sobre mi población 
ELEMENTOS/UNIDADES son las entidades acerca de las que se reúnen datos
POBLACION ESTADISTICA/INDIVIDUOS: conjunto de todos los elementos que cumplen una o varias características (200 empleados de una organización)
MUESTRA DE INDIVIDUOS: subconjunto de los elementos de una población de individuos (Quejas de 30 empleados)
UNIDAD DE ANALISIS: elementos que componen una población
POBLACION DE OBSERVACIONES: conjunto de todos los valores que puede tomar una variable estadística sobre la población de individuos (conjunto de nros que representa la cantidad de quejas de los 200 empleados)
MUESTRA DE OBSERVACIONES: conjunto de todos los valores que puede tomar una variable estadística sobre la muestra de individuos (conjunto de nros que representan la cantidad de quejas de los 30 empleados)
MODALIDAD: cada una de las maneras en las que se presenta una característica
VARIABLE: Cuando en la característica hay más de una modalidad, sino se llama constante
CARACTERÍSTICA: fenómeno observable en los individuos de una población 
VARIABLE ESTADISTICA: representación numérica de las diferentes características
· Cualitativa: aquella cuyos valores presentan atributos (tipos de trastornos)
· Cuasi-cuantitativa: aquella cuyos valores indican un orden o jerarquía (nivel de ansiedad, bajo-normal-alto)
· Cuantitativa: aquella cuyos valores expresan cantidades numéricas 
· Discretas: cuyos valores son puntos aislados (1;2;3) (cant. de palabras recordadas)
· Continuas puede tomar cualquier valor dentro del intervalo numérico (tiempo de reacción ante un estímulo)
CONSTRUCTO O VARIABLES COMPLEAS (memoria, ansiedad) no son directamente observables entonces se recurre a una definición OPERACIONAL DEL CONSTRUCTO
PARAMETRO POBLACIONAL: es una propiedad descriptiva de una población. Se representa en letras griegas
ESTADÍSTICO: es una propiedad descriptiva de una muestra. Se calcula a partir de la info que provee la muestra. Simbolizado en letras latinas 
ESTIMADOR: es un estadístico que se utiliza para conocer el valor de un parámetro desconocido.
MEDICION: proceso de atribuir números a las características
· NOMINAL: informan igualdad o desigualdad (psicopatologías, tipos de sangre)
· ORDINAL: refleja distintos grados en los que se presenta la característica, (nivel de ansiedad, bajo, normal, alto)
· INTERVALAR: cuenta con un 0 pero no absoluto (temperatura)
· RAZON: cuenta con un 0 absoluto (centímetros)
DISTRIBUCIÓN DE FRECUENCIAS: agrupaciones de los datos en tablas o gráficos para mostrarlos de manera más resumida 
Cumple tres funciones:
· Proporciona una reorganización y ordenación racional de los datos
· Ofrece info necesaria para hacer representaciones graficas
· Facilitar los cálculos necesarios para obtener estadísticos muestrales
Propiedades
· Medidas de tendencia central
· Medidas de variabilidad
· Asimetría 
· Curtosis
RESUMENES ESTADISTICOS: Sirven para describir lo que pasó en la muestra con respecto a la variable que nos interesa estudiar. Los resúmenes estadísticos describen cada una de las características de la muestra
Medidas de posición, MTC, Medidas de variabilidad, Asimetría, Curtosis 
MATRIZ DE DATOS: disposición de números donde cada fila representa la info de interés, cada columna es lo que se ha seleccionado para estudiar una variable y cada celda es la modalidad de la variables
· FR ABSOLUTA: Cantidad de veces que aparece un valor de la variable en los datos. De un valor Xi y se simboliza por ni al nro de veces que se repite Xi en la muestra
· FR RELATIVA: Es el cociente entre la Fr Abs y el tamaño de la muestra. De un valor Xi, se simboliza Pi al ni/n. Divido la Fr abs. Por el nro total de la muestra
· FR PORCENTUAL: para sacar %, es la Fr Rel. X 100, se simboliza Pi%
· ACUMULADA es la cantidad de observaciones acumuladas hasta determinada modalidad de la variable
· FR AB ACU: de un valor Xi, se simboliza na al nro de veces que se repite en la muestra ese valor Xi o cualquiera inferior
· FR REL ACU: de un valor Xi, se simboliza Pa al cociente entre su Fr Ab Acu y el tamaño de la muestra. Pa=na/n
· FR POR ACU: es la Fr Rel. Acu. Multiplicada por 100, se simboliza Pa%
GRAFICOS: se usan para representar las distribuciones de frecuencias y para su fácil interpretación 
· Variables cualitativas a nivel nominal
· DIAGRAMA CIRCULAR/PICTOGRAMA
· Variables cuasicuantitativas a nivel ordinal: son los mismos que para las cualitativas, pero se prefiere el:
· DIAGRAMA DE RECTANGULOS/BARRAS: permite ver el orden de las variables
En Y las frecuencias, en X los valores de la variable en cuestión
· Variables cuantitativas discretas
· DIAGRAMA DE BARRAS/BASTONES: igual al de rectángulos, pero cambia la variable. En vez de rectángulos tiene líneas
Eje X los valores de la variables, en Y las frecuencias
· POLIGONO DE FRECUENCIAS: se obtiene uniendo los extremos superiores de las barras
· DIAGRAMA DE TALLO-HOJA: es una forma de visualizar conjuntamente los datos (originales) junto con la forma de la distribución 
· Variables cuantitativas continuas
· HISTOGRAMA: similar al de rectángulos, las barras se encuentran unidas. En Y las Fr (en general relativa), en X los intervalos
· POLIGONO DE FR: se realiza a partir del histograma. Se unen los extremos
· Comparación de distribución de frecuencias
· DIAGRAMA DE RECTANGULOS (O BARRAS) ADYACENTES: misma variable en dos grupos distintos
MEDIDAS DE POSICION: son índices diseñados para revelar la situación de una puntuación con respecto al grupo. (Ordinal +)
Indican que porcentaje de casos de la muestra queda por debajo de un valor determinado de la variable
· CENTILES: son 99 puntuaciones que dividen a la distribución en 100 partes. Ck
· DECILES: son 9 puntuaciones que dividen a la distribución en 10 partes. Dk
· CUARTILES: son 3 puntuaciones que dividen a la distribución en 4 partes. Qk
El VALOR K es el RANGO PERCENTILAR, es el porcentaje de observaciones que es superado por un valor de la variable (Centiles)
MEDIDAS DE TENDENCIA CENTRAL: son medidas de resumen. Hacen referencia a la magnitud general de observaciones
· MEDIA ARITMETICA (promedio de los datos): es la suma de los valores observados dividida por el total de la muestra. Para variables cuantitativas (intervalar+) 
1. La suma de las puntuaciones diferenciales con respecto a su media es igual a 0 (n-media y las sumo)
2. La suma de los cuadrados de las desviaciones de unas puntuaciones con respecto a su media es menor que con respecto a cualquier otro valor (n-media, sus resultados elevados a las 2 y las sumo)
3. Si sumamos una constante a un conjunto de puntuaciones, la media quedará aumentada en la misma constante (n+ constante, su resultado, hago el promedio again, es lo mismo que media+ constante)
4. Si multiplico por una constante a un conjunto de puntuaciones, la media quedara multiplicada por esa misma constante (igual anterior)
5. Media ponderada: la media total de un grupo de puntuaciones puede obtenerse ponderando las medias parciales a partir de los tamaños de los subgrupos en que han sido calculadas
6. Una variable definida como la combinación lineal de otras variables, tiene como media la misma combinación lineal de las medias de las variables intervinientes en su definición 
· MEDIANA Me: Es el centro de la distri. Representa las puntuación que es superada por la mitad de las observaciones. Es el C50 y el Q2. Para Cuasi y Cuanti (Ordinal +)
· MODA Mo: es el valor de la variables con mayor Fr Ab. Para Cuali, Cuasi y Cuanti (Nominal+)
La media es sensible a las puntuaciones extremas no compensadas
Se prefiere la medianaantes de la moda cuando esta medida en escala ordinal
Se prefiere la moda antes que la mediana cuando esta medida en una escala nominal
MEDIDAS DE VARIABLIDAD: miden la variabilidad de la distribución de Fr. Miden la dispersión o heterogeneidad de los datos
Grado de concentración de las observaciones en torno a la media
· VARIANZA: Es la suma de las puntuaciones diferenciales al cuadrado. Se usa para comparar el grado de dispersión de dos o más conjuntos de valores en una misma variable. A + varianza o desvió, - representativa es la media del grupo. Para calcular la varianza necesito la media y el desvió típico S2. Variables Cuantitativas
 S2=
· La varianza y al desviación son valores esencialmente positivos
· Si sumamos una constante al grupo de puntuaciones, su varianza no se altera
· DESVIÓ TIPICO: mide cuan cerca o lejos están los datos de la media. Es la raíz de la varianza Sx. Cuanto más bajo el desvió + homogénea la distri (intervalar, razón). Variables Cuantitativas
· COEFICIENTE DE VARIACION: mide el peso relativo que tiene la media de cada grupo. Se usa para comparar dos grupos con medias distintas (peso-altura). Cuanto más bajo el CV + homogénea la distri CV=.100. Variables cuantitativas (Razón)
No toman como referencia a la media
· RANGO O AMPLITUD: se obtiene hallando la diferencia entre los valores extremos observados. AT= Xmax-Xmin
· RANGO SEMI-INTERCUARTIL: cuando en las puntuaciones hay algún valor extremo que puede distorsionar la representatividad de la varianza Q=Q3-Q1/2. La mediana es Q2 
· ENTROPIA: Mide el grado de desorden de un sistema, solo variables cualitativas. Cuando no hay variabilidad la entropía es 0. A – entropía más homogénea la muestra.
MEDIDAS DE ASIMETRIA, CURTOSIS Y P. TIPICAS
GRADO DE ASIMETRIA: hace referencia al grado en que los datos se reparten por encima o por debajo de la MTC
· ASIMETRIA -: la media es > a la moda y da valores menores que 0
· ASIMETRIA +: la media es < a la moda y da valores mayores que 0
· SIMETRICA: coinciden los tres índices de tendencia central
INDICE DE CURTOSIS: Es el grado de apuntalamiento de la curva que representa a la distribución (la punta). Se basa en el promedio de las típicas elevadas a la 4 potencia
· PLATICURTICA: si es negativo su apuntalamiento, es menor que el de la distri normal
· MESOCURTICA: si en la distri el índice es igual a 0, tiene un grado de curtosis similar al de la distri normal
· LEPTOCURTICA: si es positivo su apuntalamiento, mayor que el de la distri normal 
P. DIFERENCIALES: indican si la puntuación es superior o inferior o igual a la media. Para pasar a típicas es 
P. TIPICAS: indican el nro de desvíos que esa observación se separa de la media del grupo, se representa Z. Z=. Tiene dos características
· La media de las puntuaciones típicas es 0
· La varianza y desvió es 1
ESCALAS DERIVADAS: surgen cuando transformamos P. Típicas en otras que sean equivalentes. A la P. Típica la multiplico por una constante (a) y le sumo otra constante (b)
· T: puntuaciones en que la media es 50 y la DT 10
· S: puntuaciones en que la media es 5 y la DT 2
· CI: puntuaciones en que la media es 100 y la DT 15
ESTADISTICA INFERENCIAL: proporciona métodos para extraer conclusiones sobre las poblaciones a partir de sus muestras controlando el margen de error que se puede cometer. Me permite inferir sobre mi población 
MODELO: construcción teórica, representación simplificada de la realidad
La PROBABILIDAD de un valor de una variable puede interpretarse como una medida de la posibilidad de que dicho valor sea observado. Es la Fr Rel. 
DISTRIBUCIÓN DE PROBABILIDADES es un modelo de distribución de Fr Rel. Teóricas
· Distribución binomial X~B (n;p) tiene una variable dicotómica (Bernoulli) que admite dos valores.
Son variables cuantitativas discretas que cuentan la cantidad de éxitos que ocurren en n observaciones de una variable dicotómica de parámetro P
El parámetro P es la probabilidad de obtener éxito en cada uno de los ensayos de la variable dicotómica
· Condición de estabilidad: la probabilidad de éxito debe permanecer constante en las n observaciones de la variable dicotómica
· Condición de independencia: la probabilidad de éxito en una observación no aumenta ni disminuye si se conoce el resultado de otra observación 
Ej: probabilidad de alcanzar el éxito terapéutico (parámetros n;p)
· Distribución normal X~N (u;o) son variables cuantitativas continuas con parámetros u (media poblacional) y o (desvió poblacional). Los valores de mayor frecuencia están a +- un desvió. La distancia entre los centiles es menor cuanto más cerca a la media están
· Su distribución es la campana de Gauss (mesocúrtica)
· Es simétrica respecto a un valor central, coinciden la media, mediana y moda.
· Es asintótica respecto al eje de abscisas (nunca llega a tocar los ejes)
· La simetría de este modelo es P(Z<-1); P(Z>1). El C50 es 0 en valor Z. Por probabilidad es 0.5
Ej: puntajes en la escala de ansiedad
Tipificacion: Z= Destipificacion X=Z.o+u
MEDIA MUESTRAL: es una variable y tiene su propia distribución de probabilidad
DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO: son los valores de un estadístico con probabilidad de verificación 
DISTRIBUCIÓN DE LA MEDIA MUESTRAL: proporciona todos los valores que puede asumir para muestras de tamaños n. X~N (u; )
· Variable (media muestral) de muestras aleatorias n
· U: media poblacional de 
· O: desviación típica poblacional de (error típico)
· El centro de la distribución muestral de es el mismo de la distribución poblacional de U=UX
· La varianza de es igual a la de X dividida por n. O = O /n
· El desvió de es igual al de X dividida por la raíz cuadrada de n. O = O/
TEOREMA CENTRAL DEL LIMITE: si no conozco si mi muestra tiene distribución normal, la media muestral va a ser aproximadamente normal si mi n>30
T DE STUDENT: se utiliza cuando el desvió poblacional es desconocido. Es una distribución de probabilidad.
CONSTRASTE DE HIPÓTESIS: es un proceso de decisión en el que una hipótesis formulada en términos estadísticos es puesta en relación con los datos empíricos para ver si es o no compatible con ellos
HIPÓTESIS ESTADISTICA: es una afirmación sobre la forma de una o más distribuciones de probabilidad
HIPÓTESIS CIENTIFICA: es una afirmación sobre una o varias características de una población
Relación: mientras una hipótesis científica se refiere a algún aspecto de la realidad, una hipótesis estadística se refiere a algún aspecto de una distribución de probabilidad
HIPÓTESIS NULA H0: se somete al contraste, es en general una afirmación concreta sobre la forma de la distribución de probabilidad
HIPÓTESIS ALTERNATIVA H1: es la negativa de la nula, es lo que busca el investigador
ERRORES
· TIPO I: si rechazamos una H0 que puede ser verdadera
· TIPO II: si conservamos una H0 que puede ser falsa
REGLA DE DECISIÓN
· P<α: rechazo H0
· P>α: Conservo H0
α Nivel de significación, zona de aceptación
El VALOR P es la probabilidad de rechazar H0 de acuerdo al valor obtenido con el estadístico
SUPUESTOS: conjunto de afirmaciones que se necesita establecer
· Tipo de distribución de X
· Desvió de Sigma
· Muestra aleatoria
TIPO DE CONTRASTE: es el tipo de hipótesis que deseamos contrastar lo que determina el tipo de contraste
· BILATERAL H0: U=U0 H1: U≠U0
· UNILATERAL DERECHO H0: U=U0 H1: U>U0
· UNILATERAL IZQUIERDO H0: U=U0 H1: U<U0
ESTADÍSTICO DE PRUEBA: es un indicador numérico calculado a partir de la info de la muestra. Brinda información empírica relevante sobre la afirmación de H0, y posee una distribución muestral conocida (z o t-student) 
CONTRASTE SOBRE UNA MEDIA CON DESVIÓ CONOCIDO
E~N (0;1) H0: U=U
· La variable X se distribuye normalmente
· El desvió poblacional es conocido
· Muestra aleatoria
Ej: Puntaje promedio de la cantidad de síntomas experimentados en el último ataque de pánico 
CONSTRASTE SOBRE UNA MEDIA CON DESVIÓ DESCONOCIDO 
E~T (n-1)
· La variable X se distribuye normalmente
· El desvió poblacional es desconocido
· Muestra aleatoria
CONSTRASTESOBRE DOS MEDIAS INDEPENDIENTES
E~T (n1+n2-2). Se trabaja con dos poblaciones distintas de las que se extrae dos muestras aleatorias de tamaños n1 y n2. La comparación de medias se hace mediante su resta 
· Las variables X1 y X2 se distribuyen normalmente
· Los desvíos poblacionales son desconocidos e iguales
· Las muestras son aleatorias e independientes
Ej: Hombres y mujeres cuanto puntúan en motivación por el tratamiento
CONTRASTE SOBRE DOS MEDIAS APAREADAS (RELACIONADAS)
E~T (n1+n2-2). Son apareadas cuando es el mismo grupo de sujetos evaluados en dos momentos 
· La variable D se distribuye normalmente con media uD
· Desvió desconocido
· Muestra aleatoria
Ej: Ansiedad en mujeres PRE y POST parto
TEST PARA UNA PROPORCION
E~N (0;1) π=π. Se evidencia cuando habla de un %
· La variable X es dicotómica con parámetro π
· La muestra es aleatoria 
· Las observaciones son independientes con la misma probabilidad de éxito
Ej: El 30% de los pacientes con TAG presenta a su vez Trastorno de Estrés Postraumático
COEFICIENTE DE CORRELACION DE PEARSON: representado por la r, mide la relación lineal entre dos variables cuantitativas. Puede valer entre -1 y +1.
INTERPRETACION R DE PEARSON
· CUANTIA: refiere al grado de la relación. Un valor +-1 indica una relación perfecta. Cuanto mas se acerca a 0 más débil es
· SENTIDO: refiere al tipo de relación. Un signo + indica una relación directa o positiva. Un signo – indica relación inversa o negativa
DIAGRAMAS DE DISPERSION
· DIRECTA PERFECTA: todos los puntos perfectamente alineados R=1 (imposible en psi)
· DIRECTA O POSITIVA: los puntos tienden a ubicarse en torno a una recta creciente, no llega a R=1 (A mas horas de estudio, mayor nota)
· INVERSA PERFECTA: todos los puntos alineados en recta decreciente R=-1
· INVERSA O NEGATIVA: las variables covarian en sentidos contrarios, no llega a R=-1. A valores bajos de una, altos de la otra (Mayor depresión, menor desempeño ¿?)
· LINEAL O NULA: un R de aproximadamente 0. Hay dos posibilidades
· Las dos variables son independientes. No están asociadas de ninguna manera
· Las dos variables están relacionadas, pero no de forma lineal 
· VARIABLES IGUALES: siempre será R=1 (Ansiedad con ansiedad)

Continuar navegando

Materiales relacionados

44 pag.
Estadistica Descriptiva

SIN SIGLA

User badge image

Vale Clau

15 pag.
1_Estadistica descriptiva - Eliana Benavides

User badge image

Desafío COL y ARG Veintitrés

43 pag.
Bioestadística-Variables

SIN SIGLA

User badge image

Hernán Samper

68 pag.
Resumen_Probabilidad_y_Estadistica

SIN SIGLA

User badge image

haydee_sisu_1