Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Dr. Guillermo Pastor Morales Romero SEMINARIO DE ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EDUCACIONAL Población y Muestra UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio Nacional Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Agenda Población y muestra. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Unidad de análisis Llamada también unidad de observación, es cada uno de los elementos a observar, que en forma conjunta la componen la población o muestra, objeto de estudio. Pueden ser objetos, personas, animales, organizaciones u otros de existencia abstracta o tangible. Ejemplo Un profesor mayor de 40 años, perteneciente a la UGEL Nº 2. Un colegio de adultos de la zona de la Victoria. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Población o universo En un conjunto de N elementos ( personas, animales, objetos, materiales, instituciones organismos historias clínicas, etc.) que verifican una definición buen determinada y no diferenciada entre si. Puede ser finita o infinita. Ejemplo: Población finita: Profesores mayores de 40 años, pertenecientes a la UGEL Nº 2 Población infinita: Los peces de las 200 millas peruanas ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos …Población o universo La población debe limitarse claramente entorno a sus características de contenido, lugar, espacio, volumen y tiempo. Ejemplo. Empresas proveedoras del municipio de Lima. Los medios de información de Lurín. Los alumnos de la I.E. Juan Velasco de Lima. Estado civil de los pobladores de la Urb. Señor de los Milagros. Las edades de los estudiantes de la Facultad de Ciencias. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Unidad de Muestreo Es el elemento utilizado para seleccionar una muestra. En muchos casos la unidad de muestreo y la unidad de análisis son las mismas. Ejemplo Si se quiere estudiar el desarrollo del pensamiento lógico matemático en niños del nivel primario, no podría tener información sobre cuantos son, donde viven, como se llaman, por lo que es difícil extraer una muestra de niños. El investigador deberá tomar como muestra a las I.E. de nivel primario, para llegar a niños del nivel primario. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos …Unidad de Muestreo Sin embargo, para el ejemplo anterior para el estudio del desarrollo del pensamiento lógico matemático en niños del nivel primario, también se debe considerar como factores a los docentes y a los padres. Por esta razón debe hacerse un muestreo estratificado en cada I.E. seleccionada. Entonces, a la I.E. se le llama: Unidad compuesta o primaria. A los niños, docentes y padres: Unidades de muestreo elementales. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Muestra Conjunto de unidades primarias que debe ser representativa y tener un tamaño mínimo apropiado, del cual pueden hacerse inferencias sobre la población. Puede contener unidades de muestreo primarias. Que comprenda parte de una población y no en su totalidad. (5% a 20% del universo total). Cuando el universo es muy dinámico la muestra debe ser mayor. Sea representativo. Las distintas variedades y matices del universo estén presentes proporcionalmente en la muestra. El objetivo es hacer inferencias ( deducciones) sobre el universo. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Parámetro Es una medida descriptiva que resume las características de una población. Estadístico Es un valor que se calcula en base a los datos que se toman como muestra, que se usa para estimar el valor del parámetro. El valor del estadístico es conocido y varía de acuerdo a la muestra tomada. ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Población (Parámetros) Muestra (Estadísticos) P p μ x σ2 s2 Donde P: Proporción poblacional μ : Media poblacional σ2: Varianza de la población p: Proporción muestral x: Media muestral s2 : Varianza de la muestra ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Error Error de muestreo Cuando se trabaja con una muestra y se calcula como la diferencia que existe entre el valor que se quiere calcular en la muestra y el valor que existe en la población. Ejemplo 0.01 (error de muestreo) Se debe estimar el error (E). Por ejemplo máximo error permisible 0.05 (5%). Población Muestra μ=16.7 σ2= 0.35 s2= 0.36 ‹Nº› Taller de Estadística Aplicada Población y Muestra Términos básicos Error Error no muestral Comprende los sesgos y equivocaciones en cualquiera de las etapas desde la recolección de datos hasta la obtención de resultados. ERROR = Error no muestral + error de muestreo ‹Nº› Taller de Estadística Aplicada Obtención de la muestra La muestra se deriva de: Definición del problema Definición de los objetivos Definición de las variables Determinación del universo y de la población en relación a los objetivos de la investigación Estimaciones de los posibles sesgos de la investigación ‹Nº› Taller de Estadística Aplicada Tipos de Muestreo ‹Nº› Taller de Estadística Aplicada Muestreo probabilístico Simple Sistemático Muestreo no probabilístico De juicio o criterio Bola de nieve Estratificado Por conglomeración Por racimos De etapas múltiples Por áreas Conveniencia (Intencional) Por cuotas Muestreo aleatorio o probabilístico Muestreo Aleatorio Simple Mecanismo ideal para elegir la mejor muestra posible; debe cumplir las condiciones: Cada elemento de la población tiene la misma probabilidad de ser escogido. Todas las posibles muestras del tamaño muestral (n) tienen la misma probabilidad de ser seleccionadas. Dos formas: Muestreo aleatorio con reposición Muestreo aleatorio sin reposición Conveniente para poblaciones homogéneas Poblaciones infinitas o finitas. ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Aleatorio Simple Ejemplo: ¿Cómo seleccionar una muestra? Elaborar una lista con todos los nombres de la población. Elaborar una “papeleta” o “bolilla” con cada nombre. Mezclar y extraer las n papeletas o bolillas. Este procedimiento cumple las dos condiciones antes planteadas. ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Aleatorio Simple En la práctica. ¿Cómo seleccionar una muestra? Numerar todos los sujetos de la población. Obtener lista de números aleatorios (mediante el uso de Microsoft EXCEL). Ejemplo. Elegir una muestra de 20 alumnos de una lista de 100 estudiantes de primer año de secundaria. Copiar en 20 celdas la formula: =ENTERO(ALEATORIO()*100) ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Aleatorio Simple Otro procedimiento. Ejemplo: Una población N = 150 y una muestra n= 10 P = 10 / 150 = 1 / 15 El procedimiento consiste en enumerar los elementos de la población Se usa la tabla de números aleatorios. Si N = 150 en la tabla de números aleatorios se seleccionan 3 columnas por que tiene 3 dígitos, y se busca desde 001 a 150 La muestra tomada es sin reposición , es decir si un número se repite varias veces solo se tomará una sola vez). Arbitrariamente tomamos un numero aleatorio por ejemplo el que se encuentra en A(1,1) (fila=1 y columna=1) De ahí tomamos los restantes hacia abajo (cuyos tres dígitos sean menores que 150), en este caso se encuentra : 124 127 62 118 123 89 9 94 71 61 ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico Muestreo Sistemático Este procedimiento exige, numerar todos los elementos de la población, se eligen de la población a intervalos uniformes a partir de un listado ordenado (Poblaciones homogéneas). Ejemplo Tamaño de la Población N=1000 Tamañode la muestra n=100 Tamaño del intervalo k=N/n = 1000/100 = 10 Luego: 1 2 3 4 … … 1000 Arranque del sorteo, se elije al azar Intervalo k=N/n k=N/n = 1000/100=10 Muestra 3,13,33,43,53,… ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Sistemático Ejemplo Al elegir una muestra de 80 alumnos de 1600 ingresantes a una universidad, se tiene: k=1600/80=20. El primero se elige al azar un alumnos de los 20 primeros de la lista, supongamos que el alumnos elegido es e 15. Entonces la muestra estará compuesta por: 15,35,55,75,95,…,1575. ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico Muestreo Estratificado La estratificación suele producir un límite más pequeño para el error de estimación. El costo por observación en la encuesta puede ser reducido mediante la estratificación de los elementos en grupos adecuadamente elegidos. Pasos Definir la población de estudio Determinar tamaño de muestra requerido Establecer los estratos o subgrupos Determinar la fracción total de muestreo por estratos dividiendo el tamaño del estrato entre el tamaño de la población de estudio Multiplicar la fracción total de muestreo por estrato por el tamaño de la muestra para obtener la cantidad de unidades de análisis de cada estrato que se integran a la unidad muestral. ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Estratificado …Pasos Selección y extracción de la muestra aplicando el procedimiento de muestreo aleatorio simple. Médicos 230 Enfermeras 470 Psicólogas 10 Nutricionistas 15 Obstetricias 10 Tecnólogos 32 Farmacéuticos 5 Total 772 P=ni/N p 0.298 0.609 0.013 0.019 0.013 0.041 0.007 1.000 ni=p.n ni 23 47 1 1 1 3 1 n=77 ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Estratificado Ejemplo: En este ejemplo haremos uso de la fracción de muestreo Diseñamos un cuestionario para indagar las áreas de una ciudad sobre uso de internet. Los cuestionarios se aplicarán a una muestra de sujetos adultos: varones y mujeres – de más de 21 años de edad, y que vivan en una casa o departamento propio o rentado de la ciudad. La población es de N=500 manzanas de la ciudad, está dividida por la previos estudios de acuerdo a 4 estratos socioeconómicos, que categoriza las 500 manzanas según el ingreso mensual promedio de sus habitantes de manera que se distribuyen como sigue: Estrato Número de manzanas 1 50 2 170 3 200 4 80 N=500 ‹Nº› Taller de Estadística Aplicada Muestreo aleatorio o probabilístico …Muestreo Estratificado Solución Para una muestra de tamaño 90, tenemos el factor de estratificación fn=90/500 = 0.18 Luego procedemos de la siguiente manera: Estrato Número de manzanas H=0.18 Muestra 1 50 (0.18) 9 2 170 (0.18) 31 3 200 (0.18) 36 4 80 (0.18) 14 N=500 n=90 ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra Definir el tamaño de la muestra Definir la menor cantidad de unidades muestrales pero suficientes. Criterios Recursos disponibles Plan de análisis que fija el tamaño mínimo Determinar si la población es finita o infinita Lo importante no es la proporción que la muestra representa del total de la población, sino en tamaño absoluto de la muestra. Por ejemplo, si se tiene 100 individuos, se debe tomar al menos el 30%. Pero si la población tiene 40000 individuos, una muestra de 30% representará el 12000, el 10% representará el 4000 casos y el 1% dará una muestra de 400. En este caso lo más adecuado sería una muestra del 1%. ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra Observación importante Si la población es homogénea se requiere pocos elementos en la muestra y si la población es heterogénea se requiere un mayor número de elementos. Para establecer una fórmula del tamaño de muestra se requiere saber el tipo de parámetro que se desea estimar (Media o Proporción), es decir, si el interés es estimar una media aritmética se requiere una fórmula específica y si se quiere estimar una proporción se considera otra fórmula. Para nuestro estudio hacemos uso de las fórmulas para calcular el tamaño de la muestra ( proporción) ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra A. Cuando la varianza muestral (s2) es conocida: Para poblaciones infinitas o tamaños de población desconocida: Para poblaciones finitas (N) o conocidas: ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra B. Cuando la varianza muestral (s2) es desconocida: Para poblaciones infinitas o tamaños de población desconocida: Para poblaciones finitas (N) o conocidas: ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra Donde: Una población es desconocida o infinita cuando no se expresa en número total de los elementos que lo conforman. n= Tamaño de la muestra Z = Nivel de confianza N.C. : 90% 95% 99% Z : 1.64 1.96 2.57 E= Error de la estimación P= Es la proporción de la característica de interés Q= 1 – P 2: Es la varianza de la población, si no se conoce se hace una estimación con una muestra piloto. s2: Es la varianza de la muestra (estimador de la varianza poblacional). d: Es el margen de error permisible. Establecido por el investigador. Expresado en decimales. Ejemplo. Si es el 2% entonces (0.02) ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra Ejemplo 1: Se desea conocer el tamaño de la muestra para estimar el porcentaje de hogares pobres en una provincia, de un estudio preliminar se sabe que el 20% son hogares pobres. Se desea estar seguro en un 95% que la proporción muestral se halle dentro del 5% de la proporción poblacional. Sol. No se conoce la varianza muestral (s2). No se conoce la Población (N) Donde: Nivel de confianza Z = 1.96 (95%) N.C. : 90% 95% 99% Z : 1.64 1.96 2.57 E=0.05 (5%) Es el error muestral permisible P= 0.2 (20%) Es la proporción de la característica de interés ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra Ejemplo 2: Estimar el tamaño de la muestra de estudio para una población de 120 estudiantes de primer año de educación secundaria. Solución. No se conoce la variación muestral. Población finita. N= 120 Z=1,96 (para un nivel de confianza al 95%). P= 0,5 ( asumida por el investigador) Q= 1-P = 0,5 d = 0,1 (asumida por el investigador) ‹Nº› Taller de Estadística Aplicada Selección del tamaño de la muestra Ejemplo 3: Interés: Conocer la proporción de estudiantes que tienen bajo rendimiento académico en la UNE Facultad de Ciencias. De un estudio preliminar se ha determinado que la proporción de alumnos que tienen bajo rendimiento es de 30%. Número de estudiantes N=1800. Solución: No se conoce la varianza muestral. Se conoce el tamaño de la población. Grado de confianza del 95%, por consiguiente, Z=1.96. P=0.3 El error absoluto que se toma en cuenta es de E=0.05 Luego: ‹Nº› Taller de Estadística Aplicada Práctica dirigida 4 Formular el título de su proyecto de investigación (Identificar las variables y sub variables). Determinar el tipo de investigación Determinar la población de estudio. Determinar la muestra de estudio. Determinar si es estratificado. Hallar el tamaño de la muestra. Si estratificado hallar el factor de muestreo (fm=n/N) y determinar el tamaño en cada estrato. Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada 16 = x 2 2 2 d S Z n = 2 2 2 2 2 ) 1 ( S Z N d S NZ n + - = 2 2 d PQ Z n = PQ Z N d PQ NZ n 2 2 2 ) 1 ( + - = 2 2 E PQ Z n = 246 86 . 245 ) 05 . 0 ( ) 2 . 0 1 )( 2 . 0 ( ) 96 . 1 ( 2 2 » = - = n PQ Z N d PQ NZ n 2 2 2 ) 1 ( + - = ) 5 , 0 )( 5 , 0 ( ) 96 , 1 ( ) 1 120 ( ) 1 , 0 ( ) 5 , 0 )( 5 , 0 ( ) 96 , 1 ( 120 2 2 2 + - = n 59 , 53 1504 , 2 248 , 115 = = n 53 » n 274 ) 7 . 0 )( 3 . 0 ( ) 96 . 1 ( ) 1799 ( ) 05 . 0 ( )7 . 0 )( 3 . 0 ( ) 96 . 1 )( 1800 ( ) 1 ( 2 2 2 2 2 2 = + = + - = PQ Z N d PQ NZ n
Compartir