Logo Studenta

Sesión 5_ Base de datos

¡Este material tiene más páginas!

Vista previa del material en texto

Elaboración de la Base de datos
Distribución de frecuencias de datos de variable cualitativa y cuantitativa discreta y continua. Elaboración de tablas y gráficos. Interpretación
(Aplicaciones con software estadístico o EXCEL). 
Mg. 
@ucvvirtual.edu.pe
¿Qué es una base de datos?
Según Gómez, M (2013) una base de datos es un conjunto de información (un conjunto de datos) relacionada que se encuentra agrupada o estructurada.
Base de datos en SPSS
https://www.youtube.com/watch?v=rNXniau2J-g
Según la variabilidad de los datos almacenados: Estadísticas o dinámicas.
Según el contenido: Bibliográficas, de texto completo o directorios
Según el formato: Referenciales: (referencias bibliográficas, enlaces al texto) 
Ejm. Scopus, Medline, etc.
Además pueden ser públicas o privadas, y estar online.
Tipo de base de datos
¿Cómo hacer nuestra base de datos?
Los instrumentos de medición deben representar a las variables de investigación. Cuyas respuestas se obtienen, codifican y transfieren a una matriz o base de datos y se preparan para su análisis mediante un paquete estadístico para computadora
Metodología de la investigación. Sampieri pág. 197
Ejemplo base de datos en Excel
Ejemplo base de datos en SPSS
Vista de datos: son similares a las que se encuentran en aplicaciones de hojas de cálculo
Vista de variables: Contiene descripciones de los atributos de cada variable del archivo de datos. 
Elaboración
base de datos
Codificación de preguntas cerradas: Asignando un valor a cada respuesta dada. 
Codificación de preguntas abiertas y semiabiertas: estableciendo clases de respuestas y asignando códigos numéricos a cada respuesta.
0 1
1 2
1 2 3
3 2 1
Elaboración base de datos
Elaboración base de datos
Obtenemos los totales de puntajes de las dimensiones y/o variables 
Puntaje máximo en la dimensión y/o variable:
6 ítems x 3 puntos= 18 puntos 
Puntaje mínimo en la dimensión y/o variable:
6 ítems x 1 punto= 6 puntos 
La variable puede especificar el nivel de medición como escala; ejm: Estrategias didácticas puede ser Buena, regular o mala.(3 niveles)
=SI(H5<=10;"Mala";SI(H5<=14;"Regular";SI(H5<=18;"Buena")))
Use la función SI, una de las funciones lógicas, para devolver un valor si una condición es verdadera y otro si es falsa. Por ejemplo:
Hernández, Fernández y Baptista (2014) por último, las variables de la investigación son las que nos interesan, ya sea que estén compuestas por uno, dos, diez, 50 o más ítems. El primer análisis es sobre los ítems, únicamente para explorar; el análisis descriptivo final es sobre las variables del estudio. (p. 283).
Distribución de frecuencias de datos de variable cualitativa y cuantitativa discreta y continua. 
Para organizar, resumir y tener una idea del comportamiento de un conjunto de datos correspondiente a una variable cualitativa o cuantitativa discreta y continua, es conveniente presentarlos en una tabla de distribución de frecuencias o en gráficos en donde se aprecien los valores posibles de la variable y el número de veces o el porcentaje de veces que se repite cada valor.
¿Que son las distribuciones de frecuencias?
Son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc.
Necesidad de resumir la información. Organizar para distinguir patrones y tendencias y llegar así a conclusiones lógicas.
Una forma de organizar un conjunto de datos es clasificarlos en categorías o clases y luego contar cuántas observaciones quedan dentro de cada categoría en frecuencias y porcentajes.
Definición y uso
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
Frecuencias absolutas
 …. N
La frecuencia es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos, se puede expresar en tantos por ciento y se representa por la hi.
La suma de las frecuencias relativas es igual a 1, cuando se expresa en decimal y a 100 cuando se expresa en porcentaje 
Frecuencias relativas
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi
Frecuencia absoluta acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el numero total de datos. Se puede expresar en tantos por ciento. Se representa por Hi
Frecuencia relativa acumulada
Si la variable estudiada es cualitativa, de la cual se observan categorías C1,C2,...,Ck, la distribución de frecuencias se presenta en una tabla de manera similar a la variable cuantitativa; en la primera columna se colocan las categorías de la variable, seguidas de las columnas correspondientes a las frecuencias absolutas (fi), frecuencias relativas (hi) y porcentajes (hi%). En este caso no tiene sentido calcular las frecuencias absolutas acumuladas y las relativas acumuladas, porque las categorías de la variable no tienen un único ordenamiento natural como lo tienen las variables cuantitativas.
Distribución de frecuencias para
variables cualitativas
Ejemplo
A 30 estudiantes de maestría de la UCV, además del número de hijos se les pidió la información sobre el conocimiento de otro idioma (conoce y no conoce), como se muestra a continuación. Se desea presentar los datos en una tabla de distribución de frecuencias.
Solución
Aplicando lo descrito en la presente sección, directamente mostramos la tabla solicitada.
Para la presentación de las distribuciones de frecuencias de las variables cuantitativas se acostumbra usar las llamadas tablas de distribución de frecuencias y para su elaboración se recomienda:
1. Identificar el tipo de variable: cuantitativa discreta o continua.
2. Determinar el mayor ( Xmax) y el menor (Xmin) valor del conjunto de datos para luego hallar el rango R donde R= Xmax -Xmin
Distribución de frecuencias para
variables cuantitativas
 el rango es pequeño, entonces trabajar con los valores originales ordenados de la variable;
 el rango es grande, entonces trabajar con los datos ordenados y agrupados en intervalos de clase, teniendo en cuenta que lo que se gana en manejo e interpretación de los datos al agruparlos en intervalos de clase, lo perdemos en precisión al no trabajar con los datos originales. 
Si la variable es cuantitativa discreta y: 
Ejemplo
Se seleccionó una muestra de 30 alumnos del doctorado de la Facultad de Educación de la UCV se muestra a continuación:
Variable de interés X : número de hijos 
Tipo de variable: cuantitativa discreta 
Máximo valor = 5 y mínimo valor =0 
Rango R = 5 – 0 = 5 Como el rango es pequeño, se trabaja con los valores originales de la variable: 0, 1, 2, 4, 5; no necesitamos usar intervalos de clase.
Procedemos a la tabulación, considerando la primera columna para los posibles valores de la variable, la segunda columna para las frecuencias absolutas fi obtenidas mediante el conteo del número de veces que se repite cada valor de la variable y las otras columnas para los diferentes tipos de frecuencias: hi , Fi , Hi , hi% y Hi%
Solución
Aplicando lo descrito en la presente sección, directamente mostramos la tabla solicitada.
Los intervalos cerrados [a, b] y los semiabiertos por la derecha [a, b) son los más usados en las tablas de distribución de frecuencia. 
Hallar la amplitud de los intervalos de clase requerida para cubrir el rango o recorrido, dividiendo el rango entre el número de intervalos. Dado un intervalo de clase, su amplitud o ancho es la diferencia de sus valores extremos.
Si la variable es cuantitativa contínua: 
Determinar los límites de cada intervalo de clase. Añadiendoal valor del límite inferior de cada intervalo la amplitud del intervalo, se obtendrán los límites de los intervalos semi abiertos por la derecha.
Proceder a la tabulación, para lo que usamos las siguientes notaciones:
Si la variable es cuantitativa continua: 
Ejemplo
Los siguientes datos corresponden a las aportaciones que hicieron al Sistema Nacional de Pensiones 100 docentes universitarios pertenecientes a la Ley 20530, en el mes de enero del presente año. Los datos están expresados en nuevos soles.
Solución
Referencias
Gómez, M. (2013). Bases de Datos. Departamento de Matemáticas Aplicadas y Sistemas 	(Pág. 5). Universidad Autónoma Metropolitana, C.P. 14787, México D.F.IBSN: 978-	07-477-880-9
Hernández, R (2014) Metodología de la investigación. (pág. 197). editorial 2014, respecto a 	la sexta edición por Mcgraw-hill / Interamericana Editores, S.A. DE C.V
	
P1P2P3P4P5P6TNP7P8P9P10P11P12TNP13P14P15P16P17P18TN
132232214Regular33333217Buena32213213Regular44Buena
222232314Regular33223215Buena32313315Buena44Buena
322222111Regular22222212Regular22323214Regular37Regular
422232112Regular22322213Regular23323215Buena40Regular
533322215Buena22223213Regular22222212Regular40Regular
633122213Regular22322112Regular1211218Mala33Regular
733331316Buena32332316Buena31312212Regular44Buena
823222112Regular23313214Regular22223213Regular39Regular
933332216Buena22223213Regular22222212Regular41Regular
1032322315Buena23223214Regular22213313Regular42Regular
1132322315Buena23223214Regular22213313Regular42Regular
1222222111Regular33323216Buena32323316Buena43Buena
1333222113Regular33222315Buena22222212Regular40Regular
1422222111Regular23223214Regular32213314Regular39Regular
1533332216Buena22222313Regular22222212Regular41Regular
1622213212Regular22131211Regular12223212Regular35Regular
Buena6Buena5Buena3Buena4
Regular10Regular11Regular12Regular12
Mala0Mala0Mala1Mala0
16161616
Promedio141412.8840.25
Desviación estándar1.91.61.8213.1728
Coeficiente de variación14%12%14%8%
Variable: Estrategias didácticas
InnovadoraFlexibleOrientadora
TotalNivel
Variable: Estrategias didácticas
SexoProcedenciaP1P2P3P4P5P6TN
10132232214Regular
20122232314Regular
31122222111Regular
41122232112Regular
51233322215Buena
60133122213Regular
71133331316Buena
81323222112Regular
90333332216Buena
101132322315Buena
110132322315Buena
120122222111Regular
130233222113Regular
141222222111Regular
Generales
N°
Innovadora
Máx=18
Mín=6
Rango=12
Niveles=3
Amplitud=4
Límites superior18
14
Limite inferior10
(14 - 18]Bueno
(10 - 14]Regular
(6 - 10]Mala
P1P2P3P4P5P6TotalNivelP7P8P9P10P11P12TotalNivelP13P14P15P16P17P18TotalNivel
132232214Regular33333217Buena32213213Regular44Buena
222232314Regular33223215Buena32313315Buena44Buena
322222111Regular22222212Regular22323214Regular37Regular
422232112Regular22322213Regular23323215Buena40Regular
533322215Buena22223213Regular22222212Regular40Regular
633122213Regular22322112Regular1211218Mala33Regular
733331316Buena32332316Buena31312212Regular44Buena
823222112Regular23313214Regular22223213Regular39Regular
933332216Buena22223213Regular22222212Regular41Regular
1032322315Buena23223214Regular22213313Regular42Regular
1132322315Buena23223214Regular22213313Regular42Regular
1222222111Regular33323216Buena32323316Buena43Buena
1333222113Regular33222315Buena22222212Regular40Regular
1422222111Regular23223214Regular32213314Regular39Regular
1533332216Buena22222313Regular22222212Regular41Regular
1622213212Regular22131211Regular12223212Regular35Regular
1733331316Buena32332316Buena31312212Regular44Buena
1821222312Regular22212110Mala12222110Mala32Regular
1922213111Regular22322213Regular23123213Regular37Regular
2022222111Regular23232214Regular33123214Regular39Regular
2123232113Regular23322214Regular32123213Regular40Regular
2223222112Regular23322214Regular32123213Regular39Regular
Variable: Estrategias didácticas
OrientadoraFlexibleInnovadora
TotalNivel

Continuar navegando