Logo Studenta

Análisis de datos

¡Estudia con miles de materiales!

Vista previa del material en texto

Niveles o escalas de medición para una variable 
• Escala Nominal: En este nivel de medición los datos son etiquetas o categorías 
que se usan para definir un atributo de un elemento, no implican un orden 
especifico. 
 
Ejemplo. El género, es un ejemplo claro de la escala nominal, puede asumir los 
valores de Femenino=F y Masculino=M. Además, si se le asigna un numero a cada 
una de estas categorías (Femenino=0 y Masculino=1), estos números no están 
asociados con una cantidad, ni indican un orden jerárquico, únicamente se utilizan 
como clasificación. 
 
• Escala Ordinal: Una escala de medida es ordinal si los datos pueden usarse 
para jerarquizar u ordenar las observaciones. Implican un orden inherente entre 
los datos. 
 
Ejemplo. El estrato social, es un ejemplo de variable en la escala de medición 
ordinal, aunque hay un orden establecido que indica niveles de superioridad, no 
tiene sentido considerar una resta entre estos niveles. 
 
• Escala de Intervalo: La medición de intervalo posee las características de la 
medición nominal y ordinal. Establece la distancia entre una medida y otra en 
unidades unificadas, por lo que la diferencia entre dos medidas de la variable 
está definida, sin embargo, el cero no constituye la ausencia de la característica. 
La escala de intervalo se aplica a variables cuantitativas, pero carece de un 
punto cero absoluto, razón por la cual no se puede hablar de una 
proporcionalidad entre los valores (es decir, el cociente entre dos valores no 
suministra ningún tipo de información). 
 
Ejemplo. La temperatura ambiental es un ejemplo de variables en la escala de 
medida de intervalo, obsérvese que una temperatura de cero grados, en cualquiera 
de las unidades de medida, no significa ausencia de temperatura sin embargo la 
resta entre dos temperaturas marca una distancia entre ellas; adicionalmente, una 
temperatura de 40◦C no indica el doble de calor de una temperatura de 20◦C. 
• Escala de Razón: La escala de medición de razón incluye las características de 
los tres niveles de medición anteriores (nominal, ordinal y de intervalo). 
Determina la distancia exacta entre los intervalos de una categoría. 
Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe 
la característica o atributo que se mide; en consecuencia a la presencia del cero 
absoluto se tiene que el cociente entre dos valores tiene un sentido estadístico. 
 
Ejemplo. El peso es un ejemplo de una variable en la escala de medida de razón, 
note que el cero en este caso indica la ausencia de peso, es decir la ausencia de la 
característica; adicionalmente tiene un orden establecido, y la resta indica una 
distancia entre los pesos, esto es, satisface las condiciones de las escalas de 
medida anteriores. Además, un peso de 80 kg es el doble de un peso de 40 kg. 
 
Análisis de Datos Cualitativos 
 
Una vez se han recolectado los datos, es necesario familiarizarse con ellos, a partir 
de un análisis exploratorio. Hay varias formas de organizar los datos para su 
exploración: tablas y gráficos. 
Tabla de frecuencia 
Arreglo de los datos cualitativos organizados por categorías excluyentes que 
muestra tanto el número como la proporción de elementos que hay en cada 
categoría. 
 
 
Representación Gráfica: 
 
• Diagrama de Barras: muestran la cantidad de datos que pertenecen a cada 
categoría como áreas rectangulares del mismo ancho y altura proporcional a la 
frecuencia absoluta. 
 
• Diagrama Circular: muestran el porcentaje de datos que hay en cada una de 
las categorías de la variable de estudio. 
 
Ejercicio: Los siguientes datos describen el color que prefieren un grupo de 24 
personas para adquisición de un vehículo. Determine la población, defina la variable 
y clasifíquela, construya una tabla de frecuencias para los datos, realice un 
diagrama de barras y determine cuál es el color de carro más preferido en la 
muestra. 
 
 
Tabla de contingencia 
Hasta el momento se ha realizado el estudio de una sola variable categórica. Sin 
embargo, en ocasiones resulta necesario estudiar el comportamiento de dos o más 
variables simultáneamente, en este caso las tablas de contingencia se constituyen 
en una herramienta de gran utilidad, dado que permite organizar los datos 
bivariados que resultan del estudio de dos variables cualitativas. Por ejemplo: 
 
 
 
Ejercicio: 
Los jóvenes antioqueños en su afán por brillar en el mundo del modelaje, o en una 
sociedad que ha establecido la delgadez como un sinónimo de éxito social, han 
desarrollados practicas alimenticias que los han a padecer de enfermedades tan 
delicadas como la Bulimia y la Anorexia. Con el ánimo de estudiar el impacto que 
ha tenido este fenómeno se tomó una muestra de 40 personas diagnosticados como 
Bulímicos o Anoréxicos y se les registraron las siguientes características: género, 
edad categorizada como joven o adulto y los signos visibles de la enfermedad, está 
información se registró en la siguiente tabla: 
 
 
 
 
 
Utilice el R para construir los objetos solicitados en los siguientes numerales. 
a. Clasifique cada una de las variables y diga cuál es su nivel de medida. 
b. Construya una tabla frecuencias para las variables Género y síntoma. 
c. Construya una tabla frecuencias para las variables Edad. 
d. Construya un gráfico de barras para resumir la información de la variable 
Síntoma. 
e. Construya un diagrama de Pastel para la variable Edad. 
f. Calcule y comente alguna medida de resumen para la variable Síntoma. 
g. ¿Qué porcentaje de personas enfermas son mujeres jóvenes? 
h. ¿Qué proporción de hombres adultos presentan el síntoma de "Uso de Ropa 
holgada"? 
i. ¿Qué porcentaje de las personas encuestas presentan el síntoma de una dieta 
severa? 
 
 
 
Análisis de Datos Cuantitativos 
 
Los datos asociados con las escalas de medida de intervalo y de razón serán 
reconocidos como datos cuantitativos. 
 
El primer paso para la organización de los datos es la preparación de un arreglo 
ordenado. 
 
Arreglo Ordenado: Es un listado de los valores de una colección (población o 
muestra) ordenada de menor a mayor. 
En R usamos la función “sort” para realizar dicha tarea. 
 
Para la organización de los datos cuantitativos también se usan tablas y 
representaciones gráficas: 
 
• Tabla de distribución de frecuencias 
 
• Histograma 
 
• Polígono de frecuencias 
• Ojiva 
• Diagrama de cajas y bigotes 
 
 
Interpretación de Tablas y Gráficos 
 
Ejemplo: En una compañía de comunicaciones se ha observado el tiempo empleado 
en atender consultas de los clientes (en minutos). Los datos obtenidos se han 
recogido en la siguiente tabla: 
 
 
 
a. ¿Cuál es la variable de estudio, qué tipo es y cuál es su nivel? 
 
b. Si en la muestra para una cliente se demoraron en atenderlo 45 minutos, 
¿Cuántos clientes tienen un tiempo menor de espera? 
 
c. La compañía quiere dar un regalo a cada una de las personas que tuvieron 
que esperar mínimo 40 minutos, ¿Qué porcentaje de personas recibirán 
regalo? 
 
 
Ejemplo: El gráfico muestra la distribución de los gastos por concepto de 
investigación de mercados en una muestra de empresas de Medellín: 
 
 
 
a. ¿La proporción empresas que tienen gastos por debajo de 22 millones de 
pesos es de? 
 
b. ¿El porcentaje de empresas que tienen gastos por encima de 18 millones de 
pesos es de? 
 
c. ¿El número de empresas que han gastado más de 22 millones de pesos en 
investigación es?

Continuar navegando