Logo Studenta
¡Este material tiene más páginas!

Vista previa del material en texto

Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 1 
 
 
 
 
 
 
 
 
 
APUNTES SOBRE ESTADISTICA 
(Borrador para corrección) 
 
 
 
 
 
 
 
 
 
 
Héctor Medina Disla 
 
 
 
 
 
 
 
 
 
Santo domingo, D. N. 
Junio 2010
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 2 
 
I. INTRODUCCION 
 
Estadística: Es una metodología científica que permite recolectar, organizar y 
procesar datos que proporcionen información que sirvan de base para la 
toma de decisión. Por ejemplo aplicar una encuesta para conocer la preferencia 
del electorado, aplicar un tratamiento especial a un grupo de personas y 
observar el resultado, buscar datos sobre la matrícula estudiantil, u otro tema 
en particular. En cambio, cuando hablamos de Estadísticas nos referimos a 
un conjunto de medidas o indicadores que describen el comportamiento de 
un fenómeno de interés en un momento determinado. Por ejemplo, el 
porcentaje de lectores que prefieren a un candidato en particular, el tiempo 
necesario para realizar unas tarea, las unidades producidas diariamente por 
una empresa, las ventas de una empresa, etc. 
 
 Es decir que las estadísticas representan el fin u objetivo que buscamos y 
la Estadística el medio para conseguirlo. 
 
1.1 DIVISION DE LA ESTADISTICA 
 
La Estadística como metodología científica se divide en dos ramas, la 
Estadística Descriptiva y la Estadística Inferencial 
 
Estadística Descriptiva: Es un conjunto de métodos y técnicas que 
permiten describir un conjunto específico de datos. La Estadística Descriptiva 
como su nombre lo indica, describe un grupo particular. Sus principales 
herramientas son. 
1) Cálculo de porcentaje y tasas 
2) Presentación tabular, (cuadros y tablas) 
3) Presentación gráfica 
4) Cálculo de medidas de Medidas de Tendencia Central, (promedios) 
5) Cálculo de medidas de dispersión o variabilidad 
6) Cálculo de números índice. 
7) Otras técnicas descriptivas. 
 
Estadística Inferencial: Se refiere a un conjunto de métodos y técnicas que 
permite obtener información acerca de una población completa, con solo 
estudiar una parte de ella (muestra). La Estadística Inferencial nos permite 
llevar los resultados obtenidos en una muestra a la población. Sus principales 
herramientas son: Cálculo de probabilidades, muestreo y distribución 
muestral, estimación, prueba de hipótesis, análisis de varianza, análisis de 
regresión y correlación, otras. 
 
1.2. Conceptos y Definiciones 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 3 
1. Población: Es un conjunto de elementos con características parecidas o 
similares y que son de interés para la realización de un estudio. En términos 
estadísticos una población se define de acuerdo a lo que se desea investigar o 
estudiar. Por ejemplo si queremos conocer el rendimiento escolar de los/as 
niños/as de la educación básica, entonces nuestra población va a estar 
definida por la cantidad de niños/as inscrito en los curso de la educación 
básica o si queremos evaluar la calidad de la producción de una empresa, 
nuestra población estará formada por todas las unidades producidas por la 
empresa durante el periodo de interés. 
 
Muestra: Es un subconjunto de la población que se toma para fines de 
desarrollar una investigación. Cuando un estudio se hace a partir de una 
muestra, esta debe ser representativa y significativa. 
 
Se dice que una muestra es representativa cuando los elementos que 
componen dicha muestra contienen las mismas características que los 
elementos en la población de la cual se tomó dicha muestra, el concepto de 
representatividad se refiere a los aspectos cualitativos de la muestra. Por 
ejemplo si quisiéramos conocer la preferencia política de los estudiantes de la 
UASD una muestra sería representativa si en la misma se incluyen estudiantes 
de todas las edades, de todas las carreras, de ambos sexo, de todos los centros 
regionales, etc. de forma tal que al observar la muestra es como si 
observáramos la población en miniatura. 
 
Por su parte el concepto de significación tiene que ver con la cantidad de 
elementos que conforma la muestra. En este sentido, no existe un número de 
elementos específico para que una muestra sea significativa, sino, que la 
cantidad de elementos necesarios para que la muestra sea significativa varía 
de acuerdo a la características de la población. Si la población a estudiar es 
muy variable, se requerirá de un mayor número de elementos para que la 
muestra sea significativa que si la población tiende a ser homogénea, en cuyo 
caso un muestra pequeña puede ser significativa. 
 
2. Parámetro: Es una medida de referencia la cual se calcula a partir de 
datos de una población completa. El parámetro se refiere a la medida de una 
variable en la población. Por ejemplo, cuando se aplican las Pruebas 
Nacionales y se obtiene el promedio de las calificaciones, esta medida es un 
parámetro de las calificaciones de los estudiantes. 
 
3. Estimador o Estadígrafo: Es una medida calculada a partir de los datos 
obtenidos en una muestra y se utiliza para estimar el valor del parámetro, ya 
que en la mayoría de los casos, se hace difícil y muy costoso conocer el valor 
real o verdadero de la variable. Por ejemplo cuando se toma una muestra para 
conocer la preferencia política de la población, los porcentajes que se obtienen 
a partir de la encuesta son estimadores del porcentaje de real de preferencia de 
todos/as las votantes. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 4 
 
1.3 FUENTES DE DATOS 
 
Ya se ha dicho que la Estadística es una metodología científica que permite 
obtener datos que al ser procesados se convierten en estadísticas o indicadores 
relacionados a una o múltiples variables. Podemos decir entonces que el 
quehacer de la Estadística se centra en dar respuestas a una serie de 
preguntas o interrogantes que surgen en un momento determinado sobre un 
tema en particular, por ejemplo, ¿Cuál es la bebida gaseosa preferida por la 
población?, ¿por qué las personas prefieren un banco en particular para 
depositar sus ahorros?, ¿qué porcentaje de la producción está saliendo 
defectuoso?, ¿cuál será el nivel de precios para el próximo semestre?, ¿Cómo 
podemos motivar a los/as estudiantes?, ¿cuál método de enseñanza es más 
efectivo para lograr el aprendizaje en los/as estudiantes? y así sucesivamente. 
 
Para dar respuestas a estas preguntas debemos recurrir a la búsqueda de 
datos y en tal sentido debemos de responder a las siguientes preguntas ¿cuáles 
son las fuentes para obtener datos? O ¿de donde obtendremos datos para dar 
respuesta a nuestra pregunta? 
 
En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de 
los datos y en este sentido las fuentes de datos pueden ser primarias y 
secundarias. Las fuentes de datos primarias son aquellas en las cuales los 
datos son generados por quien o quienes realizan la investigación, es decir que 
son datos de primera mano, hechos “a la medida” como lo señala Dillon1, es 
decir que las fuentes primarias se utilizan para cubrir una necesidad de 
información específica. 
 
1.3.1 Fuentes primarias de datos 
 
Las principales fuentes primarias de datos son el Censo, La Encuesta o 
Estudios por Muestreo y Los Experimentos. 
 
1. Censo: Es un tipo de investigación en la cual se estudian todos los 
elementos de una población determinada. El censo tiene las ventajas de que 
proporciona información sobre una población completa, con un bajo 
margen de error y además permite la ubicación física de cada uno de los 
miembros de la población. Tiene la desventaja de que resulta muy costoso en 
términos económicos, de tiempo y de materiales. 
 
2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una 
parte de la población, es decir una muestra. Los estudios por muestreo tienen 
las ventajas de que proporcionan información útily confiable sobre una 
 
1 William Dillon, Thomas J. Madden y Neil H. Firtle: “La Investigación de Mercados. Entornos de 
Marketing” 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 5 
población en corto tiempo y además resultan menos costosos que un censo. 
Tienen las desventajas de que no proporcionan información sobre la ubicación 
física de de los elementos de una población y de que si no se diseña de manera 
adecuada puede proporcionar información distorsionada sobre el 
comportamiento del fenómeno que se está estudiando. 
 
3. Experimentos: Son estudios especializados en los cuales un grupo de 
elementos de la población es sometido a un tratamiento o condición especial y 
los resultados obtenidos con dicho tratamiento se comparan con los 
resultados de otro grupo que no ha sido sometido al tratamiento o con los del 
mismo grupo cuando no ha sido sometido al tratamiento o condición especial. 
El grupo sometido al tratamiento recibe el nombre de grupo experimental y el 
grupo con el cual se comparan los resultados recibe el nombre de grupo de 
control. 
 
El objetivo principal de los diseños experimentales es conocer el efecto que 
tiene en la población estudiada la exposición de esta a un tratamiento o 
condición especial. 
 
1.3.2 Fuentes secundarias de datos 
 
Las fuentes secundarias son aquellas en las cuales los datos se encuentran 
publicados en forma de reportes. Las fuentes de datos secundarias pueden ser 
externas o internas. Las fuentes secundarias internas son aquellas en las 
cuales los reportes son el resultado del registro de las actividades de quien 
lleva a cabo la investigación, en cambio las fuentes secundarias externas son 
aquellas en las cuales los datos se encuentran en reportes o publicaciones 
realizados por entidades ajenas a quien o quienes realizan la investigación. 
 
Las principales fuentes secundarias de datos son los registros internos de la 
empresa y los reportes de datos de otras organizaciones o externos. 
 
1. Registros internos de la organización: son fuentes secundarias de 
datos y se refieren al conjunto de datos que se origina como resultado 
del registro continuo y sistemático de las actividades de una 
organización. 
2. Reportes de datos externos: es un conjunto de datos que pueden ser de 
interés para dar respuesta a nuestras interrogantes y que han sido 
generado por organizaciones o entidades externas a quien realiza la 
investigación. 
 
Los registros externos como fuente de información tienen las ventajas de 
que son de fácil acceso, tienen un costo más bajo que las demás fuentes de 
datos y además están disponibles en el momento requerido. Tienen la 
desventaja de que quien realiza la investigación no dispone de los 
mecanismos de control para garantizar la calidad y la confiabilidad de los 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 6 
datos incluidos en los reportes, así como el formato y la cantidad de datos 
existentes no siempre se corresponde con los requeridos por el investigador. 
 
 
1.4 VARIABLES Y SU CLASIFICACIÓN 
 
Una Variable es una característica que puede variar de un elemento a otro en 
la población estudiada. Ejemplos: peso corporal de las personas, tamaño las 
aulas universitarias, estatura de las personas, número de asignaturas 
cursadas por los estudiantes por semestre, etc. 
 
Las variables se dividen en dos grupos: Cualitativas y Cuantitativas 
 
Variables cualitativas: son aquellas variables que describen una cualidad o 
atributo en el elemento estudiado, estas variables responden la pregunta 
¿cuál?, ejemplos de estas variables pueden ser: religión que profesan los 
dominicanos, partido político preferido, color de la piel, sexo de los y las 
estudiantes, raza, carrera estudiada, etc. 
 
Variables cuantitativas: son aquellas variables que describen una cantidad 
en el elemento estudiado. Las variables cuantitativas responden la pregunta 
¿cuánto?, por ejemplo: número de estudiante por aula, venta diaria de una 
empresa, número de hijos por familia, estatura de los estudiantes que cursan 
estadística en este semestre, etc. 
 
Las variables cuantitativas se dividen en dos categorías: Continuas y 
discontinuas o discretas. 
 
Variables cuantitativas continuas: son aquellas variables cuantitativas 
cuyos resultados pueden expresarse en números fraccionarios o decimales. 
Estas variables provienen de un proceso de medición, por ejemplo el nivel 
de ingreso de las personas, consumo familiar, estatura de las personas, gasto 
diario de los estudiantes, etc. 
 
Variables cuantitativas discontinuas o discretas: son aquellas variables 
cuantitativas cuyos resultados se expresan en números enteros, es decir que 
no admiten valores decimales. Las variables cuantitativas discontinuas o 
discretas provienen de un proceso de conteo, por ejemplo número de 
asignaturas por estudiante, número de estudiantes por aula, número de 
personas que llega a un restaurante de comida rápida, etc. 
 
Obsérvese que las variables cuantitativas continuas pueden expresarse en 
número fraccionarios y las discretas o discontinuas se expresan en números 
enteros, por lo que, aunque en muchas ocasiones expresamos una variable en 
número enteros, no significa que sea discreta, por ejemplo, el gasto en 
transporte, mayormente lo expresamos en número entero, sin embargo, es una 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 7 
variable continua, pues el resultado admite valores fraccionarios, pero el 
número de asignaturas cursada por ejemplo solo se expresa en número enteros 
pues no admite valores fraccionarios. 
 
1.5 MEDICION Y ESCALA DE MEDICIÓN 
 
Daniel2 señala “cuando la mayoría de las personas escuchan o leen la palabra 
medición piensan en actividades tales como usar cintas métricas para 
determinar la longitud, anchura o circunferencia de algún objeto, pesar un 
objeto o persona, y determinar el volumen de alguna sustancia como cuando 
un cocinero mezcla las cantidades de ingredientes específicas de una receta. A 
la palabra medición, sin embargo, puede dársele una definición más científica 
que la acostumbrada” 
 
En efecto la medición va más allá de determinar cantidad, longitud, volumen o 
cualquier otra medida de interés. En el ámbito de la Estadística cuando nos 
referimos a medición llegamos un poco más profundo, así por ejemplo 
hablamos de la medición de la personalidad, de la medición de los niveles de 
tolerancia, los niveles de preferencia por un servicio o un producto, etcétera. 
 
Para el desarrollo de este curso enteremos por Medición al proceso mediante el 
cual se le asigna un numeral (número, letra o símbolo) a una variable. Por 
ejemplo si estamos realizando una investigación sobre las características de la 
población estudiantil podremos incluir variables como la edad, el sexo, el 
número de asignaturas cursadas el gasto diario, percepción sobre los servicios 
de la biblioteca, las asignaturas más preferidas y muchas otras variables. 
 
En cada una de estas variables tendremos una medición en cada uno de los 
elementos estudiados, así por ejemplo, para la edad nos referiremos a los años 
cumplidos y por lo tanto tendremos medidas numéricas, (23, 21, 19, 35,…..), 
para la variable sexo podríamos asignarle un número por ejemplo uno para 
masculino y dos para femenino o viceversa, pero de igual forma podríamos 
asignarle una letra, M para los masculinos y F para las femeninas o un símbolo 
para diferenciar cada sexo, de la siguiente manera ♂ para los masculinos y ♀ 
para las femeninas 
 
De igual forma para la variable número de asignaturas de registraría el número 
que representa la cantidad de asignaturas inscrita, por ejemplo, 3, 6, 5, 4,…… 
y par la variable gasto también se registraría el número que representa el 
monto del gasto diario, 100, 150, 60, 180, ……. y la variable relacionada con la 
percepción sobre los serviciosde la biblioteca podemos asignarle una 
calificación desde cero a cinco, tomando el cero como una percepción de los 
 
2 Wayne W., Daniel & James C. Terrell: “Estadística para Administración y Economía” Tomo I. Editora 
McGraw-Hill. 7ª. Edición. Junio 2000. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 8 
servicios como muy malos y cinco una percepción de que los servicios son 
excelentes. 
 
Para la variable relacionada con las asignaturas más preferidas, podríamos 
establecer un registro en orden de importancia, para que la persona estudiada 
nos diga en orden de preferencia cuales son las asignaturas preferidas, en tal 
sentido podríamos establecer el primer lugar para la más preferida, el segundo 
para la segunda más preferida y así, sucesivamente. 
 
Lo que se quiere señalar es que hay diferente forma en como podemos 
establecer la medición para una variable, es decir que hay diferente tipo de 
escala para medir una o múltiples variables, pudiendo entonces establecer una 
definición para la escala de medición. 
 
Escala de Medición: Es la forma en como se mide una variable, es decir 
que la escala de medición es el proceso mediante el cual se le asigna un 
numeral a cada variable. Existen cuatro tipos de escala de medición: 
nominal, ordinal, de intervalo y de razón o proporción. 
 
Escala Nominal: Es aquella escala de medición en la cual los numerales 
asignados a cada valor o atributo no representa ningún orden de jerarquía, 
de importancia o preferencia. En este tipo de escala los numerales solo se 
utilizan para identificar los valores o atributos de cada variable. Ej.: los 
numerales o códigos asignados a las variables cualitativas, los números 
asignados a los integrantes de un equipo béisbol, la matrícula estudiantil, etc. 
 
Escala Ordinal: Es aquella escala en la cual los numerales se asignan a cada 
variable de acuerdo a un orden de jerarquía, importancia o de preferencia. 
En este tipo de escala, cada numeral representa un tramo jerárquico, de 
preferencia o de importancia. Ej.: los códigos asignados a los cargos en una 
empresa, preferencia de un producto según su orden de importancia, el 
número asignado a las placas de los vehículos oficiales, etc. 
 
Tanto la escala ordinal como la nominal se usan en la medición de variables 
cualitativas. 
 
Escala de Intervalo: Es una escala cuantitativa cuya característica principal, 
es que no parte de un cero absoluto, es decir que el punto a partir del cual se 
empieza a medir es arbitrario. En este tipo de escala la presencia del cero 
como de medida de la variable no representa ausencia de la variable. Ej.: Las 
escalas usadas para medir la temperatura, la intensidad de un temblor de 
tierra, coeficiente inteligente, etc. 
 
Escala de Razón o Proporción: Es una escala cuantitativa cuya característica 
principal es que el proceso de medición de inicia a partir de un cero absoluto, 
es decir, que la presencia del cero como medida de la variable significa la 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 9 
ausencia de esta. A este tipo de escala corresponden la mayoría de las 
variables con que trabajamos a diario, ejemplo, peso corporal, tamaño de las 
personas, consumo familiar, ventas de una empresa, distancia recorrida, 
unidades producidas, distancia recorrida diariamente, etc. 
 
1.6 PASOS DE UNA INVESTIGACIÓN ESTADÍSTICA 
 
Cuando nos planteamos una interrogante sobre un tema en particular, nos 
vemos en la necesidad de buscar datos que nos proporcionen las informaciones 
necesarias para dar respuesta a dicha interrogante, este proceso de búsqueda 
de datos conlleva la realización de una investigación la cual requiere de cinco 
pasos fundamentales3: planeación, diseño de la investigación, recolección de 
datos, procesamiento y análisis y presentación de resultados. 
 
Figura no. 1: Pasos de una investigación 
 
 
Aunque estos pasos pueden y varían atendiendo a los criterios del investigador 
en términos generales estos pasos representan el proceso lógico de una 
investigación aunque reciban diferentes nombres. A continuación se hace una 
descripción breve de cada uno de estos. 
 
1. Planeación: Es la fase en la cual se definen los aspectos administrativo y 
operativos de la investigación. Esta fase comprende entre otras actividades, el 
establecimiento de los objetivos: general y específicos, alcance de la 
investigación, población de estudio, presupuesto necesario, cronograma de 
actividades y plan de análisis o resultados esperados. 
 
2. Diseño del estudio: En esta fase se define y se diseña el instrumento de 
recolección de datos (cuestionario, entrevistas, observación, entre otros) y se 
 
3 Ver a Lincoln L. Chao: “Estadística para las Ciencias Administrativas.” Tercera Edición. Editora 
McGraw-Hill 
Diseño del 
Estudio 
Análisis y 
presentación 
Planeación 
Recolección 
de datos 
Procesa- 
miento 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 10 
define además, la metodología a seguir para la aplicación del instrumento de 
recolección de datos. 
 
3. Recolección de datos: Es la fase que requiere de más tiempo y consiste en 
la aplicación del instrumento de recolección de datos definido en el diseño del 
estudio de acuerdo a la metodología establecida. En esta fase la persona a 
cargo de la investigación y su equipo de trabajo se lanzan al terreno para 
recolectar los datos que una vez procesados darán respuestas a los objetivos de 
la investigación. 
 
4. Procesamiento de datos: Es la fase en la cual se obtienen los cuadros y 
tablas, así como las medidas o indicadores estadísticas que permiten describir 
el comportamiento de la población estudiada, así como dar respuestas a los 
objetivos planteados en la fase de planeación. La fase de procesamiento de los 
datos conlleva cuatro actividades esenciales previas: Limpieza y organización 
de los datos, codificación, digitación y edición. 
 
La limpieza y organización de los datos se refiera al proceso mediante el cual se 
verifican la calidad de los datos obtenidos, se enumeran los instrumentos de 
recolección de datos utilizados, verificación del cumplimiento de las metas en 
cuanto a la cantidad y calidad. La codificación por su parte es la actividad que 
permite asignar un código numérico a cada respuesta del instrumento de 
recolección de datos. Esto se hace con la finalidad de facilitar el proceso de 
digitación. 
 
La digitación es el proceso mediante el cual los datos son introducidos al 
computador con el fin de que el procesamiento sea más eficiente. La edición por 
su parte es un proceso de verificación, es decir, con la edición de los datos 
verificamos que se haya digitado lo que realmente se ha respondido en el 
instrumento de recolección de datos. 
 
5. Análisis y presentación de resultados: Es la fase es la cual se analizan 
los resultados obtenidos, estableciendo descripción de la población estudiada, 
comparaciones y asociaciones entre variables, inferencias muestrales, entre 
otras. En la fase de procesamiento y además se dan a conocer los resultados 
obtenidos en la investigación. 
 
Veamos un ejemplo relacionado con el proceso de investigación. En el semestre 
2006-1 de la UASD, el trabajo final de un grupo de estudiantes fue medir el 
rendimiento, (tomando para ello el promedio de las calificaciones) de un grupo 
de estudiantes tanto en las escuelas públicas como en las escuelas privadas. 
De esta forma la población estaba definida, así como los objetivos del trabajo 
de investigación. 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 11 
Como se podrán imaginar, el presupuesto era pequeño y no predeterminado, 
pero tengan por seguro que aquellas personas que no pasaron de curso se lo 
encontraron más costoso, pero bueno, ese no es el caso ahora. 
 
El instrumento de recolecciónde datos fue un cuestionario, el cual se muestra 
en la figura número dos y la metodología consistió en tomar una muestra de 
estudiantes de las escuelas públicas y otra muestra en colegios privados. 
 
El cuestionario utilizado como instrumento de recolección de datos se muestra 
en la figura número dos de la página siguiente. 
 
Figura no. 2. Instrumento de recolección de datos utilizado en el estudio 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante __________________________ 
 
2. Edad ______ 3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante _____________________________ 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas ______ 
8. Calificación en Español ______ 
9. Calificación en Sociales ______ 
10. Calificación en Naturales _____ 
 
La metodología consistió en tomar una muestra de treinta estudiantes de la 
escuela pública y treinta de la escuela privada. La fuente de datos utilizada fue 
el registro de cada estudiante en la escuela, procediendo a completar el 
instrumento de recolección de datos diseñado 
 
A continuación se presenta una muestra del instrumento de recolección de 
datos completado durante la tercera fase del estudio. Por conveniencia las 
respuestas se han subrayado de forma que se puedan identificar fácilmente. 
 
Nótese que los cuestionarios no están numerados y si lo estuvieran no 
representan una jerarquía o importancia, sino que el numeral asignado es una 
escala nominal. 
 
 
 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 12 
 
Figura no. 3: Instrumentos de recolección de datos completados 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Rodolfo Peña 
 
2. Edad 15 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante: Con padre y madre 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 69 
8. Calificación en Español 75 
9. Calificación en Sociales 72 
10. Calificación en Naturales 71 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Raúl Arias 
 
2. Edad 12 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante: con ambos padres 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 67 
8. Calificación en Español 69 
9. Calificación en Sociales 64 
10. Calificación en Naturales 69 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Paola Moción 
 
2. Edad 10 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante Tía 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 80 
8. Calificación en Español 78 
9. Calificación en Sociales 76 
10. Calificación en Naturales 80 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante: Yordi González 
 
2. Edad 11 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante: con la madre 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 70 
8. Calificación en Español 68 
9. Calificación en Sociales 65 
10. Calificación en Naturales 65 
 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Ashley Ciprián 
 
2. Edad 9 años 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante ambos padres 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 85 
8. Calificación en Español 80 
9. Calificación en Sociales 82 
10. Calificación en Naturales 78 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Vicente Mejía 
 
2. Edad 13 años 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante con la madre 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 65 
8. Calificación en Español 70 
9. Calificación en Sociales 78 
10. Calificación en Naturales 70 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 13 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Cándida Beatriz 
 
2. Edad 11 años 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante ambos padres 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 83 
8. Calificación en Español 90 
9. Calificación en Sociales 89 
10. Calificación en Naturales 91 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Manuel Fontana 
 
2. Edad 10 años 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante con una tía 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 88 
8. Calificación en Español 90 
9. Calificación en Sociales 89 
10. Calificación en Naturales 85 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Charly Cepeda 
 
2. Edad 13 años 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante ambos padres 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 77 
8. Calificación en Español 78 
9. Calificación en Sociales 83 
10. Calificación en Naturales 78 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 
1. Nombre y apellidos del estudiante Helena Parache 
 
2. Edad 11 años 
 
3. Sexo: 1. Masculino 2. Femenino 
 
4. Con quien vive el estudiante con ambos padres 
 
5. Tipo de escuela: 1. Pública 2. Privada 
 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 77 
8. Calificación en Español 72 
9. Calificación en Sociales 81 
10. Calificación en Naturales 65 
 
Una vez agotada la tercera fase, la recolección de datos, nos dedicamos a 
cuarta fase, el procesamiento de los datos, recordando que esta fase incluye la 
organización, codificación, digitación y edición, para luego obtener los cuadros 
y tablas, así como las medidas estadísticas que nos permitan dar respuestas a 
los objetivos planteados. 
 
En el caso que nos ocupa para la organización podemos por ejemplo asignar un 
número a cada instrumento completado. Para la codificación, el trabajo se 
reduce significativamente, ya que el instrumento diseñado tiene cada pregunta 
pre-codificada, por ejemplo, para el sexo se le asigna el número uno a los de 
sexo masculino y el dos a las de sexo femenino, de igual forma a losy las 
estudiantes de escuelas públicas se le asigna el número uno y los y las de 
colegios privados el número dos. 
 
Sin embargo, en el caso de la pregunta relacionada a con quien vive el o la 
estudiante, es recomendable establecer un código numérico para las posibles 
respuestas, ya que en el instrumento esta es una pregunta abierta. Los códigos 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 14 
asignados son: el número uno para los y as que viven con ambos padres, 
(padre y madre), el dos para los y las que viven solo con la madre, el tres para 
los y las que viven solo con el padre y el cuatro para los y las que viven con 
otro familiar. 
 
La importancia de asignar un código numérico es que el proceso de digitación 
se hace más eficiente y se cometen menos errores. Un ejemplo se muestra a 
continuación con los dos primeros instrumentos 
 
Figura no. 4: instrumentos de datos completados y codificados 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 No. 1 
1. Nombre y apellidos del estudiante Rodolfo Peña 
2. Edad 15 
3. Sexo: 1. Masculino 2. Femenino 
4. Con quien vive el estudiante: 1 
5. Tipo de escuela: 1. Pública 2. Privada 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 69 
8. Calificación en Español 75 
9. Calificación en Sociales 72 
10. Calificación en Naturales 71 
Universidad Autónoma de Santo Domingo 
Estudio sobre el rendimiento escolar 
Formulario de recolección de datos 
 No. 2 
1. Nombre y apellidos del estudiante Raúl Arias 
2. Edad 12 
3. Sexo: 1. Masculino 2. Femenino 
4. Con quien vive el estudiante: 1 
5. Tipo de escuela: 1. Pública 2. Privada 
6. Condición del estudiante: 
 1. Promovido 2. Repitiente 
7. Calificación en Matemáticas 67 
8. Calificación en Español 69 
9. Calificación en Sociales 64 
10. Calificación en Naturales 69 
 
Como se muestra en la figura anterior, a la derecha aparece el número 
asignado al instrumento y en la pregunta de con quien vive el o la estudiante 
se ha asignado como respuesta el número uno ya que en ambos casos los 
estudiantes viven con ambos padres. 
 
Para la digitación se podría colocar los datos en una matriz, colocando cada 
variable en las columnas y cada fila para los elementos estudiados. En este 
caso vamos a utilizar la hoja de cálculo de Excel para la digitación como se 
muestra en la figura número cinco. (Es preciso aclarar que existen numerosos 
programas en los que se puede hace la digitación, se ha elegido el Excel por la 
disponibilidad y facilidad del mismo) 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 15 
Figura no. 5: Ilustración de la digitación en Excel 
 
El proceso de edición de los datos sería imprimir los datos digitados y luego 
verificar si el proceso de digitación se ha hecho correctamente. 
 
Una vez que se ha realizado el proceso de digitación y edición de los datos, se 
procede a obtener los cuadros y tablas, así como las medidas estadísticas que 
nos permitan dar respuesta a los objetivos del trabajo de investigación, pero 
sobre este particular volveremos a tratarlo en los capítulos siguientes. 
 
 
1.7 PRESENTACIÓN DE RESULTADOS 
 
Una vez que se ha completado el proceso de investigación con el análisis de los 
resultados, el paso siguiente consiste en presentar dichos resultados a la 
entidad interesada. Para hacerlo existen cinco formas que describiremos 
brevemente a continuación: 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 16 
 
1. Presentación oral: Cuando los resultados de la investigación se presentan 
en forma de discurso. Por ejemplo, muchas organizaciones, (empresas, partidos 
políticos, ONG`s, entre otras) convocan a una rueda de prensa o a un 
encuentro con el objetivo de dar a conocer los resultados de una investigación 
determinada. 
 
La presentación oral tiene la ventaja de que es fácil de preparar y su costo es 
bajo, sin embargo, presenta la desventaja de que quien recibe la información va 
olvidando los primeros datos en la medida en que se avanza con el suministro 
de información. 
 
2. Presentación escrita: Es aquella en la cual los resultados de una 
investigación se presentan en un informe en forma de texto. La presentación de 
los resultados de una investigación presentados en un informe, requieren de 
una mayor formalidad y de un esfuerzo mayor. Un informe con los resultados 
de una investigación consta de seis partes esenciales. 
 
2.1 Hoja y/o carta de presentación: en esta parte se presenta de manera 
formal los resultados de la investigación. 
 
2.2 Índice de contenido: en esta parte del informe se establece o describe la 
ubicación física de cada una de las partes contenidas en el informe. 
 
2.3 Resumen ejecutivo: como lo indica su nombre, es un resumen que 
contiene los principales resultados de la investigación. Su objetivo 
fundamental es describir el comportamiento de la población estudiada 
de manera rápida y precisa sin adentrarse en detalles. 
 
2.4 Cuerpo del trabajo: En esta parte se describen de manera detallada 
todos los resultados de la investigación, incluye la presentación de 
cuadros, tablas, gráfico, descripción textual, así como el cálculo de 
medidas estadísticas. 
 
2.5 Conclusiones: las conclusiones representan el juicio extraído de los 
resultados de la investigación. Se refieren a los puntos a los cuales llega 
quien o quienes realizan el estudio después de analizar de manera 
detallada los resultados obtenidos. Las conclusiones dan respuestas a 
las interrogantes establecidas y a los objetivos planteados en la fase de 
planeación. 
 
2.6 Recomendaciones: se refiere al conjunto de sugerencias o curso de 
acción que se sugieren seguir a partir de los resultados de la 
investigación. 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 17 
2.7 Anexos: en esta parte del informe se incluye toda información que sea 
relevante para el estudio que se realiza y que por alguna razón no se incluyó en 
el cuerpo del trabajo, por ejemplo cuadros, copia del o los instrumentos de 
recolección de datos utilizados, cronograma de actividades, fotografías, copias 
de artículos, de leyes, entre otros. 
 
3) Presentación tabular: es aquella es la que los resultados de una 
investigación se presentan en forma de cuadros o tablas. Un cuadro o tabla 
estadística se compone de tres partes esenciales y una opcional. 
 
3.1 Título: en este se detalla de manera clara, precisa y lo más corto 
posible los datos incluidos en el cuadro. El título es de vital importancia 
a fin de edificar a la persona interesada sobre la información que se 
presenta en el cuadro o la tabla de que se trate. 
 
3.2 Cuerpo o armazón: es un arreglo matricial, (arreglo de filas y 
columnas) en el cual se detallan los datos especificados en el título. El 
cuerpo o armazón está compuesto de dos partes: 
 
3.2.1 La columna principal, en la cual se describe la variable o las 
variables a presentar en el cuadro. 
 
3.2.2 Las columnas secundarias, es las cuales se describen los valores 
relacionados a cada valor o atributo de la variable. 
 
3.3 Fuente: es la parte del cuadro en la cual se específica el origen de los 
datos presentados en dicho cuadro. La importancia de la fuente es que 
al informar sobre el origen de los datos descrito en la tabla, permite, de 
alguna manera, evaluar la calidad y confiabilidad de los mismos. 
 
Nota aclaratoria: se utiliza para 
especificar cualquier detalle o 
aclaración referente a los datos 
incluidos en el cuadro. Por ejemplo, en 
el cuadro que se muestra a 
continuación se podría incluir una 
nota aclaratoria para indicar que solo 
se incluyen a los estudiantes que 
asistieron ese día a la clase o que 
incluye a otros “colados” de otra secciónde la que se trate. 
 
4) Presentación gráfica: es aquella en la cual los resultados de una 
investigación se presentan en forma de gráfico. La importancia de la 
presentación gráfica es que permite observar el comportamiento de una 
variable sin entrar en detalles, solo con observar el cuadro. 
Cuadro No: Sexo de los estudiantes 
de Est-XXX, sección XX 
SEXO No. % 
MASCULINO 
FEMENINO 
9 
25 
26.5 
73.5 
TOTAL 34 100.0 
Fuente: Clase 17/01/2004 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 18 
Sex o de lo s e s tu d ia n tes de Es t-x x x , s e cc ión 
0 0
26.5%
73.5%
MASCULINO FEMENINO
Comparación mensual de su consumo
0
100
200
300
400
500
600
700
Abr May Jun Jul Ago Sep Oct Nov Dic Ene Feb Mar Abr
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Por ejemplo, al 
observar un recibo 
de la facturación 
de la electricidad, 
se muestra un 
gráfico como el que 
vemos a nuestra 
derecha, 
observamos como 
ha variado el 
consumo, si se ha 
consumido más o 
se ha consumido 
menos. 
 
Una presentación gráfica contiene los mismos elementos que un cuadro o 
tabla, es decir: título, cuerpo, fuente y nota aclaratoria. 
 
5) Presentación Mixta: es aquella en la cual quien o quienes realizan la 
investigación utilizan para la presentación de los resultados del estudio dos o 
más formas de presentación de datos. 
Fuente: clase del 7/01/2004 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 19 
II. ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS 
 
2.1 ORGANIZACIÓN SIMPLE 
 
El objetivo fundamental de la organización de los datos es conocer el 
comportamiento y las características de las variables estudiadas, sin una 
organización de los datos se hace un tanto difícil el análisis de los mismos. 
Supongamos que tenemos los datos relacionados con el rendimiento 
académico de 133 estudiantes y los mismos se muestran en el recuadro 
siguiente: 
 
82.5 73.8 73.0 76.8 81.5 79.5 67.8 
88.5 68.3 60.5 71.0 77.5 63.0 70.5 
70.8 85.5 60.0 81.3 82.0 81.0 61.0 
80.3 70.8 69.5 61.3 78.8 62.8 61.8 
81.0 81.8 64.8 71.5 71.0 75.0 68.8 
86.3 77.0 67.5 82.0 84.5 82.3 71.8 
77.8 79.5 72.3 71.5 69.5 84.8 67.3 
85.0 87.8 67.0 81.3 72.8 69.8 71.0 
79.0 78.8 67.0 76.0 72.8 67.0 69.0 
91.3 87.3 62.0 83.5 78.5 68.8 91.8 
88.8 73.8 66.5 84.0 69.3 65.3 67.8 
88.5 84.5 69.0 68.5 72.0 58.0 61.5 
88.5 83.3 66.0 84.3 67.8 66.8 63.0 
93.0 71.8 71.3 82.8 70.3 56.5 83.5 
85.0 81.3 65.8 92.5 70.3 63.8 81.8 
95.3 80.8 69.8 72.5 89.8 70.0 66.8 
88.0 90.8 72.8 70.5 70.5 72.0 77.8 
82.0 71.0 61.3 78.5 77.8 56.8 64.5 
85.0 70.5 64.8 67.0 90.8 84.3 63.5 
 
Como se puede observar, tenemos datos suficientes como para dar un 
diagnóstico sobre el rendimiento de los y las estudiantes, sin embargo, sin 
una organización esto se hace poco aplicable. Una forma sencilla de iniciar 
una exploración de los datos, para conocer sus características es organizando 
los mismos en orden ascendente como se ilustra a continuación. 
 
Este procedimiento no nos proporcionará mucha información sobre las 
características relevantes de la variable, nos permite conocer por ejemplo cual 
es el rendimiento mayor y el menor y permite además observar si existe un 
valor que se repita con una frecuencia mayor que los demás, etc. 
 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 20 
56.5 65.3 69.0 71.0 76.8 81.3 84.8 
56.8 65.8 69.0 71.3 77.0 81.3 85.0 
58.0 66.0 69.3 71.5 77.5 81.5 85.0 
60.0 66.5 69.5 71.5 77.8 81.8 85.0 
60.5 66.8 69.5 71.8 77.8 81.8 85.5 
61.0 66.8 69.8 71.8 77.8 82.0 86.3 
61.3 67.0 69.8 72.0 78.0 82.0 87.3 
61.3 67.0 70.0 72.0 78.5 82.0 87.8 
61.5 67.0 70.3 72.3 78.5 82.3 88.0 
61.8 67.0 70.3 72.5 78.8 82.5 88.5 
62.0 67.3 70.5 72.8 78.8 82.8 88.5 
62.8 67.5 70.5 72.8 79.0 83.3 88.5 
63.0 67.8 70.5 72.8 79.5 83.5 88.8 
63.0 67.8 70.5 73.0 79.5 83.5 89.8 
63.5 67.8 70.8 73.8 80.3 84.0 90.8 
63.8 68.3 70.8 73.8 80.8 84.3 90.8 
64.5 68.5 71.0 75.0 81.0 84.3 91.3 
64.8 68.8 71.0 75.0 81.0 84.5 91.8 
64.8 68.8 71.0 76.0 81.3 84.5 92.5 
 
Ahora podemos fijarnos una idea más acabada sobre el rendimiento de los y 
las estudiantes de las escuelas públicas y privadas, por ejemplo, observamos 
que más de un tercio tiene un rendimiento promedio inferior a los 70.0 
puntos, que solo cinco de los 133 estudiantes estudiados tienen un 
rendimiento superior a 90.0 puntos y así sucesivamente. 
 
2.2 DISTRIBUCIONES DE FRECUENCIA 
 
Los datos que provienen de un censo, una encuesta por muestreo, diseño 
experimental y aquellos que provienen de fuente secundarias que no han sido 
agrupados o condensados, como por ejemplo la revisión de un expediente 
clínico, se presentan en la mayoría de los casos en una Distribución de 
frecuencia, ya sea para una o para múltiples variables. Una distribución de 
frecuencia es un arreglo matricial, (arreglo de filas y columnas) donde se 
presenta los valores o atributos de una variable y su respectivas frecuencias. 
 
Antes de entrar en detalles sobre los diferentes tipos de distribuciones de 
frecuencias, vamos a definir el concepto de frecuencia y los diferentes tipos de 
frecuencias. La Frecuencia, en términos estadísticos, se define como el 
número de veces que se repite un dato u observación. Por ejemplo, al observar 
el sexo de 50 estudiantes de un curso de Estadística, se observaron los datos 
que se presentan en la tabla siguiente 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 21 
 
Tabla 1: Sexo de 50 estudiantes de un curso de Estadística 
M F F F M F F M F F 
F F F M F F F F F M 
M F F F M M F M F F 
F F F F F F F F F F 
F F M F F F F F F M 
 
Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es 
su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia. 
 
2.3 TIPOS DE FRECUENCIA 
 
Existen cuatro tipos de frecuencias: la absoluta simple, la relativa simple, la 
absoluta acumulada y la absoluta relativa acumulada. 
 
2.3.1 Frecuencia absoluta simple, (fi): se define como el número de veces que 
se repite un dato u observación. Comúnmente se le denomina con el nombre de 
frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una 
frecuencia absoluta simple de 11, mientras que el dato femenino presenta una 
frecuencia absoluta simple de 39. 
 
2.3.2 Frecuencia absoluta acumulada, (FA): consiste en la suma continua y 
subsecuente de la frecuencia absoluta simple. La frecuencia absoluta 
acumulada expresa la cantidad de elementos que se encuentra por debajo de 
un valor específico. 
 
2.3.3 Frecuencia relativa simple, (fr o %): consiste en expresar la frecuencia 
absoluta simple, (fi) como una proporción con aspecto al total de frecuencia. 
 
2.3.4 Frecuencia relativa acumulada, (FRA o % acumulado): Expresa la 
frecuencia absoluta acumulada, (FA) como un porcentaje con respecto al total 
de frecuencia y representa la proporción de elementos que se encuentran por 
debajo de un valor determinado. La FRA se puede obtener de dos formas: 
 
a) Sumando de manera continua y subsecuente la frecuencia relativa simple. 
b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia. 
 
2.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que 
para fines de análisis se consideras homogéneos. 
 
Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que 
conforma una distribución de frecuencia. Para la ilustración vamos a tomar la 
calificación obtenida por 50 estudiantes en una prueba parcial de Estadística, 
los datos se ilustran en la tabla número dos a continuación. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 22 
 
Tabla 2: Calificación obtenida por 50 estudiantes de Estadística en una prueba 
parcial 
14 14 19 15 10 12 13 14 9 12 
13 14 8 16 14 16 16 12 18 15 
17 18 10 14 16 10 19 19 13 15 
16 16 13 17 16 9 13 17 11 11 
12 12 19 10 8 17 6 18 14 16 
 
Para ordenar estos datos, lo primero que vamos a hacer es colocar en la 
primera columna la variable,en este caso la calificación obtenida, pero como 
puede tomar múltiple valores, se clasifica en cinco categorías, la primer, los/as 
que obtuvieron menos de 12 puntos, la segunda los/as estudiantes que 
obtuvieron entre 12 y menos de 14 puntos, la tercera los/as estudiantes que 
obtuvieron entre 14 y menos de 16 puntos, la cuarta clase está compuesta por 
los/as estudiantes que obtuvieron entre 16 y menos de 18 puntos y la quinta 
clase, está formada por aquellos/as estudiantes que obtuvieron entre 18 y 20 
puntos. 
 
De esta forma, la primera columna queda como se ilustra a continuación: 
 
Calificación 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
TOTAL 
 
El segundo paso es determinar la cantidad de estudiantes que cae dentro de 
cada una de estas categorías o clases. Para esto, sencillamente se cuenta en la 
tabla dos, la cantidad de calificaciones que está dentro de cada uno de los 
límites de cada categoría o clase. 
 
Para determinar la cantidad de datos en cada categoría o clase se puede hacer 
contando de manera directa cada valor o a partir de un proceso de conteo 
detallado, colocando una raya, un punto o un símbolo en cada categoría cada 
vez que aparece un valor que se corresponda con esta. 
 
Al observar los datos sueltos de la tabla dos, en la primera categoría, las 
calificaciones menores de 12 puntos, hay 11 estudiantes, con calificación 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 23 
menor a 12 puntos. De igual forma se observa que hay 10 estudiantes con 
calificación entre 12 y menos de 14 puntos, igual cantidad, 10 estudiantes con 
calificación entre 14 y menos de 16 puntos. 
 
De igual forma se observa que hay 12 estudiantes con calificación entre 16 y 
menos de 18 puntos y finalmente, siete estudiantes con calificación entre 18 y 
20 puntos. En la segunda columna de la distribución se coloca la frecuencia de 
cada clase o categoría, por lo que la tabla quedaría como se ilustra a 
continuación: 
 
Calificación fi 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
 
11 
10 
10 
12 
7 
TOTAL 50 
 
A partir de esta frecuencia absoluta simple, se obtienen las demás frecuencias. 
La frecuencia relativa, por ejemplo se obtiene al dividir cada frecuencia 
absoluta entre el total de frecuencia. Si esta frecuencia se desea expresar como 
un porcentaje, entonces se multiplica por 100. La primera frecuencia relativa 
es [(11/50) x 100]= 22.0%, la segunda frecuencia relativa es [(10/50) x 100]= 
20.0% y así sucesivamente, la tercera frecuencia relativa es [(10/50) x 100]= 
20.0%, la cuarta frecuencia relativa es [(12/50) x 100]= 24.0% y la quinta y 
última frecuencia relativa de esta distribución es [(17/50) x 100]= 14.0% El 
resultado de calcular cada una de la frecuencia relativa se muestra en la tabla 
siguiente: 
 
Calificación fi % 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
 
11 
10 
10 
12 
7 
 
22.0 
20.0 
20.0 
24.0 
14.0 
TOTAL 50 100.0 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 24 
De igual forma, a partir de la frecuencia absoluta simple se obtiene la 
frecuencia absoluta acumulada. Esta frecuencia es el resultado de sumar las 
frecuencias absoluta simple de cada clase. En términos generales, la frecuencia 
absoluta acumulada de una clase o categoría en particular es igual a la 
frecuencia acumulada hasta la clase anterior más la frecuencia absoluta 
simple de la clase o categoría de que se trate. 
 
Así, la frecuencia absoluta acumulada de la primera clase o categoría es igual a 
frecuencia absoluta simple, para nuestro ejemplo, la frecuencia absoluta 
acumulada de la primera clase es igual a 12. La frecuencia absoluta 
acumulada en la segunda clase o categoría es la suma de la frecuencia 
acumulada en la primera clase más la frecuencia absoluta simple de la 
segunda clase, es decir (11 + 10)= 21. 
 
El procedimiento se sigue de manera similar hasta determinar la frecuencia 
acumulada para cada clase o categoría. De esta forma la frecuencia acumulada 
de la tercera clase es igual a la frecuencia acumulada de la segunda clase más 
la frecuencia absoluta simple de la tercera clase, en este caso (21 + 10)= 31, la 
frecuencia acumulada de la cuarta clase es igual a la frecuencia acumulada 
hasta la tercera clase más la frecuencia absoluta simple de la cuarta, esto es 
(31 + 12)= 43 y la frecuencia acumulada de la quinta clase o es igual a la 
frecuencia acumulada hasta la cuarta clase más la frecuencia simple de la 
quinta clase, es decir (43 + 7)= 50. El resultado de las sumas se muestra en la 
tabla siguiente: 
 
Calificación fi % FA 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
 
11 
10 
10 
12 
7 
 
22.0 
20.0 
20.0 
24.0 
14.0 
 
11 
21 
31 
43 
50 
TOTAL 50 100.0 
 
Una vez que se ha determinado la frecuencia absoluta acumulada el siguiente 
paso es calcular la frecuencia relativa acumulada o porcentaje acumulado. 
Este porcentaje puede obtenerse de dos formas, o se acumula la el porcentaje 
simple o se divide cada frecuencia absoluta acumulada entre el total. El 
procedimiento de acumular el porcentaje simple, simplifica los cálculos. 
 
El porcentaje acumulado de la primera clase es igual porcentaje simple de la 
misma. Para nuestro ejemplo, el porcentaje acumulado de la primera clase o 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 25 
categoría es igual a 22.0%. El porcentaje acumulado en la segunda clase o 
categoría es la suma del porcentaje acumulado en la primera clase más el 
porcentaje simple de la segunda clase, es decir (22.0 + 20.0)= 42.0%. 
 
Al igual que en la frecuencia absoluta acumula, procedimiento se sigue de 
manera similar hasta determinar la porcentaje acumulado para cada clase o 
categoría. De esta forma la porcentaje acumulado de la tercera clase es igual al 
porcentaje acumulado de la segunda clase más el porcentaje simple de la 
tercera clase, en este caso es (42.0 + 20.0)= 62.0%, el porcentaje acumulado 
de la cuarta clase es igual al porcentaje acumulado hasta la tercera clase más 
el porcentaje simple de la cuarta, esto es (62.0 + 24.0)= 86.0% y el porcentaje 
acumulado de la quinta clase o es igual al porcentaje acumulado hasta la 
cuarta clase más el porcentaje simple de la quinta clase, es decir (86.0 + 14.0)= 
100.0%. El resultado de las sumas se muestra en la tabla siguiente: 
 
Calificación fi % FA FRA 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
 
11 
10 
10 
12 
7 
 
22.0 
20.0 
20.0 
24.0 
14.0 
 
11 
21 
31 
43 
50 
 
22.0 
42.0 
62.0 
86.0 
100.0 
TOTAL 50 100.0 
 
Una vez que han calculado las frecuencias se procede a completar el cuadro 
de manera adecuada, es decir, poner el título, se elimina la columna del 
conteo, (si se ha incluido), y se coloca la fuente de los datos. 
 
Cuadro No : Calificación de 50 estudiantes de 
un curso de estadística en una prueba parcial 
Calificación fi % FA FRA 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
 
11 
10 
10 
12 
7 
 
22.0 
20.0 
20.0 
24.0 
14.0 
 
11 
21 
31 
43 
50 
 
22.0 
42.0 
62.0 
86.0 
100.0 
TOTAL 50 100.0 
Fuente: Tabla 2 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 26 
 
2.5 TIPOS DE DISTRIBUCIÓN DE FRECUENCIA 
 
Para agrupar los datos existen tres tipos de distribución de frecuencia, la 
cuales se utilizarán de acuerdo al tipo de datos que estemos tratando. 
 
2.5.1 Distribución de frecuencia para datos cualitativos: cuando se tienen 
datos cualitativos, el procedimiento se simplifica, pues solo se requiere 
colocar las diferentes categorías de la variable y la frecuencia asociada con 
dada una de ellas, como se muestra en el ejemplo siguiente: 
 
Cuadro No.: Personas con quienes viven los/as 
estudiantes de las escuelas públicas y de la privadas 
Con quien vive fi % 
Ambos padres 106 79.7Con la madre 15 11.3 
Con el padre 5 3.8 
Otro familiar 7 5.3 
Total 133 100.0 
Fuente: Estudio de mayo del 2006 
 
2.5.2 Distribución Frecuencia Simple o Tipo I: es un tipo de distribución 
de frecuencia que se utiliza para presentar una variable cuantitativa discreta, 
cuyo rango de valor sea menor o igual de diez. Es decir se utiliza para 
variables cuantitativas discretas que toman pocos valores diferentes. 
 
Ejemplos de estas variables son número de hijos/as por familia, número de 
asignaturas cursadas por los estudiantes de la UASD, número de cursos 
realizados por los empleados y empleadas de una empresa, entre otros. 
 
Ejemplo: Se les preguntó a cincuenta profesores sobre el número de 
estudiantes reprobados que tenía en su curso, los datos son: 
 
Tabla 3: Número de estudiantes reprobados/as por curso 
3 1 4 5 3 2 2 4 2 2 
5 4 2 4 5 3 2 3 3 1 
3 5 3 1 2 2 4 2 1 0 
2 4 4 5 4 3 1 2 3 1 
 
El dato menor que aparece en los datos es el valor cero y el mayor es el cinco 
de forma tal que esta variable en esta muestra toma seis valores diferentes: 
cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una 
distribución de frecuencia simple o tipo I colocamos los diferentes valores de 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 27 
la variable en la primera columna y luego se cuenta el número de veces que se 
repite cada dato, como se muestra en la distribución de frecuencia siguiente: 
 
Cuadro No.: Cantidad de estudiantes reprobados/as por curso 
# de estudiantes fi. % FA % Acum. 
0 1 2.5 1 2.5 
1 6 15.0 7 17.5 
2 11 27.5 18 45.0 
3 9 22.5 27 67.5 
4 8 20.0 35 87.5 
5 5 12.5 40 100.0 
Total 40 100.0 
Fuente: Encuesta a 40 profesores noviembre 2006 
 
2.5.3 Distribución Frecuencia con Clase o Tipo II: Este tipo de distribución 
se utiliza para variables cuantitativas continuas y para aquellas variables 
cuantitativas discretas, cuyo rango de valor sea mayor de diez. 
 
Siempre que se trate de datos cuantitativos continuos se hace necesario el 
uso de este tipo de distribución. La razón para ello es que los datos 
cuantitativos continuos pueden diferir uno del otro por milésima de datos, lo 
que, de tener los diferentes valores con sus respectivas frecuencias se podría 
tener tantas clases como valores individuales se tenga, perdiéndose de esta 
manera la esencia de la agrupación de los datos, “proporcionar información 
sobre las características de las variables estudiadas” 
 
Un ejemplo de este tipo de distribución de frecuencia se muestra a 
continuación 
 
Cuadro No : Calificación de 50 estudiantes de 
un curso de estadística en una prueba parcial 
Calificación fi % FA FRA 
 
≤ 12.0 
12.0 – 13.9 
14.0 – 15.9 
16.0 – 17.9 
18.0 – 20.0 
 
11 
10 
10 
12 
7 
 
22.0 
20.0 
20.0 
24.0 
14.0 
 
11 
21 
31 
43 
50 
 
22.0 
42.0 
62.0 
86.0 
100.0 
TOTAL 50 100.0 
Fuente: Tabla 2 
 
2.6 Pasos para construir una distribución de frecuencia con clase. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 28 
 
Los pasos que se presentan a continuación son solo una guía de cómo 
organizar los datos en una distribución de frecuencia con clase, puesto que la 
forma de presentar los datos muchas veces depende de lo que se quiera 
mostrar en la distribución. Pero cuando no se tiene una idea de cómo agrupar 
los datos, los siguientes pasos son una buena guía y estos pasos son: 
 
1. Calcular el rango de la variable: El rango de una variable se define como la 
diferencia entre dato mayor y el dato menor y el mismo indica los diferentes 
valores posibles que puede tomar la variable 
 
 RV = Xmayor - Xmenor 
 
2. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase 
es la diferencia que existe entre el límite inferior y el límite superior de cada 
clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo 
a los objetivos de quien está presentado la información. Una forma de obtener 
el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual 
establece que el ancho o intervalos de clases en una distribución de frecuencia 
puede aproximarse a partir de la siguiente fórmula: 
 
)log322.3(1 nx
RVÏ

 , n representa el total de datos o tamaño de la muestra 
 
A partir de esta fórmula se obtiene un intervalo de igual dimensión para todas 
las clases lo que facilita el análisis. 
 
3. Establecer los límites de cada clase: para establecer los límites de cada 
clase o intervalo, se inicia con el dato menor y se le suma el intervalo y así se 
continúa hasta llegar al dato mayor observado. Es importante tener en 
consideración que los límites se deben establecer de forma excluyentes, esto es, 
que los valores en los límites no deben ser iguales, por ejemplo, si una clase va 
de 30 a 40, como el 40 no va incluido en esa clase lo aconsejable es establecer 
como limite superior el resultado de la suma disminuido en una unidad, lo que 
nos daría una clase con los siguientes límites; 30 a 39, así, la siguiente clase 
iniciaría con 40 y de esta forma los valores del límite superior de una clase y el 
inferior de la siguiente no van a ser iguales. 
 
Este procedimiento ayuda a que quien lea u organice la información no tenga 
dudas sobre donde colocar por ejemplo el 40, además de que este 
procedimiento facilita un mayor entendimiento del comportamiento de los 
datos. 
 
4 Herbert A. Sturges: “The Choice of a Class Interval”, Journal of the American Statistical 
Association. Marzo 1926 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 29 
 
4. Realizar el conteo y establecer las frecuencias: El conteo consiste es 
determinar cuantos valores de la variable pertenecen a cada clase o intervalo 
 
Ejemplo: 
 
1. Los datos que se muestran a continuación representan las edades de un 
grupo de 40 personas que asistieron al estreno de una película 
 
21 24 33 29 35 26 26 25 44 32 
40 21 31 28 20 26 21 33 32 41 
22 20 22 23 43 50 47 45 26 38 
26 22 24 39 38 35 20 46 20 25 
 
A partir de los datos desarrolle las siguientes preguntas: 
 
a) Construir una distribución de frecuencia 
b) Determinar el porcentaje de personas que tiene menos de 30 años 
c) Interprete el resultado de la frecuencia relativa simple de la tercera clase 
d) Interprete el resultado de la frecuencia relativa acumulada de la quinta 
clase. 
e) ¿Qué porcentaje de las personas que asistieron al curso de estadística 
tiene menos de 38 años? 
 
Iniciamos con los cinco pasos para construir una distribución de frecuencia 
con clase: 
 
1. Rango de la variable: 
 
RV = Xmayor - Xmenor 
RV = 50 – 20 
RV = 30 
 
2. 
)log322.3(1 n
RVÏ

 
 
575.4
3221.6
30
3221.51
30
)6021.1322.3(1
30
)40log322.3(1
30






Ï 
 
3. Establecer los límites de cada clase: recordemos que para la primera 
clase se suma el intervalo al dato menor y así sucesivamente, como se 
muestra a continuación: 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 30 
EDAD 
20-24 
25-29 
30-34 
35-39 
40-44 
45-50 
 
Obsérvese que la primera clase inicia con el 20 que es el dato menor y termina 
en 24 ya que el intervalo de la distribución es de cinco. El lector podrá 
preguntarse porque la primera la clase no termina en 25 que es resultado de 
sumar el intervalo al dato menor y la respuesta es que el 20 como dato menor 
va incluido en el intervalo de la clase y si contamos teneos 20, 21, 22, 23 y 24 
que son los cinco valores del intervalo. 
 
4. Por último establecemos la frecuencia de cada de una de las clases. Un 
procedimiento recomendado es hacer un conteo, tomando en consideración los 
límites de cada clase. Así por ejemplo, si tomamos los valores de la primera 
columna observamos que estos son: 21, 40, 22 y 26 por lo que el primer valor 
corresponde a la primera clase porque es un valor que esta entre 20 y 24, el 
segundo valor corresponde es el 40 y correspondela quinta clase que va de 40 
a 44, el tercer valor es 22 y corresponde a la primera clase porque este valor 
está entre 20 y 24 y el cuarto valor es el 26 y pertenece a la segunda claro 
porque este valor esta entre 25 y 29 que son los límites de esta clase. Este 
procedimiento se sigue hasta incluir todos los valores de la variable en la clase 
o intervalo correspondiente. El resultado de dicho proceso se muestra a 
continuación: 
 
Cuadro No.: Edad de las personas que asistieron al estreno de la película. 
EDAD fi % FA % Acum. 
20-24 13 32.5 13 32.5 
25-29 9 22.5 22 55.0 
30-34 5 12.5 27 67.5 
35-39 5 12.5 32 80.0 
40-44 4 10.0 36 90.0 
45-50 4 10.0 40 100.0 
Total 40 100.0 
Fuente: Encuesta hecha a los/as asistentes al cine 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 31 
b) Determinar el porcentaje de personas que tiene menos de 30 años: 
Como se muestra en la tabla anterior menor a 30 años hay un 55.0% que son 
las personas que tienen entre 20 y 24 años y las que tienen entre 25 y 29 años. 
 
c) Interprete el resultado de la frecuencia relativa simple de la tercera 
clase: La tercera clase es la que va de 30 a 34 y el resultado indica que el 
12.5% de las personas que asistieron al estreno de la película tienen entre 30 y 
34 años. 
 
d) Interprete el resultado de la frecuencia relativa acumulada de la quinta 
clase. El resultado de la frecuencia relativa acumulada de la quinta clase es 
90.0% y el mismo indica que el 90.0% de las personas que asistieron al estreno 
de la película tienen 44 años o menos. 
 
También se puede decir, que el 90.0% de las personas que asistieron al estreno 
de la película tienen menos de 45 años. 
 
e) ¿Qué porcentaje de las personas que asistieron al estreno de la película 
tiene menos de 38 años? Como el 38 no aparece en ninguno de los límites, se 
hace necesario determinar en los datos sueltos cuantas personas tienen menos 
de 38 años y esta cantidad la dividimos entre el total y se multiplica por 100 
para determinar el porcentaje. 
 
Para este caso tenemos un total de 29 personas con menos de 38 años, luego el 
porcentaje de persona con menos de 38 años es de (29/40)*100, es decir 
72.5% 
 
 
 
Ejercicios para el aula 
 
1. El tamaño de un grupo de viviendas, expresado en ciento de m2, se muestra 
en la tabla siguiente. 
 
26 36 33 19 28 26 20 22 8 30 30 20 5 34 
20 25 29 40 17 32 20 6 18 31 19 4 19 32 
20 17 6 28 
 
a) Construir una distribución de frecuencia. 
b) ¿Qué por ciento de las viviendas tienes un tamaño inferior a los 25 m2? 
c) ¿Qué por ciento de las viviendas tiene un espacio mayor a 30 m2? 
d) Interpretar el resultado de la cuarta clase de la frecuencia relativa 
acumulada. 
e) Interpretar el resultado de la frecuencia relativa simple de la tercera clase. 
 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 32 
2. Los datos que se presentan a continuación representan el índice de 
calificación de un grupo de estudiantes de preparatoria. 
 
2.75 3.53 2.42 3.00 3.85 3.71 2.25 2.96 3.00 3.00 
3.50 3.06 3.09 2.22 2.47 3.20 3.02 2.00 2.05 3.60 
 
a) Construir una distribución de frecuencia con cinco clases. 
b) Interpretar el resultado de la frecuencia relativa simple de la tercera clase. 
c) Interpretar el resultado de la frecuencia absoluta acumulada de la cuarta 
clase. 
d) ¿Qué porcentaje de estudiantes tiene un índice de calificación menor a 3.00 
puntos? 
 
3. La escolaridad de 35 padres de familia (expresado en años de educación) se 
presenta como sigue. 
14 16 13 14 16 12 12 13 12 15 16 14 16 17 
16 16 13 12 15 12 16 14 12 12 15 14 13 17 
13 14 16 12 15 16 18 
 
a) Organice los datos en una distribución de frecuencia. 
b) ¿Qué porcentaje de padres de familia, tiene menos de 15 años de 
educación? 
c) ¿Qué porcentaje de padres de familia tiene 12 años de educación? 
 
4. El ingreso quincenal, en cientos de RD$ de un grupo de empleados de la 
empresa K.G. se muestra en los datos siguientes. 
 
24 44 38 22 29 27 48 31 30 27 21 37 42 
39 38 16 32 28 60 10 23 12 17 24 18 
 
a) Organice los datos en una distribución de frecuencia con un intervalo de 
RD$10. 
b) ¿Qué porcentaje de los empleados ganan menos de $20? 
c) ¿Qué porcentaje gana entre 30 y 40? 
d) Interpretar el resultado de la frecuencia relativa simple de la segunda clase. 
 
5) El área de estudio de un grupo de 30 estudiantes se presenta a 
continuación. 
 
1. Administración 11. Indeciso 21. Administración 
2. Economía 12. Indeciso 22. Computación 
3. Contabilidad 13. Economía 23. Mercadeo 
4. Contabilidad 14. Mercadeo 24. Economía 
5. Mercadeo 15. Indeciso 25. Indeciso 
6. Economía 16. Administración 26. Administración 
7. Mercadeo 17. Economía 27. Computación 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 33 
8. Administración 18. Mercadeo 28. Mercadeo 
9. Mercadeo 19. Indeciso 29. Economía 
10. Economía 20. Computación 30. Mercadeo 
 
a. Construir una distribución de frecuencia. 
b. Calcular el porcentaje de estudiante por área de estudio. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 34 
2.7 TABULACIÓN CRUZADA 
 
También se le llama tabla de doble entrada y se utiliza para presentar dos o 
más variables en un solo cuadro. La Tabulación Cruzada proporciona una 
descripción básica de la interrelación que hay entre las variables que se 
tabulan en el cuadro, de igual forma ayuda a buscar patrones de interacción 
siempre que la frecuencia de cada celda represente un número significativo con 
respecto al total. 
 
Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que 
para construir una distribución de frecuencia con una variable. Es decir que se 
debe tomar en consideración las variables a incluir en el cuadro de doble 
entrada, (cualitativa o cuantitativa y en el caso de las variables cuantitativas, 
se debe tomar en cuenta si estas son continuas o discontinuas). 
 
2.7.1 TABULACIÓN CRUZADA PARA DOS VARIABLES 
 
Para la construcción de un cuadro de doble entrada con dos variable, se coloca 
una de las variables en la primera columna o columna principal y la otra 
variable en la primera fila, de forma tal que se forme una celda común para 
cada una de las categorías de las variables incluidas. La variable que se coloca 
en la primera fila generalmente es aquella que tienen un mayor número de 
categorías. 
 
Para ilustrar lo que se ha dicho, suponga que estamos interesados en conocer 
la relación que existe entre dos variables, digamos X e Y. Suponga además que 
la variable X tiene cinco categorías, X1, X2, X3, X4 y X5 y que la variable Y tiene 
tres categorías, Y1, Y2, Y3, si queremos presentar estas dos variables en un solo 
cuadro, el cuadro tendría la forma siguiente: 
 
Yi 
Xi Y1 Y2 Y3 
 
TOTAL 
X1 C11 C12 C13 Total X1 
X2 C21 C22 C23 Total X2 
X3 . . . . 
X4 . . . . 
X5 C51 C52 C53 Total X5 
TOTAL Total Y1 Total Y2 Total Y3 
Total 
general 
 
El cuadro indica dos renglones para el total, esto es debido a que estamos 
presentando solo dos variables, así, en el total de la última fila representa el 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 35 
total de cada columna, mientras que el total de la última columna representa el 
total de cada fila del cuadro. 
 
En las celdas que se forman, se colocaránlos datos que tienen las dos 
características del cuadro. Por ejemplo, en la celda C11, se colocan los 
elementos que son comunes a X1 y a Y1, en la columna C12 se colocan los 
elementos que son comunes a X1 y a Y2 y así sucesivamente. 
 
Ejemplo: Se evaluó el sexo y la calificación final de treinta estudiantes de una 
escuela primaria para conocer la relación entre la calificación en matemáticas y 
el sexo de los/as estudiantes. Los datos se muestran en la tabla siguiente. 
 
No. Sexo Calif. No. Sexo Calif. No. Sexo Calif. 
1 Masc. 68 11 Masc. 70 21 Fem 87 
2 Fem 86 12 Fem 91 22 Masc. 76 
3 Masc. 74 13 Masc. 72 23 Masc. 81 
4 Masc. 72 14 Fem 70 24 Masc. 77 
5 Masc. 72 15 Masc. 65 25 Fem 77 
6 Fem 85 16 Fem 82 26 Masc. 73 
7 Fem 66 17 Fem 68 27 Fem 60 
8 Fem 79 18 Masc. 86 28 Masc. 60 
9 Masc. 70 19 Masc. 71 29 Masc. 71 
10 Masc. 72 20 Fem 82 30 Masc. 73 
 
Para este caso tenemos dos variables, una variable cuantitativa, (calificación 
matemática) y una cualitativa, (sexo de los/as estudiantes). La variable sexo 
tiene dos categorías, masculino y femenino, y la calificación en matemática es 
continua y su rango es mayor de 10 por lo tanto hay que hacer una 
distribución con clases. Para ello vamos a dividir esta variable en cuatro 
categorías, los estudiantes con menos de 70 puntos, los que tienen entre 70 y 
80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o más puntos. 
Luego de esta clasificación el cuadro queda como se ilustra a continuación: 
 
Como se muestra en el cuadro siguiente, el primer alumno es de sexo 
masculino y tiene una calificación de 68 puntos, por lo tanto se coloca en la 
columna de masculino y en la primera fila, ya que aquí de colocan los que 
tienen calificación entre 60 y 69 puntos. El segundo estudiante es una 
estudiante y tiene una calificación de 86 puntos, por lo tanto se coloca en la 
columna de sexo femenino y en la tercera fila, ya que aquí se deben colocar los 
estudiantes que tienen entre 80 y 89 puntos. 
 
El tercer estudiante es sexo masculino y tiene una calificación de 72 puntos, 
por lo que se coloca en la columna de masculino y en la segunda fila, ya que en 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 36 
esta se colocan los estudiantes con calificación entre 70 y 79 puntos. El 
procedimiento se continúa hasta tabular los datos de la tabla como se ilustra a 
continuación 
 
Sexo 
Calificación Masculino Femenino 
 
Total 
60 - 69 /// /// 
70 - 79 ///////////// /// 
80 - 89 // ///// 
90 - 100 / 
Total 
 
Luego del conteo de las frecuencias, los datos son 
 
 
Cuadro No. Calificación en matemáticas y sexo de 
los estudiantes 
Sexo 
Calificación 
Masculino Femenino 
Total 
60 - 69 3 3 6 
70 - 79 13 3 16 
80 - 89 2 5 7 
90 - 100 0 1 1 
Total 18 12 30 
Fuente: Registro de la escuela 
 
Preguntas 
 
1. Determinar el porcentaje de estudiante por sexo 
2. Calcular el porcentaje de estudiantes con menos de 80 puntos 
3. De los que tienen menos de 90 puntos, ¿qué porcentaje es femenino? 
4. Del grupo femenino ¿qué porcentaje tiene menos de 90 puntos? 
5. Que porcentaje de estudiantes tiene entre 80 y 89 puntos 
 
Ejercicio: 
 
Con los datos que se presentan en la tabla siguiente crear un pequeño reporte 
indicando la relación entre el rendimiento académico y el sexo de los 
estudiantes, entre el número de asignatura por sexo, así como el gasto en 
transporte por sexo y número de asignaturas cursadas. Finalmente incluya un 
pequeño análisis de la relación entre la edad de los estudiantes y el número de 
asignaturas cursadas. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 37 
Para el índice académico divida esta variable en tres categorías, los que tienen 
menos de 75 puntos, los que tienen entre 75 y 80 puntos y los que tienen más 
de 80 puntos. En el caso del número de asignaturas, divídala en tres 
categorías, los que cursan menos de cuatro asignaturas, los que están 
cursando cuatro asignaturas y los que cursan más de cuatro. 
 
Para la edad divida esta variable en tres categorías, los que tienen entre 20 y 
23 años, los que están entre 24 y 27 años y los que tienen de 28 y más años. 
En el caso del gasto en transporte haga una división en categorías, si lo 
considera necesario y ser así, divida la variable a su conveniencia. 
 
Datos personales de 30 estudiantes de Informática 
No. EDAD SEXO 
# DE 
ASIG. 
INDICE 
ACAD. 
GASTO EN 
TRANSP. 
1 22 M 3 80.0 20 
2 24 F 3 77.8 50 
3 23 M 4 75.6 60 
4 25 M 5 74.6 30 
5 21 M 3 82.1 30 
6 25 F 3 74.3 50 
7 22 M 3 77.7 40 
8 21 F 6 80.1 40 
9 28 F 3 70.3 40 
10 28 F 4 70.3 40 
11 29 M 5 73.5 40 
12 25 F 3 74.3 20 
13 20 M 4 79.8 40 
14 30 F 2 73.3 20 
15 28 F 3 81.5 40 
16 24 F 4 74.4 40 
17 28 F 3 78.6 40 
18 24 F 6 76.7 40 
19 21 F 4 77.7 20 
20 24 M 3 79.4 20 
21 35 M 2 75.7 40 
22 21 F 4 83.0 40 
23 24 M 3 81.2 50 
24 22 F 3 76.8 60 
25 21 F 4 80.7 30 
26 26 F 3 70.8 50 
27 25 F 4 71.3 20 
28 24 M 5 74.9 80 
29 29 M 3 82.6 30 
30 25 F 5 80.6 20 
FUENTE: ENCUESTA EN EL AULA EST-211 SEC-01. 24/02/2007. 
Apuntes sobre Estadística 
Elaborado por H. Medina Disla. Junio 2010. 38

Más contenidos de este tema