Logo Studenta

EB_ProgramaDesarrollado_20dic

¡Este material tiene más páginas!

Vista previa del material en texto

Educación Superior Abierta y a Distancia • Primer cuatrimestre 1 
 
 
 
 
 
Primer cuatrimestre 
 
 
 
Programa de la asignatura: 
Estadística básica 
 
 
 
Clave: 
 
 
 
 
ESAD 
Noviembre, 2010 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 2 
 
Índice 
 
 
I. Información general de la asignatura 3 
 
A. Ficha de identificación 
B. Descripción 
C. Propósito 
 
II. Competencia a desarrollar 5 
 
III. Temario 5 
 
IV. Metodología de trabajo 6 
 
V. Evaluación 7 
 
VI. Material de apoyo 8 
 
VII. Desarrollo de contenidos por unidad 9 
 
Unidad 1. Fundamentos de estadística 9 
 
Unidad 2. Representación numérica y gráfica de datos 21 
 
Unidad 3. Medidas de tendencia central y dispersión 34 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 3 
 
 
I. Información general de la asignatura 
 
 
A. Ficha de identificación 
 
Nombre de la Licenciatura o Ingeniería: Tronco común 
Nombre del curso o asignatura Estadística básica 
Clave de asignatura: 
Seriación: Sin seriación 
Cuatrimestre: Primero 
Horas contempladas: 90 
 
 
B. Descripción 
 
En un mundo cada vez más competitivo, tanto en las áreas comerciales, financieras, 
tecnológicas y científicas, y donde invariablemente el flujo de información es mayor a cada 
momento, se hace indispensable no sólo la correcta descripción de los datos sino también su 
análisis e interpretación. Es aquí donde la estadística juega un papel preponderante, al ser una 
de las herramientas más poderosas para comprender la variabilidad inherente a los datos 
observados y se constituye como la mejor herramienta para la toma de decisiones. 
 
La diversidad de conocimientos, habilidades, actitudes, creencias y valores, requeridos en cada 
una de las carreras que ofrece la ESAD, hace necesaria la conformación de un tronco básico 
que, por un lado, garantice la formación integral en los atributos generales deseables de los 
estudiantes, y por el otro, derive, de manera natural, en los atributos particulares necesarios 
para cada disciplina de estudio. 
 
El tronco básico se conforma de varias asignaturas comunes que promueven, por un lado, la 
formación integral de los estudiantes, integrando asignaturas de distintas áreas del 
conocimiento, y por otro lado, desarrollan en el estudiante competencias transversales 
necesarias para la investigación, el análisis crítico, el manejo y la sistematización de 
información y datos, así como una serie de valores que le permitan conducirse con ética y 
responsabilidad durante su trayectoria académica y su desempeño profesional. 
 
Las materias que forman el tronco básico son: Contexto socioeconómico de México, Desarrollo 
humano, Estadística básica y Fundamentos de investigación; estas materias a simple vista 
parecen desarticuladas, pero se interrelacionan para contribuir a la formación integral de los 
estudiantes. 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 4 
 
En relación al tronco básico la asignatura Estadística básica tiene varios propósitos, pues 
pretende despertar en el estudiante el interés por la investigación para la toma de decisiones, la 
solución de problemas y el análisis de situaciones y eventos relacionados con el entorno 
académico, profesional, personal y social, rigiéndose en todo momento por un código de ética 
profesional y personal. 
 
Los propósitos de la asignatura en relación al tronco básico son que los estudiantes: 
 
1. Adquieran la capacidad de lectura e interpretación de tablas y gráficos estadísticos que 
con frecuencia aparecen en diferentes medios. 
2. Lleguen a comprender y apreciar el papel de la estadística en la sociedad, incluyendo 
sus diferentes campos de aplicación y el modo en que la estadística ha contribuido a su 
desarrollo. 
3. Identifiquen, dentro del contexto socioeconómico mexicano, la importancia y utilidad de 
los análisis estadísticos para la toma de decisiones. 
4. Se conduzcan de manera ética y responsable en el manejo y análisis de la información. 
 
De manera particular, la materia pone especial énfasis en el enfoque práctico del material y los 
contenidos que se presentan, tratando siempre de relacionar los conceptos, técnicas y casos de 
estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los 
estudiantes el deseo de adentrarse cada vez más a la teoría de la probabilidad y estadística, al 
ver lo importante que resulta su utilización en las diferentes áreas de trabajo. 
 
La asignatura consta de cuatro unidades. En la primera unidad se estudian los fundamentos de 
la estadística, en la segunda las técnicas para representación gráfica y numérica de datos, en la 
tercera se abordan los conceptos básicos de la teoría de probabilidad como una medida del 
riesgo frente a la incertidumbre en experimentos aleatorios y la última unidad presenta el 
concepto de variables aleatorias y los modelos de probabilidad Binomial, Poisson y Normal. 
 
 
C. Propósito 
 
La asignatura tiene como propósito introducir al estudiante con los conceptos y técnicas básicas 
de la estadística aplicada a la licenciatura e ingeniería. El curso tiene un nivel matemático 
elemental, con la intención de que el estudiante comprenda la metodología y su aplicación, y no 
tanto la teoría matemática detrás de ella. 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 5 
II. Competencia a desarrollar 
 
2.1. Competencia general 
 
Utiliza la estadística descriptiva para el análisis de información a través de la recolección, 
representación y la descripción de datos. 
 
 
III. Temario 
 
1. Fundamentos de la estadística 
 
1.1. Introducción a la estadística 
1.1.1. División de la estadística 
 
1.2. Conceptos básicos e importancia de estadística 
1.2.1. Población 
1.2.2. Individuo 
1.2.3. Muestra 
1.2.4. Muestreo 
1.2.5. Dato 
1.2.6. Variable 
1.2.7. Solución de un problema estadístico 
 
1.3. Muestreo aleatorio 
1.3.1. Conceptos básicos de muestreo aleatorio 
1.3.2. Metodología del muestreo aleatorio simple 
 
2. Representación numérica y gráfica de datos 
 
2.1. Organización de datos y distribución de frecuencias 
2.1.1. Frecuencias 
2.1.2. Intervalos 
2.1.3. Construcción de intervalos de clase 
2.1.4. Tablas de datos 
2.1.5. Tablas de frecuencias 
2.1.6. Tablas por intervalos de clase 
2.1.7. Tablas de doble entrada 
 
2.2. Representación gráfica de datos 
2.2.1. Histograma 
2.2.2. Gráfica de barras 
2.2.3. Gráfica de líneas 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 6 
2.2.4. Gráfica de área o de pastel 
 
3. Medidas de tendencia central y dispersión 
 
3.1. Medidas de tendencia central 
3.1.1. Media aritmética 
3.1.2. Mediana 
3.1.3. Moda 
 
3.2. Medidas de dispersión 
3.2.1. Recorrido 
3.2.2. Varianza 
3.2.3. Desviación típica o estándar 
 
 
IV. Metodología de Trabajo 
 
Para el logro de la competencia, es fundamental que los conceptos y procedimientos 
presentados se ejerciten todo el tiempo, pues esperamos que los contenidos no sólo se 
comprendan sino que se apliquen en la solución de problemas que tengan que ver con 
situaciones que los estudiantes pueden enfrentar en su trayectoria académica y profesional. 
 
Por lo anterior, las estrategias metodológicas de enseñanza-aprendizaje son, por un lado, el 
planteamiento de ejercicios y problemas tipo, de cada uno de los procedimientos que se 
abordan durante el curso, esto con el objetivo de que los estudiantes ejerciten en el uso, 
aplicación y manejo de formulas y contenidos procedimentales. Por otro lado, los facilitadores 
de la asignatura tendrán que orientar la aplicación de cada uno de estos procedimientos a las 
áreas específicas de interés delos estudiantes; es decir, dentro de la asignatura se trabajan los 
contenidos de manera aislada y los facilitadores tendrán que ejemplificar y presentar casos y 
situaciones aplicables en las diferentes carreras, que complementen los ejercicios que se están 
planteando. 
 
Como estrategia de evaluación se utiliza un proyecto integrador, donde el estudiante haga uso 
de todo lo que se trabajó en el curso. A lo largo del curso, se les presentarán a los estudiantes 
varias autoevaluaciones de carácter lúdico, esto con el fin de que puedan observar e identificar 
cuáles son sus avances y las dificultades que presentan en el aprendizaje de los temas. 
 
Estas autoevaluaciones contarán con una retroalimentación que sirva para reforzar los temas 
que se evalúan. 
 
El facilitador juega un papel muy importante dentro del curso, pues se espera que sea quien 
dirija y oriente todo el proceso de aprendizaje. 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 7 
 
Deberá diseñar estrategias que propicien un aprendizaje verdaderamente significativo, 
facilitando la comprensión del contenido y relacionando éste con los conocimientos previos del 
estudiante así como con sus áreas específicas de estudio, a través del estudio casos y 
problemas relacionados con el hacer cotidiano donde los estudiantes puedan aplicar y ejercitar 
lo aprendido. Además de ser quien oriente las discusiones y sesiones de trabajo que se 
plantean en los espacios de aprendizaje colaborativo. 
 
 
V. Evaluación 
 
En el marco del Programa de la ESAD, la evaluación se conceptualiza como un proceso 
participativo, sistemático y ordenado que inicia desde el momento en que el estudiante ingresa 
al aula virtual. Por lo que se le considera desde un enfoque integral y continuo. 
 
Por lo anterior, para aprobar la asignatura, se espera la participación responsable y activa del 
estudiante así como una comunicación estrecha con su facilitador para que pueda evaluar 
objetivamente su desempeño. Para lo cual es necesaria la recolección de evidencias que 
permitan apreciar el proceso de aprendizaje de contenidos: declarativos, procedimentales y 
actitudinales. 
 
En este contexto la evaluación es parte del proceso de aprendizaje, en el que la 
retroalimentación permanente es fundamental para promover el aprendizaje significativo y 
reconocer el esfuerzo. Es requisito indispensable la entrega oportuna de cada una de las 
tareas, actividades y evidencias así como la participación en foros, wikis, blogs y demás 
actividades programadas cada una de las unidades, dentro del tiempo especificado y conforme 
a las indicaciones dadas. La calificación se asignará de acuerdo con la rúbrica establecida para 
cada actividad, por lo que es importante que el estudiante la revise antes realizar la actividad 
correspondiente. A continuación presentamos el esquema general de evaluación. 
 
Recursos y herramientas Valor 
Actividades formativas (Envíos a taller y tareas). 20% 
Interacción en el aula y trabajo colaborativo 
(foro, blog, wiki, base de datos). 
20% 
Autoevaluaciones de unidad. 20% 
E-Portafolio. Evidencias de aprendizaje. 40% 
 
Cabe señalar que para aprobar la asignatura, se debe de obtener la calificación mínima 
indicada por la ESAD. 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 8 
 
VI. Material de apoyo 
 
Bibliografía básica: 
 
 Douglas C. Montgomery, George C. Runger (2007). Probabilidad y Estadística aplicadas 
a la ingeniería. Cuarta Edición. México: McGraw-Hill. 
 Walpole Ronald E., Myers Raymond H. (2007). Probabilidad y Estadística para 
Ingenieros. Octava Edición. México: Editorial Pearson. 
 
Bibliografía complementaria: 
 
 Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. (2010). Estadística 
Matemática con Aplicaciones. Séptima Edición. México: Cengage Learning. 
 Ferris Ritchey. (2008). Estadística aplicada a las ciencias sociales. Segunda Edición. 
México: Mc Graw Hill. 
 Douglas L., William M., Samuel W. (2008). Estadística aplicada a los negocios y la 
economía. Decimotercera Edición. México: Mc Graw Hill. 
 Castillo Manrique, Isabel (2006). Estadística descriptiva y cálculo de probabilidades, 
Primera Edición. Pearson Education de México. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 9 
 
VII. Desarrollo de contenidos por unidad 
 
Unidad 1. Fundamentos de la estadística 
 
Propósitos 
 
En esta unidad: 
 Identificarás los conceptos básicos relacionados con la Estadística. 
 Reconocerás la utilidad e importancia de la Estadística. 
 Aplicarás el procedimiento para obtener una muestra aleatoria simple. 
 
 
Competencia específica 
 
Aplica la metodología estadística para obtener información de una muestra aleatoria simple, 
identificando los elementos que intervienen en un problema estadístico. 
Introducción 
 
La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, 
muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar 
las herramientas de análisis estadístico, es necesario comprender qué representa cada 
concepto y la metodología mediante la cual se obtiene un dato estadístico. 
 
En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos 
básicos, así como la metodología del muestreo para que al final, obtengas una muestra 
aleatoria simple. 
 
 
1.1. Introducción a la estadística 
 
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a 
individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden 
deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en 
general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la 
interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva. 
 
Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, 
una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la 
palabra estadística, en primer término se usa para referirse a la información estadística 
descripción de parámetros; también se utiliza para referirse al conjunto de técnicas y métodos 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 10 
que se utilizan para analizar la información estadística; y el término estadístico, en singular y en 
masculino, se refiere a una medida derivada de una muestra. 
 
Utilidad e importancia 
 
La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para 
interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de 
un fenómeno a través de cierto tiempo. 
 
En México, el Instituto Nacional de Estadística y Geografía (INEGI) se encarga de recabar 
información estadística y geográfica de todo el país, en diferentes áreas y contextos. Los datos 
que publica sirven para dar a conocer a cualquier persona la situación en la que se encuentra el 
área de donde se obtuvo la información. 
 
Los métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de 
conocimiento; tanto en el ámbito académico, como en el profesional y laboral, en todos ellos la 
finalidad es poder resolver un problema - entendiendo que un problema queda definido como la 
diferencia entre lo real y lo deseado –, en donde la estadística muestra a la realidad para que el 
investigador pueda analizar sus deseos y con ello tomar una decisión. 
 
 
1.1.1. División de la estadística 
 
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística 
Descriptiva y la Inferencial. 
 
 Estadística Descriptiva: La función descriptiva de la estadística se enfoca en la 
presentacióny clasificación de los datos obtenidos de la población que se analiza. 
 
 Estadística Inferencial: Esta aplicación de la estadística busca plantear y resolver 
problemas específicos y/o hacer previsiones a partir de los datos de una muestra, dado 
que es muy difícil estudiar a la población completa. 
 
 
La estadística descriptiva describe datos. 
 
 
La estadística inferencial infiere con esos 
datos, entendiendo inferir como la 
estimación de un resultado. 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 11 
 
1.2. Conceptos básicos e importancia de la estadística 
 
1.2.1. Población 
 
Conjunto de todos los elementos que permiten resolver un problema y que presentan una 
característica común determinada, observable y medible. Por ejemplo, si el elemento es una 
persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los 
elementos que integran una población pueden corresponder a personas, objetos o grupos (por 
ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.). 
 
1.2.2. Individuo 
 
Un individuo o unidad estadística es cada uno de los elementos que componen la población. 
Nota que un individuo en estadística puede ser distinto a un individuo como persona. Por 
ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada 
negocio, que está formado por varias personas, es un individuo de la población. 
 
1.2.3. Muestra 
 
Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso 
que no se detiene (como la producción de un bien), se debe analizar un subconjunto o parte de 
esta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto 
presenta el mismo comportamiento y características que la población. En general el tamaño de 
la muestra es mucho menor al tamaño de la población. 
 
1.2.4. Muestreo 
 
Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción 
reducida y representativa de la población. 
 
1.2.5. Dato 
 
El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico. Por 
ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, 
cruz. 
 
1.2.6. Variable 
 
Se llama variable a una característica que se observa en una población o muestra, y a la cual 
se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. 
Las variables se pueden clasificar en cuantitativas y cualitativas: 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 12 
 
 
a) Variable cuantitativa: se expresa en valores numéricos. Dentro de ella, se subdividen en: 
 Discreta: Se tratan de variables expresadas con valores enteros. Ej. N° de hijos de una 
familia, n° de alumnos de un curso. 
 Continua: son valores que pueden tomar cualquier valor dentro de un intervalo. Ej. Peso, 
estatura, sueldos. 
 
b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen 
en: 
 Nominal: son variables presentadas sin orden ni jerarquía. Ej. Estado civil, preferencia 
por una marca, sexo, lugar de residencia. 
 Ordinal: son variables organizadas de acuerdo con una clasificación. Ej. grado de 
estudios, días de la semana, calidad de la atención, nivel socioeconómico. 
 
 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 13 
 
1.2.7. Solución de un problema estadístico 
 
La solución de un problema estadístico comprende los siguientes pasos: 
 
a) Planteamiento del problema 
En el planteamiento se define si se requiere de una muestra o es posible estudiar la 
población, las características a estudiar (las variables), si es necesario establecer 
una hipótesis, etc. En este punto también se analizan los medios de los que se 
dispone y el procedimiento a seguir. 
 
b) Elaboración de un modelo 
Se establece un modelo teórico de comportamiento de las variables de estudio. En 
ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Los 
posibles modelos son Normal, Binomial, Poisson, Uniforme, Cuando es difícil 
estudiar la población debido a su gran tamaño o que provenga de un proceso que no 
se detiene (como la producción de un bien) , se debe analizar un subconjunto o 
parte de esta que la represente, etc. 
 
c) Extracción de la muestra 
Se usa alguna técnica de muestreo o un diseño experimental para obtener 
información de una pequeña parte de la población. 
 
d) Tratamiento de los datos 
En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos 
y se calculan los valores que serán necesarios en pasos posteriores, como la media 
y la varianza de la muestra. Los métodos de esta etapa corresponden a los métodos 
de la estadística descriptiva. 
Algunas de las etapas de esta fase son: recopilación, clasificación y presentación de 
la información. 
 
e) Estimación de los parámetros 
La estadística inferencial nos proporciona herramientas para la predicción o 
estimación de los parámetros de la población que nos ayudarán a resolver el 
problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se 
obtienen del análisis de los datos y los intervalos de confianza. 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 14 
 
1.3. Muestreo aleatorio 
 
Introducción 
 
Los estudios estadísticos normalmente se hacen con una parte de la población, ya que 
realizarlos sobre la totalidad resultaría demasiado complicado. Para que la información obtenida 
tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones 
específicas, relacionadas con el método para determinar el tamaño y características de la 
muestra y los individuos que la componen. 
 
1.3.1. Conceptos básicos de muestreo aleatorio 
 
Para que la información obtenida tenga validez y confiabilidad es necesario que cumpla con 
algunas condiciones específicas. Los métodos de muestreo se pueden clasificar en: 
 
 Muestreo probabilístico: en él, todos los elementos de una población y, por lo tanto, 
todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestras 
obtenidas a través de este tipo de muestreo son confiables porque aseguran la 
condición de representatividad que es muy importante para hacer generalizaciones. 
 Muestreo no probabilístico: en este tipo de muestreo los elementos de la población no 
comparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas no 
cumplen con la condición de representatividad, por lo que no es confiable hacer 
generalizaciones a toda la población. 
 
 
1.3.2. Metodología del muestreo aleatorio simple 
 
1. Definir la población de estudio y el parámetro a estudiar. 
Recordemos que la población es el grupo formado por el conjunto total de individuos, objetos 
o medidas que poseen algunas características comunes observables en un lugar y en un 
momento determinado. Por lo tanto, el paso 1 es determinar el que se va a estudiar. 
Por ejemplo: 
 
Un investigador realiza un estudio sobre las relaciones de género en el noviazgo, su 
objeto de estudio es las manifestaciones de violencia física y psicológica entre los 
estudiantes del último año de la carrera de química. Su población es el total de 
estudiantes del último año de ingeniería química que tengan novio o novia; el total 
de individuos con esta característica es de 386 en este ejemplo. Por lo que, la 
población es de 386 individuos y las variables son: violencia física y violencia 
psicológica. 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 15 
 
2. Enumerar a todas las unidades de análisis que integran la población, 
asignándoles un número de identidad o identificación. 
 
Una vez que hemos definido nuestra población y las variables a estudiar, esnecesario asignar un número de identificación a cada individuo de la población. 
Siguiendo con el ejemplo de la relaciones de género en el noviazgo en los 
estudiantes de química, lo que sigue es numerar a los 386 estudiantes un número 
del 1 al 386. 
 
3. Determinar el tamaño de la población, determinar el porcentaje de error y el 
porcentaje de confianza y obtener una muestra preliminar. 
 
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores: 
 
a) El porcentaje de confianza con el cual se quiere generalizar los datos desde la 
muestra hacia la población total. 
b) El porcentaje de error que se pretende aceptar al momento de hacer la 
generalización. 
c) El nivel de variabilidad que se calcula para comprobar la hipótesis.Veamos en 
qué consiste cada concepto: 
 
 Definir el tamaño de la población: Significa determinar el número de individuos que la 
constituyen; la variable N representa el tamaño de la población. Esto es, N=X. 
 
 Porcentaje de confianza: Es el grado o nivel de seguridad que existe para generalizar 
los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir 
que no existe ninguna duda para generalizar tales resultados, pero también implica 
estudiar a la totalidad de los casos de la población. 
 
Para evitar un costo muy alto se busca un porcentaje de confianza menor, comúnmente 
es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningún 
cálculo) para poder acertar al valor verdadero de la población. Este dato se obtiene a 
partir de la distribución normal estándar (esto se considerará en la unidad 4). 
 
 Porcentaje de error: Este error es una distancia alrededor del valor que deseamos 
estimar y nos da un margen de aproximación. Al igual que en el caso de la confianza, si 
se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del 
mismo tamaño que la población, por lo que conviene correr un cierto riesgo de 
equivocarse. Comúnmente se aceptan entre el 4% y el 6% como error, tomando en 
cuenta de que no son complementarios la confianza y el error. 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 16 
 
 Variabilidad: Es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la 
hipótesis que se quiere comprobar. El porcentaje con que se aceptó tal hipótesis se 
denomina variabilidad positiva y se indica con p (también llamada probabilidad de éxito), y 
el porcentaje con el que se rechazó la hipótesis es la variabilidad negativa, identificada 
por q (también llamada probabilidad de fracaso y se obtiene 1-p). 
Variabilidad positiva = p = a la probabilidad de que suceda el evento. 
Variabilidad negativa = q = a la probabilidad de que no suceda el evento. 
 
4. Determinar el tamaño óptimo de muestra para el estudio. 
 
Una vez que la población, el porcentaje de confianza, el porcentaje de error y el nivel de 
variabilidad han sido determinados, se debe determinar el tamaño de la muestra. 
En este paso, se utiliza cualquiera de las siguientes fórmulas. El uso de una u otra 
depende de si se conoce o no el tamaño de la población. 
 
Para cuando no se conoce el tamaño de la población: 
 
n es el tamaño de la muestra 
Z es el nivel de confianza 
p es la variabilidad positiva 
q es la variabilidad negativa 
E es la precisión o error 
 
Ejemplo: 
En un lote grande de medicinas, se desea verificar que la proporción de los ingredientes 
activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de 
confianza del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5. 
 
Solución: 
Para el nivel de confianza sea igual al 95%, tenemos que P(Z)=0.95 si Z=1.96. 
Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en 
el caso necesario, hay que convertir esos valores a proporciones. 
 
Sustituyendo:
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 17 
 
Es decir, se ocupará una muestra de aproximadamente 384 unidades. 
 
 
Para cuando se conoce el tamaño de la población: 
 
 
n es el tamaño de la muestra 
Z es el nivel de confianza 
p es la variabilidad positiva 
q es la variabilidad negativa 
N es el tamaño de la población 
E es la precisión o error 
 
Ejemplo: 
En un lote de 25,000 cajas de medicina, se desea verificar que la proporción de los 
ingredientes activos sea el adecuado. Se debe determinar el tamaño de la muestra para 
un nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidad 
p=q=0.5. 
 
Solución: 
Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96. 
Sustituyendo: 
 
 
 
 
En otras palabras, se ocupará una muestra de aproximadamente 378 cajas. 
 
 
5. Seleccionar la muestra usando números aleatorios. 
 
El último paso para obtener la muestra es saber qué individuos específicos de la 
población se tomarán. Para hacer esto debemos: 
 
1. Numerar a los individuos de la población del 1 a N (donde N es el tamaño de la 
población). 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 18 
 
2. Generar números aleatorios mediante programas computaciones (por ejemplo, Excel 
con la función “=aleatorio ()” ), funciones en calculadora o bien utilizando tablas de 
números aleatorios. También puedes generar números aleatorios de formas mecánicas, 
por ejemplo, sacando números de una urna o lanzando una moneda al aire. 
 
3. Tomar los individuos correspondientes a los números elegidos. 
 
 
 
Nosotros nos enfocaremos únicamente en el uso de la tabla de números aleatorios. 
Procedimiento para utilizar las Tablas de Números aleatorios: 
Se selecciona el bloque, el renglón y la columna de la tabla. Partiendo de esta 
selección, se toman tantas columnas como dígitos tenga la población (N). Comenzando 
por el primer número de las columnas, s- e incluirán en la muestra aquellos individuos 
que en la lista de la población ocupen la posición de los “n“ números de las columnas 
seleccionadas, siempre que sean menores que N. Si el número seleccionado en la tabla 
es mayor que N lo pasamos por alto y seguimos hasta tener la muestra total. 
Ejemplo: 
Suponga que tenemos la siguiente tabla de 100 datos, numerados del 00-99. 
 
 0 1 2 3 4 5 6 7 8 9 
0 61 21 15 68 79 63 81 84 73 28 
1 78 73 10 4 40 20 87 1 46 84 
2 83 26 21 49 30 71 69 45 25 29 
3 64 74 1 83 74 98 24 25 91 65 
4 29 46 29 34 46 38 25 23 81 17 
5 79 34 24 77 23 1 44 31 29 99 
6 93 39 73 64 66 93 92 61 25 69 
7 58 39 34 88 88 33 5 79 58 51 
8 67 64 52 56 18 51 30 16 68 29 
9 32 7 72 88 48 28 30 22 74 39 
 
 
 
Selecciona una muestra aleatoria de 7 números. 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 19 
 
 
 
 
En la figura anterior tenemos una tabla de números aleatorios tomados de este documento 
(http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf), 
seleccionemos una fila al azar, suponga la fila 5, y separamos los números de 2 en 2, 
tendríamos entonces la siguiente serie de 7 números: 65 03 83 69 67 67 43 54 49 27 82 50 15 
06 etc. Esto significa que nuestra muestra aleatoria deberá contener esos individuos, en el caso 
de 67 que se repite, solo lo consideramos una vez y pasamos al siguiente número. (En algunas 
calculadoras existe la función RAN# que nos proporciona también números aleatorios, en esta 
basta con poner en la calculadora el número de muestras + (Tecla SHIFT) + RAN# y cada vez 
que presionemos la tecla (=) nos dará un numero aleatorio, si solo queremos la parte entera, 
ignoramos al decimal). Tendríamos la siguiente tabla: 
 
 
Número aleatorio Individuo de la muestra 
65 93 
03 68 
83 56 
69 69 
67 61 
43 34 
54 23 
49 17 
27 45 
82 52 
 
Por lo que nuestra muestra quedaría con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52. 
 
 
 
 
 
 
 
Educación SuperiorAbierta y a Distancia • Primer cuatrimestre 20 
 
Consideraciones específicas de la unidad 
 
En esta unidad se trabajará con lecturas de apoyo y se resolverán problemas como ejercicios 
para reforzar el aprendizaje. 
 
Tendrás que participar en una encuesta con la cual se generará una base de datos, este 
material lo utilizarás a lo largo del curso para que elabores las evidencias de aprendizaje de 
cada unidad. 
 
Referencias: 
 
1. --- Statistics. (2010). En Merriam-Webster Online Dictionary. Consultado el 8 de marzo 
de 2010 en: http://www.merriam-webster.com/dictionary/statistics 
2. Borrego, Silvia (2008). “Estadística descriptiva e inferencial” en: Revista digital 
innovación y experiencias educativas 13. Consultado el 10 de marzo de 2010 en: 
http://www.csi-
csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf 
3. Castillo Manrique, Isabel (2006). Estadística descriptiva y cálculo de probabilidades. 
México: Pearson Educación. 
4. Galbiati Riesco, Jorge M. (s/f). Conceptos Básicos de Estadística. Pontificia Universidad 
Católica de Valparaíso, Instituto de Estadística. Consultado el 01 de marzo de 2010 en: 
http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf 
5. Jordi Casal, Enric Mateu (2003). “Tipos de muestreo” en: Revista Epidem. Med. Prev. 1: 
3-7. Consultado el 01 de marzo de 2010 en: 
http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf 
6. Larios Osorio, Víctor (1999). “Unidad 5. Teoría de muestreo”. Consultado el 12 de marzo 
de 2010 en: http://www.uaq.mx/matematicas/estadisticas/xu5.html 
7. Lind, Douglas; William Marchal y Samuel Wathen (2008). Estadística aplicada a los 
negocios y la economía. Decimotercera edición. México: McGraw-Hill. 
8. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadística 
aplicadas a la ingeniería. Cuarta edición. México: McGraw-Hill. 
9. Ritchey, Ferris (2008). Estadística para las ciencias sociales. Segunda edición. México: 
McGraw-Hill. 
10. Ruiz Muñoz, David (2004). Manual de estadística. Consultado el 09 de marzo de 2010 
en: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm 
11. Wackerly, Dennis D.; William Mendenhall III y Richard L. Scheaffer (2010). Estadística 
Matemática con Aplicaciones. Séptima edición. México: Cengage Learning. 
12. Walpole Ronald E.; Raymond H. Myers, et al. (2007). Probabilidad y Estadística para 
Ingeniería y ciencias. Octava Edición. México: Pearson Educación. 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 21 
 
Unidad 2. Representación numérica y gráfica de datos 
 
 
Propósitos 
 
En esta unidad: 
 Identificarás algunos conceptos que se utilizan en estadística descriptiva. 
 Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas. 
 
 
Competencia específica 
 
Utiliza las técnicas de representación numérica y gráfica para representar información a través 
de la organización de los datos obtenidos de una muestra o población. 
 
 
Introducción 
 
En la unidad anterior vimos que existen dos grandes divisiones de la estadística: la que se 
dedica a la recolección, presentación y categorización de datos, llamada estadística descriptiva, 
y la que se dedica a realizar hipótesis en base a dichos datos, llamada inferencial. También 
aprendimos a determinar el espacio de estudio, es decir la población, y las variables que se van 
a estudiar de acuerdo al problema planteado. 
 
En esta unidad estudiaremos la Estadística Descriptiva, y dentro de ella aprenderemos cómo 
organizar y presentar los datos que se obtienen de las muestras tomadas de nuestras 
poblaciones. Antes de comenzar con los temas, veamos de dónde y cómo se obtienen los 
datos que vamos a organizar. 
 
Cuando se realiza un trabajo que requiere de la estadística, las personas que realizan el trabajo 
diseñan sus instrumentos para recolectar la información y obtener los datos que necesitan. 
Existen muchos métodos para recolectar información, pero los más frecuentes son: 
 
Censos 
Es una técnica de recolección de datos que se aplica a la totalidad de los elementos que 
componen la población o universo que se estudia. Un censo debe cumplir dos condiciones: 
Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la población. 
Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado. 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 22 
Encuesta 
Esta técnica se utiliza para recolectar información de una muestra de la población. Consiste en 
presentar un conjunto de preguntas abiertas (preguntas que no tienen respuestas 
predeterminadas) o cerradas (preguntas que cuentan con una serie de respuestas 
establecidas). 
 
Experimento 
Otra de las técnicas más recurridas en estadística para recolectar información son los 
experimentos, veamos en qué consisten. 
 
Un experimento es una prueba que se realiza para determinar las características o 
comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué 
alimentos nos parecen más salados. 
 
Un experimento, también se define como el proceso que se realiza para verificar una serie 
de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las 
características o comportamientos del fenómeno que se analiza. Por ejemplo, un experimento 
para determinar la velocidad de la luz en el vacío; donde se está determinando la velocidad de 
la luz. 
 
La diferencia entre la primera y la segunda definición es que en la segunda se parte de una 
hipótesis mientras que en la primera no necesariamente. 
 
En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cuál pienso 
que me sabrá más salado. En el segundo ejemplo, mi hipótesis, a partir de estudios anteriores, 
es que la velocidad de la luz en el vacío es de 300 000 km/seg. 
Mi experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error 
experimental. 
 
2.1. Organización de datos y distribución de frecuencias 
 
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta 
área sólo describe, resume, organiza y representa los datos obtenidos de una población o 
muestra de dicha población, sin elaborar inferencias ni obtener conclusiones. 
La organización de datos se realiza a través de tablas que se utilizan para simplificar la 
presentación y distribución de estos datos. A continuación veremos que existen diferentes tipos 
de presentación de datos y con base en ellos distintas clasificaciones de frecuencia, como: 
frecuencia relativa, frecuencia acumulada y frecuencia absoluta. 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 23 
2.1.1. Frecuencias 
 
Dentro de los conceptos básicos para la organización de datos están los que conciernen a la 
frecuencia: 
 
 Frecuencia: es el número de veces que se repite un dato, también se le conoce como 
frecuencia absoluta. 
 
 Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables hasta 
el renglón i. También es conocida como frecuencia absoluta acumulada. 
 
 Frecuencia relativa: es el resultado de dividir la frecuencia entre el número total de 
datos (N). Este dato también puede verse como un porcentaje. 
 
 Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta el 
renglón i. 
 
Podemos encontrar las frecuencias organizadas en tablas que estudiaremos más adelante. Por 
ahora veamos cómo se representan los tipos de frecuencia que vimos anteriormente, 
supongamos que tenemos la siguiente distribución de datos: 
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 
23, 52, 7, 18, 52, 23. 
 
No. De 
renglón 
(i) 
Datos 
obtenidos de 
la variable 
Frecuenci
a 
fi 
Frecuencia 
Acumulada 
Fi 
Otra forma 
para obtener 
Fi 
FrecuenciaRelativa 
hi 
Frecuencia 
Relativa acumulada 
Hi 
1 7 f1= 2 f1=F1= 2 f1 = F1=2 
h1=f1/N=0.06
25 
h1=H1=0.0625 
2 18 f2= 6 
f1+f2= F2= 
8 
F1+f2=F2=
8 
h2=f2/N=0.18
75 
h1+h2=H2=0.2500 
3 23 f3= 8 
f1+f2+f3= 
F3=16 
F2+f3=F3=
16 
h3=f3/N=0.25
00 
h1+h2+h3=H3=0.5000 
4 41 f4= 4 
f1+f2+f3+f4
= F4=20 
F3+f4=F4=
20 
h4=f4/N=0.12
50 
h1+h2+h3+h4=H4=0.6250 
5 47 f5= 7 
f1+f2+f3+f4
+f5= F5=27 
F4+f5=F5=
27 
h5=f5/N=0.21
87 
h1+h2+h3+h4+h5=H5=0.8430 
6 52 f6= 5 
f1+f2+f3+f4
+f5+f6= 
F6=32 
F5+f6=F6=
32 
h6=f6/N=0.15
63 
h1+h2+h3+h4+h5+h6=H6=1.0
000 
Total N=32 1.0000 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 24 
2.1.2. Intervalos 
 
 Intervalo o rango: Conjunto de números comprendidos entre otros dos números dados, 
conocidos estos últimos como límites del intervalo. 
 
 Intervalo de clase: En estadística, se llama intervalo de clase a la expresión que 
nombra un intervalo. 
 
 Amplitud del intervalo: Es la diferencia del límite superior menos el límite inferior (Ls -
Li). 
 Fronteras de clase: Son los puntos medios entre los límites de intervalos consecutivos. 
 
 Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un 
intervalo y el límite inferior del siguiente. 
 
Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de 
los límites inferior y superior del intervalo dividido entre 2. A la marca de clase 
también se le denomina punto medio de clase. 
 
Ejemplo de intervalos 
Veamos cómo se representan los conceptos relacionados con los intervalos. 
Dados los números 15 y 25, tendríamos que: 
El intervalo corresponde a todos los números que se encuentran entre el 15 y el 
25. El intervalo de clase sería: 15-25 
 
Los límites del intervalo son: 
 
Límite inferior = 15 
Límite superior = 25 
 
La amplitud del intervalo 15-25 sería: 25 menos 15, es decir 10. Es 
recomendable que todos los intervalos tengan la misma amplitud. Para ello 
podemos restar el dato menor del dato mayor y dividir este resultado entre el 
número de intervalos que se deseen. 
La frontera de clase: si tomamos los intervalos 4-14, 15-25 y 26-36, las fronteras 
de clase serían: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo 
intervalo, por último, 25.5 y 36.5 para el tercer intervalo. 
 
La frontera de clase no debe coincidir con los datos límites del intervalo, porque 
sería complicado identificar el intervalo al que pertenece dicho dato. 
Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos 
3.5-14.5, 14.5-25.5 y 25.5-36.5. Si se tiene el dato 25.5 no se sabría si ponerlo 
en el segundo o en el tercer intervalo. 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 25 
 
Si esta coincidencia sucede deberá moverse el intervalo. Siguiendo con el 
ejemplo, moviéndolo un punto a la izquierda tendríamos los intervalos 2.5-13.5, 
13.5-24.5 y 24.5-35.5. 
La marca de clase del intervalo 15-25 es igual a: 
 
 
Es recomendable que la marca del intervalo coincida con alguno de los datos. 
Esto no es necesario y no siempre se logra, sobre todo cuando los intervalos 
tienen la misma amplitud. 
 
2.1.3. Construcción de intervalos de clase 
 
La formación de clases o intervalos de clase, que se representa con (k), dependen, 
generalmente, del tamaño del rango de la población o muestra. Lo que se debe hacer para 
determinar los intervalos de clase es lo siguiente: 
 
1. Calcular el rango: 
 
Para esto, se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es 
el resultado de la resta, esto es: 
 
R= Xn – X1 
 
Por ejemplo: 
Si en una serie de datos que van desde el 18 hasta el 56, tendríamos lo siguiente: 
Xn= 56 y X1= 18, por lo tanto: 
R= Xn – X1= 56 – 18= 38 
 
2. Determinar el número de intervalos que se desea tener: 
No existe una regla para determinar el número de intervalos, pero generalmente se suelen 
crear entre 5 y 20 intervalos. La decisión la toma el investigador. 
Siguiendo con nuestro ejemplo, diríamos que vamos a construir 7 intervalos. 
Entonces decimos que K=7. 
 
3. Dividir el rango entre el número de intervalos que se desea tener: 
Recordemos que lo recomendable es elegir un número entre 5 y 20 para los intervalos. 
Dividimos entre uno menos de los intervalos deseados porque con el número de datos se 
acumula un intervalo más. 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 26 
 
Siguiendo con el ejemplo, deseo 7, entonces: 
 
Esta será la amplitud de los intervalos. Cuando no es un número entero, se escoge el entero 
más cercano, como en este caso, tomamos el rango igual a 5. 
Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo más, entonces 
se divide entre el número de intervalos que se quieren. 
 
4. Se forman los intervalos: 
 
Los intervalos se forman comenzando un número antes del primer dato: 
INTERVALOS: 
17 a 22 (se cuenta 5 desde 18 hasta 22) 
23 a 28 
29 a 34 
35 a 40 
41 a 46 
47 a 52 
53 a 58 
 
Nota: No importa que el último intervalo exceda el último dato. 
 
Ejemplo de construcción de intervalos 
Veamos el siguiente ejemplo para la construcción de intervalos de clase. 
El director de una consultoría en desarrollo de software desea conocer el número de 
incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello 
pide a uno de sus empleados que le elabore un reporte, el empleado tiene los siguientes datos: 
35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 
27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 
25, 24, 60, 55, 48, 37, 31, 30, 22, 20. 
 
Vayamos paso por paso: 
 
1. Calcular el rango: 
R= Xn – X1= 60-20=40 
 
2. Determinar el número de intervalos entre 5 y 20: 
Elegimos 8 intervalos 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 27 
 
3. Dividir el rango entre el número de intervalos: 
 
 
4. Se forman los intervalos: 
Comenzamos por un número anterior al límite inferior: 19-24, 25-29, 30-35, 36-
40, 41-45, 46-50, 51-55, 56-60. 
 
 
2.1.4. Tablas de datos 
 
Existen diferentes tipos de tablas para presentar los datos, las más utilizadas son: Tabla de 
datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. 
 
Veamos en qué consiste cada una: 
Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza 
cuando la información que necesitamos son los datos mismos. Se organizan en columnas o 
renglones y se registran las mediciones o datos obtenidos. 
 
Ejemplo: 
Supongamos que la medición de temperatura a lo largo del día da como resultado los 
siguientes valores en grados Celsius: 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7. Entonces 
construimos una tabla como la siguiente: 
 
Temperatura 
(Celsius) 
20.4 21.2 22.1 23.9 25.3 26.9 27.7 
 
 
2.1.5 Tablas de frecuencias 
 
Esta nos aporta mayor información pues está formada por categorías de la variable que se esté 
midiendo y su frecuencia (es decir, el número de ocurrencias de un valor dado). 
 
Ejemplo: 
suponga que un experimento da los siguientes valores medidos: 
1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 28 
 
Procedemos entonces a agrupar por categorías, según la frecuencia o número de veces que 
aparece cada medición: 
 
Valor de la 
Variable medida 
Frecuencia 
1 4 
2 7 
3 5 
4 4 
5 5 
6 1 
 
 
2.1.6. Tablas por intervalos de clase 
 
En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores 
correspondientes a cada variable. 
 
Ejemplo: 
En una encuesta sobre el desempleo en el Área Metropolitana de la Ciudadde México, se 
organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de 
cada intervalo, teniendo un total de 23,700 desempleados. 
 
Grupo de edad Frecuencia 
De 12 a 19 9600 
De 20 a 24 7100 
De 25 a 34 3900 
De 35 a 44 1500 
De 45 a 99 1600 
 
 
2.1.7. Tablas de doble entrada 
 
Estas tablas proporcionan información referente a dos variables o eventos relacionados entre 
sí. Se forma poniendo en los renglones de la tabla la información de una de las variables y en 
las columnas la información de la otra variable. 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 29 
 
Ejemplo: 
 
Suponga que se miden el número de cirugías realizadas por edades en una muestra de 100 
personas, encontrándose lo siguiente: 
 
Edades / No. de cirugías Menos de 2 cirugías Más de 2 cirugías 
0-10 1 0 
11-20 2 2 
21-30 6 4 
31-40 11 7 
41-50 17 6 
Más de 50 30 14 
 
 
Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables 
relacionadas son los rangos contra el valor de las variables en dicho rango. 
 
Por ejemplo: 
 
Supongamos que medimos la temperatura de un líquido con respecto al tiempo de 
calentamiento. En el renglón colocamos los tiempos y en las columnas la temperatura obtenida. 
 
Podríamos considerar la tabla como una tabla de frecuencias o como una tabla de doble 
entrada: 
Tiempo 
(min) 
Temperatura 
(°C) 
1-5 36 
6-10 44 
11-15 67 
 
 
2.2. Representación gráfica de datos 
 
Introducción 
 
En el tema anterior presentamos diferentes formas de organizar o de tabular datos y vimos la 
distribución de frecuencias. Ahora veremos la representación gráfica de los datos. 
Las gráficas son representaciones visuales de los datos que se muestran en una tabla. Existen 
diferentes tipos de gráficas, cada una de ellas se elabora con base en el tipo de información 
que se quiere representar. 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 30 
 
2.2.1. Histograma 
 
Histograma es la representación gráfica de una variable continua. Se elabora en un sistema de 
coordenadas rectangulares. 
 
 El eje horizontal se utiliza para representar a la variable independiente, es decir, a la 
escala de medición o fronteras de clase. 
 El eje vertical representa a la escala de frecuencias. 
 Si los intervalos de clase tienen el mismo ancho, las alturas de las barras serán 
proporcionales a las frecuencias. 
 
El histograma también proporciona visualmente el aspecto de la distribución y dispersión de las 
mediciones. 
 
 
2.2.2. Gráfica de barras 
 
Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En estas se 
muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura de la barra y 
no por el área de la barra. Esta gráfica muestra las discontinuidades en las mediciones por 
medio de espacios vacios entre las barras. 
 
La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas: 
 
Barras verticales: 
 
• En el eje horizontal se representan los valores de la variable. 
• En el eje vertical se representa la frecuencia de cada clase. 
 
Barras horizontales: 
 
• En el eje horizontal se representan las frecuencias. 
• En el eje vertical los valores de la variable. 
 
Un histograma y una gráfica de barras son muy semejantes, la diferencia radica en que el 
histograma no presenta separación entre las barras. 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 31 
 
2.2.3. Gráfica de líneas 
 
Una gráfica de líneas se construye también en un sistema coordenado rectangular, y muestra la 
relación entre las variables mediante puntos conectados por líneas continuas. La frecuencia de 
cada valor medido es representada por la altura del punto. 
 
En el eje horizontal se representa a la variable y en el eje vertical la frecuencia. Se determinan 
los puntos de corte del valor de la variable con su frecuencia y se unen, obteniéndose la gráfica 
de línea. 
 
2.2.4. Gráfica de área o de pastel 
 
Una forma de representar datos u observaciones de una variable cualitativa es mediante un 
diagrama circular. Esta gráfica muestra la relación entre las variables dividiendo un círculo (o 
pastel) en sectores (o rebanadas). También se utilizan para representar la distribución de 
frecuencias, pero es el área de cada sector la proporcional a los valores medidos. 
 
Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del problema 
con respecto a la circunferencia determinando sectores circulares para cada categoría. 
 
Ejemplo: 
 
Considere la siguiente tabla de datos. 
 
Medición en 
cm 
Frecuencia 
Frecuencia 
acumulada 
Porcentaje 
30 3 3 3% 
30.1 7 10 6% 
30.2 12 22 10% 
30.3 18 40 15% 
30.4 23 63 19% 
30.5 21 84 18% 
30.6 17 101 14% 
30.7 11 112 9% 
30.8 5 117 4% 
30.9 1 118 1% 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 32 
 
En esta figura se muestra el histograma de las mediciones en cm vs. frecuencia, note como el 
ancho de las clases es el mismo. 
 
 
En la gráfica de pastel se muestra dentro de cada “rebanada” la medición en cm y el porcentaje 
que corresponde a la frecuencia relativa. 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 33 
 
En esta figura se muestra la frecuencia acumulada mediante una gráfica de línea. 
 
 
 
 
Consideraciones específicas de la unidad 
 
En esta unidad se trabajará con dos problemas diferentes que permitirán practicar a 
elaboración de tablas de datos y gráficas, además de participar en un foro sobre el uso 
cotidiano de la estadística descriptiva. La evidencia de aprendizaje se generará a partir de la 
muestra que se obtuvo en la unidad uno. Consiste en la elaboración de tablas de datos y 
gráficas de diferentes tipos. 
 
Referencias: 
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadística 
aplicadas a la ingeniería. Cuarta edición. México: McGraw-Hill. 
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadística para 
Ingeniería y ciencias. Octava edición. México: Pearson Educación. 
3. Intervalos de clase. Consultado el 26 de abril de 2010 en: 
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descrip
tiva_2/estadistica_descriptiva_2.htm 
4. Censo y entrevista. Consultados el 26 de abril de 2010 en: 
http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc. 
http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf 
 
Para saber más: 
5. Estadística y probabilidad. Consultado el 27 de abril de 2010 en: 
http://www.vitutor.com/estadistica.html 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 34 
 
Unidad 3. Medidas de tendencia central y dispersión 
 
 
Propósitos 
 
En esta unidad: 
 
• Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión 
en datos agrupados y no agrupado. 
 
 
Competencia específica 
 
Utiliza las medidas de tendencia central y dispersión para describir un conjunto de datos 
mediante la representación numérica y gráfica de la información obtenida en una muestra o 
población. 
 
Introducción 
 
Para cualquier conjunto de datos estudiados es importante tener información resumida de sus 
características. Esta información nos indica cómo se comporta la población de datos que 
tenemos. Para resumir la información se utilizan dos tipos de valores que en lugar de 
representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores 
estadísticos son: las medidas de tendencia central, que nos muestran hacia qué valores se 
agrupan o acumulan los datos, y las medidas de dispersión, que, de forma contraria a las 
anteriores, muestran cómo se dispersan o separan los datos. 
 
3.1.Medidas de tendencia central 
 
Las medidas de tendencia central son los valores que representan un conjunto de datos de 
forma tal que nos ayudan a saber dónde están acumulados los datos pero sin indicar como se 
distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos. 
Las medidas de tendencia central más comunes son: la media aritmética, comúnmente 
conocida como media o promedio, la mediana y la moda. 
 
3.1.1. Media aritmética 
 
La media aritmética o, simplemente, media, se denota por o por la letra μ según se calcule en 
una muestra o en la población, respectivamente. La media es resultado de dividir la suma de 
todos los valores (xi) entre el número total de datos (N). 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 35 
 
La fórmula para calcular la media de una distribución de datos, varía de acuerdo a la manera 
cómo los tenemos organizados. 
 
Fórmula para calcular la media en datos no agrupados 
 
Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir, 
cada valor se representa de manera individual. Las fórmulas para calcular la media son: 
 
En una población En una muestra 
 
 
 
En estas fórmulas la diferencia radica en que, el total de la población se representa con la letra 
N y el total de la muestra se representa con la letra n. 
 
Fórmula para calcular la media en datos agrupados por frecuencias simples 
Los datos agrupados en frecuencias son aquellos que organizamos en una tabla de 
frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable (xi) y, en 
otra columna, la frecuencia (fi) o el número de veces que se repite cada valor en una serie de 
datos. 
 
Las fórmulas para calcular la media con los datos organizados de esta manera son: 
 
En una población En una muestra 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 36 
 
Fórmula para calcular la media en datos agrupados por intervalos 
Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango 
establecido entre un límite inferior y un límite suprior. Recuerda que las tablas de intervalos 
muestran el número de datos que abarca cada intervalo (frecuencia por intervalo). 
Las fórmulas para calcular la media con los datos organizados de esta manera son: 
 
En una población En una muestra 
 
 
3.1.2. Mediana 
 
La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la 
mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o 
decreciente, entonces, el número de datos que queda a la izquierda de la mediana es igual al 
número de datos que queda a la derecha. 
 
Si n es impar hay un dato que queda en medio de todos, éste será igual a la mediana. Si n es 
par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de 
esos dos datos, es decir, su suma dividida entre dos. 
 
Para cuando la cantidad de valores de la distribución es impar: 
1. Ordenamos los valores de menor a mayor. 
2. Buscamos el valor del centro. 
 
Por ejemplo: 
Supongamos que tenemos los siguientes valores: 
2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9 
1. Ordenamos: 
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 37 
 
2. El dato que divide a la mitad es: 4, por lo tanto Me: 4 
 
Para cuando la cantidad de valores es impar: 
 
1. Ordenamos los valores de menor a mayor. 
2. Buscamos los valores del centro. 
3. Promediamos los valores del centro. 
 
Por ejemplo: 
Supongamos que tenemos los siguientes valores: 
5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2 
1. Ordenamos 
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9 
 
2. Buscamos los datos del centro: 
4, 5 
 
3. Promediamos: 
, por lo tanto Me: 4.5 
 
Mediana en datos agrupados por intervalos 
Cuando queremos calcular la mediana en datos agrupados por intervalos, tenemos que buscar 
el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias 
absolutas, es decir, es necesario localizar el intervalo donde se encuentre , ocupamos 
siguiente fórmula: 
 
 
En donde: 
Li = Límite inferior del renglón en donde debe estar la mediana 
Fi-1 = Frecuencia acumulada anterior al renglón de la mediana 
fi = frecuencia del renglón de la mediana 
ai = tamaño del intervalo 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 38 
 
3.1.3. Moda 
 
La moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta 
es mayor, y se denota como Mo. Algunas veces el valor que más se repite puede no ser único, 
es decir, puede haber dos o más datos que aparezcan con la misma frecuencia absoluta, 
siendo ésta la mayor. En esas ocasiones podemos hablar de poblaciones o muestras 
bimodales si existen dos modas o multimodales si existen más de dos. 
 
Por ejemplo si tomamos una muestra de hombres y mujeres y medimos sus estaturas 
tendremos dos modas. 
 
Cuando nuestra distribución de datos es por intervalos de clase, primero localizamos el 
intervalo que tiene mayor frecuencia absoluta y utilizamos la siguiente fórmula para calcular la 
moda: 
 
 
 
En donde: 
 
Li = Límite inferior del renglón en donde debe estar la moda 
fi = frecuencia del renglón de la moda 
fi+1 = Frecuencia ulterior al renglón de la moda 
fi-1 = Frecuencia anterior al renglón de la moda 
ai = tamaño del intervalo 
 
3.2. Medidas de dispersión 
 
A diferencia de las medidas de tendencia central, que miden acumulaciones, mediante un solo 
punto, las medidas de dispersión miden el grado de separación o alejamiento que tiene una 
variable estadística en torno a una medida de posición o tendencia central. Dicho grado de 
separación nos indica lo representativa que es la medida de posición con respecto al conjunto 
total de datos. A mayor dispersión menor representatividad de la medida de posición y 
viceversa. 
 
Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar. 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 39 
3.2.1. Recorrido 
 
El recorrido representa la distancia que hay entre el primero y el último valor de la variable, 
también se le conoce como rango y se denota por Re. 
 
La fórmula para calcularlo es: 
 
 
 
Donde: 
 
máx xi es el valor máximo del a variable 
min xi es el valor mínimo de la variable 
 
Por ejemplo: 
 
Supongamos que tenemos la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 
74, 69, 52, 76. 
 
Calculamos el rango, sustituyendo los valores: 
 
Re=78-52=26 
 
3.2.2. Varianza 
 
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media 
aritmética. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de 
los cuadrados de las diferencias del valor de los datos menos la media aritmética de estos. 
 
La fórmula de la varianza para datos no agrupados es: 
 
 
 
 
 
 
 
 
 
 
 
Para calcularla en una población: Para calcularla en una muestra: 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 40 
 
 
Varianza para datos agrupados por intervalos 
 La fórmula para calcular la varianza en datos agrupados por intervalos es la siguiente: 
 
 
 
 
 
 
3.2.3. Desviación típica o estándar 
 
La desviación típica muestra qué tan alejado está un dato del valor de la media aritmética, es 
decir, la diferencia que hay entre un dato y la media aritmética. Se denota como S o, según se 
calcule en una muestra o en toda la población, respectivamente. 
 
Se define como la raíz cuadrada positiva de la varianza. Se expresa mediante las siguientes 
fórmulas: 
 
En datos no agrupados: 
En unapoblación: 
 
 
En una muestra: 
 
 
 
 
 
 
 
 
 
 
 
 
Para calcularla en una población: 
 
Para calcularla en una muestra: 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 41 
 
En datos agrupados por intervalos: 
 
En una población: 
 
 
 
En una muestra: 
 
 
 
Consideraciones específicas de la unidad 
 
Las actividades de esta unidad se trabajan en diferentes momentos, a partir de un problema 
que se trabaja en la unidad 2, los alumnos tendrán que obtener las medidas de tendencia 
central y dispersión. Se les solicita a los alumnos que al concluir cada subtema (tipo de medida) 
se elabora una actividad relacionada con el mismo, al final del tema uno y dos estas actividades 
se comparten con el resto del grupo para que entre todos se revisen y retroalimenten. 
 
Se contará con dos foros de uso general, uno para las medidas e tendencia central y otro para 
las medidas de dispersión. El objetivo de estos foros es que los alumnos planteen sus dudas a 
todo el grupo o compartan información que pueda ser de utilidad para el estudio de los temas. 
 
Cuenta con una actividad que debe ser enviada al facilitador como tarea, además de la 
autoevaluación y la evidencia de aprendizaje. Esta última consiste en la presentación de las 
medidas de tendencia central y dispersión de los datos obtenidos de la muestra de la unidad 
uno, además de incluir, a manera de conclusión, una reflexión sobre el uso y las aplicaciones 
de la estadística descriptiva. 
 
 
 
 
 
 
 
 
 
Educación Superior Abierta y a Distancia • Primer cuatrimestre 42 
 
Referencias: 
 
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadística 
aplicadas a la ingeniería. Cuarta edición. México: McGraw-Hill. 
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadística para 
Ingeniería y ciencias. Octava edición. México: Pearson Educación. 
3. Medidas de tendencia central y dispersión. Consultado el 27 de abril de 2010 en: 
http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/estadisticadescriptivav
ariables2.pdf 
4. Estadística y probabilidad. Consultado el 27 de abril de 2010 en: 
http://www.vitutor.com/estadistica.html

Otros materiales