Logo Studenta

Colección de datos - Carlos Tomas Santana Colin

¡Estudia con miles de materiales!

Vista previa del material en texto

PROBABILIDAD Y ESTADÍSTICA 
UNIDAD 1: COLECCIÓN DE DATOS Y DISTRIBUCIÓN DE FRECUENCIAS 
1.1 Colección de datos. 
1.1.1 Introducción. 
La estadística es una materia que ha adquirido una importante presencia durante 
los últimos años; en diferentes áreas del que hacer industrial, en el desarrollo 
tecnológico, en el diseño de nuevos productos y nuevos descubrimientos 
científicos. Algunos ejemplos de estadística son: 
- Evaluar los resultados en la protección de la capa de ozono. 
- Calcular las tasas de desempleo y ocupación en américa latina. 
- Los censos poblacionales. 
- Determinar la lista de las 40 canciones más escuchadas en la radio durante 
la última semana. 
- Predecir la confiabilidad de productos como: celulares, estufas, luminarias, 
por mencionar algunos. 
- Determinar la incidencia del Covid 19 en el mundo. 
Actualmente la estadística se define como la ciencia que brinda los instrumentos 
(métodos y técnicas) para recopilar, organizar, presentar, analizar e interpretar 
información que apoye los procesos de toma de decisiones en cualquier ámbito. 
Extrayendo la información contenida en los datos, podremos comprender mejor las 
situaciones que ellos representan. Los métodos estadísticos abarcan todas las 
etapas de la investigación, desde el diseño de la investigación hasta el análisis 
final de los datos. 
En general, la estadística se clasifica en dos grandes ramas: 
a) Inferencial. Comprende los métodos y técnicas utilizadas para que a partir 
del estudio de una parte de la población (muestra), se hagan 
generalizaciones, predicciones o estimaciones con el fin de tomar las 
decisiones correctas. 
b) Descriptiva. Es una rama de la estadística que enseña técnicas para 
describir los conjuntos de mediciones. Se basa en: 
- La recolección de datos por medio de encuestas o de otras técnicas. 
- La caracterización de datos por medio del cálculo de medidas estadísticas 
como la media (promedio). 
- La presentación de datos mediante tablas y gráficas. 
1.1.2 Población y muestra. 
El procedimiento para recabar información consiste en identificar a la población 
que será objeto de estudio. La población (N) está constituida, por una colección de 
individuos u objetos a los que se les observa algún atributo (característica 
particular), que será objeto de estudio. La población debe estar bien definida antes 
de iniciar cualquier estudio. 
Una vez definida la población el siguiente paso es obtener una muestra (n) de la 
población. Una muestra consiste en seleccionar una parte de la población para 
realizar el estudio y conocer las características de la población. Sus ventajas 
consisten en reducir el tiempo y el esfuerzo para obtener lo que quiere. El 
muestreo es, por consiguiente, un conjunto de técnicas empleadas para 
seleccionar la “mejor” muestra posible, es decir, la que se considera que 
representa mejor a la población. 
El término censo se refiere a la obtención de datos de cada uno de los miembros 
que forman una población. En todo estudio, lo ideal sería llevar a cabo un censo, 
pues así se conocería muy bien a la población, pero cuando no se tienen los 
recursos necesarios se recurre al muestreo. 
El muestreo se centra en obtener, por medio de métodos diversos, una muestra de 
toda la población para luego, una vez que se cuenta con los resultados acerca de 
las características que se desean estudiar, hacer una proyección respecto de toda 
la población. 
Muestreo aleatorio simple: Se pueden usar varios métodos para seleccionar una 
muestra a partir de una población; uno de los más comunes es el muestreo 
aleatorio simple. La definición de este método y el proceso de seleccionar una 
muestra aleatoria simple dependen de si la población es finita o infinita (Solano 
and Álvarez, 2005). 
Muestra aleatoria simple (población finita): Una muestra aleatoria simple de 
tamaño n, de una población finita de tamaño N, es una muestra seleccionada de 
tal manera que cada muestra posible de tamaño n tenga la misma probabilidad de 
ser seleccionada. 
Un procedimiento para identificar una muestra aleatoria simple a partir de una 
población finita es seleccionar uno por uno los elementos que constituyen a la 
muestra, de tal modo que cada uno de los elementos que aun queden en la 
población tenga la misma probabilidad de ser seleccionados. 
Al muestrear n elementos en esa forma, satisface la definición de una muestra 
aleatoria simple de una población finita. 
Muestreo para poblaciones infinitas: La mayoría de los casos de muestreo en 
los negocios y la economía son de poblaciones finitas, pero en algunas 
situaciones, la población es infinita o (si es finita) es tan grande que, para fines 
prácticos, se puede considerar como infinita. AI muestrear una población infinita 
debemos usar una nueva definición de muestra aleatoria simple. Además, como 
no se pueden numerar los elementos de una población infinita, debemos emplear 
un proceso distinto para seleccionar los elementos de la muestra (Solano and 
Álvarez, 2005). 
Supongamos que se desea estimar el tiempo promedio que transcurre entre 
colocar un pedido y recibirlo, para los clientes de un restaurante de comida rápida, 
entre las II:30 A.M. y la I:30 P.M., que es el horario del almuerzo. Si consideramos 
la población de todos los posibles clientes, vemos que no sería factible especificar 
un límite finito de la cantidad de posibles visitas. De hecho, si definimos que Ia 
población es todas las visitas de clientes que se pudieran recibir concebiblemente 
durante las horas del almuerzo, podemos considerar que la población es infinita. 
Nuestra tarea consiste en seleccionar una muestra aleatoria simple de n clientes 
de esa población. 
Muestra aleatoria simple (población infinita): Una muestra aleatoria simple de 
una población infinita es aquella que se selecciona en tal forma que se satisfacen 
las siguientes condiciones: 
I. Cada elemento seleccionado proviene de la misma población. 
2. Cada elemento se selecciona en forma independiente. 
En el caso del problema de seleccionar una variable aleatoria simple de 
asistencias de clientes a un restaurante de comida rápida, vemos que se satisface 
la primera condición antes mencionada, para cualquier asistencia de cliente 
durante el horario del almuerzo estando trabajando el restaurante con su personal 
regular y bajo condiciones "normales" de funcionamiento. La segunda condición se 
satisface asegurando que la selección de determinado cliente no influye sobre la 
selección de cualquier otro. Esto es, los clientes son seleccionados en forma 
independiente. Un restaurante muy conocido de comida rápida implemento un 
procedimiento de muestreo aleatorio simple para este caso. EI procedimiento de 
muestreo se basa en el hecho de que algunos clientes presentan cupones de 
descuento en precios de emparedados, bebidas, papas fritas, etc. Siempre que un 
cliente presenta un cupón de descuento, se selecciona para la muestra al 
siguiente cliente que llega. Como los clientes que presentan cupones de 
descuento lo hacen al azar e independientemente, la empresa considera que el 
plan de muestreo satisface las dos condiciones del muestreo aleatorio simple de 
poblaciones infinitas. 
La encuesta es un estudio o investigación que se realiza a una muestra de 
individuos representativa seleccionada de una población, empleando 
procedimientos de interrogación con el fin de obtener mediciones cuantitativas y 
cualitativas de una diversidad de características objetivas y subjetivas de una 
población. 
 
Ejemplo 1. Unos estudiantes desean saber que tan bueno es el servicio que 
ofrece la cafetería de la escuela y están interesados en todos los posibles clientes 
de la cafetería. 
a) ¿Cuáles son los posibles clientes? 
Alumnos, Maestros, Trabajadores, etc. 
b) ¿Qué personas deben incluirse en la población? 
Visitantes (supervisor, padres de familia, proveedores, etc) 
c) ¿Cuál es la muestra?Parte de los clientes de la cafetería. 
d) ¿Cómo podrías evaluar el servicio que ofrece la cafetería? 
Haciendo encuesta a los clientes que forman la muestra, entrevista. 
Ejemplo 2. La dirección de una escuela desea estudiar la compresión de la lectura 
de sus estudiantes antes y después de un programa de capacitación en la lectura. 
Si la escuela cuenta con 5000 estudiantes, podría ser virtualmente imposible medir 
la comprensión de la lectura de todos ellos. 
a) ¿Cuál es la población de interés? 
Los alumnos que hayan tomado el curso de capacitación. 
b) ¿Cuál podría ser la muestra? 
Una parte de esos estudiantes que tomaron el curso, mediante encuestas/entrevistas. 
1.1.3 Tipos de gráficas. 
Una vez que se han coleccionado los datos se debe dar una mirada general a 
ellos para obtener una percepción de sus características principales y de algún 
rasgo sorprendente antes de contestar cualquier pregunta formal. Esta etapa del 
estudio de los datos es generalmente conocida como la fase exploratoria. 
Es posible que un investigador que ha recopilado datos desee resumir y describir 
características importantes de los mismos. Esto implica utilizar métodos de 
estadística descriptiva. Algunos de ellos son de naturaleza gráfica; la construcción 
de histogramas, diagramas de caja y gráficas de puntos, grafica de tallos y hojas, 
son ejemplos primordiales. 
Primero se propone la manera en que los datos deben presentarse, 
particularmente en tablas. Las tablas estadísticas representan toda la información 
de modo esquemático y están preparadas para los cálculos posteriores. Los 
gráficos estadísticos nos transmiten esa información de modo más expresivo, nos 
van a permitir, con un sólo golpe de vista, entender de que se nos habla, observar 
sus características más importantes, incluso sacar alguna conclusión sobre el 
comportamiento de la muestra donde se está realizando el estudio. Los gráficos 
estadísticos más usuales son: 
Histograma 
Un histograma es una representación gráfica de una variable en forma de barras. 
Se utilizan para variables continuas o para variables discretas, con un gran 
número de datos, y que se han agrupado en clases. En el eje abscisas se 
construyen unos rectángulos que tienen por base la amplitud del intervalo, y por 
altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es 
proporcional a la frecuencia de los valores representados. 
 
Gráficas de Barras. 
Un gráfico de barras es aquella representación gráfica bidimensional en que los 
objetos gráficos elementales son un conjunto de rectángulos dispuestos 
paralelamente de manera que la extensión de los mismos es proporcional a la 
magnitud que se quiere representar. Los rectángulos o barras pueden estar 
colocados horizontal o verticalmente. En éste último caso reciben también el 
nombre de gráficos de columnas. 
 
Son de utilidad para representar datos de variables continuas o discretas. Las 
gráficas de barras son muy similares a los histogramas, como mencionamos 
anteriormente. Se elaboran con rectángulos que deben tener un ancho igual en su 
base y una altura equivalente a la frecuencia que se busca representar. La escala 
horizontal no tiene que ser continúa por tanto las barras o columnas pueden 
representarse separadamente. 
Polígono de Frecuencias. 
Se utilizan para variables estadísticas cuantitativas, discretas o continuas. Para 
una variable discreta, el polígono de frecuencias se obtiene uniendo por una 
poligonal, los extremos superiores de las barras. Para una variable continua, el 
polígono de frecuencias se obtiene uniendo por una poligonal los puntos medios 
de la base superior de los polígonos del histograma. 
Las escalas utilizadas para representar los polígonos de frecuencias influyen 
mucho por el impacto visual de los mismos. 
 
Gráficas circulares. 
Las gráficas circulares también se conocen como sectoriales, de pastel. Este tipo 
de gráfica sirve especialmente cuando nos fijamos en valores cualitativos en lugar 
de cuantitativos, permitiendo además comparar muy rápidamente las frecuencias 
relativas de los diferentes grupos. 
En la gráfica circular, los diferentes sectores (triángulos) representan diferentes 
grupos separados por elementos cualitativos. Esto significa que su separación no 
se correspondería con valores numéricos, si no con características difícilmente 
traducibles a números, como distintos colores o sectores de la población. 
Además, las gráficas circulares tienen la ventaja de representar la totalidad de la 
muestra. Al observar la gráfica, sabemos que estamos viendo el 100% de los 
eventos representados en ella, con las diferentes frecuencias porcentuales 
perteneciendo a los distintos sectores en los que hemos separado la muestra de 
estudio. 
 
Diagrama de tallo y hoja 
Esta gráfica presenta una exhibición gráfica de los datos usando los valores 
numéricos reales de cada punto de datos. A veces las opciones de tallo 
disponibles resultan en una gráfica que contiene muy pocos tallos y un gran 
número de hojas dentro de cada tallo. En esta situación, se pueden prolongar los 
tallos al dividir cada uno en varias líneas, dependiendo de los valores de hojas que 
se les asignen. Por lo general los tallos se dividen en una de dos formas: 
• En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda 
línea. 
• En cinco líneas, con las hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas, 
respectivamente. 
 4, 11, 13, 14, 15, 16, 17, 18, 18, 18, 19, 21, 22, 22, 23, 24, 25, 26, 26, 26, 26, … 
 
 
 0 (0-4) | 4 
 0 (5-9) | 
1 (0-4)| 1 3 4 
1 (5-9)| 5 6 7 8 8 8 9

Continuar navegando