Logo Studenta

Clase 20 - Medidas de tendencia central

¡Este material tiene más páginas!

Vista previa del material en texto

Clase 20. Medidas de tendencia central 
Estadistica
Concepto
Es la ciencia dedicada a la sistematización, recolección, ordenamiento y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre.
La estadística la podemos definir como una conjunción de datos sobre determinadas características de familias, animales, individuos, hogares o cualquier otro detalle de interés con la finalidad de estudiarlos y analizarlos para llegar a conclusiones que resulten útiles para prever o planear actividades de futuro. En la actualidad se pueden considerar como una rama de las ciencias matemáticas a través del empleo de métodos de forma científica. Se trata de una ciencia antigua, dado que los egipcios ya la usaban hace aproximadamente cinco mil años.
Aplicación de las estadísticas
Las variadas técnicas empleadas en las estadísticas son aplicadas en varios campos, como por ejemplo en la ingeniería, medicina, estudios de mercado, resultados deportivos, educación, encuestas electorales, controles sobre la calidad, etc. Se consideran a las estadísticas como imprescindibles para lograr una interpretación correcta de la realidad. Estaríamos sumergidos en un caos general si no se usarán los procedimientos estadísticos, ya que gran cantidad de directores, políticos, gobernantes y hasta ejecutivos no contarían con una información vital al instante de adoptar decisiones sobre determinadas situaciones inciertas.
La estadística se basa en la repetibilidad del ser humano, y en el hecho de que aunque individualmente somos diferentes, el comportamiento en grupo sigue pautas y tendencias, lo cual hace que ante una muestra de elección, la distribución no sea homogénea.
Este hecho es el que se estudia muy especialmente desde los gestores de técnicas de venta, para poder detectar esas tendencias y así poder anticiparse a la demanda, de forma que no se dediquen esfuerzos a lo que no se va a elegir y poder dar respuesta rápida a lo más solicitado.
Población y muestra.
Población
La población es el conjunto de todos los elementos de interés (personas, cuentas, clientes...) en determinado análisis. Población se refiere al universo, conjunto o totalidad de elementos sobre los que se investiga o hacen estudios
Los elementos de una población lo conforman cada uno de los individuos asociados, debido a que comparten alguna característica en común.
La población estadística puede ser un conjunto de personas, lugares o cosas reales. Por ejemplo, los adolescentes de un pueblo o los usos posibles del azúcar en recetas de cocina.
Tipos de poblaciones
La población se puede clasificar de la siguiente manera según la cantidad de individuos que la conforme:
· Población finita: es aquella que se puede contar y se pueden estudiar con mayor facilidad a sus integrantes. Por ejemplo, la cantidad de personas inscritas en un gimnasio.
· Población infinita: son inmensas poblaciones donde se hace muy difícil contabilizar a sus integrantes, por lo que suele tomarse en cuenta sólo una porción de ella a la hora de realizar un estudio, seleccionando así una muestra. Por ejemplo, la cantidad de granos de arena en una playa.
· Población real: son grupos de integrantes tangibles. Por ejemplo, la cantidad de animales en un zoológico.
· Población hipotética: son poblaciones posibles que pueden ser estudiadas ante una eventualidad. Por ejemplo, la cantidad de nacimientos de bebés prematuros.
Muestra
La muestra es un subconjunto de la población al cual tenemos acceso, sobre el cual se aplican las mediciones. Este debería ser representativo.
Es una parte de elementos que se seleccionan previamente de una población para realizar un estudio.
Normalmente se selecciona la muestra de una población para su estudio, debido a que estudiar a todos los elementos de una población resultaría muy extenso y poco práctico.
Tipos de muestras
Existen diferentes tipos de técnicas para conformar una muestra.
Muestreo aleatorio
Es una técnica que ofrece la misma posibilidad a los elementos de ser seleccionados, por ser tomados al azar. Los tipos de muestreo aleatorio son:
· Muestreo aleatorio simple: los elementos se eligen de una lista al azar. Funciona más eficazmente cuando el universo es reducido y homogéneo.
· Muestreo sistemático: el primer elemento se elige al azar y luego se escogen a intervalos constantes los elementos restantes.
· Muestreo estratificado: se realiza dividiendo a la población en partes o estratos que respondan a características establecidas y luego se eligen aleatoriamente los individuos que se van a estudiar.
· Muestreo por conglomerado: la población se divide en grupos heterogéneos y éstos a su vez se subdividen en grupos homogéneos con características comunes para ser estudiados de acuerdo a lo requerido por el investigador.
Muestreo no aleatorio o por selección intencionada
Se elige con base en el manejo de información de los elementos a estudiar, por lo que la representatividad de la muestra puede ser subjetiva. En este caso, se corre el riesgo de que los resultados sean sesgados.
Cuando uno solo de los estudios no es suficiente porque la población a estudiar es muy extensa, se pueden usar dos o más tipos de muestreo.
Estadística descriptiva
Es la rama de la estadística que tiene por objetivo identificar las principales características de un conjunto de datos mediante un grupo reducido de gráficos y/o números.
La estadística descriptiva es la parte de la estadística que arregla los datos de forma que puedan ser analizados e interpretados. Los métodos de estadística descriptiva nos permiten:
· Determinar la tendencia central de una variable: promedio o media aritmética, mediana o moda.
· Determinar cómo es la distribución de una variable: histograma de frecuencias, diagrama de barras.
· Determinar cuál es la posición de una variables: cuartiles, deciles, percentiles.
Un ejemplo de estadística descriptiva sería cuando queremos calcular la media de goles por partido de un futbolista. Se trata de estadística descriptiva, ya que tratamos de describir una variable (número de goles). En este caso, mediante el cálculo de una métrica.
Así pues, decir que Ronaldo metió 1,05 goles por partido durante los últimos 30 partidos, es una frase propia de estadística descriptiva.
También podríamos decir, por ejemplo, que el 30% de los compañeros de clase de Juan tienen los ojos azules, el 60% castaños y el 10% restante negros. Se trataría de una variable cualitativa (color de ojos), pero estamos describiendo la frecuencia con la que aparece.
Para describir un conjunto de datos se suele comenzar con un análisis individual de cada variable y posteriormente se estudian las relaciones entre variables. 
Se suele comenzar con representaciones gráficas y posteriormente se calculan resúmenes numéricos. 
Medidas de tendencia central
Son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. 
Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos en una distribución.
Las características globales de un conjunto de datos estadísticos pueden resumirse mediante una serie de cantidades numéricas representativas llamadas parámetros estadísticos. Entre ellas, las medidas de tendencia central, como la media aritmética, la moda o la mediana, ayudan a conocer de forma aproximada el comportamiento de una distribución estadística.
Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemáticas. Este puntaje, por sí mismo, tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienenen una prueba.
Volviendo al ejemplo, la calificación promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificación del alumno se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 65 puntos, entonces la conclusión sería muy diferente, debido a que se ubicaría muy por debajo del promedio de la clase.
En resumen, el propósito de las medidas de tendencia central es:
· Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
· Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.
· Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.
· Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.
Media
La media es el valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores.
La media, a diferencia de la esperanza matemática, es un término matemático. Por su parte, la esperanza matemática es un término estadístico, relacionado con las probabilidades. El cálculo de ambas variables viene, muchas veces, a ser el mismo. No obstante, no siempre se utilizan en el mismo contexto.
Formas de calcular la media
Existen muchas formas de calcular una media. La más conocida es la media aritmética. Aun así, hay otras formas para calcular la media de un conjunto de valores, como la media geométrica, la ponderada o la armonizada. Vamos a verlas una a una:
Media aritmética
Es la forma que todos conocemos en la que todas las observaciones tienen la misma ponderación y la solemos calcular con la siguiente fórmula:
Donde x es el valor de la observación i, y N el número total de observaciones.
Supongamos que nuestras calificaciones en la escuela son:
N = número total de asignaturas = 4
Entonces aplicando la fórmula que acabamos de exponer, el resultado sería:
Nuestra nota media será de un 7,5.
Media ponderada
Ahora vamos a ver un ejemplo en el que vamos a calcular nuestra nota de Economía. Nuestra nota media de economía, va a depender de tres notas. Dado que la importancia o ponderación, de las distintas partes de la asignatura no es el mismo, tomaremos como referencia la siguiente fórmula:
Donde x es el valor de la observación i, P es el peso o importancia de cada observación y N el número total de observaciones.
Trabajo sobre el crash del 29 — 20%
Examen final ———————— 70%
Asistencia a clase —————— 10%
En el trabajo sobre el crash del 29, gracias a que buscamos información en Economipedia, nos pusieron un 9,5. En el examen final tuvimos un 8,5. Sin embargo, solo asistimos a 10 clases de un total de 20. Por lo que nuestra nota en asistencia a clase es de un 5.
Para saber nuestra nota final de la asignatura de economía debemos multiplicar nuestra nota por la ponderación. Tal que:
Nuestra nota final de la asignatura es de 8,35.
Media geométrica
La media geométrica del conjunto de números positivos, y siempre positivos, es la raíz n-ésima del producto del conjunto de números.
Dado que es un producto conjunto, si uno de los elementos es cero, entonces el producto total será cero. Y, en consecuencia, la raíz dará como resultado cero. Por ello, debe siempre tenerse en cuenta que ninguno de los números sea cero.
Donde N es el número de observaciones que tenemos.
Esta media se utiliza principalmente para variables en tantos por uno (porcentajes) o índices. Su ventaja sobre las demás formas de cálculo es su menor sensibilidad a valores extremos de las variables. Su desventaja, sin embargo, es que no se pueden utilizar números negativos, ni valores iguales a cero.
Supongamos los resultados de una empresa. La empresa ha generado un 20% de rentabilidad el primer año, un 15% el segundo año, un 33% el tercer año y un 25% el cuarto año. Lo fácil, en este caso sería sumar las cantidades y dividir entre cuatro. Sin embargo esto no es correcto.
Para calcular la media de varios porcentajes debemos hacer uso de la media geométrica. Aplicado al caso anterior, tendríamos lo siguiente:
El resultado es 1,23, que expresado en porcentaje es un 23%. Lo que quiere decir que en promedio, cada año la empresa ha ganado un 23%. Dicho de otra forma, si cada año hubiese ganado un 23%, hubiera ganado lo mismo que ganando un 20% el primer año, un 15% el segundo, un 33% el tercero y un 25% el último año.
NOTA: Si las rentabilidades fueran negativas, no se pondrían números negativos. Si la rentabilidad es del -20%, el número a multiplicar sería 0,80. Si la rentabilidad es del -5%, el número a multiplicar sería 0,95. En conclusión si las rentabilidades son positivas, a uno le sumamos el porcentaje en tanto por uno. Mientras que, si las rentabilidades o porcentajes son negativos, a 1 le restamos el porcentaje en tanto por uno.
Media armonizada
La media armonizada de un conjunto de valores es igual a la inversa de la media aritmética. Su fórmula queda tal que:
Se recomienda para calcular velocidades. Es especialmente sensible a valores extremos pequeños, pero poco sensible a valores extremos grandes. En economía se usa para calcular uno de los índices más famosos y utilizados en estadística económica, el índice de Paasche.
Supongamos que tenemos una empresa con reparto a domicilio en moto. Nos realizan un encargo a 4 kilómetros. El primer kilómetro el repartidor va a una velocidad de 30 km/h, el segundo kilómetro a 25 km/h, el tercer kilómetro se encuentran con tráfico y reduce la velocidad a 15 km/h y el último tramo a 35 km/h.
Nos disponemos a calcular la velocidad media del repartidor y obtenemos que:
La velocidad media de nuestro repartidor durante el reparto ha sido de 23,5 km/h.
Mediana
La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de mayor a menor, o al contrario de menor a mayor. Esto es, que tengan un orden.
La mediana, junto con la media y la varianza es un estadístico muy ilustrativo de una distribución. Al contrario que la media que puede estar desplazada hacia un lado o a otro, según la distribución, la mediana siempre se sitúa en el centro de esta. Dicho sea paso, a la forma de la distribución se le conoce como curtosis. Con la curtosis podemos ver hacia dónde se desplaza la distribución. Ver curtosis
Fórmula de la mediana
Una vez definida la mediana vamos a pasar a calcularla. Para ello, necesitaremos una fórmula.
La fórmula no nos dará el valor de la mediana, lo que nos dará es la posición en la que está dentro del conjunto de datos. Debemos tener en cuenta, en este sentido, si el número total de datos u observaciones que tenemos (n) es par o impar. De tal forma que la fórmula de la mediana es:
Cuando el número de observaciones es par:
Mediana = (n+1) / 2 → Media de las observaciones
Cuando el número de observaciones es impar:
Mediana = (n+1) / 2 → Valor de la observación
Es decir, que si tenemos 50 datos ordenados preferiblemente de menor a mayor, la mediana estaría en la observación número 25,5. Esto es el resultado de aplicar la fórmula para un conjunto de datos par (50 es número par) y dividir entre 2. El resultado es 25,5 ya que dividimos entre 50+1. La mediana será la media entre la observación 25 y la 26.
En el próximo epígrafe lo veremos más detenidamente, con ejemplos visuales.
Ejemplo de cálculo de la mediana
Imaginemos que tenemos los siguientes datos:
2,4,12,6,8,14,16,10,18.
En primer lugar los ordenamos de menor a mayor con lo que tendríamos lo siguiente:
2,4,6,8,10,12,14,16,18.
Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la misma cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones tenemos? 9 observaciones. Calculamos la posición con la fórmula de la mediana correspondiente.
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos dice que el valor dela mediana, se encuentra en la observación cuya posición es la quinta.
Por lo tanto la mediana de esta sería de datos sería el número 10, ya que está en la quinta posición. Además, podemos comprobar como tanto a la izquierda del 5 hay 4 valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y 18).
Otro ejemplo de la mediana
Imaginemos ahora que tenemos los siguientes números:
1,2,4,2,5,9,8,9.
Si los ordenamos tendríamos lo siguiente:
1,2,2,4,6,8,9,9.
En este caso, la cantidad de observaciones es par. Por tanto, tener en cuenta las consideraciones para el número de observaciones pares. La fórmula nos indica lo siguiente:
Mediana = 8+1 / 2 = 4,5
Claro que pensaréis, ¿cuál es la posición 4,5? O está en la posición 4 o está en la posición 5, pero la 4,5 no existe. Lo que haremos será una media de los valores que están en la posición 4 y 5. Esos números son el 4 y el 6. La media entre estos dos números es 5 [ (4+6) / 2 ].
El valor de la mediana, por tanto, sería 5. El número 5 (nos lo imaginamos) dejaría al lado izquierdo (1, 2, 2 y 4) la misma cantidad de observaciones que al lado derecho (6, 8, 9 y 9).
Moda
La moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones de cada valor. Por ejemplo, ¿cuál es la moda de la siguiente tabla de salarios?
La moda sería 1.236€. Si vemos los salarios de los 10 trabajadores, veríamos que 1.236€ se repite en tres ocasiones.

Continuar navegando

Materiales relacionados