Estadistica_para_educacion_fisica

•

SIN SIGLA

Maria Nelis Camacho

4/3/2024

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Educación Física

275.229 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

SEGUNDA EDICIÓN

FERNANDO MAUREIRA CID

Fernando Maureira Cid
________________________________________________________________________

ISBN papel: 978-84-686-4579-7
ISBN digital: 978-84-686-4604-6

Impreso en España Código de barras
Editado por Bubok Publishing S.L

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Fernando Mauriera Cid

Es PhD. en Educación, con especialización en
neurociencia. Autor de más de 60 artículos científicos
y varios libros sobre neurociencia, neuropsicobiología,
ciencias cognitivas, metodología de la investigación y
estadística.
Profesor de la Escuela de Educación en Ciencias del
Movimiento y Deportes, Universidad Católica Silva
Henríquez. Santiago de Chile.

Fernando Maureira Cid
________________________________________________________________________

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Dedicado a mis hermanas
Miriam y Yessenia
a mis padres
Fernando y Nidia,
a mi amor
Elizabeth

Fernando Maureira Cid
________________________________________________________________________

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

La segunda edición de Estadística
para educación física es una introducción al
cálculo de diversas pruebas descriptivas e
inferenciales, siendo en primera instancia
un proceso manual y luego utilizando el
programa estadístico SPSS. Este libro
puede ser utilizado como base para un
curso de estadística en carreras de educa-
ción física o ciencias del deporte y/o
magísteres o maestrías en dichas discipli-
nas.
Cada vez estoy más convencido de
la importancia de conocer y entender los
fundamentos de la estadística y su aplica-
ción en el ámbito de la educación física,
ya que esto nos permitirá generar nuevo
conocimiento, expandiendo el campo de
acción de nuestra disciplina y entregando
sólidas bases a nuestro quehacer.
Algunas características que se han
mantenido de la primera edición del libro
son: el enfoque pedagógico, realizando
las pruebas estadísticas paso a paso, de
manera que el estudiante pueda desarro-
llar manualmente los estadísticos y así
comprenda los fundamentos matemáticos
que justifican la utilización de los diver-
sos análisis; los ejemplos enfocados en
situaciones y estudios en el ámbito de la
educación física, de manera que la reali-
dad analizada sea lo más cercana al
lector; y la utilización del SPSS como
herramienta computacional para realizar
las pruebas de contraste de hipótesis.
En esta nueva edición se incluyen
definiciones más completas de los funda-
mentos teóricos de la estadística y de las
pruebas inferenciales; mayor número de
análisis de datos; nuevos ejemplos para
familiarizar al lector con la aplicación de
las diversas pruebas; y la utilización de
una versión más actualizada del SPSS.
En esta nueva edición de Estadística
para educación física quisiera volver a
agradecer a mis estudiantes, los cuales
gracias a sus necesidades y dudas rela-
cionadas con los análisis de datos, fueron
un estímulo para la redacción de este
libro y para quienes espero este texto sea
de utilidad.

Santiago, Julio 2017
Fernando Maureira Cid

Fernando Maureira Cid
________________________________________________________________________

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

INTRODUCCIÓN 19

PARTE I. ESTADÍSTICA DESCRIPTIVA 21

Capítulo 1. Conceptos básicos en estadística 23
Capítulo 2. Estadística descriptiva: representación de datos 33
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición 47
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja 61

PARTE II. MUESTRAS Y PROBABILIDADES 77

Capítulo 5. Muestra y Muestreo 79
Capítulo 6. Distribuciones de probabilidades 87

PARTE III. ESTADÍSTICA INFERENCIAL UNIVARIADA PARAMÉTRICA 101

Capítulo 7. Estadística inferencial: aspectos básicos 103
Capítulo 8. Normalidad de los datos 115
Capítulo 9. Homogeneidad de varianzas 127
Capítulo 10. Comparación de dos grupos 137
Capítulo 11. Análisis de varianza 155
Capítulo 12. ANOVA de medidas repetidas 169
Capítulo 13. Correlación y regresión 183

PARTE IV. ESTADÍSTICA INFERENCIAL UNIVARIADA NO PARAMÉTRICA 201

Capítulo 14. Comparación de dos grupos 203
Capítulo 15. Comparación de tres o más grupos 225
Capítulo 16. Asociación de variables 243

REFERENCIAS BIBLIOGRÁFICAS 255

ANEXOS 257

Fernando Maureira Cid
________________________________________________________________________

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

INTRODUCCIÓN 19

PARTE I
ESTADÍSTICA DESCRIPTIVA 21

Capítulo 1. Conceptos básicos en estadística 23
1.1 Definiciones básicas 23
1.2 Niveles de medición 25
1.2.1 Datos categóricos 25
1.2.2 Datos numéricos 25
1.3 Análisis de datos 26
1.4 Desarrollo histórico de la estadística 27

Capítulo 2. Estadística descriptiva: representación de datos 33
2.1 Tablas de frecuencia 33
2.2 Gráficos de barra y torta 36
2.3 Diagrama de tallo y hoja 36
2.4 Histograma, polígonos de frecuencia y ojiva 38
2.5 Representación de datos en SPSS 42

Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición 47
3.1 Medidas de tendencia central 47
3.1.1 Media aritmética 47
3.1.2 Mediana 48
3.1.3 Moda 50
3.2 Medidas de dispersión 51
3.2.1 Amplitud o rango 51
3.2.2 Varianza 51
3.2.3 Desviación estándar 53
3.3 Medidas de posición 54
3.3.1 Percentiles 54
3.3.2 Cuartiles 55
3.3.3 Quintiles y deciles 56
3.4 Medidas centrales, dispersión y posición en SPSS 57

Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja 61
4.1 Asimetría 61
4.2 Curtosis 63
4.3 Distribución según su forma 65
4.4 Gráfico de caja (box-plot) 67
Fernando Maureira Cid
________________________________________________________________________

4.5 Gráfico de dispersión (scatter-plot) 70
4.6 Medidas de forma en SPSS 72
4.7 Gráfico de caja en SPSS 74

PARTE II
MUESTRAS Y PROBABILIDADES 77

Capítulo 5. Muestra y muestreo 79
5.1 Muestras en investigación 79
5.1.1 Calculo del tamaño de la muestra 79
5.1.2 Muestras para construir un instrumento de medición 82
5.2 Muestreo 83
5.2.1 Para muestras probabilísticas 83
5.2.2 Para muestras no probabilísticas 85

Capítulo 6. Distribuciones de probabilidades 87
6.1 Conceptos básicos en probabilidades 87
6.2 Distribuciones discretas 88
6.2.1 Distribuciónde Bernoulli 88
6.2.2 Distribución binominal 89
6.2.3 Distribución de Poison 92
6.2.4 Distribución hipergeométrica 93
6.3 Distribuciones continuas 94
6.3.1 Distribución normal 94
6.3.2 Distribución Z 95
6.3.3 Distribuciones con muestras pequeñas 97

PARTE III
ESTADÍSTICA INFERENCIAL UNIVARIADA PARAMÉTRICA 101

Capítulo 7. Estadística inferencial: aspectos básicos 103
7.1 Conceptos básicos en estadística inferencial 103
7.1.1 Nivel de significancia 103
7.1.2 Métodos de inferencia estadística 104
7.2 Intervalos de confianza 107
7.3 Normalidad de los datos 114
7.4 Prueba de normalidad KS en SPSS 117

Capítulo 8. Normalidad de los datos 115
8.1 Prueba KS de normalidad 115
8.2 Prueba de normalidad de Shapiro-Wilks 118
8.3 Prueba KS de normalidad en SPSS 121
8.4 Prueba de normalidad de Shapiro-Wilks en SPSS 123
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Capítulo 9. Homogeneidad de varianzas 127
9.1 Prueba de Cochran, Hartley y Bartlett 127
9.2 Prueba de homogenidad de varianzas en SPSS 134

Capítulo 10. Comparación de dos grupos 137
10.1 Prueba t de Student para muestras independientes 137
10.2 Prueba t de Student para muestras relacionadas 141
10.3 Prueba t para una muestra en SPSS 146
10.4 Prueba t para muestras independientes en SPSS 148
10.5 Prueba t para muestras relacionadas en SPSS 151

Capítulo 11. Análisis de varianza 155
11.1 Análisis de varianza de un factor 155
11.1.1 Comparaciones posteriores a F 160
11.2 ANOVA de un factor en SPSS 162

Capítulo 12. ANOVA de medidas repetidas 169
12.1 Análisis de varianza de un factor de medidas repetidas 169
12.1.1 Comparaciones posteriores a F 174
12.2 ANOVA de medidas repetidas en SPSS 176

Capítulo 13. Correlación y regresión 183
13.1 Coeficiente de correlación de Pearson 183
13.2 Regresión lineal simple 187
13.3 Correlación de Pearson en SPSS 191
13.4 Correlaciones parciales en SPSS 193
13.5 Regresión lineal simple en SPSS 195

PARTE IV
ESTADÍSTICA INFERENCIAL UNIVARIADA NO PARAMÉTRICA 201

Capítulo 14. Comparación de dos grupos 203
14.1 Prueba U de Mann-Whitney 203
14.2 Prueba de rangos de Wilcoxon 206
14.3 Prueba de Chi-cuadrado 208
14.4 Prueba de Chi-cuadrado 2x2 211
14.5 Prueba de McNemar 213
14.6 Prueba Z de proprociones 214
14.7 Prueba U de Mann-Whitney en SPSS 215
14.8 Prueba de rangos de Wilcoxon en SPSS 218
14.9 Prueba de Chi-cuadrado en SPSS 219
14.10 Prueba de Chi-cuadrado 2x2 en SPSS 222
14.11 Prueba de McNemar en SPSS 223

Fernando Maureira Cid
________________________________________________________________________

Capítulo 15. Comparación de tres o más grupos 225
15.1 Análisis de la varianza unifactorial de rangos de Kruskal-Wallis 225
15.2 Prueba de varianza por rango de Friedman 230
15.3 Prueba Q de Cochran 234
15.4 Prueba de Kruskal-Wallis en SPSS 236
15.5 Prueba de Friedman en SPSS 239
15.6 Prueba Q de Cochran en SPSS 241

Capítulo 16. Asociación de variables 243
16.1 Correlación de Spearman 243
16.2 Correlación de Phi 247
16.3 Correlación de Spearman en SPSS 249
16.4 Correlación de Phi en SPSS 251

REFERENCIAS BIBLIOGRÁFICAS 255

ANEXOS 257

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Fórmula 1. Frecuencia relativa 34
Fórmula 2. Media 47
Fórmula 3. Mediana 49
Fórmula 4. Rango 51
Fórmula 5. Varianza 52
Fórmula 6. Desviación estándar 53
Fórmula 7. Percentil 55
Fórmula 8. Cuartil 56
Fórmula 9. Corrección cuartil 56
Fórmula 10. Coeficiente de asimetría de Fisher 62
Fórmula 11. Coeficiente de apuntamiento de Fisher 64
Fórmula 12. Distancia inter-cuartil 67
Fórmula 13. 1° cota 68
Fórmula 14. 2° cota 68
Fórmula 15. Tamaño de una muestra infinita 81
Fórmula 16. Tamaño de una muestra finita 82
Fórmula 17. Tamaño de una muestra estratificada 84
Fórmula 18. Probabilidades 87
Fórmula 19. Probabilidad de Bernoulli 89
Fórmula 20. Probabilidad binominal 90
Fórmula 21. Posibilidad de Poisson 92
Fórmula 22. Modelo hipergeométrico 93
Fórmula 23. Calificación Z 95
Fórmula 24. Error estándar de la media con desviación estándar conocida 107
Fórmula 25. Error estándar de la media con desviación estándar desconocida 108
Fórmula 26. Diferencia de la media muestral y poblacional 108
Fórmula 27. Intervalo de confianza para una población con desviación estándar
conocida 109
Fórmula 28. Intervalo de confianza para una población con desviación estándar
desconocida 111
Fórmula 29. Intervalo de confianza para proporciones 112
Fórmula 30. Contraste de hipótesis para proporciones 113
Fórmula 31. Prueba de Shapiro-Wilk 119
Fórmula 32. Valor F 128
Fernando Maureira Cid
________________________________________________________________________

Fórmula 33. R de Cochran 129
Fórmula 34. F de Hartley 130
Fórmula 35. B de Bartlett 132
Fórmula 36. Valor C 132
Fórmula 37. Valor S2p 132
Fórmula 38. Error estándar de la diferencia de medias independientes con desviación
estándar conocida 138
Fórmula 39. Error estándar de la diferencia de medias independientes con desviación
estándar desconocida 138
Fórmula 40. Intervalos de confianza de diferencia de medias independientes 139
Fórmula 41. Valor t de muestras independientes 139
Fórmula 42. Tamaño del efecto de la prueba t para muestras independientes 140
Fórmula 43. Desviación típica combinada 140
Fórmula 44. Suma de cuadrados de la diferencia 143
Fórmula 45. Desviación estándar de diferencia de medias relacionadas 143
Fórmula 46. Error estándar de diferencia de medias relacionadas 143
Fórmula 47. Intervalos de confianza de diferencia de medias relacionadas 144
Fórmula 48. Valor t de muestras relacionadas 145
Fórmula 49. Tamaño del efecto de la prueba t para muestras relacionadas 145
Fórmula 50. Suma de cuadrados totales 156
Fórmula 51. Suma de cuadrados inter-grupos 157
Fórmula 52. Suma de cuadrados intra-grupos 157
Fórmula 53. Cuadrados medios inter-grupos 158
Fórmula 54. Cuadrados medios intra-grupos 158
Fórmula 55. Valor F de análisis de varianza 158
Fórmula 56. Cuadrado medio intra-grupo promedio 160
Fórmula 57. Error estándar de una media 161
Fórmula 58. Valor D 161
Fórmula 59. Suma de cuadrados totales 170
Fórmula 60. Suma de cuadrados inter-grupos 171
Fórmula 61. Suma de cuadrados inter-sujetos 171
Fórmula 62. Suma de cuadrados residual 172
Fórmula 63. gl inter-grupos 172
Fórmula 64. gl inter-sujetos 172
Fórmula 65. gl residual 172
Fórmula 66. gl total 172
Fórmula 67. Media cuadrática inter-grupos 172
Fórmula 68. Media cuadrática residual o intra-grupos 173
Fórmula 69. Valor F 173
Fórmula 70. Intervalos de confianza para pares de medias 175
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Fórmula 71. Covarianza 184
Fórmula 72. Correlación de Pearson 185
Fórmula 73. Coeficiente de determinación 186
Fórmula 74. Regresión lineal 188
Fórmula 75. Suma de los errores al cuadrado 188
Fórmula 76. Valor β1 188
Fórmula 77. Valor SSxy 188
Fórmula 78. Valor SSxx 188
Fórmula 79. Valor β0 189
Fórmula 80. Varianza residual 190
Fórmula 81. Estadístico de contraste t para regresión lineal 191
Fórmula 82. ValorU de Mann-Whitney 204
Fórmula 83. Puntuación Z de la U de Mann-Whitney 205
Fórmula 84. Puntuación Z de la prueba de Wilcoxon 208
Fórmula 85. Media de la T de Wilcoxon 208
Fórmula 86. Desviación estándar de la T de Wilcoxon 208
Fórmula 87. Frecuencia esperada 209
Fórmula 88. Prueba de Chi-cuadrado 210
Fórmula 89. Grados de libertad de Chi-cuadrado 210
Fórmula 90. Valor de Chi-cuadrado para tabla de 2x2 212
Fórmula 91. Valor X2 de McNemar 213
Fórmula 92. Prueba Z de proporciones 214
Fórmula 93. Valor de Kruskal-Wallis sin empates 227
Fórmula 94. Valor de Kruskal-Wallis con empates 227
Fórmula 95. Valor crítico de diferencias de KW 229
Fórmula 96. Valor de Friedman sin empates 232
Fórmula 97. Valor de Friedman con empates 232
Fórmula 98. Valor crítico de diferencias de Friedman 233
Fórmula 99. Valor Q 235
Fórmula 100. Correlación de Spearman sin empates 245
Fórmula 101. Correlación de Spearman con empates 246
Fórmula 102. Correlación de Phi 248

Fernando Maureira Cid
________________________________________________________________________

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

La estadística es un elemento funda-
mental para desarrollar nuestras investí-
gaciones científicas, ya que ella nos per-
mite clasificar, comparar y asociar nues-
tros datos, de manera tal que podamos
generar conclusiones e inferencias. Una
vez que determinamos nuestro tipo de
investigación (exploratoria, descriptiva,
correlacional o explicativa), nuestro dice-
ño (experimental o no experimental),
nuestros instrumentos y recogemos los
datos, debemos proceder a aplicar diver-
sos análisis estadísticos para obtener
nuestros resultados.
Existen falencias en los conocimien-
tos y aplicaciones de la estadística por
parte de los estudiantes y profesionales
de la educación física, por lo que surge la
idea de este libro con los aspectos básicos
de esta ciencia, orientado a los lectores
que estudian por primera vez esta área de
conocimiento, ya sea por la exigencia de
un curso o por la necesidad de realizar
una investigación orientada a la obten-
ción de una licenciatura o magíster.
El libro está dividido en 4 partes: la
primera corresponde a la estadística des-
criptiva, constituida por cuatro capítulos
donde se explican algunos conceptos fun-
damentales para esta ciencia, se presenta
una clasificación de los principales análi-
sis, se realiza un breve resumen de la his-
toria de esta rama de las matemática, se
muestra el paso a paso de los cálculos de
frecuencia, las principales formas de
representación gráfica de las mismas, los
principales análisis de tendencia central,
dispersión, posición y forma. Todos para
presentar los datos de una investigación.
En la segunda parte, constituida por
dos capítulos, se estudia el cálculo del ta-
maño de las muestras y las formas de
muestreo. Además se analizan breve-
mente las principales distribuciones de
datos, tanto discretas como continuas.
La tercera parte corresponde a la
estadística inferencial univariada para-
métrica y está constituida por siete
capítulos. En ellos se realiza una intro-
ducción a los conceptos más relevantes
en estadística inferencial: nivel de signi-
ficancia, estimaciones, contraste de hipó-
tesis y cálculos de normalidad en la dis-
tribución de datos. Luego se explican los
cálculos de igualdad de varianzas y
pruebas estadísticas para comparar dos y
tres o más grupos diferentes (prueba t
para muestras independientes y ANO-
VA de un factor), dos y tres o más
mediciones al mismo grupo (prueba t
para muestras relacionadas y ANOVA
de un factor de medidas repetidas) y
asociaciones entre variables (correlacio-
nes de Pearson y regresiones lineales
simples).
La cuarta parte corresponde a la
estadística inferencial univariada no
paramétrica, constituida por tres capítu-
los. En ellos se explican los análisis para
datos que no poseen una distribución
normal, comparando dos y tres o más
grupos diferentes (prueba U de Mann-
Whitney, de Wilcoxon y Chi-cuadrado),
comparando dos y tres o más mediciones
al mismo grupo (Kruskal-Wallis, Fried-
man y Q de Cochran) y asociación de
variables (correlaciones de Spearman y
de Phi).
Fernando Maureira Cid
________________________________________________________________________

Cada capítulo presenta los análisis
de datos en su versión manual y en el
programa estadístico SPSS 22.0.
Es importante destacar que los ejem-
plos mostrados en cada uno de los capítu-
los y temas de este libro son FICTICIOS y
solo formulados para ilustrar los análisis
correspondientes.
Espero que este libro pueda ser una
guía para estudiantes de pre-grado y
magíster en educación física, como así
también para profesionales del área que
deseen explorar y desarrollar la inves-
tigación científica y ayuden de este modo
al crecimiento de nuestra disciplina.

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Fernando Maureira Cid
________________________________________________________________________

Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

________________________________________________________________________

La estadística es una rama de las
matemáticas que reúne y clasifica los da-
tos numéricos para generar conclusiones
e inferencias a partir de ellos. General-
mente se cuenta sólo con un pequeño con-
junto de datos, ya que puede resultar difí-
cil medir a todas las unidades que posean
las características que interesan al investí-
gador. Pese a ello es posible inferir parti-
cularidades del conjunto total de unida-
des con sólo un pequeño grupo de ellas.
Por ejemplo, es posible conocer con cierta
precisión la estatura promedio de todos
los estudiantes de un colegio, aun cuando
sólo evaluemos a algunos de ellos.
La particularidad de describir e infe-
rir información es lo que hace de la esta-
dística una disciplina tan atractiva para
cualquier ámbito de conocimiento. Debi-
do a la necesidad de incorporar esta rama
de las matemáticas a la educación física es
que comenzaremos nuestro estudio con la
aclaración de algunos conceptos funda-
mentales y que se utilizarán a los largo de
este libro.

1.1 DEFINICIONES BÁSICAS

a) Población: conjunto total de sujetos o
unidades de análisis sobre los que de-
seamos hacer conclusiones. En gene-
ral este conjunto es demasiado grande
para abarcarlo en su totalidad. Por
ejemplo: los 10.000 estudiantes de
enseñanza media de los colegios de
la comuna de Santiago Centro, los
5.000 adultos mayores de la zona
oriente de Santiago, los 700 estudian-
tes de enseñanza básica de un colegio
de Iquique, las 1.200 personas que
asisten a un gimnasio de la comuna
de Providencia, etc.

b) Muestra: subconjunto de la pobla-
ción a la cual tenemos acceso y sobre
quienes se realizarán verdaderamen-
te las mediciones. Por ejemplo: 250
estudiantes de enseñanza media de 5
colegios de la comuna de Santiago
Centro, 160 adultos mayores de la
zona oriente de Santiago, 80 estu-
diantes de enseñanza básica de un
colegio de Iquique, 130 personas que
asisten a un gimnasio de la comuna
de Providencia, etc.

c) Variable: es una característica obser-
vable que varía entre los diferentes
individuos de una población. Por
ejemplo: la edad, estatura, peso,
porcentaje de grasa corporal, fuerza,
resistencia, etc.

d) Dato: un valor particular de una va-
riable,también llamado observación
o medición. Por ejemplo: 28 años,
1,82 mts. de estatura, 84 kilos, 21% de
Fernando Maureira Cid
________________________________________________________________________

grasa corporal, 7 minutos en el test de
Naveta, etc.

e) Parámetro: Cantidad numérica calcu-
lada sobre una población. Por ejem-
plo: la estatura media de los 10.000
estudiantes de enseñanza media de
los colegios de la comuna de Santiago
Centro, la fuerza del tren superior de
los 5.000 adultos mayores de la zona
oriente de Santiago, la resistencia de
los 700 estudiantes de enseñanza
básica de un colegio de Iquique, el
porcentaje de grasa de las 1.200
personas que asisten a un gimnasio
de la comuna de Providencia, etc.

f) Estadístico: Cantidad numérica calcu-
lada sobre la muestra. Por ejemplo, la
estatura media de 250 estudiantes de
enseñanza media de los colegios de
la comuna de Santiago Centro, la
fuerza del tren superior de 160
adultos mayores de la zona oriente
de Santiago, la resistencia de 80
estudiantes de enseñanza básica de
un colegio de Iquique, el porcentaje
de grasa de 130 personas que asisten
a un gimnasio de la comuna de
Providencia, etc.

g) Censo: datos de una o más variables
de toda la población. Por ejemplo: el
CENSO poblacional que se realiza en
nuestro país cada 10 años.

h) Unidad de análisis: corresponde al
objeto estudiado. Por ejemplo, una

Variable Caso Observación

Figura 1.1 Conceptos importantes en un conjunto de datos.
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

persona, una familia, un colegio, una
región, un país, etc.

i) Caso o registro: corresponde al con-
junto de mediciones realizadas sobre
una unidad de análisis. Por ejemplo:
el sexo, la edad, el curso y el IMC de
una persona; la fuerza, velocidad,
resistencia y flexibilidad de un depor-
tista, etc.

1.2 NIVELES DE MEDICION

Los datos obtenidos de nuestras va-
riables evaluadas pueden ser de dos ti-
pos: a) categóricos; b) numéricos. Deter-
minar correctamente el nivel de medición
(o naturaleza de los datos) es fundamen-
tal en estadística, ya que esto determinará
finalmente que tipos de análisis podemos
realizar con ellos.

1.2.1 Datos categóricos

Las variables categóricas son las que
registran la presencia de un atributo. Es
importante destacar que las categorías
deben ser excluyentes, es decir, un mismo
sujeto no puede estar en dos categorías al
mismo tiempo. La cantidad de categorías
va a depender de las características del
atributo medido. Son ejemplos de datos
categóricos la puntuación baja, media y
alta de un test; la presencia y ausencia de
una cualidad; el tipo de colegio (munici-
pal, subvencionado y particular), etc.
Las variables categóricas se dividen a
su vez en dos grupos:

a) Variables categóricas nominales: Son
aquellas donde las categorías no po-
seen un orden, todas valen los mismo.
Estas variables pueden ser dicotó-
micas (cuando poseen dos catego-
rías) o policotómicas (tres o más ca-
tegorías). Por ejemplo:
 Sexo de un sujeto: masculino-feme-
nino (variable dicotómica)
 Presencia o ausencia de un atributo:
embarazada – no embarazada (varia-
ble dicotómica)
 Religión: cristiano, musulmán, pro-
testante, budista, etc. (variable poli-
cotómica)
 Estado civil: soltero, casado, separa-
do, viudo (variable policotómica).
 Comuna de residencia: Santiago Cen-
tro, Recoleta, Providencia, Ñuñoa,
Maipú, etc. (variable policotómica).

b) Variables categóricas ordinales: Son
aquellas donde las categorías poseen
un orden jerárquico, es decir, hay
categorías mayores o más importan-
tes que otras. Por ejemplo:
 Cursos del colegio (1°, 2°, 3°, 4°, etc.)
 Nivel de desarrollo de patrones mo-
tores (bajo, medio y alto)
 IMC (bajo-peso, normal, sobrepeso,
obeso)
 Puesto de trabajo (rector, director,
subdirector, jefe de UTP, profesor,
etc.)

1.2.2 Datos numéricos

También conocidas como variables
continuas o discretas. Las variables nu-
méricas son las que presentan el resul-
tado de sus observaciones como núme-
ros, permiten ordenar los valores en un
continuo y el intervalo entre cada par de
valores es siempre el mismo indepen-
diente del lugar donde este (el intervalo
entre el 4 y el 5 es el mismo que entre el
Fernando Maureira Cid
________________________________________________________________________

81 y 82). Estas variables se clasifican
en dos grupos:

a) Variables intervalares: Son aquellas
que miden atributos donde el cero es
arbitrario y no significa la ausencia
del atributo. También puede tomar
valores negativos. Por ejemplo:
 Las puntuaciones en las pruebas.
 Las puntuaciones de coeficiente inte-
lectual.
 Las puntuaciones de un test cognitivo
(atención, memoria, planificación,
etc.).
 La temperatura (en grados Celsius o
Fahrenheit).
 Las puntuaciones de un test de motri-
cidad, agilidad, coordinación, etc.

b) Variables de razón: Son aquellas que
miden atributos donde el cero no es
arbitrario, sino que indica la ausencia
de dicha característica. No existen los
valores negativos. Por ejemplo:
 Edad, peso, estatura, etc.
 Número de hermanos (el cero indica
que no se tiene hermanos).
 Velocidad, fuerza, resistencia, etc.  Número de ingreso y egreso de una
carrera, etc.

Como se dijo anteriormente, es muy
importante definir correctamente el tipo
de datos al que corresponden nuestros
valores medidos, ya que eso determina
que tipos de análisis estadísticos son
posibles de realizar y cuáles no. Por
ejemplo, obtener el promedio de una
variable numérica tiene sentido en
cambio determinar el promedio de una
variable categórica no lo tiene.

1.3 ANALISIS DE DATOS

La estadística se divide en dos gran-
des áreas: la estadística descriptiva o aná-
lisis exploratorio de datos (presentación
de los datos organizados y resumen de
los mismos) y la estadística inferencial
(conjunto de métodos que permiten pre-
decir características de un fenómeno).
La estadística descriptiva contiene
las tablas de frecuencia, gráficos, medi-

Figura 1.2 Tipos de datos.
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

Figura 1.3 Tipos de análisis en la estadística descriptiva.

das de tendencia central, medidas de dis-
persión, medidas de posición y medidas
de forma (Fig. 1.3).
Por su parte, la estadística inferen-
cial se divide en Univariada (cuando en
la investigación existe una sola variable
dependiente, pudiendo existir 1 o más va-
riables independientes) y Multivariada
(cuando en la investigación existen dos o
más variables dependientes, pudiendo
existir una o más variables independien-
tes). La estadística univariada puede divi-
dirse en paramétrica y no paramétrica,
existiendo en ambos casos prueba para
comparar grupos y para realizar asocia-
ciones entre variables (Fig. 1.4). Por su
parte, la estadística multivariada se
divide en métodos de dependencia,
métodos de interdependencia y métodos
estructurales (en este libro se abordará la
estadística descriptiva y la univariada).

1.4 DESARROLLO HISTÓRICO DE
LA ESTADÍSTICA

La estadística es tan antigua como
la escritura y corresponde a un elemento
complementario a todas las ciencias. La
historia de esta disciplina puede clasifi-
carse en 4 etapas: Censos, Aritmética Po-
lítica, Cálculo de probabilidades y Esta-
dística moderna.

a) La primera etapa de la estadística se
conoce como los censos, ya que se
basa en la descripción de la población
y riquezas por parte de los gobernan-
Fernando Maureira Cid
________________________________________________________________________

Figura 1.4 Tipos deanálisis en la estadística inferencial univariada.

tes para lograr mejorar la administra-
ción de los estados. A continuación
se presentan los hechos más relevan-
tes de esta etapa:

 Los primeros indicios se remontan al
antiguo Egipto unos 3.050 años A.C.,
con los censos de población y registro
de las riquezas.
 Situación similar ocurre en China en
el año 2238 A.C.
 Los romanos fueron quienes más uti-
utilizaron la estadística con censos,
registros de nacimientos, defunción,
matrimonios, riquezas, etc.

b) La segunda etapa de la estadística: la
aritmética política.

 Durante los mil años posteriores a la
caída del imperio romano se realiza-
ron muy pocas operaciones estadísti-
cas, con la excepción de las compila-
ciones de tierras de la iglesia realiza-
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

da por el rey franco Pipino el Breve
en 758 D.C.
 En el año 1532 Enrique VII exige el
registro de las defunciones en Ingla-
terra, debido al temor que tenía a la
peste. Misma época en que los cléri-
gos franceses debían registrar los
nacimientos, defunciones y matrimo-
nios.
 En 1540 Sebastián Muster realiza una
compilación de datos sobre la organi-
zación política, comercio y recursos
militares de Alemania.
 En 1632 se publican las Cuentas de
Mortalidad en Inglaterra con los datos
de nacimientos y defunciones.
 En 1662 John Graunt publica Observa-
ciones Políticas y Naturales hechas a
partir de las Cuentas de Mortalidad,
donde utiliza registros de 30 años
para efectuar predicciones sobre la
muerte de personas por diversas en-
fermedades, siendo el primer intento
de inferencia estadística del que se
tiene registro.

c) La tercera etapa de la estadística es
denominada cálculo de probabilida-
des.

 Las probabilidades comenzaron a ser
formalizada por los franceses Blaise
Pascal y Pierre Fermat en 1654 quie-
nes encontraron la solución a cómo
repartir las apuestas de un juego que
no había finalizado, mediante las pro-
babilidades de ganar que tuviese cada
participante en ese momento.
 En 1665 Blaise Pascal publica Tratado
sobre el triángulo aritmético que se basa
en las propiedades combinatorias del
posteriormente llamado triángulo de
Pascal (una representación de los
coeficientes binominales ordenados
en forma de triángulo).

Figura 1.5 En las imágenes superiores
Pipino el Breve (izquierda) y Enrique VII
(derecha); en las imagenes inferiores
Sebastián Muster (izquierda) y John
Graunt (derecha).

Figura 1.6 En las imagenes superiores
Blaise Pascal (izquierda) y Pierre Fermat
(derecha); en las imagenes inferiores
Jacob Bernoulli (izquierda) y Godofredo
Achenwall (derecha).
Fernando Maureira Cid
________________________________________________________________________

Figura 1.7 En las imágenes superiores
Thomas Bayes (izquierda) y Pierre
Laplace (derecha); en las imagenes
inferiores Karl Gauss (izquierda) y
Jacques Quételec (derecha).

 En 1687 se publica la obra póstuma El
arte de la Conjetura del matemático
Suizo Jacob Bernoulli, donde se en-
cuentra entre otras cosas, las bases del
teorema de Bernoulli (frecuencia
aproximada que un suceso a la proba-
bilidad p ocurra a medida que se
repite un experimento).
 En 1760 Godofredo Achenwall, pro-
fesor alemán, acuño el término esta-
dística que proviene del latín status
que significa estado o situación.
 En 1764 se publica la obra póstuma
de Thomas Bayes Ensayo sobre la
resolución de un problema en la doctrina
del azar, la cual fue ignorada por sus
contemporáneos, pero 2 siglos des-
pués sirvió para formulación de la
inferencia bayesiana, la cual asigna
probabilidades a fenómenos no alea-
torios, pero cuyos resultados no son
conocidos.
 En 1812 Pierre Simón Laplace publi-
ca Teoría analítica de probabilidades
donde estudia los problemas de las
probabilidades continuas. También
descubre y demuestra el teorema de
límite central y fusiona el cálculo de
probabilidades y la estadística.
 En 1823 Karl Friedrich Gauss desa-
rrolla la teoría de errores (conjunta-
mente con Bessel y Laplace) estable-
ciendo el método de mínimos cua-
drados. Además de esto, el estudio
de la distribución normal fue el gran
aporte de Gauss al cálculo de proba-
bilidades.
 En 1835 Jacques Quételect (matemá-
tico belga) es quien aplica por prime-
ra vez la estadística a las ciencias so-
ciales.

d) La cuarta etapa de la estadística es
denominada Estadística moderna.

 En 1837 Simeón Poisson publicó
Tratado de probabilidades que contiene
la ley de probabilidades conocida
como distribución de Poisson y la
generalización de la ley de los gran-
des números de Bernoulli.
 En 1888 Francis Galton introdujo el
término correlación para hacer refe-
rencia a la influencia relativa de una
variable sobre otra. También trabajo
en regresión lineal, componentes de
varianza y diseño curvas normales
inversas llamadas ojivas. Sus trabajos
en la ley normal bivariada de proba-
bilidades dieron origen a la ley nor-
mal multivariada, base de la estadís-
tica multivariante.
 En 1892 Karl Pearson publica La
gramática de la ciencia, donde estudió
curvas asimétricas y generó el test de
Chi-cuadrado. También trabajó y
perfeccionó los análisis de correla-
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________

ción de Galton, desarrollando la
correlación de Pearson.
 En 1902 el inglés William Sealey
Gosset publica un artículo con las ba-
ses de la distribución t de Student
(seudónimo con el cual publicó dicho
artículo).
 En 1925 Ronald Arnold Fisher,
matemático y biólogo inglés, publica
su libro Métodos estadísticos para inves-
tigadores. Creo el análisis de varianza,
numerosos análisis multivariados y
del método de máxima verosimilitud
para la estimación de parámetros.
Desarrollo el diseño experimental en
bloques, la aleatorización y los dice-
ños factoriales. Considerado el más
grande estadístico del siglo XX.
 En 1933 el ruso Andrei Kolmogorov
desarrolló una teoría de probabilida-
des totalmente basada en axiomas
fundamentales totalmente rigurosos.
 En 1934 el polaco Jerzy Neyman
introduce la teoría de los intervalos
de confianza. También publica el pri-
mer trabajo en muestreos de pobla-
ciones finitas.
 En 1936 Jerzy Neyman y Egon Pear-
son (hijo de Karl Pearson) presentan
una teoría sobre la prueba de hipóte-
sis en estadística.
 La década de 1930-1940 fue el auge de
la estadística multivariada con Maha-
lanobis (1936), Fisher (1936), Hotte-
ling (1936), Bartlett (1938), etc.
 En 1945 el estadounidense Frank
Wilcoxon publicó un trabajo donde
reemplazó los datos por sus rangos,
de manera que fue posible conocer
propiedades distribucionales de los
mismos, creando así la prueba de
rangos de Wilcoxon. Esta idea es la

Figura 1.8 En las imágenes superiores
Francis Galton (izquierda) y Karl
Pearson (derecha); en las imagenes
inferiores Ronald Fisher (izquierda) y
Frank Wilcoxon (derecha).

base de la estadística no paramétrica.
 En 1952 los estadounidenses William
Kruskal y Allen Wallis publican el
análisis de rangos que lleva su nom-
bre.
 A partir de la segunda mitad del
siglo XX, la estadística está fuerte-
mente asociada a la computación, ya
que el desarrollo de software estadís-
ticos permite la realización de cientos
o miles de cálculos en tiempos redu-
cidos o el trabajo con decenas de
variables al mismo tiempo. Por ejem-
plo el programa SPSS fue creado en
1968 y en el 2016 se lanzó su versión
24.0. Los programas estadísticos más
usados en la actualidad son: SPSS,
SAS, R, Statistica, Stata, Matlab,
Minitab, etc.

Fernando Maureira Cid
________________________________________________________________________

32Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

________________________________________________________________________

La estadística descriptiva o análisis
exploratorio de datos ofrece modos de
presentar y evaluar las características más
importantes de un conjunto de datos. Esto
a través de tablas, gráficos y medidas re-
súmenes. Es importante recordar que la
finalidad de estos análisis no es el de
obtener conclusiones sobre las variables
que se están midiendo, sino solamente
mostrar las características que presentan
los datos que hemos recolectado.

2.1 TABLAS DE FRECUENCIA

Nivel de medición:
Nominal y Ordinal

La tabla de frecuencia es el modo
más sencillo de presentar los datos, en
ella se observa:

 El nombre de las categorías: grupos
en los cuales se clasifican los datos
obtenidos. Por ejemplo: presión arte-
rial baja, presión arterial media y pre-
sión arterial alta; soltero, casado, di-
vorciado, viudo; colegio municipal,
colegio subvencionado, colegio parti-
cular, etc.
 La frecuencia absoluta: número de
sujetos que componen cada catego-
ría. Por ejemplo: de 155 personas
evaluadas 20 de ellas poseen una pre-
sión arterial baja, 80 personas una
presión arterial media y 55 personas
una presión arterial alta.
 La frecuencia relativa: porcentaje
que representa el número de sujetos
en cada categoría en relación al total
de observaciones. Por ejemplo: el
12,9% de las personas evaluadas po-
seen una presión arterial baja, el
51,6% poseen una presión arterial
media y el 35,5% posee una presión
arterial alta.
 La frecuencia acumulada: porcentaje
acumulado que corresponde a la su-
ma de los porcentajes de cada catego-
ría más las categorías anteriores. Por
ejemplo: el 12,9% de las personas
evaluadas posee una presión arterial
baja, el 64,5% posee una presión arte-
rial baja-media y el 100% posee una
presión arterial baja-media-alta.

Los pasos de elaboración de una ta-
bla de frecuencias se observan en el
ejemplo 2.1.
También es posible utilizar tablas
de frecuencia con datos de naturaleza
numérica, sin embargo, aquí es necesario
realizar un agrupamiento de los datos en
intervalos de clases, donde cada inter-
valo corresponde a una categoría y con
ellas es posible seguir los pasos para
construir la tabla. Este proceso se observa
en el ejemplo 2.2.
Fernando Maureira Cid
________________________________________________________________________

Ejemplo 2.1
Un profesor busca conocer el IMC de 15 estudiantes de primer año básico de un colegio
de Santiago, para ello mide la talla y el peso de ellos y luego calcula el IMC obteniendo
los siguientes resultados:

 Paso 1:
Para elaborar la tabla de frecuencia debemos agrupar los valores del IMC obtenidos en
diversas categorías:

Bajo peso (<18,5) = 1 sujeto
Normal (18,5 a 24,9) = 6 sujetos
Sobre-peso (25 a 29,9) = 4 sujetos
Obesidad I (30 a 34,9) = 2 sujetos
Obesidad II (35 a 39,9) = 1 sujetos
Obesidad III (>40) = 1 sujeto

 Paso 2:
Calculamos la frecuencia relativa (fr) de cada categoría con la siguiente fórmula:

(fórmula 1)

fr = n1 * 100
N

n1 = número de observaciones de una categoría
N = número de todas las observaciones

Aplicamos la fórmula de la fr a los datos obtenidos en el paso 1:

Bajo peso = 1 sujeto (1/15)*100 = 6,7
Normal = 6 sujetos (6/15)*100 = 40,0
Sobre-peso = 4 sujetos (4/15)*100 = 26,7
Obesidad I = 2 sujetos (2/15)*100 = 13,2
Obesidad II = 1 sujetos (1/15)*100 = 6,7
Obesidad III = 1 sujeto (1/15)*100 = 6,7

 Paso 3:
Calculamos la frecuencia acumulada con la frecuencia relativa de la primera categoría,
luego la frecuencia relativa de la segunda más la primera categoría, luego la tercera más
la segunda y más la primera, así sucesivamente.
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

Bajo peso 6,7
Normal = 40,0 + 6,7 = 46,7
Sobre-peso = 26,7 + 40,0 + 6,7 = 73,4
Obesidad I = 13,2 + 26,7 + 40,0 + 6,7 = 86,6
Obesidad II = 6,7 + 13,2 + 26,7 + 40,0 + 6,7 = 93,3
Obesidad III = 6,7 + 6,7 + 13,2 + 26,7 + 40,0 + 6,7 = 100,0

 Paso 4:
Elaboramos la tabla de frecuencia con los datos anteriores:

En la tabla de frecuencia podemos observar que la categoría normal presenta el mayor
número de sujetos (6) y por ende la mayor frecuencia relativa (40,0%). Por otra parte, la
categoría bajo peso, normal y sobre-peso presentan una frecuencia acumulada de 73,4%,
es decir, las tres categorías suman ese porcentaje de sujetos de la muestra.

Ejemplo 2.2
Un profesor desea conocer cómo se distribuyen las notas de sus estudiantes en el último
control realizado. Los resultados obtenidos fueron los siguientes:

 Paso 1:
Debido a que la variable es numérica es necesario establecer intervalos de clases:

Notas entre 2,0 y 2,9 Notas entre 4,0 y 4,9 Notas entre 6,0 y 6,9
Notas entre 3,0 y 3,9 Notas entre 5,0 y 5,9

Fernando Maureira Cid
________________________________________________________________________

 Paso 2:
Construimos la tabla de frecuencia como en el ejemplo 2.1:

*Nota: generalmente los intervalos de clases poseen la misma longitud.

2.2 GRÁFICOS DE BARRA Y TORTA

Nivel de medición:
Nominal y Ordinal

Una vez que hemos desarrollado
una tabla de frecuencias es posible gene-
rar una representación de esta mediante
gráficos.
El gráfico de barras se utiliza para
representar variables categóricas nomi-
nales u ordinales. La altura de cada barra
indica un valor de frecuencia absoluta o
relativa (Fig. 2.1), por lo tanto, es posible
comparar visualmente las diferencias en-
tre cada categoría. También es posible uti-
lizar el gráfico de barra para comparar
dos o más distribuciones (Fig. 2.2).
El grafico de torta (también conoci-
do como circular o de sectores) repre-
senta la frecuencia como un ángulo y una
porción dentro de un círculo (Fig. 2.3).
Para calcular los grados de arco que co-
rresponden a cada categoría es necesario
multiplicar la frecuencia por 360 (que
corresponde a la cantidad total de grado
de un círculo) y el resultado dividirlo en
100. Por ejemplo: en un grupo evaluado
el 40% son varones, por lo tanto el valor
de frecuencia relativa debe multiplicarse
por 360 (40*360 = 14.440) y ese resultado
se divide por 100 (14.440 / 100 = 144),
siendo la porción del grafico de torta que
representa a los varones de 144°.
Este tipo de grafico es igual de útil
que el de barra para representar la dis-
tribución de un grupo, pero resulta me-
nos eficiente para representar a dos o
más grupos siendo necesario utilizar va-
rios gráficos (uno por cada población o
muestra).

2.3 DIAGRAMA DE TALLO Y HOJA

Nivel de medición:
Intervalar y de razón

Corresponde a una alternativa a
gráficos como el de barra, con la ventaja
que no se pierde la información original.
En este diagrama las decenas co-
rresponden al tallo y las unidades a las
hojas, las cuales deben ubicarse siempre
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

Figura 2.1 Gráfico de barra del porcentaje de IMC en estudiantes de primer año medio
de un colegio de la ciudad de Santiago.

Figura 2.2 Gráfico de barra del IMC comparando estudiantes de sexo masculino y
femenino de primer año medio de un colegio de la ciudad de Santiago.

Fernando Maureira Cid
________________________________________________________________________

Figura 2.3 Gráfico de torta de la distribución de una muestra según sexo. Los varones
representan el 40% (144° del círculo) y las damas el 60% (216° del círculo).a la derecha. En el ejemplo 2.3 se explica
el proceso para generar un diagrama de
estas características.

2.4 HISTOGRAMA, POLÍGONOS DE
FRECUENCIA Y OJIVA

Nivel de medición:
Intervalar y de razón

Es el más conocido de los gráficos
para representar variables numéricas. A
diferencia del gráfico de barra, en un
histograma no existe separación entre
categorías (a menos que una categoría
tenga valor cero), ya que sus valores son
continuos.
En el ejemplo 2.4 se observa la re-
presentación de una tabla de frecuencia
en forma de histograma. Es importante
destacar que la representación visual de
este tipo de gráfico depende de la canti-
dad de clases que utilicemos (divisiones
de los datos como categorías).
Muchas clases provocarán que po-
cos datos queden dentro de cada clase y
por ende el histograma presentará una
distribución uniforme. Por el contrario,
pocas clases provocarán que muchos da-
tos queden dentro de una clase y el gráfi-
co mostrará pocas características impor-
tantes. El número ideal de clases se ha
calculado entre 6 y 15.
Los histogramas pueden utilizarse
tanto con las frecuencias relativas, como
con las frecuencias acumuladas y repre-
sentan la base para elaborar polígonos
de frecuencia, que corresponden a una
gráfica lineal que se construye uniendo
los puntos centrales de cada barra del
histograma (ejemplo 2.5). Así obtenemos
una imagen de la curva que genera la
distribución de la variable.

Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

Ejemplo 2.3
Un entrenador evalúo la flexibilidad de 18 gimnastas varones (edades entre 9 y 11 años)
mediante una prueba de elevación frontal de la pierna. Los resultados fueron los
siguientes:

 Paso 1:
El primer dígito de cada valor se convierte en el tallo y el segundo en la hoja, ubicando
los tallos en forma ascendente. Luego el segundo dígito se ubica a la izquierda del tallo:

5 7
6 0 3 5 6 9
7 0 4 8
8 1 4 8
9 0 0 1 2 4 5

En el diagrama es posible observar que la mayor cantidad de casos se encuentran en el
rango de 90 cms. o más, en tanto el rango de 50 a 59 cms. solo presenta un sujeto.
E

Ejemplo 2.4
Un profesor evaluó el desarrollo de los patrones motores en 42 estudiantes de tercer año
básico de un colegio de Santiago. El test presenta una puntuación de 1 a 5 (1=muy bajo;
2=bajo; 3=ni bajo ni alto; 4=alto; 5=muy alto). A continuación se presenta la tabla de
frecuencia con los resultados:

La frecuencia relativa de las puntuaciones del test de patrones motores de tercer año
básico se presenta en el siguiente histograma:
Fernando Maureira Cid
________________________________________________________________________

Figura 2.4 Histograma de las puntuaciones de los patrones motores de 42 estudiantes de
tercer año básico de un colegio de la ciudad de Santiago.

Ejemplo 2.5
Un profesor evaluó la coordinación de 15 niños de 6 años de un colegio de Santiago,
mediante una escala de 1 a 5 (1=muy baja; 2=baja; 3=ni baja ni alta; 4=alta; 5=muy alta) y
obtuvo los siguiente resultados:

Se construyó la tabla de frecuencia:

..
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

 Paso 1:
Elaboramos el histograma y unimos el centro de cada barra con una recta, entregando la
forma del polígono de frecuencia:

Figura 2.5 Polígono de frecuencia relativa de los puntajes de la coordinación.

 Paso 2:
Elaboramos el histograma con la frecuencia acumulada y unimos las barras con una
recta, entregando la ojiva.

Figura 2.6 Ojiva de los puntajes de la coordinación.

Fernando Maureira Cid
________________________________________________________________________

Finalmente, si construimos el histo-
grama con la frecuencia acumulada y se
unen los puntos de cada barra se obtiene
un polígono de frecuencia acumulada,
también llamada ojiva, la que resulta ser
una curva ascendente que comienza con
la 1° frecuencia acumulada y termina con
un 100%. En este gráfico es posible
conocer cómo van sumando las categorías
y tener una visión de la evolución de la
frecuencia de los datos.
2.5 REPRESENTACIÓN DE DATOS
EN SPSS

En la actualidad existen muchos
programas estadísticos que pueden ayu-
darnos a realizar los cálculos necesarios
para nuestras investigaciones. A conti-
nuación se utilizará el programa SPSS
(Statistical Package for the Social Scien-
ces) para trabajar los análisis descripti-
vos.

Tras instalar el SPSS en nuestro computador abrimos el programa mostrando una
pantalla como la figura siguiente:

Figura 2.7 Pantalla inicial del SPSS 22.0.

Luego debemos ingresar los descriptores de las variables que utilizaremos presionando
Vista de variables en la barra inferior, con esto aparece una pantalla como la figura 2.8.
En la primera columna colocamos los nombres de las variables. En la columna Tipo
aparece el concepto de numérico (en variables numéricas) o cadena (en variables
categóricas, con nombres en lugar de números). En la columna Decimales podemos
modificar la cantidad de decimales de nuestros valores.

Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

Figura 2.8 Descripción de las variables en el SPSS 22.0.

Si la variable es categórica debemos describir dichas categorías presionando en la
columna Valores, así aparecerá una pantalla como la siguiente:

Figura 2.9 Valores de las variables.

En el recuadro Valor colocamos el número asignado a cada grado de la categoría. Por
ejemplo, si la variable es sexo, un valor será 1 para femenino y 2 para masculino. En el
recuadro de Etiqueta escribimos el nombre de la categoría.
Una vez introducidos ambos valores presionamos Añadir para grabar los datos y
comenzamos a realizar lo mismo nuevamente con la siguiente categoría de la variable.
Recuerde que las variables numéricas no necesitan completar esta información.
Una vez completada la información de todas las variables volvemos a Vista de varia-
bles y podemos escribir los valores para cada variable hasta completar el traspaso de
datos.
Fernando Maureira Cid
________________________________________________________________________

Figura 2.10 Pantalla con los datos en el SPSS 22.0.

Para realizar todos los análisis estadísticos debemos ir a Analizar que se ubica en la
barra superior y se desplegará el índice general de pruebas. Cuando seleccionamos una
de estas alternativas se desplegará un nuevo índice con los análisis particulares para
cada caso.

Figura 2.11 Desplegar los analisis estadisticos del SPSS 22.0.

Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________

Para obtener una tabla de frecuencia y los gráficos en el SPSS 22.0 vamos en el
menú a:

 Analizar
 Estadísticos descriptivos
 Frecuencia

Figura 2.12 Pantalla de frecuencia en el SPSS 22.0.

En el cuadro de la izquierda aparece la lista de nuestras variables. Tomamos la variable
categórica y la llevamos al cuadro derecho (Variables). Luego presionamos Gráficos y
marcamos Gráfico de barra, Gráficos circulares o Histograma (Fig. 2.13).

Figura 2.13 Pantalla de graficos en el SPSS 22.0.

Tras esto presionamos Continuar para volver a la pantalla de frecuencia y presionamos
Aceptar. La hoja de cálculos del programa nos entrega una tabla como la siguiente:
Fernando Maureira Cid
________________________________________________________________________

Tabla 2.1 Tabla de frecuencia

En la tabla de frecuencia observamoslos nombres de las categorías de la variable, la
frecuencia (número de sujetos en la categoría), el porcentaje o frecuencia relativa, el
porcentaje válido (porcentaje que se ajusta cuando existen casos perdidos) y el
porcentaje acumulado o frecuencia acumulada.
La hoja de cálculos del programa también nos entregará el gráfico que se ha escogido.

Figura 2.14 Grafico de barras entregado por el SPSS 22.0.

Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

________________________________________________________________________

3.1 MEDIDAS DE TENDENCIA
CENTRAL (MTC)

Nivel de medición:
Intervalar y de razón

Son medidas resúmenes de posición
central alrededor de los cuales se encuen-
tran las observaciones realizadas. Tam-
bién pueden ser definidas como el com-
portamiento más común en un conjunto
de datos. Las medidas de tendencia cen-
tral más usadas son la media, la mediana
y la moda.
3.1.1 Media aritmética

La media aritmética, media o pro-
medio es la MTC más utilizada y corres-
ponde a la suma de los valores de cada
observación y cuyo resultado se divide
por la cantidad de datos. El cálculo de la
media se aprecia en los ejemplos 3.1 y
3.2.
La media de una muestra se desig-
na con la letra y la media de una pobla-
ción se designa con la letra griega µ
(mu). La media representa el punto de
equilibrio de los datos y es muy sensible

Ejemplo 3.1
Un profesor ha evaluado la velocidad en 30 metros lanzados de nueve estudiantes de
primer año medio de un colegio de Santiago y ha encontrado los siguientes resultados:

 Paso 1:
Calculamos la media aritmética con la siguiente fórmula:

= ∑ Xi
n

(fórmula 2)

∑ X1 = suma del valor de todas las observaciones o datos
n = número total de observaciones
.
Fernando Maureira Cid
________________________________________________________________________

Ahora con los datos del ejemplo 3.1 reemplazamos en la fórmula de la media:

= 7,30 + 8,15 + 4,60 + 9,10 + 6,40 + 5,50 + 7,25 + 6,30 + 8,05 = 6,96
9

La media de velocidad de los 9 estudiantes en el test de 30 mts. es de 6,96 segundos.

Ejemplo 3.2
En un partido de básquetbol de la liga nacional ocho jugadores de un equipo realizan
lanzamientos a la canasta (independiente que estos terminen en puntos o no) y su
entrenador registra el número de intentos de cada uno de ellos y obtiene la siguiente
tabla:

.
En la primera columna vemos el número de jugadores, en la segunda los lanzamientos a
la canasta realizadas en el primer tiempo por cada uno de ellos que generan una media
de 5,25. Finalmente, en la tercera columna observamos una cantidad similar de
lanzamientos excepto en el jugador seis que de 2 lanzamiento aumento a 75, por lo
tanto, la media aumento a 14,38. Esto sirve para graficar como un solo dato outlier
produce grandes variaciones en la media de un conjunto de datos.

a los datos extremos (outliers), es decir,
datos demasiado atípicos o extremos pro-
ducen cambios importantes en ella (ejem-
plo 3.2).

3.1.2 Mediana

Corresponde al dato que ocupa la
posición central al ordenar las observacio-
nes de menor a mayor. Esta se obtiene
con el número total de observaciones y la
suma de una unidad, luego el resultado
es dividido en 2 entregando el lugar don-
de se encuentra la mediana (ejemplo 3.3).
Este análisis se utiliza con datos numé-
ricos, pero también con datos ordinales y
es una medida robusta, muy poco sen-
sible a los datos outliers.
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

Ejemplo 3.3
Un profesor evaluó la motricidad de 15 niños de edades pre-escolares de un jardín
infantil de Santiago y los resultados del test se presentan ordenados de menor a mayor
en la siguiente tabla:

 Paso 1:
Calculamos la mediana con la siguiente fórmula:

Mediana = n + 1
2

(fórmula 3)

n = número total de observaciones

Mediana = 15 + 1 = 16 = 8
2 2

La mediana corresponde al valor ubicado en el lugar 8 en el orden de menor a mayor y
que en esta base de datos corresponde a una puntuación de 10 en el test de motricidad.

Si la cantidad de datos es par la mediana es el valor promedio de los dos datos
centrales. Por ejemplo, si tomamos los 10 primeros casos del ejemplo anterior y
utilizamos la fórmula 2 tenemos:

Mediana= (10 + 1) / 2 = 5,5

La mediana se encuentra en el centro de los valores 5 y 6.

.
Como los valores de los lugares 5° y 6° son 7 y 8, respectivamente, es necesario obtener
la media aritmética de dichos valores:

= (7 + 8) / 2 = 7,5 que corresponde a la mediana de estos datos.
Fernando Maureira Cid
________________________________________________________________________

3.1.3 Moda

Es el dato que ocurre con mayor
frecuencia en el conjunto de observacio-
nes, pudiendo utilizarse en datos numé-
ricos y categóricos.
Cuando una distribución presenta
una sola moda recibe el nombre de uni-
modal, cuando presenta dos modas se
denomina bimodal y cuando presenta
tres o más modas se designa como dis-
tribución multimodal (Fig. 3.1).

Ejemplo 3.4
Un entrenador evaluó la cantidad de abdominales en un minuto que realizan 18
seleccionados universitarios de fútbol como parte del proceso de evaluación de su
condición física y los resultados fueron los siguientes:

La moda es el número 60, ya que es el valor que se presenta más veces en este conjunto
de datos (6 en total).

Figura 3.1 Distribuciones según sus modas. En la imagen superior izquierda se grafica
una distribución unimodal, en la imagen superior derecha una distribución bimodal y en
la imagen inferior una distribución multimodal.
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

3.2 MEDIDAS DE DISPERSIÓN

Nivel de medición:
Intervalar y de razón

Las medidas de dispersión o varia-
bilidad describe cuan cerca se encuentran
los datos entre sí o cuan cerca se en-
cuentran de alguna medida de tendencia
central.

3.2.1 Amplitud o rango

Corresponde a la diferencia de las
observaciones extrema de un conjunto de
datos (ejemplo 3.5). Es común que en los
resultados se presenten el valor menor, el
mayor y el rango, siendo este último muy
sensible a los valores outliers.
3.2.2 Varianza

La varianza (S2) es la media del cua-
drado de las desviaciones respecto a la
media de los datos. Esto permite conocer
la diferencia promedio de los valores con
respecto a su media, siendo la base de
muchos análisis inferenciales.
Este análisis siempre corresponde a
valores positivos (debido a que los valo-
res son elevados al cuadrado), siendo
muy sensible a datos outliers. La medida
de la varianza corresponde a la unidad
de medida de la variable al cuadrado,
por ejemplo, si la variable es expresada
en centímetros la varianza será en cen-
tímetros al cuadrado.
El cálculo de la varianza se observa
en el ejemplo 3.6.

Ejemplo 3.5
Un entrenador evaluó la fuerza del tren superior en 14 seleccionados de Judo. Esto se
realizó a través de una RM en press banca y los resultados fueron los siguientes:

 Paso 1:
Calculamos el rango con la siguiente fórmula:

Rango = Vmayor – Vmenor

(fórmula 4)

Vmayor = valor mayor de los datos
Vmenor = valor menor de los datos

Rango = 128 – 78 = 50

50 kilos corresponde al rango de estos datos.

Fernando Maureira Cid
________________________________________________________________________52

Ejemplo 3.6
Un investigador desea conocer los niveles de memoria visual de 11 estudiantes de
pedagogía en educación física de una universidad de Santiago y para ello se aplica un
test neuropsicológico. Los resultados de las observaciones son los siguientes:

 Paso 1:
Calculamos la varianza con la siguiente fórmula:

(fórmula 5)

S2 = ∑(Xi – 2
n – 1

∑(Xi – )2 = suma de los cuadrados de la diferencia entre cada puntuación y la media de las
puntuaciones
n = número de datos

 Paso 2:
Calculamos la suma de cuadrados para los datos de la memoria:

 Paso 3:
Aplicamos la fórmula 5 para nuestros datos:

Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

S2 = 28,55 = 28,55 = 2,855
11 – 1 10

En el ejemplo la varianza es de 2,855

3.2.3 Desviación estándar

Corresponde al grado en que las
puntuaciones de la variable se alejan de la
media. Se calcula con la raíz cuadrada de
la varianza (ejemplo 3.7).
La desviación estándar muestral se
designa con la letra S y la desviación es-
tándar poblacional con la letra sigma (σ .
Este análisis es muy útil para cono-
cer cuánto se alejan los datos de la media
de una muestra cuando esta posee una
distribución simétrica. Esto ocurre cuan-
do la mayoría de los datos obtenidos se
encuentran en los puntajes centrales y
muy pocos datos se encuentran en los
extremos (Fig. 3.2).
Por ejemplo, en un test de fuerza
muy pocas personas tendrán valores
muy bajos o muy altos, la mayoría
obtendrán puntuaciones medias. Esta
situación ocurre en la mayoría de los pro-
cesos naturales si la muestra es lo sufí-
cientemente grande (tiende a infinito).
Si la desviación estándar de la
muestra se encuentra entre la cuarta y
quinta parte del rango se considera que
la distribución es homogénea, es decir,
los datos obtenidos de todos los sujetos
evaluados se encuentran cercanos a la
media. Si la desviación estándar no se en-
cuentra en ese rango, la muestra se consi-
dera heterogénea. Cuando ocurre esta
segunda opción podría ser interesante

Ejemplo 3.7
Utilizando la varianza del ejemplo 3.6 sobre la memoria de los estudiantes
universitarios, calculamos la desviación estándar con la siguiente fórmula:

S = √S2

(fórmula 6)

√S2 = raíz cuadrada de la varianza

S = √2,855 = 1,689

El promedio o media de los datos sobre la memoria de estudiantes de educación física
fue de 5,64 y la desviación estándar fue de 1,689 esto quiere decir que todos los datos
entre – 1 S (3,951) y + 1 S (7,329) se encuentran a una desviación de la media y
siempre en este espectro se agrupa el 68% de los datos recolectados. Esto indica que casi
el 70% de las observaciones obtuvieron puntajes entre 3,951 y 7,329.

Fernando Maureira Cid
________________________________________________________________________

Figura 3.2 Distribución simétrica. En estos datos la cantidad de observaciones que se
encuentra entre una desviación estándar a la derecha y a la izquierda es del 68,26%, en
dos desviaciones estándar es del 95,45% y en tres desviaciones es del 99,73%.

comparar los resultados de los grupos
extremos de datos que hemos obtenido,
para saber si existen diferencias entre
las puntuaciones más altas y más bajas.
Para el ejemplo 3.6 de la memoria de
los estudiantes universitarios:

Rango = 6
S = 1,689
1/4 rango = 6/4 = 1,5
1/5 rango = 6/5 = 1,2

Como S =1,689 no se encuentra entre
la cuarta y quinta parte del rango (1,5 y
1,2 respectivamente) esta muestra se con-
sidera heterogénea.
Para muestras homogéneas los valo-
res de rango, varianza y desviación están-
dar serán menores, debido a que los datos
se encuentran más agrupados. En mues-
tras heterogéneas ocurrirá lo contrario.
3.3 MEDIDAS DE POSICIÓN

Nivel de medición:
Intervalar y de razón

3.3.1 Percentiles

Las medidas de posición se basan
en el orden que poseen ciertos valores de
las observaciones, comúnmente reciben
el nombre de cuantiles y se define como
el valor de la variable por debajo de la
cual se encuentra una frecuencia acumu-
lada α.
Un percentil es un valor p% que
deja una cantidad de p% de datos de bajo
de él y 1-p% sobre él. Por ejemplo, un
percentil 30 deja por debajo el 30% de las
observaciones o datos y por encima un
70% de las observaciones.
Los percentiles separan a la mues-
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

tra en grupos de 1% y la mediana siem-
pre corresponde al percentil 50. Se repre-
sentan con la letra P.
En el ejemplo 3.7 se observa como
calcular un percentil.
3.3.2 Cuartiles

Son valores que dividen a las obser-
vaciones en cuatro grupos con frecuen-
cias similares (25% cada una). El primer

Ejemplo 3.7
Un profesor midió la estatura de 21 estudiantes de cuarto año medio de un colegio de la
comuna de Santiago en la clase de educación física. Los resultados fueron los siguientes:

 Paso 1:
Los datos siempre deben ser ordenados de menor a mayor.

 Paso 2:
Calculamos los percentiles con la siguiente fórmula:

P = n * K
100

(fórmula 7)

n = número de datos
K = percentil que se desea conocer

Si queremos conocer el percentil 20 reemplazamos:

P20 = 21 * 20 = 420 = 4,2
100 100

El resultado corresponde al lugar de la lista de datos, ordenadas de menor a mayor,
donde se encuentra el valor del percentil. Si el resultado es una fracción, el valor del
percentil corresponde al lugar inmediatamente superior, en este caso el lugar 5 (1,68
mts.) corresponderá al percentil 20. Esto quiere decir que el 20% de los estudiantes
medidos están bajo 1,68 de estatura y el 80% restante está sobre 1,68.

Fernando Maureira Cid
________________________________________________________________________

cuartil corresponde al percentil 25 (cuantil
0,25), el segundo cuartil corresponde al
percentil 50 (cuantil 0,5) y el tercer cuartil
corresponde al percentil 75 (cuantil 0,75).
Los cuartiles sirven para establecer
cuatro grupos de datos, así podemos
transformar una variable numérica en
categórica. Por ejemplo, los valores igua-
les o bajo el cuartil 0,25 corresponden a
un nivel bajo, valores entre el cuartil 0,25
y 0,50 a un nivel medio bajo, valores entre
el cuartil 0,50 y 0,75 a un nivel medio alto
y valores sobre 0,75 a un nivel alto.
En el ejemplo 3.8 se toman los mis-
mos valores de la estatura de 21 estu-
diantes de 4° medio para calcular los
cuartiles

3.3.3 Quintiles y deciles

Los quintiles son valores que divi-
den a las observaciones en cinco grupos
con frecuencias similares (20%). El pri-
mer quintil corresponde la percentil 20
(quintil 0,2), el segundo quintil corres-

Ejemplo 3.8
Utilizando los mismos valores del ejemplo 3.7

 Paso 1:
Calculamos los cuartiles con la siguiente fórmula:

(fórmula 8)

Qx = K * (n + 1)
4

K = valor del cuartil (1, 2 o 3)
n = número de datos

En caso que el cálculo no corresponda con la posición exacta se utiliza la siguiente
corrección:

(fórmula 9)

Qx = Li + K * (Ls – Li )
4

Ls = límite superior del intervalo
Li = límite inferior del intervalos
.
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

Utilizando los datos de la estatura reemplazamos en la fórmula 8:

Q1 = 1 * (21 + 1) = 22 = 5,5
4 4

Q2 = 2 * (21 + 1) = 44 = 11
4 4

Q3 =3 * (21 + 1) = 66 = 16,5
4 4

Q1 corresponde a los valores en la posición 5 y 6 (1,68 y 1,69); Q2 corresponde al valor en
la posición 11 (1,74) y Q3 corresponde al valor en la posición (1,77 y 1,79). Para el cuartil
1 y 3 es necesario utilizar la fórmula 9 de corrección:

ponde al percentil 40 (quintil 0,4), el ter-
cer quintil corresponde al percentil 60
(quintil 0,6) y el cuarto quintil correspon-
de al percentil 80 (quintil 0,8).
Los deciles son valores que dividen
a las observaciones en diez grupos con
frecuencias similares (10%). El decil 1 co-
rresponde al percentil 10, el decil 2 al
percentil 20, el decil 3 al percentil 30 y así
sucesivamente.
La finalidad de los quintiles y deci-
les es la misma que cuartiles: poder esta-
blecer grupos y categorías más detalla-
das de nuestros datos.

3.4 MEDIDAS CENTRALES, DISPER-
SIÓN Y POSICIÓN EN SPSS

En el paquete estadístico SPSS vamos en el menú a:

 Analizar
 Estadísticos descriptivos
 Frecuencia

Fernando Maureira Cid
________________________________________________________________________

Figura 3.3 Frecuencia en el SPSS 22.0.

El programa mostrará una pantalla como la figura 3.4 con un cuadro a la izquierda que
muestra nuestras variables, las cuales llevaremos al cuadro derecho (variables). Hecho
esto presionamos Estadísticos abriéndose una pantalla como figura 3.5.

Figura 3.4 Pantalla de frecuencia en el SPSS 22.0

En la pantalla de estadísticos marcamos las medidas de tendencia central: media, mediana
y moda; también podemos marcar desviación estándar, varianza, rango, mínimo y máximo;
en la sección valores percentiles podemos marcar cuartiles y en punto de corte para n
grupos iguales indicamos el número de percentiles que deseamos (en este caso 10 para
obtener los deciles).

Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________

Figura 3.5 Pantalla estadísticos en el SPSS 22.0

Una vez marcados los estadísticos que deseamos presionamos Continuar para volver a
la pantalla de frecuencia y presionamos Aceptar.
La hoja de cálculos del programa nos entrega una tabla como la siguiente:

Tabla 3.1 Estadísticos descriptivos de una variable.

.
En la tabla 3.1 observamos la cantidad de datos válidos, la cantidad de datos perdidos,
la media, la mediana, la moda, la desviación estándar, la varianza, el rango de los datos,
Fernando Maureira Cid
________________________________________________________________________

el mínimo y el máximo de los datos, el cuartil 0,25 (percentil 25), el cuartil 0,50 (percentil
50) y el cuartil 0,75 (percentil 75) y los deciles que corresponden a los percentiles 10, 20,
30, etc.

Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________

________________________________________________________________________

4.1 ASIMETRÍA

Nivel de medición:
Intervalar y de razón

La asimetría corresponde a la forma
de la curva de una distribución en rela-
ción a su imagen derecha-izquierda. Una
distribución es simétrica si la mitad iz-
quierda es igual a su mitad derecha (Fig.
4.1) y por lo tanto, la mayor parte de los
datos se encuentran cercanos a la media,
existiendo pocos casos en los extremos.
En este tipo de distribuciones la media, la
mediana y la moda poseen igual valor.

Figura 4.1 Distribución simétrica.

Una distribución asimétrica es aque-
lla donde los datos tienden a agruparse
hacia alguno de los lados:

 Distribución asimétrica positiva: es
aquella donde los datos se agrupan
hacia la izquierda, dejando una cola
hacia la derecha, por lo tanto, la ma-
yoría de los datos se encuentran
cerca de las puntuaciones más bajas.
En estas distribuciones la media es
mayor que la mediana (Fig. 4.2).

 Distribución asimétrica negativa: es
aquella donde los datos se agru-
pan hacia la derecha, dejando una
cola hacia la izquierda, por lo tanto,
la mayoría de los datos se encuentran
cerca de las puntuaciones más altas.
En estas distribuciones la media es
menor que la mediana (Fig. 4.2).

Para calcular la asimetría de una
distribución existen varios análisis esta-
dísticos, nosotros utilizaremos el coefi-
ciente de asimetría de Fisher (g1), que se
basa en la relación entre las distancias a
la media y la desviación estándar. En el
ejemplo 4.1 se estudian los pasos para
calcular la asimetría de una distribución.
El valor entregado por el coeficiente
de asimetría se interpreta de la siguiente
manera:

 Valores de asimetría de cero indi-
can una distribución simétrica.
 Valores de asimetría sobre cero in-
dican una asimetría positiva.
 Valores de asimetría bajo cero in-
dican una asimetría negativa.
Fernando Maureira Cid
________________________________________________________________________

Figura 4.2 Distribuciones asimétricas. La figura izquierda corresponde a una distribución
positiva y la figura derecha a una distribución negativa.

Ejemplo 4.1
Un profesor evaluó la capacidad de planificación de los estudiantes de pedagogía en
educación física de una universidad de Santiago. Los resultados de las puntuaciones
fueron los siguientes:

 Paso 1:
Calculamos la asimetría con la siguiente fórmula:

(fórmula 10)

g1 = ∑(Xi – 3
n * S3

∑(Xi – 3 = suma de cada observación menos la media de todas las observaciones elevada al
cubo
n = número de datos
S3 = desviación estándar de los datos al cubo

 Paso 2:
Calculamos la suma de cubos para los datos de la planificación:

Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________

 Paso 3:
Para obtener el coeficiente de asimetría de Fisher reemplazamos en la fórmula 10:

g1 = 0,52 = 0,52 = 0,52 = 0,014
(9 * 1,593) 9 * 4,02 36,18

El coeficiente de asimetría de Fisher es de 0,014 (distribución asimétrica positiva).

4.2 CURTOSIS

La curtosis corresponde al grado de
apuntamiento o aplastamiento de una
distribución. Existen tres tipos de curto-
sis:

 Platicúrtica: es aquella distribución
que presenta una forma achatada, esto
significa que existen muchos casos
lejos de la media y pocos cerca de ella
(Fig. 4.3).

 Mesocúrtica: es aquella distribución
que presenta una elevación media, lo
cual muestra un grado mediano de
concentración de los datos alrededor
del promedio (Fig. 4.3).

 Leptocúrtica: es aquella distribución
que presenta una elevación alta, esto
significa que existen pocos casos lejos
de la media y muchos cerca de ella
(Fig. 4.3).

Para calcular la curtosis se puede
utilizar el coeficiente de apuntamiento
de Fisher (g2). En el ejemplo 4.2 se realiza
un análisis paso a paso del cálculo de la
curtosis de una distribución.
El valor entregado por el coeficiente
de curtosis se interpreta de la siguiente
manera:

 Valores de la curtosis de cero indi-
can una distribución mesocúrtica.
 Valores sobre cero indican una dis-
tribución leptocúrtica.
 Valores bajo cero indican una dis-
tribución platicúrtica.
Fernando Maureira Cid
________________________________________________________________________

Figura 4.3 Tipos de curtosis. Una distribución platicúrtica (imagen superior izquierda),
una distribución mesocúrtica (imagen superior derecha) y una distribución leptocúrtica
(imagen inferior).

Ejemplo 4.2
Para el cálculo de la curtosis utilizaremos los datos de la planificación de los estudiantes
de educación física:
.

Estadistica_para_educacion_fisica

SIN SIGLA

Educación Física

Continuar navegando

Otros materiales