Logo Studenta

Resumen bioestadística - Murialdo Brenda

¡Este material tiene más páginas!

Vista previa del material en texto

Preghenella, Narella M. 
BIOESTADÍSTICA 
 
 
 
Estadística matemática: Requiere conocimientos de los principios matemáticos, para realizar razonamientos y 
deducciones propios de las ciencias exactas. Bases matemáticas para el desarrollo de métodos aplicados. 
Estadística aplicada: Trata de cómo y cuándo utilizar cada procedimiento y cómo interpretar los resultados que se 
obtienen. Estudia la estadística matemática aplicada a otras disciplinas como la economía, sociología, publicidad o 
medicina. 
Bioestadística: Rama de la estadística aplicada que estudia la utilización de métodos estadísticos en problemas 
médicos y biológicos. 
▪ Descriptiva: Sintetiza y resume información contenida en unos datos. Sus misiones son recoger, clasificar, 
representar y resumir datos. Para esto utiliza 2 procedimientos: cálculo de índices estadísticos (número que 
resume de modo sencillo la información contenida en datos reales) o el uso de la representación gráfica. 
▪ Analítica o inferencial: Va más allá, porque pretende demostrar asociaciones o relaciones entre las 
características observadas. Su misión es extraer conclusiones científicas a partir de datos que servirán para 
contrastar la hipótesis de una investigación frente a los datos obtenidos. Utiliza 2 tipos de procedimientos: el 
contraste de hipótesis que confronta los resultados obtenidos empíricamente mediante la recolección de 
datos respecto a una hipótesis de la que se partía y toma decisión de si los datos apoyan o no la hipótesis. Un 
intervalo de confianza que es un rango de valores creíbles para un determinado parámetro y se mide en 
términos probabilísticos. 
 
 
 
 
 
 
 
 
 
 
 
Método científico: 
1. Observación e identificación del problema. 
2. Formulación de hipótesis, 
3. Planificación de la investigación (que, quienes, donde, cuando, como). 
4. Recolección de datos. 
Estadística → Ciencia que utiliza conjuntos de datos 
numéricos para obtener, a partir de ellos, inferencias 
basadas en el cálculo de probabilidades. 
BIOESTADÍSTICA
DESCRIPTIVA
INDICE 
ESTADÍSTICO
REPRESENTACIÓN 
GRÁFICA
ANALÍTICA O 
INFERENCIAL
CONTRASTE DE 
HIPÓTESIS
INTERVALO DE 
CONFIANZA
Preghenella, Narella M. 
5. Organización de los datos (con pruebas estadísticas). 
6. Análisis e interpretación de los datos. 
7. Conclusión. 
Etapas del método: 
 
POBLACIÓN: Conjunto de todos los individuos o elementos que cumplen ciertas características. 
MUESTRAS: Una parte de la población que fue extraída de ella para su estudio. 
La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los 
rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea 
representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir 
ejemplificar las características de ésta. 
Suele asumirse que la población es inaccesible desde un punto de vista práctico, siendo necesario conformarse con 
estudiar una muestra. 
MUESTREO: El muestreo es una herramienta de la investigación científica, cuya función básica es determinar que parte 
de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. Son los métodos o 
herramientas que se utilizan para obtener la/las muestras de la población. 
Los tipos de muestreo se clasifican según sean probabilísticos o no probabilísticos. 
Muestreo probabilístico: Al azar, sin sesgos. Son aquellos que se basan en el principio de equiprobabilidad. Es decir, 
aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra 
y, consiguientemente, todas las posibles muestras de tamaño η tienen la misma probabilidad de ser seleccionadas. La 
selección de cada unidad es independiente de las demás. Sólo estos métodos de muestreo probabilísticos nos 
aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Se puede calcular el 
error muestral. Dentro de estos, encontramos los siguientes tipos: 
1. Muestreo aleatorio simple: se asigna un número a cada individuo de la población y a través de algún medio 
mecánico (bolas dentro de una bolsa, por ejemplo) se eligen tantos sujetos como sea necesario para completar 
Preghenella, Narella M. 
el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad 
práctica cuando la población que estamos manejando es muy grande. 
 
 
 
 
 
 
 
2. Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de 
la población, pero en lugar de extraer η números aleatorios sólo se extrae uno. Se parte de ese número 
aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los 
lugares i, i+k, i+2k, i+3k,...,i+(n-1) k, siendo k el resultado de dividir el tamaño de la población entre el tamaño 
de la muestra. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo 
este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los 
miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no 
se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en 
los que los 5 primeros son varones y las 5 últimas mujeres, si empleamos un muestreo aleatorio sistemático 
con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de 
los dos sexos. 
 
 
 
 
 
 
3. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que 
simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en 
considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna 
característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el 
estado civil, etc.). Lo que se pretende con este tipo de 
muestreo es asegurarse de que todos los estratos de interés 
estarán representados adecuadamente en la muestra. Cada 
estrato funciona independientemente, pudiendo aplicarse 
dentro de ellos el muestreo aleatorio simple o el 
estratificado para elegir los elementos concretos que 
formarán parte de la muestra. En ocasiones las dificultades 
que plantean son demasiado grandes, pues exige un 
conocimiento detallado de la población. (Tamaño 
geográfico, sexos, edades...). 
 
 
 
 
Preghenella, Narella M. 
 
4. Muestreo aleatorio por conglomerados o áreas: Los métodos presentados hasta ahora están pensados para 
seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los 
elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos 
de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los 
departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras 
ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando 
los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por 
conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario para 
alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los 
conglomerados elegidos. 
 
 
 
 
 
 
 
 
 
Muestreos no probabilísticos: No azar. A veces, para estudios exploratorios, el muestreo probabilístico resulta 
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar 
generalizaciones (estimaciones inferenciales sobre la población), puesno se tiene certeza de que la muestra extraída 
sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. No se 
puede calcular el error muestral y hay un alto riesgo de invalidez producidos por los sesgos que se introducen. En 
general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la 
muestra sea representativa. Entre los métodos de muestreo no probabilísticos más utilizados en investigación 
encontramos: 
1. Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base 
de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o 
"adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio 
estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas 
"cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 
20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen 
los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las 
encuestas de opinión. 
 
 
 
 
 
 
Preghenella, Narella M. 
 
2. Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de 
obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. 
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. 
El caso más frecuente de este procedimiento es utilizar como muestra los individuos a los que se tiene fácil 
acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). 
 
 
 
 
 
 
 
3. Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir 
una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones 
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc. 
 
 
 
 
 
 
 
 
 
Muestreo Probabilístico Muestreo No Probabilístico 
Al azar. No es al azar. 
Sin sesgos. Con sesgos. 
Todos los elementos tienen la misma 
probabilidad de ser elegidos. 
No todos los elementos tienen la misma 
probabilidad de ser elegidos. 
Los elementos se eligen independientemente 
unos de otros. 
Los elementos no se eligen de forma 
independiente unos de otros. 
Se puede calcular el error muestral. No se puede calcular el error muestral. 
Más costos y difícil de realizar. Menos costoso y más fácil de realizar. 
 
Se pretende extraer conclusiones a partir de una muestra que sean aplicables o generalizables a la población de la cual 
surgió la muestra. 
Preghenella, Narella M. 
A la interpretación del tratamiento estadístico de unos datos que acaba generalizándolos a toda la población de le 
llama INFERENCIA. 
 
 
 
 
 
 
 
 
 
 
Los errores más comunes que se pueden cometer son: 
1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error 
de muestreo. 
2.- Hacer conclusiones hacia una Población mucho más grande de la que originalmente se tomó la muestra. Error de 
Inferencia. 
UNIDAD DE ANALISIS: Elemento muestral del cual se obtiene la información. 
DATO: Valor que toma la variable para cada elemento muestral y que se obtiene mediante algún método de captación 
o instrumento. 
Muestra es una cantidad de individuos o elementos que se toman de una población. La unidad de análisis es un 
elemento o un individuo de esa muestra. 
*individuos=unidad de análisis 
PARÁMETROS: indicadores estadísticos que definen a las poblaciones. 
ESTADÍSTICOS: indicadores estadísticos que definen a las muestras. 
VARIABLE: Característica observable y que es susceptible a ser medida (se pueden medir, contar o categorizar). Por 
ejemplo: edad, peso, sexo, talla, glucemia. Se aplica a muestras de hogares, de personas, de objetos, de material 
biológico, de hospitales, etcétera. 
 
 
 
 
 
 
 
 
 
 
 
 INFERENCIA MUESTREO 
 
 
 
 
POBLACIÓN 
MUESTRA 
Preghenella, Narella M. 
Características: exactitud, sensibilidad, confiabilidad, validez. 
Se debe fijar una escala de medida que se aplicara a cada variable, por ejemplo, para la variable presión arterial, se 
debe tener en cuenta cual es la PA normal. 
Las variables describen características de un sujeto y ésta varía de un sujeto a otro o incluso en el mismo sujeto en 
diferentes momentos. Por ejemplo: en un sujeto, la PA al correr no es la misma que cuando el mismo sujeto está 
sentado. 
VARIBLE Edad, sexo 
DATO 21 años, Femenino 
 
Clasificación de variables: 
▪ Categóricas: Representan cualidad o atributo. Pueden ser nominales, aquellas cuyo valor simplemente pueda 
ser un sí (1) o no (0) (sexo, carrera, obra social) u ordinales, aquellas cuyos posibles valores se encuentran 
jerarquizados y ordenados (estadio del cáncer, nivel educativo, grado de desnutrición). A estas variables se les 
puede asignar un código numérico, pero este número, es en realidad, una traducción de los nombres. Por 
ejemplo, a la variable “sexo” la puedo expresar como 1 y 2. Donde 1 se refiere a masculino y 2 a femenino. 
A su vez, las variables categóricas pueden ser dicotómicas cuando solo pueden tomar dos valores posibles (si 
o no, femenino o masculino, etc.) o politómicas cuando toman 3 o más valores. 
▪ Mensurables: Pueden medirse, cuantificarse o expresarse en números. Es decir, los números utilizados para 
expresar estas variables equivalen a verdaderos datos numéricos. Pueden ser discretas, significa que solo 
toman números enteros (n° de hijos, glucemia, días de internación) por ejemplo, la cantidad de hijos siempre 
será un numero entero, o continuas que admiten cualquier valor dentro de un intervalo (T° corporal, IMC, 
perímetro cefálico) por ejemplo, la temperatura corporal puede ser 36.7, 36.9, etc. 
Es importante: 
1. La precisión que necesito: exactitud. 
2. El instrumento de medición a utilizar. 
3. La calibración de los instrumentos. 
Precisión hace referencia a la cercanía que varias medidas tengan entre sí. Depende del correcto uso del instrumento 
de medida, mientras que exactitud es lo que se acerca esta medición al valor real y depende del tipo de instrumento 
de medida. 
En el ejemplo de la práctica de tiro, los disparos que hace el tirador representan las mediciones, los agujeros en el 
tablero (puntos azules) representan los resultados de esas mediciones y el centro del tablero (punto rojo) representa 
el valor real. 
 
 
 
 
 
 
 
 
Preghenella, Narella M. 
En el primer caso no hay precisión porque los puntos azules están alejados entre sí y no hay exactitud porque están 
alejados del centro. 
 
 
 
Categorización de una variable: Es posible transformar una variable mensurable en una categórica ordinal, de modo 
que los valores individuales se agrupan en categorías que engloban a un rango. Por ejemplo: 
Glucemia 🡪 hipoglucemia/ normal/ hiperglucemia. 
Presión arterial 🡪 hipotensión/ normal/ hipertensión. 
Semanas de gestación 🡪 prematuro/ a término/ post-término. 
1- En InfoStat me coloco sobre la columna que contiene la variable Edad cuyo código es “bhch04”. 
2- Puedo seleccionar toda la columna o no. Apretar botón derecho sobre la columna → Categorizar → Asignar 
categorías por intervalos. 
3- En el cuadro, ir a la solapa “personalizado”. En “clases” agregar hasta 4. 
4- En los cuadros poner los límites de edad máximos que queremos (teniendo en cuenta que el mínimo es 18 y 
el máximo 104). 
 
LS1 24 
LS2 44 
LS3 64 
LS4 104 
 
5- Tocar “aplicar” y colocar nombres en C1, C2, C3 y C4. Por ejemplo: 
C1: Jóvenes. C2: Adultos_1.C3: Adultos_2. C4: Adultos mayores. (primero borro C1 y después coloco el 
nombre que quiero). 
6- Seleccionar CATbhch04 (siempre selecciono el nombre). 
7- Aceptar. 
 
 
 
 
 
Preghenella, Narella M. 
Ejemplo de unidad de análisis y variables: 
 
BIOESTADISTICA DESCRIPTIVA: Variables mensurables. 
Describe un conjunto de η datos, entendiendo por descripción a la clasificación, representación gráfica y resumen de 
los mismos. Estos datos se sacan de las muestras. 
DISTRIBUCION: el uso de variables aleatorias sirve para describir eventos (acontecimientos, casos, situaciones) y su 
distribución sirve para asignar probabilidades a dichos eventos. 
La distribución de una variable describe en términos matemáticos, de qué manera se presenta un determinado 
fenómeno. Por ejemplo, si queremos estudiar cómo se distribuye la altura de los individuos de una población (altura 
media, máxima, mínima). 
La distribución más frecuente en variables mensurables es la Normal o Gaussiana (simétrica). 
 
 
 
 
 
 
 
 
 
En el eje de las X están las alturas tomadas de la muestra, en el eje de las Y, la cantidad de personas que tienen esas 
alturas. De esta forma puedo saber que 170 cm es la altura media de la población o que 195 cm es la máxima pero 
muy pocas personas tienen esa altura. 
En el proceso de la estadística descriptiva hay un paso que consiste en calcular una serie de n° cuyo propósito es 
sintetizar la información que aportan los η datos de la muestra. Para calcular este n° se utilizan medidas o estadísticos 
centrales y de dispersión (ambas describen posición y forma de la distribución, es decir, el grado de simetría). 
 
Preghenella, Narella M. 
 
 
 
 
 
 
 
 
 
 
 
Una medida descriptiva calculada a partir de los datos de una muestra se conoce como estadística. 
Una medida descriptiva calculada a partir de los datos de una población se conoce como parámetro. 
Medidas o estadísticos centrales: Representan un centro en torno al cual se encuentra ubicado el conjunto de datos. 
→ MEDIA: Valor central más representativo de la distribución. Se obtiene sumando los η datos de la muestra y 
dividiéndolos por el tamaño de ésta. EJ: (18+18+18+19+20+20+21+22) / 8 = 19.5 
→ MEDIANA: Es el valor que queda en el medio una vez ordenados los datos de menor a mayor. 
EJ: tomando las edades de 13 alumnos. 
18, 18, 18, 19, 19, 19, 20, 20, 21, 22, 25, 29, 30. 
El dato n°7→ 20 es la mediana porque deja 6 datos antes y 6 después de la mediana. 
→ MODO O MODA: Valor de la variable que tiene mayor frecuencia en la distribución y que representa un 
máximo de individuos. 
EJ: 18, 19, 19, 20, 21, 22, 22, 22, 23, 25. El modo es 22 porque es la más frecuente y en más cantidad. 
Medidas o estadísticos de dispersión: Miden el grado de dispersión (separación) de los datos de las variables. 
→ Rango: Expresa la diferencia entre el valor mayor y el menor. 
EJ: 18, 18, 18, 19, 19, 19, 20, 20, 21, 22, 25, 29, 30. 
30 – 18= 12 años de diferencia entre el alumno mayor y el menor. 
→ Varianza: Da una medida de dispersión relativa al tamaño muestral de los distintos datos. Representa la 
variabilidad de una serie de datos respecto a su media. 
La suma de la diferencia entre cada dato menos la media. 
 
Ʃ: Suma. 
Y: Número de datos. 
µ: Valor de la media. 
σ2: Varianza poblacional. 
N: Tamaño de la población. 
S2: Varianza muestral 
n: Tamaño de la muestra. 
 
→ Desviación Standard: Grado de dispersión de los datos en torno a la media. Es decir, de ese valor de la media, 
cuanto se aleja (a valores inferiores o superiores) de manera uniforme. 
MUESTRA 
POBLACIÓN 
DESCRIPTIVA PROBABILIDAD 
DESCRIPCIÓN 
Preghenella, Narella M. 
 
 
 
 
 
 
 
En la línea recta -3, -2, -1, 0, 1, 2, 3, el cero corresponde a la media, el espacio entre 0 y 1 o -1 es el primer desvío 
y es el que posee más frecuencia (más cantidad de personas presentan esos datos) y me doy cuenta porque la 
curva llega más arriba. 
Esta establecido que: 
1σ o primera desviación: incluye al 68% de la población. 
2σ o segunda desviación: incluye al 95% de la población. 
3σ o tercera desviación: incluye al 99% de la población. 
 
 
 
 
 
 
 
Las fórmulas de la desviación estándar son las mismas que para la varianza, solo que al cuadrado lo pasa para el 
otro lado para que quede como raíz. La raíz de la varianza es la desviación standard. 
 
 
Preghenella, Narella M. 
El valor de la desviación estándar nos dice cuanto es lo que se alejan los valores de la media. Mientras más grande sea 
el valor, mayor será la dispersión y más aplanada estará la curva. 
La dispersión de un conjunto de observaciones se refiere a la variedad que exhiben los valores de las observaciones. 
Si todos los valores son iguales, no hay dispersión; si no todos son iguales, hay dispersión en los datos. La magnitud de 
la dispersión puede ser pequeña, cuando los valores, aunque distintos, están próximos entre sí. Si los valores están 
ampliamente desparramados, la dispersión es mayor. (La dispersión es tomar una variable y observar la variedad de 
datos que exhibe esa variable). 
VER “GUÍA DE INFOSTAT” PARA SABER COMO CALCULAR LOS ESTADISTICOS CENTRALES Y DE DISPERSION EN EL 
INFOSTAT. 
 
BIOESTADÍSTICA DESCRIPTIVA: Variables categóricas. 
La distribución más frecuente en variables categóricas es la distribución asimétrica como la Poisson, Binomial y Chi-
cuadrado. 
 
 
 
 
 
 
 
 
 
Las medidas de resumen en el caso de variables categóricas son: 
→ Frecuencia absoluta: Número absoluto de unidades de estudio que pertenecen a las diferentes categorías de 
una variable. 
EJ: En un total de 15 personas, 6 son hombres y 9 son mujeres. 
→ Frecuencia relativa: Proporcionan un porcentaje de la unidad de estudio que pertenecen a las diferentes 
categorías de una variable. 
EJ: En un total de 15 personas, un 40% son hombres y un 60% son mujeres. 
 
 
Preghenella, Narella M. 
Para la presentación de los datos se utiliza una tabla de contingencia, que está constituida por filas y columnas. 
 Cáncer de pulmón 
SI NO 
Tabaquismo SI 264 3736 
NO 42 5958 
 
Cáncer de pulmón y tabaquismo son dos variables categóricas. Por conveniencia en las columnas coloco la 
enfermedad o afección y en las filas coloco el factor que quiero estudiar. 
En el InfoStat no puedo hacer una tabla como la anterior, sino que tengo que hacerla a lo largo, por eso la forma de 
armarla es la siguiente: 
Caso Fila Columna Frecuencia 
1 Fuma Con cáncer 264 
2 Fuma Sin cáncer 3736 
3 No fuma Con cáncer 42 
4 No fuma Sin cáncer 5958 
 
VER “GUIA DE INFOSTAT” PARA SABER COMO HACER LA TABLA Y COMO CALCULAR LAS FRECUENCIAS EN EL INFOSTAT. 
 
ESTADÍSTICA INFERENCIAL 
La inferencia se define como el conjunto de métodos estadísticos que permiten deducir cómo se distribuye la 
población e inferir las relaciones entre variables a partir de la información que proporciona la muestra recogida. Por 
tanto, los objetivos fundamentales de la inferencia estadística son la estimación y el contraste de hipótesis. 
La estimación estadística es el conjunto de técnicas que nos permitirán dar un valor aproximado de un parámetro 
(característica) poblacional a partir de la información obtenida de la muestra. Para realizar estimaciones utilizaremos 
ciertas fórmulas que dependen de los valores obtenidos en la muestra, se denominan estimadores. Un buen estimador 
debe ser insesgado, lo que significa que la estimación muestral debe coincidir con la poblacional; eficiente, es decir, 
de mínima varianza; y suficiente, debe utilizar toda la información contenida en la muestra. 
 
Hay dos tipos de estimación: 
● Estimación puntual: Es un solo valor numérico utilizado para estimar el parámetro correspondiente de la 
población. Por ejemplo, para estimar la edad media de la población utilizaremos la edad media de la muestra. 
● Estimación por intervalos: Consta de dos valores numéricos que definen un intervaloque, con un grado 
especificado de confianza, se considera incluye al parámetro que se está estimando. 
Poblaciones muestreadas y poblaciones blanco: El investigador en el área de salud, quien utiliza los procedimientos 
de inferencia estadística, debe estar al tanto de las diferencias entre dos tipos de población: la población muestreada 
y la población objetivo. La población muestreada es la población de la cual en realidad se extrae una muestra. La 
población objetivo es la población de la cual se desea hacer una inferencia. Estas dos poblaciones pueden ser o no la 
misma. Los procedimientos de inferencia estadística permiten hacer inferencias acerca de las poblaciones 
muestreadas (siempre que se hayan utilizado métodos de muestreo apropiados). Solo cuando la población objetivo y 
la población muestreada son la misma, pueden utilizarse procedimientos de inferencia estadística para llegar a 
conclusiones a cerca de la población objetivo. En caso de que ambas poblaciones sean distintas el investigador puede 
llegar a conclusiones acerca de la población objetivo solo en base a consideraciones no estadísticas. 
Preghenella, Narella M. 
Supóngase, por ejemplo, que un investigador desea estimar la efectividad de un método para tratar la artritis 
reumatoide. La población objetivo consta de todos los pacientes que sufren esta enfermedad. No es practico extraer 
una muestra de esta población. Sin embargo, el investigador puede extraer una muestra de todos los pacientes con 
artritis reumatoide de alguna clínica especifica. Estos pacientes constituyen la población muestreada y, si se utilizan 
métodos de muestreo apropiado, pueden hacerse inferencias sobre esta población muestreada en base a la 
información de la muestra. Si el investigador desea hacer inferencias acerca de todos los pacientes con artritis 
reumatoide, debe confiar en los medios no estadísticos para hacerlo. Quizá el investigador sepa que la población 
muestreada es similar, respecto a todas las características importantes, a la población objetivo. Es decir, es posible 
que el investigador sepa que la edad, sexo, severidad de la enfermedad, duración de desarrollo de esta, etc., son 
similares. Y con base en este conocimiento, el investigador puede ya extrapolar sus descubrimientos a la población 
objetivo. 
En muchos casos, la población muestreada y la población objetivo son idénticas y, cuando esto ocurre, las inferencias 
en torno a la población objetivo son directas. Sin embargo, el investigador debe estar consciente de que este no 
siempre es el caso, a fin de que no caiga en el error de hacer inferencias erróneas acerca de una población que difiere 
de la que ha sido muestreada. 
 
Significancia estadística: 
Como se mencionó anteriormente, una de las aplicaciones de la estadística es hacer inferencias a poblaciones, a partir 
de muestras. En la realización de este proceso inferencial, siempre existe el riesgo de error o imprecisión ya sea por el 
azar o la variabilidad biológica del fenómeno a estudiar. El papel del azar debe ser siempre contemplado, evaluado y 
medido, realizando: 
● test de hipótesis o, 
● construyendo intervalos de confianza. 
para conocer la precisión de nuestra estimación dentro de una seguridad previamente definida. 
Nos centraremos a continuación con el test de hipótesis. 
Los test de hipótesis son test de significación estadística que cuantifican hasta qué punto la variabilidad de la muestra 
puede ser responsable de los resultados de un estudio en particular. Entonces tenemos: 
La H0 (hipótesis nula) representa la afirmación de que no hay asociación entre las dos variables estudiadas y, 
la H1 (hipótesis alternativa) afirma que hay algún grado de relación o asociación entre las dos variables. 
Es decir, la H0 me dice que las dos variables a estudiar son iguales entre sí y por lo tanto no se pueden asociar y es muy 
probable que cualquier diferencia entre las variables se deba al azar, mientras que la H1 me dice que las variables son 
diferentes. 
Nuevamente la estadística nos muestra su utilidad ya que nos ayuda a tomar la decisión de que hipótesis debemos 
elegir. Dicha decisión puede ser afirmada con una seguridad que nosotros previamente decidimos. 
Las hipótesis deben ser establecidas antes de recoger los datos. 
PROBABILIDAD: Medida de certidumbre asociada a un suceso o evento futuro y suele expresarse como un numero 
entre 0 y 1. Es posible determinar cuál es la probabilidad que tiene un evento de ocurrir bajo determinadas condiciones 
y cuál es la variación que puede presentar ese mismo valor debido al azar. 
Ejemplo: Si tiro una moneda, que probabilidad hay de que caiga “cara”: 
½=0.5. 1 es la opción que quiero que caiga, en este caso, cara. 2 es el total de opciones que hay, cara y numero. 0.5 es 
la probabilidad de que caiga una o la otra. 
Preghenella, Narella M. 
El mecanismo de los diferentes test se realiza, aunque con matices, siempre de la siguiente forma: En primer lugar, 
se obtiene un valor de probabilidad al comparar los grupos en estudio (A y B). Si este valor de probabilidad (valor 
de "p"), es menor que un error (valor de alfa) previamente establecido, concluimos que la diferencia es significativa 
entre A y B. Por tanto, aceptamos la hipótesis alternativa y rechazamos la hipótesis nula. 
De lo que trata es de probar o no que la hipótesis nula es cierta. 
El proceso de aceptación o rechazo de la hipótesis lleva implícito un riesgo que se cuantifica con el valor de la "p", que 
es la probabilidad de aceptar la hipótesis alternativa como cierta, cuando la cierta podría ser la hipótesis nula. 
El valor de "p" que indica que la asociación es estadísticamente significativa ha sido arbitrariamente seleccionado y 
por consenso se considera en 0.05. Una seguridad del 95% lleva implícito una p < de 0.05 y una seguridad del 99% 
lleva implícita una p < 0.01. Cuando rechazamos la H0 (hipótesis nula) y aceptamos la H1 (hipótesis alternativa) como 
probablemente cierta afirmando que hay una asociación, o que hay diferencia, estamos diciendo en otras palabras 
que es muy poco probable que el azar fuese responsable de dicha asociación. Del mismo modo si la p>0.05 decimos 
que el azar no puede ser excluido como explicación de dicho hallazgo y no rechazamos la H0 (hipótesis nula) que afirma 
que ambas variables no están asociadas o correlacionadas. Es decir, si aceptamos la H0 significa que no hay diferencia 
entre las dos variables, y que cualquier diferencia que haya, se debe al azar. 
En resumen, el valor establecido para la probabilidad es p<0.05. Si la p da por debajo de 0.05 entonces rechazamos la 
hipótesis nula y decimos que hay diferencia entre las variables. Si la p da más que 0.05 o da exacto 0.05, rechazamos 
la hipótesis alternativa y decimos que no hay diferencia entre las variables. P = 0.05 = 5% 
Hipótesis nula Hipótesis alternativa 
Representa lo que el investigador quiere 
descartar. 
Representa el interés del investigador. 
Los grupos son iguales. Hay diferencia entre los grupos. 
El tratamiento no tiene efecto. El tratamiento hace efecto. 
No descartar una H0 no implica que sea 
verdadera. 
Se asume como cierta cuando la H0 es 
descartada. 
 
Error de tipo I (α) 
Al realizar el test estadístico, podríamos correr el riesgo de equivocarnos al rechazar la hipótesis nula. La probabilidad 
de rechazar la hipótesis nula cuando en realidad es verdadera (error de tipo I) se le denomina nivel de significación y 
es la "p". Esta probabilidad de rechazar la hipótesis nula cuando es verdadera se le conoce también como error alfa. La 
"p" no es por tanto un indicador de fuerza de la asociación ni de su importancia. 
La significación estadística es por tanto una condición resultante del rechazo de una hipótesis nula mediante la 
aplicación de una prueba estadística de significación. El nivel de significación es el riesgo o la probabilidad que 
voluntariamente asume el investigador de equivocarseal rechazar la hipótesis nula, cuando en realidad es cierta. Este 
riesgo se establece normalmente en 0.05 o 0.01. 
El proceso de poner a prueba una hipótesis involucra una toma de decisiones para rechazar o no la hipótesis 
nula. Aunque los valores de la "p" son los de una variable continua, se utiliza para forzar una decisión cualitativa, 
tomando partido por una u otra hipótesis. Si p < 0.05 se considera significativo, en cuyo caso se rechaza la hipótesis 
nula y no significativo si p> 0.05 en cuyo caso no se rechaza. Una "p" pequeña significa que la probabilidad de que los 
resultados obtenidos se deban al azar es pequeña. 
Error de tipo II (β) 
El riesgo alfa a ("p") indica la probabilidad de cometer un error de tipo I (falso positivo). El error de tipo I, es por lo 
tanto rechazar la H0 cuando en realidad es verdadera. Se podría considerar que para evitar este tipo de error 
deberíamos de elegir un nivel de confianza más elevado, sin embargo, al aumentar el nivel de confianza aumenta la 
probabilidad de cometer el error de tipo II. El error de tipo II consiste en aceptar la hipótesis nula cuando es falsa y 
esto se conoce como el error de tipo II o Beta (β) (falso negativo). 
Preghenella, Narella M. 
 Si H0 es verdadera Si H0 es falsa 
Si H0 es rechazada Error tipo I (alfa) No hay error 
Si H0 no es rechazada No hay error Error tipo II (beta) 
 
En la práctica no es posible saber si estamos cometiendo un error tipo I o un error tipo II, pero existen ciertas 
recomendaciones para disminuir dichos errores. Por ejemplo, para disminuir el error tipo I deberíamos depurar la base 
de datos para evitar posibles outliers o valores extremos que puedan producir resultados significativos, utilizar un nivel 
de significación pequeño y disponer de una teoría que guíe las pruebas. Para reducir el error tipo II es aconsejable 
incrementar el tamaño muestral, estimar la potencia estadística o incrementar el tamaño del efecto a detectar. 
Al tener los datos de la muestra se siguen los siguientes pasos: 
1. Someter los datos a análisis estadístico. 
2. La función del test estadístico es generar un valor, el cual es convertido vía tabla o algoritmo a un valor de 
probabilidad. 
3. Interpretación del test estadístico y su probabilidad. 
 
ESTADÍSTICA INFERENCIAL: Pruebas 
 
TEST T O TEST DE STUDENT: Se utiliza cuando se desea comparar dos medias de dos variables: una variable categórica 
y otra mensurable cuando tengo uno o dos grupos. 
Ejemplo 1: La interrogante en el experimento es si la sangre de las personas tratadas con la droga B presenta el mismo 
tiempo medio de coagulación que las personas tratadas con la droga G. ¿hipótesis? 
Ho: Media Droga B = Media Droga G 
Ha: Media Droga B ≠ Media Droga G 
Se observa el tiempo de coagulación sanguínea (en minutos), de un grupo de 13 personas, probando las drogas B y G. 
(Las drogas son las variables independientes, por lo que irán en las columnas, mientras que el tiempo de coagulación 
de cada persona es un variable dependiente, por lo que ira en las filas). 
● Tiempo de coagulación: Variable mensurable continua. 
● Drogas: variable categórica nominal con dos grupos (B y G). 
Droga B Droga G 
8.8 9.9 
8.4 9.0 
7.9 11.1 
 
Se sacan las medias y se aplica el test T en InfoStat (Ver guía de InfoStat en campus) y vemos que la p=0,02. 
Conclusión: Como la p<0.05 rechazamos la H0 y aceptamos la H1. Es decir que el tiempo de coagulación de la sangre es 
diferente entre los grupos de personas tratadas con diferentes tipos de drogas. 
Hipótesis propuestas 
Preghenella, Narella M. 
Ejemplo 2: se observa la edad en un grupo de pacientes de pediatría donde las niñas tienen una edad media de 4 años 
y los niños tienen una edad media de 8 años. Las dos variables en este caso son, la edad y el sexo. La edad es una 
variable mensurable y el sexo es una variable categórica, por lo tanto, aplicamos test de Student el cual permite 
determinar si las medias de edad entre niños y niñas son diferentes (se compara las medias de edad según el sexo); se 
parte de la hipótesis de que no existe diferencia entre las edades de niños y niñas (H0). Este test se utiliza cuando 
queremos compara dos medias y estima el grado de certeza de afirmar la hipótesis nula, es decir que no hay diferencia 
entre las medias. La certeza que se espera debe ser del 95% o 0,95 en términos decimales, con una probabilidad del 
0,05 de que no sea cierto. 
Si la p<0.05 entonces rechazamos la hipótesis nula y decimos que si hay diferencia entre las medias de edad de niños 
y niñas. 
Requisitos para hacer el test T: 
● Los datos son obtenidos al azar. 
● Los datos son independientes unos de otros. 
● La variable dependiente debe ser continua. 
● Las variables deber tener distribución normal. 
● Las varianzas deben ser homogéneas. 
 
→Test T para muestras apareadas: Es utilizado cuando un mismo objeto es medido bajo diferentes tratamientos (por 
ejemplo, cambio en el peso antes y después del tratamiento con un fármaco) o cuando existe una correlación entre 
las observaciones de las dos muestras. 
Ejemplo: Se está probando la efectividad de una droga que permite bajar de peso. El medicamento se les administró 
a 9 voluntarios a los que se les midió la cantidad de grasa corporal (kg) antes y después de dos semanas de iniciado el 
tratamiento. En este caso el antes y después del tratamiento va en las comunas y los kg en las filas. 
 
Individuos Antes Después Diferencia 
1 22.50 19.20 -3.3 
2 24.10 20.20 -3.9 
3 22.60 20.60 -2.0 
 
 
 
 
 
 
 
 
 
 
 
 
Preghenella, Narella M. 
Como la p=0.0001 decimos que se rechaza la H0 y por lo tanto hay diferencia entre las variables, lo que significa que el 
tratamiento funciona. 
Tener en cuenta: 
● El test T para muestras apareadas no asume normalidad de los datos. 
● Tampoco asume homogeneidad de las varianzas. 
● Pero si asume que las diferencias de los pares si se distribuyen en forma normal. 
ANALISIS DE VARIANZA (ANOVA) 
Es un test estadístico para cuando tengo 2 o más muestras (grupos) independientes, con o sin distribución normal. 
Permite determinar, por ejemplo, si diferentes tratamientos médicos (es decir, un grupo de más de dos tratamientos) 
muestran diferencias significativas en sus resultados o si por el contrario puede suponerse que sus medias 
poblacionales no difieren. 
Se tomaron medidas antropométricas de 717 pacientes mujeres en diferentes hospitales de la ciudad de Córdoba 
provenientes de la ciudad, del interior de la provincia y de otras provincias limítrofes. Se quiere saber si la talla de los 
pacientes es diferente dependiendo de su lugar de procedencia. 
Como se trata de una variable de clasificación de 3 categorías (Capital, interior y provincias limítrofes), el test utilizado 
es el ANOVA. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Las letras A, B y C me indican que los tres grupos (capital, interior y otras provincias) son diferentes entre sí. En el caso 
de tener dos letras iguales como A, A, B eso indica que hay dos grupos que son “iguales” (no son literalmente iguales, 
sino que existe una diferencia insignificante entre ellos como para separarlos en dos grupos distintos) y uno diferente. 
CHI-CUADRADO: Es una prueba estadística de contraste de hipótesis que se aplica para analizar datos recogidos en 
forma de números de observaciones en cada categoría: número de éxitos que tuvo una intervención, porcentaje de 
pacientes que presentan una característica. En definitiva, sirve para analizar variables cualitativas o categóricas y para 
comparar porcentajes. 
Ejemplo: Un estudio investigó si comer helado muy deprisa daba lugar a un dolor de cabeza con más frecuencia que 
comer helado despacio. Para ello se asignó a 145 estudiantes de manera aleatoria para tomar 100 ml de helado en 
menos de 5 segundos o en más de 30 segundos, y se registró la aparición de cefalea. Los resultados obtenidos son los 
siguientes:Preghenella, Narella M. 
 
Velocidad de consumo Cefalea Total 
 Si No 
Rápido 20 53 73 
Lento 9 63 72 
Total 29 116 145 
 
De 73 personas que habían tomado el helado rápido, 20 de ellas (27%) desarrollaron cefalea. En cambio, entre quienes 
lo habían tomado despacio, solo 9 (13%) la desarrollaron. Este tipo de problemas suele exigir que se aplique el test de 
chi cuadrado, en los siguientes pasos: 
1. Plantear la hipótesis nula y alternativa: La H0 consistiría en que la proporción de personas que desarrollan 
cefalea será la misma en los dos grupos, los que tomaron rápidamente o despacio. Es decir, que la cefalea es 
independiente de la velocidad a la que se consume el helado. La H1 sería que las proporciones de desarrollo 
de cefalea son distintas entre los que tomaron el helado rápido y los que lo tomaron despacio. 
2. Construir una tabla 2x2 con los valores de la tabla: Como hay dos variables (velocidad de consumo y cefalea) 
y cada una tiene dos categorías, resultan 4 casillas al cruzar las categorías de ambas variables. La tabla quedará 
con dos filas y dos columnas. 
3. Conclusión: P=0.0249. Como el valor de p<0.05, se puede afirmar que la diferencia es estadísticamente 
significativa y hay evidencia para rechazar la H0. Se acepta la H1, es decir, que hay asociación entre comer 
helado rápido y el riesgo de desarrollar cefalea 
En resumen: 
• Test t para datos independientes 🡪 Comparación de medias de 2 variables. 
• Test t para datos apareados 🡪 Análisis de las diferencias de las medias de 2 variables de datos. 
• ANOVA (LSD Fisher) 🡪 para comparación de más de 2 grupos. 
• En todos los casos la distribución de la variable debe ser normal. 
 
TEST T ANOVA CHI-CUADRADO 
-Compara 2 variables, una 
categórica y la otra 
mensurable. 
-Compara Medias. 
-Compara 1 o 2 grupos entre 
dos variables. 
-Compara más de 2 grupos 
en una variable. 
-Compara 2 variables 
categóricas. 
 
En estadística, un resultado o efecto es estadísticamente significativo cuando es improbable que haya sido debido 
al azar, es decir, se acepta la H1. Una «diferencia estadísticamente significativa» solamente significa que 
hay evidencias estadísticas de que hay una diferencia; no significa que la diferencia sea grande, importante o 
radicalmente diferente. Cuanto menor sea el valor p, más significativo será el resultado. 
Una "p" pequeña significa que la probabilidad de que los resultados obtenidos se deban al azar es pequeña. 
VER “GUIA DE INFOSTAT” PARA SABER COMO HACER LOS TEST ESTADÍSTICOS EN EL INFOSTAT. 
 
 
 
Preghenella, Narella M. 
DISTRIBUCIÓN 
La organización de los datos constituye la primera etapa de su tratamiento, puesto que facilita los cálculos posteriores 
y evita posibles confusiones. 
La organización va a depender del número de observaciones distintas que se tengan (los datos de las variables varían 
de un sujeto a otro, incluso en un mismo sujeto, en diferentes momentos) y de las veces que se repitan cada una de 
ellas. En base a lo anterior, se pueden estructurar (graficar) los datos de maneras diferentes. 
 
Categóricas: Distribución de frecuencia. 
Frecuentemente, se utilizan gráficos en barras donde se observa la frecuencia de un dato en distintas categorías. Por 
ej.: cantidad de casos (datos) de personas con sarampión según la edad (categoría). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Mensurables: Distribución normal y no normal. 
Donde veo dentro de toda la población cuáles son sus estadísticos centrales (media, mediana y moda) y sus estadísticos 
de dispersión (varianza y desvío estándar). 
En la distribución normal sus estadísticos centrales tienden a coincidir en un mismo punto y la dispersión es 
homogénea hacia ambos lados de la media. En el gráfico se representa con una curva simétrica. (Hay más dispersión 
cuando la curva está aplanada). Cuanto se aleja cada dato del valor de la media, al estar más disperso, tiene una mayor 
varianza. 
En el eje X observo la distribución; en el eje Y observo la frecuencia de un dato. 
Preghenella, Narella M. 
 
 
 
 
 
 
 
 
 
 
En la distribución anormal o no paramétrica tiene una distribución asimétrica, es decir que sus media, mediana y moda 
no coincide, haciendo que la gráfica suba de golpe y después se haga una cola. Por ejemplo: la cantidad de hermanos 
tiene una distribución anormal. 
 
 
 
 
 
 
 
En la distribución normal alrededor del 95% de las observaciones está dentro de 2 desviaciones estándar de la media. 
Es decir, el 95% de los valores se ubicará dentro de 2 desviaciones estándar con respecto a la media (entre +2 y -2). 
Por lo tanto, menos del 5% (0.05) de las observaciones estará fuera de este rango. Este rango es la base del nivel de 
significancia de 0.05 que se utiliza para muchas pruebas de hipótesis. 
 
 
 
 
 
 
 
Si tomo una muestra de esta población, el promedio de la muestra debiera estar alrededor o cerca al valor medio de 
la población. 
TEST ESTADISTICOS: 
De acuerdo al tipo de distribución, va a ser el tipo de test que vamos a utilizar. Es decir, según el tipo de variable 
(categórica o mensurable) de la distribución (simétrico o asimétrica) y de la cantidad de N (tamaño de la muestra, 
cantidad de unidades de análisis), va a depender el tipo de test a utilizar. 
Preghenella, Narella M. 
 Variable respuesta 
Factor de 
estudio. 
Categórico (2 
grupos) 
Categórica 
nominal (2 
categorías) 
Categórica 
nominal (>2 
categorías) 
Categórica 
ordinal 
Mensurable 
Independientes 
Chi cuadrado 
Prueba exacta 
de Fisher 
Chi cuadrado 
U de Mann-
Whitney 
Test t 
Prueba de 
Welch 
Pareados 
Prueba de 
McNemar 
Prueba de 
Fisher 
Q de cochran 
Prueba de los 
signos 
Prueba de los 
rangos 
Test t para 
datos 
apareados 
 
El factor de estudio es la variable (categórica en este caso) que no cambia pero que condiciona una respuesta. Por 
ejemplo, en el caso de la producción de cáncer de pulmón en fumadores o no fumadores 
 *Factor de estudio: ser fumador o no ser fumador. 
*Variable respuesta: si desarrolla o no cáncer pulmonar. 
Otro ejemplo comer o no comer arroz (factor de estudio), y ver si aparece o no déficit neurológico (variable respuesta). 
 
Factores de estudio: 
● Independiente: dos grupos diferentes. 
● Apareado: a lo largo del tiempo en un mismo grupo, entonces tomo 2 datos de un mismo grupo. Por ejemplo: 
ver a un grupo de pacientes, tomar medidas de talla y después de un tiempo volver a tomar las mismas 
medidas a los mismos pacientes. Entonces tenemos dos series de datos en dos tiempos diferentes (un par de 
datos para una unidad de análisis). 
Según el cuadro, cuando trabajo con una variable categórica con dos grupos (varones y mujeres, fumador y no 
fumador, etc.) y la variable respuesta también es categórica y dicotómica, el test a utilizar es el chi cuadrado (la prueba 
exacta de Fisher es un ajuste que se le hace a ese test). Este análisis lo aplico a todo el resto del cuadro. 
 
Cuando tengo más de dos grupos en el factor de estudio: 
 Variable respuesta 
Factor de 
estudio. 
Categórico (más 
de 2 grupos) 
Categórica 
nominal (2 
categorías) 
Categórica 
nominal (>2 
categorías) 
Categórica 
ordinal 
Mensurable 
Independientes Chi cuadrado Chi cuadrado 
Prueba de 
Kruskal-Walis 
ANOVA 
Pareados Q de Cochran Q de Cochran 
Prueba de 
Friedman 
ANOVA de dos 
vías 
Preghenella, Narella M. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
GRAFICOS: 
Un gráfico estadístico es una representación visual de una serie de datos estadísticos. Es una herramienta muy eficaz, 
ya que un buen gráfico: 
❖ Capta la atención del lector; 
❖ Presenta la información de forma sencilla, clara y precisa; 
❖ No induce a error; 
❖ Facilita la comparación de datos y destaca las tendencias y diferencias; 
❖ Ilustra el mensaje, tema o trama del texto que acompaña. 
TIPOS DE DATOS: Según el tipo de variable y el tipo de datos que tengo, es la gráfica quevoy a elegir realizar. 
Cualitativos o categóricos: se refiere a las modalidades que no pueden expresarse numéricamente. Pueden ser: 
● Ordinales: si siguen un orden o secuencia. (Ej. abecedario, meses del año). 
● Nominales: si no siguen ningún orden. (Ej. Estado civil de las personas). 
Preghenella, Narella M. 
Cuantitativos o mensurables: se refieren a cantidades o valores numéricos. Pueden ser: 
● Discretos: si toman valores enteros (Ej. Número de hijos, cantidad de alumnos en una clase). 
● Continuos: si pueden tomar cualquier valor dentro de un intervalo (Ej. Estatura y peso de las personas). 
● 
Gráfico de barras: en una representación gráfica en un eje cartesiano de las frecuencias de una variable categórica o 
mensurable discreta. En el eje de las X posiciono los valores que adopta la variable y el eje de las Y la frecuencia 
absoluta o relativa. Este grafico también puede orientarse de forma horizontal y las categorías pueden ordenarse por 
orden alfabético, lo que facilita su búsqueda, o por sus frecuencias, lo que facilita la comparación. Se puede utilizar 
para comparar las magnitudes de varias categorías o para ver la evolución en el tiempo de una magnitud concreta. 
 
 
 
 
 
 
 
El espacio entre las barras significa que no existe como respuesta posible aquella que este entre el 2 y el 6, es decir, 
vivís en un lugar o en otro. 
 
 
 
 
 
 
 
 
 
 
 
 
La gráfica vertical esta por orden decreciente y la gráfica horizontal esta por orden alfabético. 
 
 
 
 
Preghenella, Narella M. 
 
 
 
 
 
 
 
 
 
 
También puedo graficar variables dicotómicas 
 
 
 
 
 
 
 
Hay diferentes tipos de gráfico de barras: 
● Sencillo: contiene una única serie de datos. 
● Agrupado: contiene varias series y cada una se representa por un tipo de barra de un mismo color o 
textura y se disponen uno al lado del otro. 
● Apilado: contiene varias series de datos y las barras se dividen en segmentos de diferentes colores o 
texturas y cada uno de ellos representa una serie. 
 
 
 
 
 
 
 
 
 
 
Preghenella, Narella M. 
Histograma: el cual se utiliza para representar la frecuencia de una variable cuantitativa (mensurables) que presenta 
continuidad, por eso las barras están juntas. En el eje de las X se colocan los intervalos y en el de las Y las frecuencias. 
A diferencia de la modalidad anterior no existe una separación entre las barras (por eso se llama histograma y no 
gráfico de barras). 
 
 
 
 
 
 
 
 
 
Bidireccional: es cual tiene orientación horizontal y contiene dos series de datos cuyas barras de frecuencia crecen en 
sentidos opuestos. Un ejemplo de esta modalidad es la pirámide de población que muestra la estructura demográfica 
de una población por sexo y edad en un momento determinado. Este grafico da una visión de la juventud, madurez o 
vejez de una población y por lo tanto su grado de desarrollo y puede ser una pirámide progresiva (con alto porcentaje 
de población joven y poca población madura y en estado de vejez, esto se da en países subdesarrollados donde la 
esperanza de vida es baja y la tasa de natalidad alta), regresiva (la población está más representada por el estadio 
maduro, esto es típico en países desarrollados donde la natalidad está descendiendo y la esperanza de vida es alta) o 
estancada (hay una correlación entre la edad madura y la joven, esto es típico en países en vías de desarrollo donde 
se ha controlado la mortalidad y se está empezando a controlar la natalidad). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Preghenella, Narella M. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Gráfico de líneas: es una representación gráfica en un eje cartesiano de la relación que existe entre dos variables 
reflejando con claridad los cambios producidos. En el eje horizontal se coloca la variable que indica el tiempo y en el 
vertical la variable cuya variación en el tiempo queremos ver. 
Una modalidad de este grafico es el polígono de frecuencias, que se obtiene al unir los puntos medios de las bases 
superiores de las barras de los gráficos de barra. Las pirámides de población pueden representarse de esta forma. 
 
 
 
 
 
 
 
 
 
Preghenella, Narella M. 
 
 
 
 
 
 
 
 
 
 
 
Gráfico de sectores: es una representación circular de las frecuencias relativas de una variable categórica o 
mensurable discreta, que permite de una manera sencilla y rápida su comparación. Cada porción llamada sector 
representa la proporción de cada categoría de la variable.

Continuar navegando