Logo Studenta

BIOESTADÍSTICA 1

¡Este material tiene más páginas!

Vista previa del material en texto

BIOESTADÍSTICA – SEMANA 1
FUNDAMENTOS DE BIOESTADÍSTICA: DEFINICIONES E IDEAS BÁSICAS
ESTADÍSTICA
· La estadística deriva su nombre del hecho de haber sido aplicada en primer lugar a la recolección de datos que permitieran la administración de los estados, con propósitos militares e impositivos.
· La estadística es una ciencia y una rama de las matemáticas a través de la cual se recolecta, analiza describe y estudia una serie de datos a fin de establecer comparaciones o variabilidades que permitan comprender un fenómeno en particular.
· La estadística se vale, en gran medida, de la observación para la recolección de datos que posteriormente serán analizados y comparados a fin de obtener un resultado.
· La estadística estudia los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sean una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
TRANSVERSALIDAD DE LA ESTADÍSTICA
· Una de las características fundamentales de la estadística es su transversalidad. Su metodología es aplicable al estudio de diversas disciplinas tales como: biología, física, economía, sociología, etc.
· La estadística ayuda a obtener conclusiones relevantes para el estudio de todo tipo de agentes como: humanos, animales, plantas, etc.
RAMAS DE LA ESTADÍSTICA
· Estadística descriptiva: Se refiere a los métodos de recolección, organización, resumen y presentación de un conjunto de datos. Se trata principalmente de describir las características fundamentales de los datos y para ellos se suelen utilizar indicadores, gráficos y tablas.
· Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se refiere a los métodos utilizados para poder hacer predicciones, generalizaciones y obtener conclusiones a partir de los datos analizados teniendo en cuenta el grado de incertidumbre existente.
DISEÑO DE EXPERIMENTOS
¿Qué es un experimento? Es el cambio en las condiciones de operación de un sistema o proceso, que se hace con el objetivo de medir el efecto del cambio en una o varias variables del producto. Ello nos permite aumentar el conocimiento acerca del sistema o del proceso.
¿Qué es un diseño de experimento? Es la planificación de un conjunto de pruebas experimentales, de forma que los datos generados puedan analizarse estadísticamente para obtener conclusiones válidas y objetivas acerca del problema establecido. Diseño de experimentos (DOE, Design of Experiments) es el estudio simultáneo de varias variables del proceso. Combinando varias variables en un estudio en vez de estudiar las por separado.
RAZONES PARA REALIZAR UN EXPERIMENTO
· Determinar las principales causas de la variación en una respuesta medida.
· Para encontrar las condiciones que dan lugar a un máximo o mínimo de respuesta.
· Para comparar las respuestas logradas con diferentes ajustes de variables controlables.
· Para obtener un modelo matemático que permita predecir respuestas futuras.
ESTADÍSTICA DESCRIPTIVA
· La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos.
· La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto.
· La estadística descriptiva proporciona los métodos para recabar información acerca de una determinada población que se desea conocer o investigar con fines específicos, entonces es importante obtener muestras adecuadas que permitan inferir el comportamiento de dicha población.
METODOLOGÍA
· Selección y determinación de la muestra.
· Obtención de los datos.
· Clasificación y organización de los datos.
· Análisis descriptivo de los datos.
· Representación gráfica de los datos.
· Contraste de hipótesis, si procede.
· Conclusiones
TABLAS Y GRÁFICOS EN LA ESTADÍSTICA DESCRIPTIVA
· Histogramas
· Gráficos de Barras 
· Gráficos de Sectores
· Tablas de probabilidad
· Tablas bidimensionales
· Gráficos de cajas
INFERENCIA ESTADÍSTICA
· La inferencia estadística es el conjunto de métodos que permiten inducir, a través de una muestra estadística, el comportamiento de una determinada población.
· La inferencia estadística, estudia entonces como, a través de la aplicación de dichos métodos sobre los datos de una muestra, se pueden extraer conclusiones sobre los parámetros de la población de datos. De la misma manera estudia también el grado de fiabilidad de los resultados extraídos del estudio.
PARA ENTENDER EL CONCEPTO ES NECESARIO CONOCER:
· Inferencia: Extraer juicioso conclusiones a partir de ciertos supuestos, sean estos generales o particulares.
· Población: Una población de datos, es el conjunto total de datos que existen sobre un variable.
· Muestra estadística: Una muestra es una parte de la población de datos.
BIOESTADÍSTICA
· La bioestadística es una disciplina científica que se encarga de la aplicación del análisis estadístico a diferentes cuestiones vinculadas a la biología, a las ciencias de la naturaleza, entre las que se encuentran todas las ciencias de la salud. Puede decirse que la bioestadística es un área o una especialización de la estadística, la ciencia dedica da al estudio cuantitativo de todo tipo de variables
· La Bioestadística envuelve el desarrollo y aplicación de técnicas estadísticas a la investigación en campos relacionados a la salud incluyendo medicina, epidemiología, salud pública y también en áreas de estudios ambientales, investigación agrícola y biología.
COMPONENTE PRÁCTICO DE LA BIOESTADÍSTICA
Siendo una rama de la estadística, la Bioestadística abarca diferentes aspectos relacionados con el diseño de experimentos, la recogida de datos, y el análisis e interpretación de los mismos. En la fase de diseño de una investigación, la Bioestadística juega un papel importante a la hora de determinar el número de sujetos u observaciones que se deben incluir en el estudio, cómo van a seleccionarse los participantes y, si procede, la forma en la que estos deben ser asignados a los diferentes tratamientos o condiciones que van a investigarse. La Bioestadística proporciona las herramientas de análisis necesarias para describir y resumirlos datos obtenidos y representarlos gráficamente.
COMPONENTE TEÓRICO DE LA BIOESTADÍSTICA
La Bioestadística tiene además un componente teórico. En los últimos años se ha producido un gran auge de la investigación en Bioestadística, mediante el desarrollo de nuevos métodos de análisis específicamente orientados a la resolución de problemas prácticos relacionados con las ciencias de la vida. Esto ha contribuido a mejorar la capacidad de extraer inferencias válidas a partir de los datos observados y avanzara sí en una investigación de calidad en estos campos.
APLICACIONES DE LA BIOESTADÍSTICA
· El campo de aplicación de la Bioestadística es muy extenso. Los tratamientos médicos actuales se seleccionan en base a los resultados de ensayos clínicos que son diseñados y analizados de acuerdo con principios de la Bioestadística.
· En el campo de la medicina, el análisis bioestadístico de estudios observacionales puede también ayudara identificar factores de riesgo relacionados con el desarrollo de diferentes enfermedades, o a determinarla validez y fiabilidad de las pruebas utilizadas para el diagnóstico de diversas patologías.
· La Bioestadística también se utiliza en la investigación de riesgos medio ambientales, y ha sido empleada en el campo de la agricultura para mejorar los cultivos y la cría de animales.
POBLACIÓN
· Es el conjunto de todos los elementos o individuos cuyas propiedades o características (variables de estudio) se van a estudiar
· Una población es un conjunto de todos los elementosque estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
· "Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).
TIPOS DE POBLACIÓN 
· Población diana: Esta definida por los objetivos de estudio
· Población finita: Cuando se conoce el tamaño de la población 
· Población infinita: Cuando no se conoce el tamaño de la población
MUESTRA
· Es un subconjunto de casos o individuos de la población de estudio; es el grupo de personas que realmente se estudiaran.
· Debe ser representativa de la población y para lograr esto se tiene que tener bien definido los criterios de inclusión y exclusión, así como la realización de una buena técnica de muestreo.
· Una muestra representativa indica que reúne aproximadamente las características de la población que son importantes para la investigación.
PORQUE Y CUANDO CALCULAR EL TAMAÑO DE LA MUESTRA
¿Por qué calcular el tamaño de la muestra?
· Una muestra puede estudiarse con mayor rapidez que una población.
· El estudio de una muestra es menos costoso.
· Toma menos tiempo el estudio a realizar.
· Los resultados son más precisos.
¿Cuándo calcular el tamaño de la muestra?
· Cuando no se puede estudiar toda la población.
· Cuando se quieren estudiar dos o más grupos y establecer diferencias.
· Cuando se quieren estimar parámetros, prevalencia, promedio, porcentajes y tasas.
MUESTREO
· El muestreo es el proceso mediante el cual el investigador podrá seleccionar a los pacientes o a los sujetos de estudio a partir de la muestra calculada previamente.
· Es la técnica empleada para la selección de elementos (unidades de análisis o de investigación) representativos de la población de estudio que conformarán una muestra y que será utilizada para hacer inferencias (generalización) a la población de estudio.
TIPOS DE MUESTREO
· Probabilístico (Aleatorio)
· No probabilístico
Muestreo Probabilístico: Su principal característica es que todos los sujetos de la población de estudio tienen la misma probabilidad de ser seleccionados para formar parte de la muestra.
Muestreo No Probabilístico: En este tipo de muestreo hay uno o más criterios de selección por parte del investigador, para que uno o más sujetos pueda formar parte del estudio. No todos los sujetos tienen la misma posibilidad para ser elegidos.
BIOESTADÍSTICA – SEMANA 2
VARIABLES
· El término variable refiere a cosas que son susceptibles de ser modificadas (de variar), de cambiar en función de algún motivo determinado o indeterminado.
· En estadística, es una característica o cualidad de un individuo que esta propensa a adquirir diferentes valores. (Estos valores, se caracterizan por poder medirse).
· Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una persona, son variables estadísticas. 
VARIABLES ESTADÍSTICAS
· Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición.
· Las variables estadísticas son fundamentales para logra estudiar eventos y circunstancias que tienen a oscilar en diferentes resultados o soluciones.
CLASIFICACIÓN DE LAS VARIABLES ESTADÍSTICAS
· Cualitativas: Serán cualitativas aquellas que expresen características o cualidades diferentes.
· Cuantitativas: Serán cuantitativas cuando expresen argumentos numéricos.
VARIABLES CUALITATIVAS
Son aquellas que expresan características, cualidades o atributos y no pueden ser medidas con números. Pueden ser ordinales o nominales.
Ejemplos de Variables cualitativas:
· Red social preferida por los millenials.
· El color de ojos de los actores de una película.
· Posición en la que llega un corredor en la prueba de 100 metros planos.
· El curso favorito de tus amigos.
· Series de Netflix más vistas en tu país.
· La tienda de ropa preferida por los habitantes de una ciudad.
VARIABLES CUANTITATIVAS
Son aquellas que se expresan mediante un número, por tanto, se puede realizar operaciones aritméticas con ellas. Puede ser discretas o continuas.
Ejemplos de Variables cuantitativas:
· El peso de las vacas de una granja.
· Estatura de los habitantes de una ciudad.
· El número de hijos en una familia.
· Número de clientes atendidos en una tienda.
· Velocidad a la que avanza un tren.
· Número de personas que visitan el campus virtual de la UG en un día.
· Cantidad de goles anotados en un partido de fútbol.
MÉTODO DESCRIPTIVO
· El método descriptivo es uno de los métodos cualitativos que se utilizan en investigaciones que tienen el objetivo de evaluar algunas características de una población o situación particular.
· En la investigación descriptiva, el objetivo es describir el comportamiento o estado de un número de variables. El método descriptivo orienta al investigador en el método científico.
CARACTERÍSTICAS
· Suele atender a un método cualitativo.
· Es un primer abordaje al objeto que se está estudiando y funciona como un catalizador de nuevas investigaciones.
· Hace posible la consecución de muchos datos sobre el objeto que se estudia.
· Implica una observación atenta y hay un registro fiel de lo que se observa
· No implica generalizaciones ni proyecciones.
ESCALAS DE MEDICIÓN EN ESTADÍSTICA
· Escalas de medición son una sucesión de medidas que permiten organizar datos en orden jerárquico.
· Las escalas de medición pueden ser clasificadas de acuerdo con una degradación de las características de las variables.
· Las escalas de medición ofrecen información sobre la clasificación de variables discretas o continuas, también más conocidas como escalas grandes o pequeñas.
· La medición es un proceso inherente y consustancial a toda investigación, sea esta cualitativa y cuantitativa.
· Se mide principalmente variables considerando tres elementos básicos:
· El instrumento de medición
· La escala de medición
· El sistema de unidades de medición
· La validez, consistencia y confiabilidad de los datos medidos dependen, en buena parte, de la escala de medición que se adopte.
NIVEL DE ESCALA O MEDICIÓN
· La medición puede definirse como la asignación de numerales a objetos o sucesos siguiendo ciertas reglas, Stevens (1946). El autor de esta definición desarrolló un método para clasificar los diferentes resultados de las mediciones en lo que llamó niveles de medición.
· Un nivel de medición es la escala que representa una jerarquía de precisión dentro de la cual una variable puede evaluarse, en función de las características que rigen las escalas.
VARIABLES CUALITATIVAS O CATEGÓRICAS
· Ordinal: Los datos pueden usarse para jerarquizar u ordenar las observaciones
· Nominal: Los datos son etiquetas o categorías que se usan para definir un atributo de un elemento
VARIABLES CUANTITATIVAS O NUMÉRICAS
Intervalo: Los datos tienen las propiedades de los datos ordinales, pero a su vez la separación entre las variables tiene sentido. El valor cero no indica la ausencia de la propiedad
Razón: Posee un cero absoluto (es indispensable que exista) y determina la igualdad de relaciones o proporciones.
Por ejemplo, la variable estatura puede analizarse en diferentes niveles de medida:
· Un conjunto de personas puede clasificarse en altos y bajos, A y B, creando dos grupos. Para ello no es necesario recurrir a ninguna cinta métrica, simplemente basta observar quienes destacan sobre los demás (el grupo de altos) y el resto completarán el grupo de bajos. El nivel de medición que corresponde a esta forma de medir es nominal.
· También podrían alinearse a los sujetos y ordenarlos según su altura, el primero sería el más alto y el último el más bajo, de forma que cada persona tuviese delante a uno más alto y detrás a uno más bajo. El nivel de medición en este caso es ordinal. Hasta el momento no es posible decir cuánto es una persona más alta que otra.
· A través del número de personas que hay entre dos sujetos, por ejemplo, Andrea y Juan en la fila ordenada anteriormente. En este caso además del orden se conoce la magnitud de la altura. Si en lugar de utilizarel número de personas se recurre a una regla se puede ofrecer otra medida de la altura. Esta forma de medir es propia del nivel de intervalos, que permite saber la magnitud de los elementos comparando unos con otros.
· La cuarta posibilidad es utilizar un metro que sitúa el cero en el mismo suelo y, por lo tanto, la altura se define en función de la distancia desde la cabeza al suelo (valor cero absolutos donde se sitúa la ausencia de altura). Una característica de esta clasificación es que las propiedades de una escala se cumplen en el nivel superior.
EJEMPLOS:
Escala Nominal
· El sexo de una persona es un dato nominal no numérico.
· El número de seguro de salud de una persona es un dato nominal numérico.
Escala Ordinal
· El estado de salud de un paciente son datos ordinales no numéricos.
Escala Intervalo
· La temperatura (en grados centígrados) media de una ciudad.
· En esta escala, los números mayores corresponden a temperaturas mayores. Es decir, el orden importa, pero a la vez la diferencias entre las temperaturas importa.
Escala Razón
· Variables como la edad, la distancia, la altura, el peso y el tiempo se miden con una escala de razón.
DATOS CUALITATIVOS
· Datos que se expresan en forma de palabras o textos que ayudan comprender ciertas acciones y actitudes de los encuestados que no son cuantificables, por lo que su uso es muy importante para fundamentar cualquier investigación seria.
· Este tipo de datos tienen como principal característica que no se pueden medir, ni con número, deben ser interpretados.
· Los datos cualitativos son utilizados principalmente como el primer acercamiento al problema, ya que nos aporta información acerca de la existencia de una realidad en la que están involucrados nuestros participantes.
DATOS CUALITATIVOS: VARIABLES POLITÓMICAS
· Son aquellos que no se pueden expresar numéricamente. Representan una cualidad o atributo que clasifica a cada sujeto en una de varias categorías.
· Los valores para grupos de individuos generalmente se tabulan utilizando tablas de contingencia:
Ejemplo:
Médicos según Servicios:
· UCI
· Cirugía
· Consulta
· Externa
Medidas de aislamiento
· Lavado de manos
· Mascarillas
· Uso de guantes
DATOS CUALITATIVOS: VARIABLES DICOTÓMICAS
· Son aquellos que no se pueden expresar numéricamente.
· Representan una cualidad o atributo que clasifica a cada sujeto en una de varias categorías.
Ejemplo:
· Vivo/ Muerto: Este es el ejemplo más claro (por lo menos no se conocen muchos casos de estados intermedios entre la vida y la muerte).
· Sano/Enfermo: Requiere una definición para la condición de enfermo.
DATOS CUANTITATIVOS
· El concepto "datos cuantitativos" hace referencia a la información tangible, la que es obtenida mediante algún método de investigación. La manera de cuantificar los datos obtenidos en estudio nos, dará la pauta de qué rumbo dirigirse, de ahí la importancia de su correcto análisis para poder demostrar si estamos en lo correcto o no, en la hipótesis planteada.
· Hay dos tipos de datos cuantitativos, que también se conocen como datos numéricos: continuo y discreto. Como regla general, los recuentos discretos y las mediciones son continuas.
DATOS CUANTITATIVOS: DATOS CONTINUOS
· Se refiere al flujo constante de valores posibles de la variable, estos datos no se restringen a valores enteros (aunque normalmente son reducidos a valores enteros por aproximación). Los datos continuos se miden en lugar de contarse. Además, tienen entre sus características que pueden dividirse.
· Son aquellos datos que pueden tomar cualquier valor (dentro de un rango). Los datos continuos pueden tomar un número infinito de valores y no tiene categorías naturales.
Ejemplo:
· Medir la altura de una persona: Medir la altura en metros, centímetros y hasta dar una medida en milímetros, es decir, los datos son continuos
· Edad: Definir una edad en años, meses y hasta día
DATOS CUANTITATIVOS: DATOS DISCRETOS
· Los datos discretos tienen un finito de categorías número naturales.
· Prácticamente hablamos de números enteros, enteros, por valores completos.
· Se cuentan, no se miden.
Ejemplo:
· Número de hijos, adultos o mascotas en su familia. Son datos discretos, porque se cuentan por números indivisibles: no se puede tener 2,5 hijos, o 1,3 mascotas.
· Cantidad de empleados que trabajan en una tienda. Son datos discretos, porque se cuentan por números indivisibles: no se puede tener 20,5 empleados.
BIOESTADÍSTICA – SEMANA 3
DISTRIBUCIÓN DE FRECUENCIA – GENERALIDADES
· La organización de los datos constituye la primera etapa de su tratamiento, puesto que facilita los cálculos posteriores y evita posibles confusiones. Cuando no existían los computadores, o ni siquiera calculadoras, era necesario que los datos tuvieran alguna estructura que permitiera resumirlos y comprenderlos de una forma más o menos sencilla.
· La organización va a depender del numero de observaciones distintas que se tengan y de las veces que se repitan cada una de ellas. En base a lo anterior, se pueden estructurar los datos de maneras diferentes.
· Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contiene los datos.
· En estadística y por consiguiente en bioestadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. 
TIPOS DE FRECUENCIA
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el numero de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se denominan frecuencia. Así tenemos los siguientes tipos de frecuencias:
· Frecuencia absoluta: Cuantas veces se repite un evento (fi)
· Frecuencia relativa: hi=fi/n
FRECUENCIA ABSOLUTA
La frecuencia absoluta es una medida estadística que nos da información acerca de la cantidad de veces que se repite un suceso al realizar un numero determinado de experimentos aleatorios. Esta se representa mediante las letras fi.
La letra f se refiere a la palabra frecuencia y la letra i se refiere a la realización iésima del experimento aleatorio. (En otros textos se la encuentra como ni).
FRECUENCIA RELATIVA
La frecuencia relativa es una medida estadística que se calcula como el cociente de la frecuencia absoluta de algún valor de la población/muestra (fi) entre el total de valores que componen la población/ muestra (N)
Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin ella no podríamos obtener la frecuencia relativa. La frecuencia relativa se representa con las letras hi y su formula de cálculo es la siguiente:
 
BIOESTADÍSTICA – SEMANA 4
DISTRIBUCIÓN DE FRECUENCIA ACUMULADA – TIPOS
· Frecuencia absoluta acumulada: Sumatorio del número de veces que se repite el suceso (Fi)
· Frecuencia relativa acumulada: Sumatorio de la proporción que representa el valor i -esimo en la muestra (Hi).
FRECUENCIA ACUMULADA
La frecuencia acumulada es el resultado de sumar sucesivamente las frecuencias absolutas o relativas, desde el menor al mayor de sus valores.
FRECUENCIA ABSOLUTA ACUMULADA
La frecuencia absoluta acumulada es el resultado de ir sumando las frecuencias absolutas de las observaciones o valores de una población o muestra. Esta se representa por las siglas Fi.
Para calcular la frecuencia absoluta acumulada, hay que calcular primero la frecuencia absoluta (fi) de la población o muestra. Para ello, los datos se ordenan de menor a mayor y se colocan en una tabla.
Una vez hecho esto, la frecuencia absoluta acumulada se obtiene de ir sumando las frecuenciasabsolutas de una clase o grupo de la muestra con la anterior (primer grupo + segundo grupo, primer grupo + segundo grupo + tercer grupo y así sucesivamente hasta llegar acumular del primer grupo al último).
FRECUENCIA RELATIVA ACUMULADA
La frecuencia relativa acumulada es el resultado de ir sumando las frecuencias relativas de las observaciones o valores de una población o muestra. Esta se representa por las siglas Hi.
Para calcular la frecuencia relativa acumulada, hay que calcular primero la frecuencia absoluta (fi) y la frecuencia relativa (hi) de los valores de la población o muestra. Para ello, los datos se ordenan de menor a mayor y se colocan en una tabla.
Una vez hecho esto, la frecuencia frecuencia acumulada se obtiene de ir sumando las frecuencias relativas de una clase o grupo de la muestra con la anterior (primer grupo + segundo grupo, primer grupo + segundo grupo + tercer grupo y así sucesivamente hasta llegar a acumular del primer grupo al último)
DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS
O tabla con datos agrupados se emplea si las variables toman un numero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. 
No existen normas establecidas para determinar cuando es apropiado utilizar datos agrupados o datos no agrupados; se sugiere cuando el numero total de datos (N) es igual o superior de 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces se utilizará la distribución de frecuencias para datos agrupados, también se utilizará este tipo de distribución cuando se requiere elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.
La razón fundamental para utilizar la distribución de frecuencias de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, considerar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad.
CLASE Y DETERMINACIÓN DEL NÚMERO DE CLASES
Concepto. Es el numero de subconjuntos en que se han agrupado los datos.
Cada clase se puede denominar mediante una letra, un numero o alguna característica del subconjunto.
El numero de clases en que se agrupan los datos se determina con la raíz cuadrada del numero de datos cuando este es menor de 200.
Para muestras con 200 o más datos el numero de clases se determina con la raíz cubica del número de datos.
Límites de la clase. Cada clase esta delimitada por el limite inferior de la clase y el limite superior de la clase.
FÓRMULA DE STRUGES
Este es otra forma para calcular el intervalo de la clase:
La formula de Sturges, determina un numero aproximado de intervalos “k”. Aunque esta no siempre resulta muy adecuada, es una relación muy utilizada: k = 1 + 3.322 log (n).
Donde n es el numero de datos a condensar en la tabla.
AMPLITUD Y MARCA DE CLASE
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase (tamaño de la clase).
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
ELABORACIÓN DE INTERVALOS
El tamaño de clase indica el numero de datos que conforman a cada intervalo, considerando los valores extremos llamados límites. En cada intervalo aparece un límite inferior (LI) y un límite superior (LS).
Cada intervalo se forma sumando al limite inferior (LI) un numero menos que el tamaño de clase para obtener el limite superior.
BIOESTADÍSTICA – SEMANA 5
GRÁFICOS
¿QUÉ ES UN GRÁFICO?
GENERALIDADES
· Un gráfico es la representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que esos datos guardan entre sí y facilitar su interpretación.
· La utilización de gráficos hace más sencilla e inmediata la interpretación de los datos.
La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que:
· Induzca a pensar en el contenido más que en la apariencia.
· No distorsione la información proporcionada por los datos.
· Presente mucha información (números) en poco espacio.
· Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo, una secuencia temporal)
ELEMENTOS DE UN GRÁFICO
· Área del gráfico: Área que se encuentra definida por el marco del gráfico y que incluye todas sus partes.
· Título del gráfico: Texto descriptivo del gráfico que se coloca en la parte superior.
· Series de datos: Son los puntos de datos relacionados entre sí trazados en un gráfico. Cada serie de datos tiene un color exclusivo. Un gráfico puede tener una o más series de datos a excepción de los gráficos circulares que solamente pueden tener una serie de datos.
· Ejes: Línea que sirve como referencia de medida. El eje Y es conocido como el eje vertical y generalmente contiene datos. El eje X es conocido también como el eje horizontal y suele contener las categorías del gráfico.
· Líneas de división: Son líneas opcionales que extienden los valores de los ejes de manera que faciliten su lectura e interpretación.
· Título de eje: Texto descriptivo que se alinea automáticamente al eje correspondiente.
· Leyenda: Recuadro que ayuda a identificar los colores asignados a las series de datos.
REPRESENTACIONES GRÁFICAS DE DATOS CUALITATIVOS
En cuanto a la representación gráfica de las variables cualitativas destacamos dos tipos de gráfico por ser los que se utilizan con mayor frecuencia.
· Diagrama de sectores.
· Gráfico de barras.
DIAGRAMA DE SECTORES
· El diagrama de sectores se utiliza para visualizar de forma sencilla las frecuencias relativas de las variables.
· En los gráficos de sectores se divide una figura, habitualmente de forma circular, de forma que el área correspondiente a cada posible respuesta de la variable será proporcional a la frecuencia relativa de la variable.
REPRESENTACIONES GRÁFICAS DE DATOS CUANTITATIVOS
Estas representaciones nos ayudarán a visualizar los datos y a conocer sus principales características. Entre las principales representaciones gráficas tenemos:
· Gráfico de barras
· Histograma
· Polígonos de frecuencia
· Diagrama de tallos y hojas
· Diagrama de cajas
GRÁFICOS ESTADÍSTICOS: VARIABLES CUANTITATIVAS CONTINUAS
· Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.
· Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene este segmento como base.
DIAGRAMA DE TALLOS Y HOJAS
El diagrama tallo y hojas permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último digito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formara el tallo)
DIAGRAMA DE CAJAS
· Los diagramas de Caja-Bigotes son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.
· Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
CONSTRUCCIÓN:
· Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana).
· Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable.
· Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcadoe identificado individualmente
BIOESTADÍSTICA – SEMANA 6
MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA Y MODA
UNIDADES EXPERIMENTALES (MUESTRA)
Es una porción de la información a analizar. Ejemplo: muestra compuesta por ocho personas.
MEDIA (PROMEDIO)
· La media es la suma de todas las observaciones dividida entre el número de observaciones.
· Por ejemplo, el tiempo de espera (en minutos) de cinco clientes de un banco es: 3,2,4,1 y 2. El tiempo medio de espera es:
3+2+4+1+2/5=12/5=2.4 min
· En promedio, de un cliente espera de 2.4 minutos para ser atendido en el banco.
MEDIA ARITMETICA
· La media aritmética es el valor promedio de las muestras y es independiente de las amplitudes de los intervalos.
· La media aritmética es el valor que se obtiene al sumar todos los datos que tenemos y dividir el resultado entre el numero total de esos datos.
· es el símbolo de la media aritmética
MEDIA GEOMETRICA
· La media geométrica es un tipo de media que se calcula como la raíz del producto de un conjunto de números estrictamente positivo.
· La media geométrica se calcula como un producto conjunto. Es decir, que todos los valores se multiplican entre sí. De modo que, si uno de ellos fuera cero, el producto total seria cero. (verificar números que sean únicamente positivo)
· La media geométrica se utiliza con mas frecuencia para calcular la taza de crecimiento porcentual promedio de algunas series dada, a través del tiempo.
FORMULA DE LA MEDIA GEOMETRICA
Donde:
· N: se trata del número total de observaciones. Por ejemplo, sí beneficios tenemos el crecimiento de los beneficios de una empresa durante 4 periodos, N será 4.
· X: La variable de X es sobre la que calculamos la media geométrica. Siguiendo el ejemplo anterior, el crecimiento de los beneficios estará expresado en porcentaje y será la variable X.
· I: representa la posición de cada observación. En este ejemplo, podríamos ponerle un numero a cada periodo. Un 1, al periodo 1, un 2 al periodo 2 etc. De manera que x1 es el crecimientos de los beneficios en el periodo 1, x2 el crecimiento de los beneficios en el periodo 2,x3 el crecimiento de los beneficios en el periodo 3y x4 el crecimiento de los beneficios en el periodo 4.
FORMULA DE LA MEDIA GEOMETRICA 
· Se hace énfasis en que este tipo de la media es adecuada para calcular variable en porcentaje o índices. Una de sus principales ventajas es que es menos sensible a valores extremos (muy grandes o pequeños) que podría alterar la media de una muestra estadística. Por el contrario, su principal desventaja es que no puede utilizarse con números negativos.
MEDIANA
La mediana es el valor que cumple que la mitad de los valores de la variable son inferiores a él y la otra mitad son superiores. Si el número de datos en la muestra es impar será el valor central de la muestra ordenada (muestra en la que las unidades experimentales aparecen ordenadas según el valor que toman). Si el número de datos es par la mediana se define como la media de los dos valores centrales de la muestra ordenada.
· Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los valores es menor que o igual a 13 y el 50% de los valores es mayor que o igual a13.
· Si se ordenan todos los datos, de menor a mayor, la mediana es el valor que ocupa la posición central. Si el número de datos es par, la mediana es la media aritmética de los dos centrales.
MODA
· La moda es el valor que ocurre con más frecuencia en un conjunto de observaciones. Mientras que la media y la mediana requieren un cálculo, la moda se obtiene simplemente contando el número de veces que cada valor ocurre en un conjunto de datos.
· La moda puede ser única o no.
RELACIÓN EMPÍRICA ENTRE MEDIA, MEDIANA Y MODA
En las estadísticas, existe una relación entre la media, la mediana y el moda que se basa empíricamente. Las observaciones de innumerables conjuntos de datos han demostrado que la mayoría de las veces la diferencia entre la media y el moda es tres veces mayor que la diferencia entre la media y la mediana. Esta relación en forma de ecuación es:
Fórmula:
Media –Moda = 3(Media-Mediana)
Se puede despejar de la siguiente forma:
Moda= Media –3(Media –Mediana)
El contraste con lo teórico es la forma empírica de adquirir conocimiento.
BIOESTADÍSTICA – SEMANA 7
MEDIDAS DE POSICIÓN: CUARTILES, PERCENTILES Y DECILES
CUARTIL
· Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
· Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
· Q2 coincide con la mediana
· El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
DECILES
· Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
· Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento académico. En estadística descriptiva, un decil es cualquiera de los nueve valores que dividen a un grupo de datos ordenados en diez partes iguales, de manera que cada parte representa 1/10 de la muestra o población.
PERCENTIL
· Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
· P50 coincide con la mediana.
· Son usadas por los pediatras para para valorar el desarrollo de los niños en función de unos valores de referencia admitidos de antemano como normales para niños de una misma edad, sexo y raza.
· Las tablas se dividen en curvas de crecimiento para niños de 0 a 2 años y de 2 a 14 años y son diferentes para niños y para niñas.

Continuar navegando