Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
¿Qué es la Estadística? La invasión de la información La primera computadora programable fue inventada en 1947 y tenía la capacidad de almacenar 20 palabras. La invasión de la información “La capacidad de proceso de un chip de silicon se doblará cada 18 meses....” AÑO 1965. Gordon Moore. Co-fundador de INTEL 4 Todo el que toma decisiones debe hacerlo bajo condiciones de incertidumbre, en mayor o menor grado. Con el aumento de la competitividad, la administración de las instituciones requiere tomar decisiones cada vez con una mayor base de conocimiento para así reducir la incertidumbre. 5 El aumento en la eficiencia de los sistemas computacionales en las instituciones ... … ha producido un aumento en la capacidad de almacenar datos. Datos no faltan ... Pero los datos por si solos no sirven … Tanto, que ésta supera ampliamente la capacidad de procesarlos. 6 … si la institución no es capaz de extraer información de ellos. Y con los recursos necesarios, como competencias y experiencia, se puede convertir esta información en conocimiento … … que permite tomar buenas decisiones estratégicas, tácticas y operativas. 7 Las etapa de producción de datos y de extracción de información, requiere de métodos, técnicas y herramientas de análisis. El desarrollo de estos métodos, técnicas y herramientas se encuentra en una ciencia que se llama ESTADISTICA. 8 CONOCIMIENTO RECURSOS INTELECTUALES INFORMACION ESTADISTICA ESTADISTICA DATOS El ciclo de la producción de conocimiento. 9 CONOCIMIENTO RECURSOS INTELECTUALES INFORMACION ESTADISTICA ESTADISTICA DATOS El ciclo de la producción de conocimiento. Requerimientos de más información ¿Qué es la estadística? Diccionario de la Real Academia Española: 1. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas. 2. Conjunto de estos datos. 3. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. ¿Qué es la estadística? “Medio para recolectar y representar grandes cantidades de información” “Medio para tomar decisiones de frente a la incertidumbre” ¿Qué es la estadística? • Ciencia de recolectar, describir e interpretar datos Utilizaremos la palabra estadístico/a con cuatro significados diferentes que, según el contexto, será fácil distinguir: 1. La estadística como disciplina de estudio. Siempre estará en singular. 2. La estadística o las estadísticas como resultados que presentan organismos de estadística oficiales como, por ejemplo el INEGI 3. Un estadístico como un procedimiento para obtener un número a partir de valores de una encuesta. 4. Un estadístico o una estadística como una persona que tiene a la estadística como profesión. ¿Qué estudia la Estadística? La Estadística es la rama de la Matemática que se ocupa de recopilar datos (en censos, encuestas, etc), de organizarlos para una mejor desea comprensión del fenómeno estudiar y de analizarlos que se con un determinado objetivo. La estadística se aplica a todas las ciencias, pues facilita el estudio de hechos del mundo o de la sociedad. Ciencia que estudia La recolección El análisis Y la interpretación de datos ayuda Toma de decisiones Aplicaciones de la Estadística Obtener una muestra. Resumir datos. Haciendo inferencias de una población, basado en los resultados de la muestra. Obteniendo un modelo más simple para un grupo de datos. Se la utiliza todos los días: • Para justificar apuestas sobre el resultado de un partido de fútbol los simpatizantes comparan los rendimientos de los equipos utilizando, por ejemplo, los porcentajes de partidos ganados como local y como visitante. • Durante la transmisión de un partido de tenis por televisión, los relatores cuentan la cantidad de tiros ganadores, puntos de quiebre aprovechados, errores no forzados, saques ganadores. • Para diseñar pautas publicitarias, los publicistas consultan la planilla diaria de ratings (radio o televisión). • En un mercado los consumidores observan cómo se distribuyen los precios entre los distintos puestos para realizar la mejor compra que combine calidad y precio. • Para decidir qué alumna/o será abanderada/o de la escuela, el/la directora/a compara las notas de todos los alumnos del último año y elige el mejor promedio. Ejemplo: Se hizo una encuesta a 8976 personas, de las cuales 8707 respondieron que calman su dolor de cabeza tomando una aspirina. Si la encuesta está bien hecha, este dato puede ser utilizado por los médicos, quienes podrían afirmar que si un paciente sufre de dolor de cabeza, tiene un 97 % de probabilidad de calmarla tomando una aspirina. La necesitan: • Los profesionales de la salud, para entender los resultados de las investigaciones médicas. • Los economistas, porque cálculos eficientes les permitirán llegar al fondo de la cuestión que analizan. • Los docentes cuando se enfrentan al problema de evaluar el rendimiento de los alumnos. • Los sociólogos para diseñar y procesar sus encuestas. • Los responsables de la calidad en un proceso productivo, al detectar las piezas defectuosas y controlar los factores que influyen en la producción de las mismas. • La industria farmacéutica para desarrollar nuevos medicamentos y establecer las dosis terapéuticas. • Los ciudadanos, para sacar sus propias conclusiones sobre los resultados de las encuestas políticas, los índices de precios y desocupación, y los resultados estadísticos que habitualmente se presentan en los medios masivos de comunicación (diarios, revistas, radio, televisión). Muchas veces, las noticias surgen luego de varias etapas de elaboración. Sus primeros protagonistas son encuestadores, investigadores de mercado, médicos, técnicos gubernamentales y científicos de universidades o institutos. Ellos son la fuente original de la información estadística; publican sus resultados en revistas especializadas o en comunicados de prensa. A partir de allí, entra en juego el segundo grupo: los periodistas, que pueden estar más apurados, a la caza de resultados que les permitan obtener un titular. Finalmente, hay un tercer grupo: el de los consumidores de la información, o sea todos nosotros. Estamos frente al desafío de escuchar, leer, ver y decidir respecto a ella. Los métodos estadísticos forman parte de cada paso de una buena investigación, desde el diseño del estudio, la recolección de los datos, la organización y el resumen de la información, el análisis, la elaboración de las conclusiones, la discusión de las limitaciones y, por último, el diseño de un próximo estudio a fin de dar respuesta a las nuevas preguntas que pudieran surgir. En cualquiera de las etapas de este proceso puede haber errores. Pueden, o no, ser intencionales. Es posible mentir con estadísticas, pero es mucho más fácil mentir sin estadísticas. Cuando se empieza un estudio estadístico tenemos que tener en cuenta. ¿Qué queremos estudiar? ¿De quién queremos la información? ¿Cómo obtenemos los datos? Ética en la estadística Usos ilegítimos de la estadística ◦ Comparar datos que no siempre son comparables ◦ Derivar conclusiones de datos no representativos ◦ Esconder parte de las evidencias ◦ Manipular representaciones gráficas ◦ Confundir asociación con causalidad ◦ Derivar conclusiones que no pueden sostenerse con la evidencia disponible ◦ Medir cambio a partir de bases inadecuadas ◦ Interpretaciones acomodaticias Ética en la estadística Continuación de usos ilegítimos de la estadística ◦ Buenas matemáticas y malas estadísticas ◦ Gráficas engañosas ◦ Información insuficiente ◦ Muestras pequeñas ◦ Confundir estimaciones con conjeturas ◦ Uso de por cientos en forma distorsionada ◦ Datos parciales ◦ Distorsiones deliberadas ◦ Preguntas predispuestas ◦ Presión del encuestador Factores que pueden afectar laética Sesgo (“bias”) en selección de la muestra Exclusión individuos que puedan responder preguntas específicas Presentación de resultados sin dar tamaño de muestra ni el margen de error Preguntas sesgadas Entrevistador con actitudes y tono de voz deliberado que promueve respuestas en cierta dirección Persona que responde a encuesta puede proveer información falsa a propósito Estadística Descriptiva Rama de la estadística que se encarga de describir un conjunto de datos recopilados en una muestra. Se realizan los siguientes procesos en una muestra: ◦ Recopilación de datos ◦ Organización y tabulación de los datos recopilados ◦ Presentación de los datos en tablas y gráficas (Ayuda a resumir e interpretar los datos) ◦ Análisis estadístico (Aplicación de medidas estadísticas tales como: Tendencia Central, Posición, Variación) ◦ Interpretación del análisis estadístico ESTADÍSTICA DESCRIPTIVA Se dedica a: Analizar Presentar datos . Este análisis es básico Los datos se generalizan En las primeras conclusiones de un estudio descriptivo, se calcula una serie de medidas Para ver si Valor central Se dispersaSe junta Estadística Inferencial Es la rama de la estadística que utiliza información obtenida del estudio de una muestra para hacer inferencias sobre la población. Comprende la aplicación de una serie de técnicas estadísticas especializadas que permiten inferir las características de la población. INFERENCIA ESTADÍSTICA Comprende Métodos ProcedimientosPara deducir propiedades A partir de una Pequeña muestra Teoría de Muestra Estimación de Parámetros Contraste de Hipótesis Diseño Experimental Métodos no Paramétricos ESTADÍSTICA INFERENCIAL: ¿Cómo surge? CIENCIAS FORMALES: No necesitan contacto con el mundo real (MATEMÁTICAS) CIENCIAS EMPÍRICAS: • Necesitan observar el mundo real • Exige trabajar con muestras • Las diferencias existentes entre las observaciones (muestras) incorporan incertidumbre y el cálculo probabilístico • En las ciencias empíricas deterministas (una misma causa siempre produce un mismo resultado): FÍSICA • En las ciencias empíricas aleatorias (una misma causa no siempre produce un mismo resultado): ECONOMÍA, SOCIOLOGÍA, ETC… ANÁLISIS ESTADÍSTICO POBLACIÓN ESTADÍSTICA Es la cantidad de: Elementos Sujetos Componen Una población Pobladores de Oriente Pobladores de tierra firme Tipos de población MUESTRA ESTADÍSTICA Es un subconjunto de casos o individuos de una población Inferir propiedades representativas de la población Técnica de muestreo El numero de sujetos es menor que la población El conjunto de la muestra es realmente estudiado El conjunto debe ser suficiente para la estimación Para que la muestra sea idónea hay que recurrir al calculo En relación PARAMETRO ESTADÍSTICO (valor calculado) (medida, varianza, proporción) ESPACIO MUESTRAL (Posibles muestras extraídas) ESTIMACIÓN (Técnica para elvalor aproximado) NIVEL DE CONFIANZA (Medida a partir de las muestras) Ventajas: •Si la población es grande,se puede analizar Reducción de costos Rapidez Viabilidad Evita recursos como ( muestras sanguíneas) MUESTREO ESTADÍSTICO TÉCNICAPARA SELECCIÓN DE MUESTRA HERRAMIENTA DE INVESTIGACIÓN CIENTÍFICA PROCEDIMIENTO PARA OBTENER UNA O MAS MUESTRAS SE BASA EN EQUIPROBABILIDAD SE EXTRAE DOS O MÁS MUESTRAS DETERMINAQUE PARTE DEBE EXAMINARSE UNA VEZ ESTABLECIDO EL MARCO MUESTRAL SE SELECCIONALA TODOS LOS INDIVIDUOS TIENEN LA MISMA MUESTRA PROBABILIDAD TECNICA DE SELECCIÓN DE MUESTREO ( Simple ó Aleatoria) MUESTREO ESTRATIFICADO (División previa de la población) MUESTREO PROBABILÍSTICO (Métodos para calcular la probabilidad) MUESTREO SISTEMÁTICO (selección de elementos por orden) MUESTREO POR CONGLOMERADOS (Población dividida naturalmente) (Se eligen algunos grupos) MUESTREO ERRÁTICO (La muestra se realiza de cualquier forma) CENSO ESTADÍSTICO • Consiste En el recuento total de una población. • No trabaja sobre muestra, sino en población total. • Se realiza cada diez años. • Se considera una técnica, que usa como instrumento la cedula. Tipos de censo DE DERECHO O DE IURE DE HECHO O DE FACTO Implica el empadronamiento de toda la población presente en el territorio en estudio Implica el empadronamiento de toda la población residente en el territorio en estudio. (presentes ó ausentes) VARIABLE CARACTERÍSTICA SENSIBLE A ADOPTAR DIRFERENTES VALORES Tipos de Variables Según la medición Otras Según la influencia VARIABLES Según Medición CUALITATIVAS CUANTITATIVAS Expresan distintas cualidades o características Son variables que se expresan mediante cantidades numéricas • CUALITATIVA ORDINAL: Puede tomar distintos valores Ejemplo: ( leve, moderado , grave). • CUALITATIVA NOMINAL: En esta variable los valores no se someten a un orden. Ejemplo: ( los colores, lugar de residencia) •VARIABLE DISCRETA: Presenta separaciones o interrupciones en la escala de valores que puede tomar. Ejemplo: ( el numero de hijos, 1, 2, 3, 5) VARIABLE CONTINUA: Puede adquirir cualquier valor en la escala de valores Ejemplo: masa ( 2.3 kg, 4.3kg) ó altura ( 6.4m, 5.2m) VARIABLES Según la influencia INDEPENDIENTES DEPENDIENTES •Son un tipo de variable de control. •Modifican las variables independientes. •Son el fenómeno que se estudia y que el investigador manipula. •Son las variables de respuesta, que se observan en el estudio. •Determina el efecto de la variable independiente VARIABLES Otras variables INTERVINIENTE MODERADORA •Son las que de alguna manera afectan el resultado esperado. •Están vinculadas con las variables independientes y dependientes •Representan un tipo especial de variable independiente. •Se selecciona para determinar si afecta la relación entre variable independiente y dependiente Tipos de Escalas de la Variable Cada nivel próximo en la escala, presupone las mismas características del nivel anterior más otras que se añaden en ese nivel. Escalas de una Variable Nominal Ordinal Intervalo Razón Tipos de Escalas Nominal- Se agrupan los datos solamente en clases o categorías que son mutuamente excluyentes y no tienen un orden en particular. Ej. Variables categóricas tales como: género, religión, partido político Tipos de Escalas Ordinal- Se agrupan los datos en categorías que tiene un orden específico pero no se puede diferenciar entre sí la magnitud o el alcance de los valores de las distintas categorías. Ej. Variables categóricas tales como: clase social, minerales de acuerdo a tipo de resistencia (mucha, regular o poca), grado de agresividad (mucha, poca, ninguna) Tipos de Escalas Intervalo- Se agrupan los datos en categorías que representan un orden específico y además ese orden implica un intervalo específico de diferencias entre las distintas categorías que es igual para todas las categorías. El valor 0 es un valor más, no implica ausencia de la característica. Ej.- Variables cuantitativas tales como: temperatura, cociente intelectual Tipos de Escalas Razón- Se agrupan los datos en categorías que representan un orden específico en el cual las diferencias entre las distintas categorías son iguales para todas las categorías y además el 0 implica la ausencia de la característica. Ej. Variables cuantitativas contínuas- peso, estatura, edad DATOS DE SECCIÓN TRANSVERSAL Y DE SERIES DE TIEMPO Para los propósitos del análisis la distinción entre datos transversales y datos de series de tiempo es importante. Datos de sección transversal son los obtenidos en el mismo o aproximadamente el mismo momento (punto en el tiempo) Los datos de series de tiempo son datos obtenidos a lo largo de varios periodos.En las publicaciones sobre negocios y economía se encuentran con frecuencia gráficos de series de tiempo. Estas gráficas ayudan a los analistas a entender lo que ocurrió en el pasado, a identificar cualquier tendencia en el transcurso del tiempo y a proyectar niveles futuros para la series de tiempo. Estas gráficas suelen ser fáciles de entender y de interpretar. Fuentes de datos Las fuentes de información: primarias y secundarias. 1- Fuentes Primarias: Se obtiene información por contacto directo con el sujeto de estudio; por medio de observación, cuestionarios, entrevistas, etc. 2- Fuentes Secundarias: Información obtenida desde documentos; historia clínica, ficha académica, estadísticas, datos epidemiológicos, Censo, encuestas nacionales, etc. Software estadístico La potencia de cálculo de un ordenador puede ayudar a un investigador a realizarcientos o miles de contrastes de hipótesis en un tiempo muy reducido. Ventajas Inconvenientes complejos se necesita conocimientos En los programas más tener de programación, así como para realizar los cálculos más laboriosos. Módulos del SAS: SAS 9.4 SAS /STAT SAS Analytics Pro SAS Curriculum Pathways SAS Data Management SAS Enterprise Miner SAS Marketing Optimization SAS University Edition SAS Visual Analytics SAS Visual Statistics Foundation Tools SAS (Statistical Analysis System) Módulos del SPSS: Modelos de regresión Modelos avanzados Tablas Tendencias Categorías Análisis conjunto Mapas Pruebas exactas Análisis de valores perdidos Muestras complejas Sample power Arboles de clasificacion Validacion de datos SPSS programmability extension SPSS (Statistical Package for the Social Sciences) Es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecución de análisis estadísticos. Minitab 17 Quality trainer Devize Qeystone Quality companion 3 Minitab Es utilizado principalmente por instituciones académicas y dedicadas a la investigación, empresariales especialmente en economía, sociología, ciencias políticas, biomedicina y epidemiología. Stata permite, entre otras gestión de datos, el análisis estadístico, funcionalidades, la el trazado de gráficos y las simulaciones. Stata Statgraphics es un paquete de estadísticas que realiza y explica funcionesbásicos y avanzados de estadística. Statgraphics centurion Statgraphics sigma expresa Statgraphics stratus Statgraphics servicios web Statbeans Statgraphics PSPP es una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C. Usa científica rutinas matemáticas, plotutils para la biblioteca GNU para sus y la generación de gráficos. Es un reemplazo libre para el software propietario SPSS. PSPP Microsoft Excel es una aplicación distribuida por Microsoft Office para hojas de cálculo. Este programa es desarrollado y distribuido por Microsoft, y es utilizado normalmente en tareas financieras y contable. Excel Es una herramienta de software matemático que ofrece un entorno de desarrollo integrado (IDE) con un lenguaje de programación propio. Entre sus prestaciones básicas se hallan: la manipulación de matrices, la representación de datos y funciones, la implementación de algoritmos, la creación de interfaces de usuario (GUI) y la comunicación con programas en otros lenguajes y con otros dispositivos hardware. Matlab Es un programa usado en análisis de ecuaciones estructurales. LISREL está principalmente basado en comandos, aunque las versiones más recientes han incorporado una interfaz gráfica. LISREL (linear structural relations) InfoStat es un software para análisis estadístico de aplicación general desarrollado bajo la plataforma Windows. Cubre tanto las necesidades elementales para la obtención de estadísticas descriptivas y gráficos para el análisis exploratorio, como métodos avanzados de modelación estadística y análisis multivariado. Una de sus fortalezas es la sencillez de su interfaz combinada con capacidades profesionales para el análisis estadístico y el manejo de datos. InfoStat Términos Básicos • Población • Muestra • Variable • Dato • Datos • Experimento • Parámetros • Estadística Población • Es la colección o conjunto de individuos, objetos o eventos cuyas propiedades serán analizadas. Ejemplo de población bien definida • “Todos los estudiantes que han asistido alguna vez a una universidad mexicana” • “El conjunto de trabajadores de la industria entre 20 y 40 años en el Estado de Querétaro” Muestra • Es un subconjunto de la población Una muestra consta de los individuos, objetos o medidas seleccionados de la población por el recolector de la muestra Variable • Característica de interés sobre cada elemento individual de una población o muestra • Ejemplo: La edad de un estudiante que ingresa a la universidad, el color de su cabello, su estatura y su peso Dato • Valor de la variable asociada a un elemento de una población o muestra. Este valor puede ser un número, una palabra o un símbolo • Ejemplo: José Hernández ingresó a la universidad a la edad de “23” años, su cabello es “café”, mide “1.80m” y pesa “83 kg”. Estas cuatro piezas de datos son los valores de las cuatro variables aplicadas a José Hernández. Datos • Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la muestra • Ejemplo: El conjunto de 25 estaturas recolectadas de 25 estudiantes. Experimento • Actividad planeada cuyos resultados producen un conjunto de datos • El experimento incluye las actividades para seleccionar los elementos y obtener los valores de los datos Parámetro • Valor numérico que resume todos los datos de una población completa. Es un valor que describe a toda la población. • Ejemplo: La edad “promedio” en el momento de admisión de todos los estudiantes que han asistido alguna vez a una universidad o la “proporción” de estudiantes que tenían más de 21 años de edad cuando ingresaron a la universidad. Estadística • Valor numérico que resume los datos de la muestra. Es un valor que describe una muestra. Casi todas las estadísticas muestrales se determinan con ayuda de fórmulas y suele asignárseles denominaciones simbólicas. • Ejemplo: La estatura “promedio” encontrada al utilizar el conjunto de 25 estaturas es un ejemplo de una estadística muestral. Determinar los términos básicos... • Una estudiante de estadística está interesada en determinar algo sobre el promedio del valor en pesos de los automóviles que pertenecen al cuerpo docente de nuestra universidad. • Cada uno de los ocho términos descritos pueden identificarse en esta situación Determinar los términos básicos... • La población es la colección de todos los automóviles que pertenecen a todos los miembros del cuerpo docente de la universidad. • Una muestra es cualquier subconjunto de esa población. Por ejemplo, una muestra serían los automóviles que pertenecen a los profesores del departamento de matemáticas. • La variable es el “valor en pesos” de cada automóvil individual. • Un dato podría ser el valor en pesos de un automóvil en particular. El automóvil del profesor Juan Pérez está valuado en $100,000 pesos • Los datos serían el conjunto de valores que corresponden a la muestra obtenida ($100,000; $148,000; $30,000; $23,000...) • El experimento serían los métodos aplicados para seleccionar los automóviles que integren la muestra y determinar el valor de cada automóvil de la muestra. Podría efectuarse preguntando a cada miembro del departamento de matemáticas o de otras maneras. • El parámetro sobre el que se está buscando información es el valor “promedio” de todos los automóviles de la población. • La estadística que seencuentre es el valor “promedio” de todos los automóviles de la muestra. Variable Cualitativa Cuantitativa Variable que clasifica o describe un elemento de una población. Las operaciones aritméticas como sumar y obtener promedios no son significativas para datos que resultan de una variable cualitativa Variable que cuantifica un elemento de una población. Las operaciones aritméticas como sumar y obtener promedios sí son significativas para datos que resultan de una variable cuantitativa Ejercicio 1 • Un fabricante de medicamentos está interesado en la proporción de personas que padecen hipertensión (presión arterial elevada) cuya condición pueda ser controlada por un nuevo producto desarrollado por la empresa. Se condujo un estudio en el que participaron 5000 personas que padecen de hipertensión, y se encontró que 80% de las personas pueden controlar su hipertensión con el medicamento. Suponiendo que las cinco mil personas son representativas del grupo con hipertensión, conteste las siguientes preguntas: a) ¿Cuál es la población? b) ¿Cuál es la muestra? c) Identifique el parámetro de interés d) Identifique la estadística y proporcione su valor e) ¿Se conoce el valor del parámetro? Ejercicio 2 • Un técnico de control de calidad selecciona piezas ensambladas de una línea de montaje y registra la siguiente información sobre cada pieza: – A: defectuosa o no defectuosa – B: el número de identificación del trabajador que ensambló la pieza. – C: el peso de la pieza. a) ¿cuál es la población? b) La población ¿es finita o infinita? c) ¿cuál es la muestra? d) Clasifique las respuestas para cada una de las tres variables como datos de atributo o cuantitativos. Ejercicio 3 • Identifique las siguientes expresiones como ejemplos de variables de atributos (cualitativas) o variables numéricas (cuantitativas) a) La resistencia a la rotura de un tipo de cuerda dado b) El color de cabello de los niños que se presentan a una audición para la revista musical Annie c) El número de señales de alto que hay en poblaciones con menos de quinientos habitantes d) Si un grifo es o no defectuoso e) El número de reactivos contestados correctamente en una prueba estandarizada f) El tiempo necesario para contestar una llamada telefónica en cierta oficina de bienes raíces.
Compartir