Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
502 ¿Su auto está “Hecho en EE.UU.”? La frase “Hecho en EE.UU.” se ha convertido en grito de batalla en los últimos años porque los trabajadores estadounidenses tratan de proteger sus trabajos contra la competencia extranjera. En el caso práctico del fi nal de este capítulo explo- ramos las cambiantes actitudes de consumidores estadounidenses hacia autos hechos fuera de Es- tados Unidos, usando un sencillo análisis de re- gresión lineal. ENTRENADOR PERSONALMIMI OBJETIVOS GENERALES En este capítulo, consideramos la situación en la que el valor medio de una variable aleatoria y está relacionada con otra variable x. Al medir tanto y como x para cada unidad experimental, con lo cual se generan datos bivaria- dos, se puede usar la información dada por x para estimar el valor promedio de y y para predecir valores de y para valores de x asignados previamente. ÍNDICE DEL CAPÍTULO ● Análisis de varianza para regresión lineal (12.4) ● Análisis de correlación (12.8) ● Herramientas de diagnóstico para verifi car las suposiciones de regresión (12.6) ● Estimación y predicción con uso de la recta ajustada (12.7) ● El método de mínimos cuadrados (12.3) ● Un modelo probabilístico lineal sencillo (12.2) ● Prueba de la utilidad del modelo de regresión lineal: inferencias acerca de b, la prueba F de ANOVA, y r2 (12.5) ¿Cómo estar seguro de que mis cálculos son correctos? Regresión lineal y correlación Probabilidad_Mendenhall_12.indd 502Probabilidad_Mendenhall_12.indd 502 5/17/10 11:35:35 AM5/17/10 11:35:35 AM 12 © /DreamstimeRoza www.FreeLibros.me 12.2 MODELO PROBABILÍSTICO LINEAL SIMPLE ❍ 503 INTRODUCCIÓN Los estudiantes de último año de preparatoria, los de primer año de universidad, sus padres, así como la administración de una universidad están preocupados por el ren- dimiento académico de un estudiante después de haberse inscrito en la universidad. ¿Se puede estimar o predecir el promedio de califi caciones de un estudiante (GPA) al terminar su primer año, antes de inscribirse en la universidad? A primera vista, éste podría ser un problema difícil aunque es de esperarse que los estudiantes altamente motivados, que se hayan graduado con califi caciones altas de una preparatoria, alcancen un alto promedio GPA cuando terminen el primer año. Por otra parte, los estudiantes que carezcan de motivación o que hayan obtenido un éxito sólo parcial en preparatoria no es probable que la hagan bien. Se esperaría que el rendimiento académico de un estudiante sea una función de diversas variables: • Rango en su grupo de preparatoria • Nivel general de preparatoria • Alto promedio GPA • Califi caciones del SAT Este problema es de naturaleza más bien general. Usted estará interesado en una variable aleatoria y (promedio GPA) relacionada con diversas variables independien- tes. El objetivo es crear una ecuación de predicción que exprese y como función de estas variables independientes. A continuación, si se pueden medir las variables inde- pendientes, se pueden sustituir estos valores en la ecuación de predicción y obtener la predicción para y, es decir, el promedio GPA del estudiante en nuestro ejemplo. Pero, ¿cuáles variables deben usarse para hacer la predicción? ¿Qué tan fuerte es su relación con y? ¿Cómo se construye una buena ecuación de predicción para y como función de las variables seleccionadas para la predicción? Contestaremos estas preguntas en los siguientes dos capítulos. En este capítulo, restringimos nuestra atención al sencillo problema de predecir y como función lineal de una sola variable x de pronóstico. Este problema originalmente se abordó en el capítulo 3 en la exposición de datos bivariados. Recuerde que utilizamos la ecuación de una recta para describir la relación entre x y y y describimos la fuerza de la relación usando el coefi ciente de correlación r. Nos apoyaremos en algunos de estos resultados cuando repasemos el tema de regresión y correlación lineales. MODELO PROBABILÍSTICO LINEAL SIMPLE Considere el problema de tratar de predecir el valor de una respuesta y basada en el valor de una variable independiente x. La recta de mejor ajuste del capítulo 3, y � a � bx estuvo basada en una muestra de n observaciones bivariadas tomadas de una población más grande de medidas. La recta que describe la relación entre y y x en la población es semejante a la recta de mejor ajuste de la muestra, pero no es igual. ¿Cómo se puede cons- truir un modelo de población para describir la relación entre una variable aleatoria y y una variable x independiente relacionada? Se empieza por suponer que la variable de interés, y, está linealmente relacionada a una variable independiente x. Para describir la relación lineal, se puede usar el modelo determinista y � a � bx 12.1 12.2 Probabilidad_Mendenhall_12.indd 503Probabilidad_Mendenhall_12.indd 503 5/14/10 8:37:34 AM5/14/10 8:37:34 AM www.FreeLibros.me 504 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN donde a es la intersección con el eje y, es decir, el valor de y cuando x � 0, y b es la pendiente de la recta, defi nida como el cambio en y para un cambio unitario en x, como se muestra en la fi gura 12.1. Este modelo describe una relación determinista entre la variable de interés y, a veces llamada variable de respuesta, y la variable independiente x, denominada variable de pronóstico. Esto es, la ecuación lineal determina un valor exacto de y cuando se da el valor de x. ¿Este modelo es realista para una situación expe- rimental? Considere el siguiente ejemplo. La tabla 12.1 muestra las califi caciones del examen de matemáticas de n � 10 estu- diantes de primer año de universidad, junto con sus califi caciones fi nales en cálculo. Una gráfi ca bivariada de estos puntos y califi caciones se da en la fi gura 12.2. Se puede usar el applet Building a Scatter-plot (Construcción de una gráfi ca de dispersión) como recordatorio de cómo se traza esta gráfi ca. Observe que los puntos no están exactamente sobre una recta sino que más bien parecen ser desviaciones alrededor de una recta fun- damental. Una forma sencilla de modifi car el modelo determinista es agregar un com- ponente aleatorio de error para explicar las desviaciones de los puntos alrededor de la recta. Una respuesta particular y se describe usando el modelo probabilístico y � a � bx � e x y 0 1 2 Cruce con eje y = Pendiente = FIGURA 12.1 Intersección con el eje y y pendiente de una recta ● pendiente � cambio en y para un cambio unitario en x. cruce con eje y � valor de y cuando x � 0. CONSEJOMIMI TABLA 12.1 ● Califi caciones de examen de matemáticas y puntos fi nales en cálculo para estudiantes de primer año de universidad Califi cación de Puntos examen de fi nales en Estudiante matemáticas cálculo 1 39 65 2 43 78 3 21 52 4 64 82 5 57 92 6 47 89 7 28 73 8 75 98 9 34 56 10 52 75 Probabilidad_Mendenhall_12.indd 504Probabilidad_Mendenhall_12.indd 504 5/14/10 8:37:35 AM5/14/10 8:37:35 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.1 Introducción 12.2 Modelo probabilístico lineal simple
Compartir