Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
293 MATLAB Análisis de varianza Definición de la matriz de datos. Cada columna es un tratamiento (compare con el ejemplo) >> notas=[ 68 80 87 56; 90 73 82 80; 67 68 92 71;85 67 72 91; ... 86 49 45 80; 53 67 74 56; 64 63 85 67;71 60 93 53] notas = 68 80 87 56 90 73 82 80 67 68 92 71 85 67 72 91 86 49 45 80 53 67 74 56 64 63 85 67 71 60 93 53 >> [p, tabla, stats] =anova1(notas, {'A','B','C','D'}) Análisis de varianza con rótulos p = 0.2546 Valor p de la prueba con F tabla = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' Tabla ANOVA 'Columns' [ 730.5938] [ 3] [243.5313] [1.4314] [0.2546] 'Error' [4.7639e+003] [28] [170.1384] [] [] 'Total' [5.4945e+003] [31] [] [] [] stats = means: [73 65.8750 78.7500 69.2500] Medias de los tratamientos df: 28 Grados de libertad s: 13.0437 Error estándar Adicionalmente MATLAB muestra la tabla ANOVA en un formato estándar MATLAB también proporciona los diagramas de caja de los tratamientos 294 11 REGRESIÓN LINEAL SIMPLE El propósito de este estudio es proporcionar los conceptos y técnicas para construir modelos matemáticos que describan de manera apropiada a un conjunto de datos, cuando la relación es de tipo lineal. Estos modelos son útiles para realizar pronósticos. Este estudio se denomina análisis de regresión y el objetivo es estimar la ecuación de regresión la cual es la recta teórica poblacional (desconocida) de la cual provienen los datos. Suponer que se tiene un conjunto de n mediciones u observaciones (x1, y1), (x2, y2),...,(xn, yn) Estas observaciones provienen de las variables X y Y. La variable X se denomina variable de predicción mientras que la variable Y se denomina variable de respuesta. Se supondrá que existe una correspondencia de X a Y y el objetivo es modelar esta relación. Cada valor yi es una observación o el resultado de una medición, por lo tanto pudiesen haber otros valores yi para el mismo valor de xi. Esto permite entender que yi es uno de los posibles resultados de la variable aleatoria Yi. Una variable aleatoria debe tener una distribución de probabilidad. El siguiente gráfico permite visualizar esta suposición: Si la relación entre X y Y tiene “tendencia lineal”, lo cual puede reconocerse graficando los puntos en una representación que se denomina gráfico de dispersión, entonces es razonable proponer un modelo lineal para describir la relación y que tome en cuenta la aleatoriedad de Y Definición: Modelo de regresión lineal probabilista (modelo poblacional desconocido) Y = β0 + β1 x + ε En donde β0 y β1 son los parámetros del modelo y ε es el componente aleatorio de Y Se supondrá que para cada variable aleatoria Yi el componente aleatorio εi tiene la misma distribución de probabilidad y que además estos componentes son variables independientes: εi ∼ N(0, σ2) (distribución normal con media 0 y varianza desconocida σ2) Con este planteamiento, el valor esperado de este modelo constituye la recta teórica que describe al modelo poblacional desconocido. E[Y] = β0 + β1 x El modelo poblacional teórico tiene dos parámetros β0 (intercepción) y β1 (pendiente) Distribución de probabilidad de la variable aleatoria Yi Un resultado de la variable aleatoria Yi 295 Para comprensión de conceptos se desarrolla paralelamente un ejemplo Ejemplo Se desea construir un modelo de regresión para relacionar las calificaciones parcial y final en cierta materia, utilizando una muestra aleatoria de 10 estudiantes que han tomado esta materia: Estudiante 1 2 3 4 5 6 7 8 9 10 Nota Parcial 39 43 21 64 57 43 38 75 34 52 Nota Final 65 75 52 82 92 80 73 98 56 75 Diagrama de dispersión X: calificación parcial Y: calificación final Se observa que al incrementar x (variable de predicción) también se incrementa y (respuesta) con una tendencia aproximadamente lineal Modelo de regresión lineal poblacional propuesto Y = β0 + β1 x + ε, εi ∼ N(0, σ2), para cada Yi Modelo Poblacional β0 + β1 x 11 REGRESIÓN LINEAL SIMPLE 11.1 RECTA DE MÍNIMOS CUADRADOS
Compartir