Logo Studenta

PROBABILIDAD Y ESTADISTICA BASICA PARA INGENIEROS-99

¡Estudia con miles de materiales!

Vista previa del material en texto

293 
 
 
MATLAB 
 
Análisis de varianza 
 
Definición de la matriz de datos. Cada columna es un tratamiento (compare con el ejemplo) 
 
>> notas=[ 68 80 87 56; 90 73 82 80; 67 68 92 71;85 67 72 91; ... 
 86 49 45 80; 53 67 74 56; 64 63 85 67;71 60 93 53] 
notas = 
 68 80 87 56 
 90 73 82 80 
 67 68 92 71 
 85 67 72 91 
 86 49 45 80 
 53 67 74 56 
 64 63 85 67 
 71 60 93 53 
 
>> [p, tabla, stats] =anova1(notas, {'A','B','C','D'}) Análisis de varianza con rótulos 
p = 
 0.2546 Valor p de la prueba con F 
tabla = 
 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' Tabla ANOVA 
 'Columns' [ 730.5938] [ 3] [243.5313] [1.4314] [0.2546] 
 'Error' [4.7639e+003] [28] [170.1384] [] [] 
 'Total' [5.4945e+003] [31] [] [] [] 
stats = 
 means: [73 65.8750 78.7500 69.2500] Medias de los tratamientos 
 df: 28 Grados de libertad 
 s: 13.0437 Error estándar 
 
Adicionalmente MATLAB muestra la tabla ANOVA en un formato estándar 
 
 
 
MATLAB también proporciona los diagramas de caja de los tratamientos 
 
294 
 
 
11 REGRESIÓN LINEAL SIMPLE 
El propósito de este estudio es proporcionar los conceptos y técnicas para construir modelos 
matemáticos que describan de manera apropiada a un conjunto de datos, cuando la relación es 
de tipo lineal. Estos modelos son útiles para realizar pronósticos. 
 
Este estudio se denomina análisis de regresión y el objetivo es estimar la ecuación de 
regresión la cual es la recta teórica poblacional (desconocida) de la cual provienen los datos. 
 
Suponer que se tiene un conjunto de n mediciones u observaciones (x1, y1), (x2, y2),...,(xn, yn) 
 
Estas observaciones provienen de las variables X y Y. La variable X se denomina variable de 
predicción mientras que la variable Y se denomina variable de respuesta. 
 
Se supondrá que existe una correspondencia de X a Y y el objetivo es modelar esta relación. 
 
Cada valor yi es una observación o el resultado de una medición, por lo tanto pudiesen haber 
otros valores yi para el mismo valor de xi. Esto permite entender que yi es uno de los 
posibles resultados de la variable aleatoria Yi. Una variable aleatoria debe tener una 
distribución de probabilidad. El siguiente gráfico permite visualizar esta suposición: 
 
 
Si la relación entre X y Y tiene “tendencia lineal”, lo cual puede reconocerse graficando los 
puntos en una representación que se denomina gráfico de dispersión, entonces es razonable 
proponer un modelo lineal para describir la relación y que tome en cuenta la aleatoriedad de Y 
 
Definición: Modelo de regresión lineal probabilista (modelo poblacional desconocido) 
 
 Y = β0 + β1 x + ε 
 
En donde β0 y β1 son los parámetros del modelo y ε es el componente aleatorio de Y 
 
Se supondrá que para cada variable aleatoria Yi el componente aleatorio εi tiene la misma 
distribución de probabilidad y que además estos componentes son variables independientes: 
 
 εi ∼ N(0, σ2) (distribución normal con media 0 y varianza desconocida σ2) 
 
Con este planteamiento, el valor esperado de este modelo constituye la recta teórica que 
describe al modelo poblacional desconocido. 
 
 E[Y] = β0 + β1 x 
 
El modelo poblacional teórico tiene dos parámetros β0 (intercepción) y β1 (pendiente) 
Distribución de probabilidad 
de la variable aleatoria Yi 
Un resultado de la 
variable aleatoria Yi 
295 
 
 
 
 
Para comprensión de conceptos se desarrolla paralelamente un ejemplo 
 
 
Ejemplo 
 
Se desea construir un modelo de regresión para relacionar las calificaciones parcial y 
final en cierta materia, utilizando una muestra aleatoria de 10 estudiantes que han 
tomado esta materia: 
 
Estudiante 1 2 3 4 5 6 7 8 9 10 
Nota Parcial 39 43 21 64 57 43 38 75 34 52 
Nota Final 65 75 52 82 92 80 73 98 56 75 
 
Diagrama de dispersión 
 X: calificación parcial 
 Y: calificación final 
 
Se observa que al incrementar x (variable de predicción) también se incrementa y (respuesta) 
con una tendencia aproximadamente lineal 
 
Modelo de regresión lineal poblacional propuesto 
 
 Y = β0 + β1 x + ε, εi ∼ N(0, σ2), para cada Yi 
Modelo Poblacional 
 β0 + β1 x 
	11 REGRESIÓN LINEAL SIMPLE
	11.1 RECTA DE MÍNIMOS CUADRADOS

Continuar navegando