Logo Studenta

Distribuição Conjunta de Variáveis

¡Este material tiene más páginas!

Vista previa del material en texto

1 
 
 
 
 
 
 
 
 
 
 
Distribución Conjunta de 
Dos Variables 
— 
 
 
© Asturias Corporación Universitaria 
 
 
 
 Distribución Conjunta de Dos Variables 
 
02 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Índice 
 
1 Introducción ............................................................................................................................................................ 3 
2 Distribuciones Marginales .............................................................................................................................. 3 
3 Distribuciones Condicionadas ...................................................................................................................... 4 
4 Términos Relacionados para Tablas de Doble Entrada................................................................ 5 
4.1 Frecuencia Absoluta ............................................................................................................................. 5 
4.2 Frecuencia Relativa ............................................................................................................................... 5 
4.3 Frecuencia Absoluta Acumulada .................................................................................................. 5 
4.4 Frecuencia Relativa Acumulada .................................................................................................... 5 
5 Independencia..................................................................................................................................................... 11 
6 Medidas de Dependencia............................................................................................................................. 12 
7 Resumen ................................................................................................................................................................. 12 
8 Referencias Bibliográficas ............................................................................................................................ 12 
 
 
 
 Distribución Conjunta de Dos Variables 
 
03 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Objetivos 
 Objetivo: Conocer las distintas distribuciones y medidas de dependencia e 
independencia existentes en estadística. 
1 Introducción 
Cuando el investigador está interesado en el estudio de dos variables de una población, 
se obtienen dos observaciones para cada individuo, que se recogen en forma de pares 
de valores, que deben ser organizados en función de la naturaleza de dichas variables. 
Al igual que en el caso unidimensional, es interesante organizar los datos en forma de 
tabla de frecuencias, sin embargo, al tener que especificar los valores que toman 
ambos caracteres, la tabla debe ser de doble entrada o bidimensional como sigue: 
 
𝑋, 𝑌 𝑦1 ⋯ 𝑦𝑗 ⋯ 𝑦𝑠 
𝑥1 𝑛11 ⋯ 𝑛1𝑗 ⋯ 𝑛1𝑠 
⋮ ⋮ ⋱ ⋮ ⋱ ⋮ 
 𝑥𝑖 𝑛𝑖1 ⋯ 𝑛𝑖𝑗 ⋯ 𝑛𝑖𝑠 
⋮ ⋮ ⋱ ⋮ ⋱ ⋮ 
𝑥𝑟 𝑛𝑟1 ⋯ 𝑛𝑟𝑗 ⋯ 𝑛𝑟𝑠 
 
Tabla 1: Distribuciones conjuntas y marginales de (𝑋, 𝑌 ) 
Esta distribución se denomina distribución conjunta de (𝑋, 𝑌). 
2 Distribuciones Marginales 
En la tabla anterior se pueden sumar las frecuencias que aparecen en cada una de las 
filas y columnas, colocándose los resultados en los márgenes, como sigue: 
 
 Distribución Conjunta de Dos Variables 
 
04 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
 
𝑋, 𝑌 𝑦1 ⋯ 𝑦𝑗 ⋯ 𝑦𝑠 
𝑥1 𝑛11 ⋯ 𝑛1𝑗 ⋯ 𝑛1𝑠 𝑛1. 
⋮ ⋮ ⋱ ⋮ ⋱ ⋮ ⋮ 
 𝑥𝑖 𝑛𝑖1 ⋯ 𝑛𝑖𝑗 ⋯ 𝑛𝑖𝑠 𝑛𝑖. 
⋮ ⋮ ⋱ ⋮ ⋱ ⋮ ⋮ 
𝑥𝑟 𝑛𝑟1 ⋯ 𝑛𝑟𝑗 ⋯ 𝑛𝑟𝑠 𝑛𝑟. 
 𝑛.1 ⋯ 𝑛.𝑗 ⋯ 𝑛.𝑠 𝑛 
Tabla 2: Distribuciones marginales. 
Donde: 
𝒏.𝒋 = ∑ 𝒏𝒊𝒋
𝒓
𝒊=𝟏
 
 
𝒏𝒊. = ∑ 𝒏𝒊𝒋
𝒔
𝒋=𝟏
 
 
𝒏 = 𝒏.. = ∑ ∑ 𝒏
𝒔
𝒋=𝟏 𝒊𝒋
𝒓
𝒊=𝟏
 
 
De tal forma que, la primera y última columna de la tabla, constituyen la distribución 
marginal de 𝑋, y la primera y última fila la distribución marginal de 𝑌. 
3 Distribuciones Condicionadas 
Cuando se posee información previa de una de las variables en estudio, ésta puede 
modificar la información disponible de la otra. En particular, cuando se considera la 
distribución de una variable para un valor fijo de la otra, se obtiene la distribución 
condicionada. Más concretamente, las frecuencias condicionadas son: 
 
𝑓𝑖|𝑗
=
𝑛𝑖𝑗
𝑛.𝑗
, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖 = 1,2, … , 𝑟 
 
𝑓𝑗|𝑖
=
𝑛𝑖𝑗
𝑛.𝑖
, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑗 = 1,2, … , 𝑠 
“Distribuciones condicionadas: cuando se 
considera la distribución de una variable 
para un valor fijo de la otra” 
 
 Distribución Conjunta de Dos Variables 
 
05 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Que son, respectivamente, la condicionada de 𝑋 para el valor 𝑦𝑗 de 𝑌, para 𝑗 = 1, 2,· · · , 𝑠, 
y la condicionada de 𝑌 para el valor 𝑥𝑖 de 𝑋, para 𝑖 = 1, 2,· · · , 𝑟”1. 
4 Términos Relacionados para Tablas de Doble Entrada 
4.1 Frecuencia Absoluta 
Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 
𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia absoluta del par (𝑥𝑖 , 𝑦𝑗), denotada por 𝑛𝑖𝑗, como el 
número de veces que se observa dicho par de valores. 
Observaciones 
1. Se verifica que ∑ ∑ 𝑛𝑖𝑗
𝑠
𝑗=1
𝑟
𝑖=1 = 𝑛. 
2. Si la distribución es de atributos, la tabla se llama de contingencia. 
3. Si la distribución es de variables se denomina de correlación. 
4.2 Frecuencia Relativa 
Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 
𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia relativa del par (𝑥𝑖 , 𝑦𝑗), denotada por ℎ𝑖𝑗, como el 
cociente entre las frecuencias absolutas y el 
tamaño de la muestra. Así, las frecuencias relativas vienen dadas por: 
ℎ𝑖𝑗 =
𝑛𝑖𝑗
𝑛
 frecuencia relativa 
ℎ𝑖. =
𝑛𝑖.
𝑛
 frecuencia relativa de la marginal de 𝑋 
ℎ.𝑗 =
𝑛.𝑗
𝑛
 frecuencia relativa de la marginal de 𝑌 
4.3 Frecuencia Absoluta Acumulada 
Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 
𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia absoluta acumulada del par (𝑥𝑖 , 𝑦𝑗), denotada por 𝑁𝑖𝑗, 
como el número cuya característica 𝑋 es menor o igual que 𝑥, y su característica 𝑌 es 
menor o igual que 𝑦. 
4.4 Frecuencia Relativa Acumulada 
Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 
𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia relativa acumulada del par (𝑥𝑖 , 𝑦𝑗), denotada por 𝐻𝑖𝑗, 
como el número del cociente relativo cuya característica 𝑋 es menor o igual que 𝑥, y su 
característica 𝑌 es menor o igual que 𝑦. 
 
1 Espejo Miranda, I., Fernández Palacín, F., López Sánchez, M., Muñoz Márquez, M., Rodríguez Chía, A. S., 
& Valero Franco, C. (2006). Estadística Descriptiva y Probabilidad. Cádiz: Servicio de Publicaciones de la 
Universidad de Cádiz.p.53-56 
“Frecuencia Absoluta Acumulada: el nº cuya 
característica X es menor o igual que x, y su 
característica Y es menor o igual que y” 
“Frecuencia Relativa Acumulada: el nº del 
cociente cuya característica X es menor o 
igual que x, y su característica Y es menor o 
igual que y”Distribución Conjunta de Dos Variables 
 
06 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Ejemplo 1: De cierta población en estudio una muestra de 50 familias fue extraída con el 
propósito de observar las variables: número de personas que conforman la familia (𝑋) y 
número de personas que producen algún tipo de ingreso (𝑌). Los datos recolectados 
fueron los siguientes: 
(6,1) (1,1) (2,1) (4,2) (6,1) (1,1) (3,1) (4,2) (5,2) (5,1) (5,4) (6,1) (2,1) (3,2) (4,3) (6,2) (2,1) (3,2) (4,2) 
(3,2) (4,2) (4,3) (3,3) (4,3) (4,4) (4,4) (4,4) (4,2) (2,1) (6,2) (6,3) (4,4) (2,1) (5,1) (5,5) (4,4) (3,2) (2,2) 
(6,4) (6,5) (6,4) (6,2) (6,3) (6,2) (6,2) (5,2) (5,4) (5,1) (6,4) (5,4) 
Así la distribución conjunta de (𝑋, 𝑌) y sus respectivas marginales vendrían dadas por 
(𝑋, 𝑌) 1 2 3 4 5 
1 2 0 0 0 0 2 
2 4 1 0 0 0 5 
3 2 4 1 0 0 7 
4 0 5 3 5 0 13 
5 3 2 0 4 1 10 
6 3 5 2 2 1 13 
 14 17 6 11 2 50 
Tabla 3: Ejemplo 1, Distribución conjunta y marginales. 
Es de notar, que a pesar de que se puede perfectamente organizar la información, se 
pierde precisión en el resumen de ésta. Efectivamente, utilizando la tabla de doble 
entrada lo único que se puede decir, por ejemplo, es que: 
 Existen 5 familias que tienen 6 personas en el hogar, de las cuales 2 de ellas 
producen algún tipo de ingreso. 
 De las marginales de 𝑋 se tiene por ejemplo: que hay 13 familias con 4 personas 
en el hogar 
 De las marginales de 𝑌 se tiene por ejemplo: Hay 17 familias en las cuales solo 2 
personas producen algún tipo de ingreso. 
 
 Distribución Conjunta de Dos Variables 
 
07 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Ahora la distribución conjunta de frecuencias relativas viene dada por 
 
(𝑋, 𝑌) 1 2 3 4 5 
1 0.04 0.00 0.00 0.00 0.00 0.04 
2 0.08 0,02 0.00 0.00 0.00 0.10 
3 0.04 0.08 0.02 0.00 0.00 0.14 
4 0.00 0.10 0.06 0.10 0.00 0.26 
5 0.06 0.04 0.00 0.08 0.02 0.20 
6 0.06 0.10 0.04 0.04 0.02 0.26 
 0.28 0.34 0.12 0.22 0.04 1 
Tabla 4: Distribución conjunta de frecuencias relativas. 
Así por ejemplo, es fácil ver en términos porcentuales que: 
1. Que el 2% de la familias observadas tienen 3 miembros y todos 3 producen 
ingresos 
2. Que el 34% de las familias tienen 2 personas que producen ingresos. 
La distribución conjunta de frecuencias absolutas acumuladas viene dada por 
 
(𝑋, 𝑌) 1 2 3 4 5 
1 2 2 2 2 2 
2 6 7 7 7 7 
3 8 13 14 14 14 
4 8 18 22 27 27 
5 11 23 37 36 37 
6 14 31 37 48 50 
Tabla 5: Distribución conjunta de frecuencias absolutas acumuladas. 
 
 Distribución Conjunta de Dos Variables 
 
08 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
La distribución conjunta de frecuencias relativas acumuladas viene dada por 
 
(𝑋, 𝑌) 1 2 3 4 5 
1 0.04 0.04 0.04 0.04 0.04 
2 0.12 0.14 0.14 0.14 0.14 
3 0.16 0.26 0.28 0.28 0.28 
4 0.16 0.36 0.44 0.54 0.54 
5 0.22 0.46 0.54 0.72 0.74 
6 0.28 0.62 0.74 0.96 1 
Tabla 6: Frecuencias relativas acumuladas. 
 
 Distribución Conjunta de Dos Variables 
 
09 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Ejemplo 2: Ahora veamos un caso donde ambas variables son de tipo continuo, así con 
las siguientes tablas dadas construimos la distribución conjunta de (𝑋, 𝑌) 
𝑦𝑖 𝐿𝑖 𝐿𝑠 𝑛𝑖 
1 6.15 8.75 7 
2 8.75 11.35 8 
3 11.35 13.95 9 
4 13.95 16.55 2 
5 16.55 19.15 2 
6 19.15 21.75 2 
 
𝑥𝑖 𝐿𝑖 𝐿𝑠 𝑛𝑖 
1 5.55 7.15 4 
2 7.15 8.75 6 
3 8.75 10.35 11 
4 10.35 11.95 2 
5 11.95 13.55 5 
6 13.55 15.15 2 
 
 
 Distribución Conjunta de Dos Variables 
 
010 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
 
 
Luego la tabla de frecuencias absolutas de la distribución conjunta es: 
 
 
 
 
 
 
 
 
 
 
 
 
 
Así, la tabla de frecuencias relativas de la distribución conjunta es: 
(𝒀|𝑿) 
[𝟔. 𝟏𝟓, −𝟖. 𝟕𝟓) 
[𝟖. 𝟕𝟓 − 𝟏𝟏. 𝟑𝟓) 
[𝟏𝟏. 𝟑𝟓 − 𝟏𝟑. 𝟗𝟓) 
[𝟏𝟑. 𝟗𝟓 − 𝟏𝟔. 𝟓𝟓) 
[𝟏𝟔. 𝟓𝟓 − 𝟏𝟗. 𝟏𝟓) 
[𝟏𝟗. 𝟏𝟓 − 𝟐𝟏. 𝟕𝟓) 
[5.55
− 7.15) 
[7.15
− 8.75) 
[8.75
− 10.35) 
[10.35
− 11.95) 
[11.95
− 13.55) 
[13.55
− 15.15) 
0 1 5 0 0 1 
2 4 0 0 2 0 
2 1 3 0 2 
0 0 1 0 1 0 
0 0 2 0 0 0 
0 0 0 2 0 0 
 
 Distribución Conjunta de Dos Variables 
 
011 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Las tablas de frecuencias acumuladas se dejan como ejercicios para el lector. 
Ejemplo 3: Dados los datos del ejemplo 1 calculemos algunas frecuencias condicionales. 
 
𝒇(𝒚 = 𝟑/𝒙 = 𝟒) =
𝒇(𝒚=𝟑 ⋀ 𝒙=𝟒)
𝒇(𝒙=𝟒)
=
𝟑
𝟏𝟑
= 𝟎. 𝟐𝟑. 
 
Indica que el 23% de las familias que tienen 3 personas produciendo están compuestas 
por 4 miembros. 
 
𝒇(𝒚 = 𝟐/𝒙 = 𝟔) =
𝒇(𝒚=𝟐 ⋀ 𝒙=𝟔)
𝒇(𝒙=𝟔)
=
𝟓
𝟏𝟕
= 𝟎. 𝟐𝟗. 
 
Indica que el 23% de las familias que tienen 3 personas produciendo están compuestas 
por 4 miembros. 
5 Independencia 
La independencia viene a medir la información que arroja sobre una de las variables el 
conocimiento que se tiene de la otra variable. Así, una información total implica 
dependencia funcional, la nula información independencia, y una información parcial 
dependencia estadística. 
Formalmente, se dice que 𝑋 es independiente de 𝑌 si se verifica que: 
 
𝑓𝑖|𝑗
= 𝑓𝑖 , 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖 = 1,2, … , 𝑟; 𝑗 = 1,2, … , 𝑠 
(𝑌|𝑋) [5.55
− 7.15) 
[7.15
− 8.75) 
[8.75
− 10.35) 
[10.35
− 11.95) 
[11.95
− 13.55) 
[13.55
− 15.15) 
[6.15, −8.75) 0 0.033 0.166 0 0 0.033 
[8.75
− 11.35) 
0.066 0.133 0 0 0.066 0 
[11.35
− 13.95) 
0.066 0.033 0.1 0 0.066 
[13.95
− 16.55) 
0 0 0.033 0 0.066 0 
[16.55
− 19.15) 
0 0 0.066 0 0 0 
[19.15
− 21.75) 
0 0 0 0.066 0 0 
“Información total: dependencia funcional. 
 Nula información: independencia 
 Información parcial: dependencia estadística” 
 
 Distribución Conjunta de Dos Variables 
 
012 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
Es decir, si la frecuencia condicionada coincide con la marginal. De la misma forma se 
define la independencia de 𝑌 respecto de 𝑋. 
La definición de distribución condicionada da una expresión alternativa para la 
independencia, y así 𝑋 e 𝑌 son independientes si: 
 
𝑓𝑖𝑗 = 𝑓𝑖 ∙ 𝑓𝑖 , 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖, 𝑗. 
 
𝑋 depende funcionalmente de 𝑌, puesto que conocido el valor de 𝑌 queda 
determinado el de 𝑋, pero el recíproco no se da, puesto que si 𝑋 toma el valor 𝑥1, 𝑌 
puede tomar el valor 𝑦1 o 𝑦3. 
6 Medidas de Dependencia 
Los términos asociación, correlación, contingencia, concordancia y otros similares, se 
suelen utilizar como equivalentes muy a menudo. No obstante, haciendo un uso más 
correcto de la terminología estadística, aún con significado semejante, se puede 
considerar: 
 Correlación de variables propiamente dichas, o sea, medidas en escalade 
intervalo. 
 Concordancia de ordenaciones, entendiéndose como tales las denominadas 
variables ordinales. 
 Asociación o contingencia de variables nominales o atributos. 
 Así, para clasificar los coeficientes que detectan y miden el grado de relación, o 
dependencia estadística, se tiene en cuenta el tipo y la naturaleza de las variables 
sometidas a estudio” 
7 Resumen 
 Distribuciones condicionadas: cuando se considera la distribución de una 
variable para un valor fijo de la otra. 
 La frecuencia absoluta es el número de veces que se observa dicho par de 
valores. 
 La frecuencia relativa el cociente entre las frecuencias absolutas y el tamaño 
de la muestra. 
8 Referencias Bibliográficas 
 Montgomery, D. C y Runger, R. (2008). Probabilidad y Estadística Aplicadas a la 
Ingeniería. 2da. Edición. Limusa Wiley. Mexico. 
 
 Distribución Conjunta de Dos Variables 
 
013 ASTURIAS CORPORACIÓN UNIVERSITARIA® 
Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total 
o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. 
 
 Rincón. L. (2010). Curso Elemental de Probabilidad y Estadística. 1ra Edición. 
Circuito Exterior de CU. México D.F. 
 Walpole, R. E., Myers, R. H., Myers,S. L. y Ye, K. (2007). Probabilidad y Estadística 
para Ingeniería y Ciencias. 8va. Edición. Pearson. Mexico 
 I. Espejo Miranda, F. Fernández Palacín, M. A. López Sánchez, M. Muñoz 
Márquez, A. M. Rodríguez Chía, A. Sánchez Navas, C. Valero Franco. (2006). 
Estadística Descriptiva y Probabilidad. 3ra. Edición. Servicio de Publicaciones de 
la Universidad de Cádiz. 
 Devore, J. (2008). Probabilidad y Estadística para Ingeniería y Ciencias. 7ma. 
Edición. Cengace Learning Editores. México 
 Canavos, G. Probabilidad y Estadística. Métodos y Aplicaciones. 
 Daniel, W. (2009). Bioestadística. Base para el análisis de las ciencias de la 
salud. Cuarta edición. Limusa Wiley. México. 
 Mendenhall, W., Wackerly, D. y Scheaffer, R. (1994). Estadística Matemática con 
Aplicaciones. Grupo Editorial Iberoamericana. México.

Continuar navegando

Contenido elegido para ti

114 pag.
DO-UC-EG-MT-A0175-20162

SIN SIGLA

User badge image

Mucha Aprendizaje

38 pag.
Semana1_Estadistica_Descriptiva_Patricia_Guevara

Escola Santa Afra

User badge image

Edgar Gallegos

108 pag.
cuinap_13_2020_0

Escuela Universidad Nacional

User badge image

Ferney Colpa

171 pag.