Logo Studenta

Congreso Sesión 6 C Calero_08032023

¡Este material tiene más páginas!

Vista previa del material en texto

egp.up.edu.pe
ESCUELA DE
GESTIÓN
PÚBLICA
Módulo+IV:+Técnicas+de+búsqueda+y+
análisis+de+información
Sesión 6:)Tratamiento)y)análisis)de)información)
(Parte)I)
Ec.)Carla)Calero
CJ.CaleroL@up.edu.pe
mailto:CJ.CaleroL@up.edu.pe
egp.up.edu.pe
Estructura
a) Polí-cas públicas3basadas3en3evidencia
b) Información de3fuentes3oficiales3(Parte3I)
c) Información de3fuentes3oficiales3(Parte3II)
d) Búsquedas especializadas3en3internet
e) Tratamiento3y3análisis3de3información3(Parte3I)
f) Tratamiento3y3análisis3de3información3(Parte3II)
g) Tratamiento3y3análisis3de3información3(Parte3III)
egp.up.edu.pe
Determinar)las)técnicas)analí/cas
Análisis gráfico
(tablas y6gráficos)
Resumen de6
medidas estadísticas
(p.6ej.6media)
Otras técnicas (p.6ej.6
análisis
multivariado)
egp.up.edu.pe
Describiendo los datos numéricamente
1.1.(Media(aritmética
1.2.(Mediana
1.3.Moda
Describiendo datos numéricamente
2.3.(Desviación estándar
2.4.(Coeficiente de(Variación
2.1.(Rango
2.2.(Varianza
1.(Tendencia central 2.(Variación
egp.up.edu.pe
1.#Medidas de#tendencia central
Tendencia central
Media Mediana Moda
n
x
x
n
1i
i!
==
Punto.medio.de.
los valores
ordenados
Valor.observado
con.mayor.
frecuencia
Media.
aritmé:ca
egp.up.edu.pe
1.1.#Media#aritmética
• Media*=*suma de*valores dividido por el*número de*valores
• Afectada por valores extremos (outliers)
0**1***2***3***4***5***6***7***8***9***10
Media*=*3
0**1***2***3***4***5***6***7***8***9***10
Media*=*4
3
5
15
5
54321
==
++++ 4
5
20
5
104321
==
++++
egp.up.edu.pe
1.2.$Mediana
• En una lista ordenada,1el1número del1“medio”1(50%1
arriba,150%1debajo)
• No1es afectada por los valores extremos
01111112111311141115111611171118111911110
Mediana =13
01111112111311141115111611171118111911110
Mediana =13
egp.up.edu.pe
Encontrando la*mediana…
• Localización de0la0mediana:
• Si0el0número de0datos es impar,0la0mediana es el0valor0del0medio
• Si0el0número de0datos es par,0la0mediana es el0promedio de0los dos0números del0medio
• Tenga en cuenta que0000000000000000no0es el0valor de0la0mediana,0solamente la0posición
de0la0mediana en los datos ordenados
2
1n +
Posición Mediana =0000000000000000posición en los datos ordenados2
1n +
egp.up.edu.pe
1.3.$Moda
• Valor,que,ocurre de,manera más frecuente
• No,se,ve afectado por valores extremos
• Se,utiliza para,variables,categóricas o,numéricas
• Puede ser que,no,haya moda
• Puede ser que,haya varias modas
0,,,1,,,2,,,3,,,4,,,5,,,6,,,7,,,8,,,9,,,10,,,11,,,12,,,13,,,14
Moda =,9
0,,,1,,,2,,,3,,,4,,,5,,,6
No,hay,Moda
egp.up.edu.pe
Ejemplo:
• Cinco,casas,en una montaña cerca a,la,playa
$2,000%K
$500%K
$300%K
$100%K
$100%K
Valor,de,las,casas:,
$2,000,000
500,000
300,000
100,000
100,000
egp.up.edu.pe
Ejemplo:
• Media: ($3,000,000/5)//
=//$600,000
• Mediana: valor/medio/de/los datos
ordenados
=/$300,000
• Moda: valor/más frecuente
=/$100,000
Valor/de/las/casas:/
$2,000,000
500,000
300,000
100,000
100,000
Suma//3,000,000
egp.up.edu.pe
Ejercicios en clase:
1. Se)pidió a)diez economistas que)pronosticaran el)crecimiento
porcentual del)Índice de)Precios al)Consumidor durante el)próximo
año.)Sus predicciones fueron las)siguientes:
a.)Estime la)media)
b.)Estime la mediana
c.)Encuentre la)moda
3.6)))))3.1))))3.9))))3.7))))3.5
3.7)))))3.4))))3.0))))3.7)))))3.4)
egp.up.edu.pe
2. Las+edades de+una muestra de+12+estudiantes matriculados en un+
curso de+macroeconomía en línea son+las+siguientes:
a.+Cuál es la+edad promedio para+esta muestra?+
b.+Es<me la mediana de+la+edad?
c.+Cuál es el+valor+de+la+moda de+la+edad?
21+++++22+++++27+++++36+++++18+++++19
22+++++23++++++22+++++28+++++36+++++33
egp.up.edu.pe
¿"Cuál es la"“mejor”"medida?
• Media se(utiliza generalmente,(a(menos que(existan
valores extremos (outliers)(
• La(mediana se(utiliza a(menudo,(dado(que(no(es
sensible(a(los valores extremos
• Ejemplo:.la(mediana del(valor(de(las(casas(puede ser
reportado para(una región– menos sensible(a(los outliers
egp.up.edu.pe
Forma&de&la&Distribución
• Describe-como los datos están distribuidos
• Medidas de-la-forma
• Simétrica o-Asimétrica
Media-= MedianaMedia-< Mediana Mediana <-Media
Asimétrica a-la-derechaAsimétrica a-la-izquierda Simétrica
egp.up.edu.pe
2.#Medidas de#Variabilidad
Centrada de,la,misma manera,,
diferente variación
Variación
Desviación
estándar
Coeficiente
de,variación
Rango Varianza
! Medidas de,variabilidad
brindan información sobre la,
dispersión o variabilidad de,
los datos.
egp.up.edu.pe
2.1.$Rango
• Medida más simple.de.variabilidad
Rango =.Xmás grande – Xpequeño
0...1...2...3...4...5...6...7...8...9...10...11...12....13...14...
Range.=.14.D 1.=.13
Ejemplo:
egp.up.edu.pe
Desventajas del+rango
• Ignora la-manera en que-los datos están distribuidos
• Sensible-a-valores extremos
7-----8-----9-----10----11----12
Range-=-12-@ 7-=-5
7-----8-----9----10-----11----12
Range-=-12-@ 7-=-5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range-=-5-@ 1-=-4
Range-=-120-@ 1-=-119
egp.up.edu.pe
2.2.#Varianza (población)
• Promedio del-cuadrado de-las-desviaciones de-los valores respecto a-
su media
• Varianza de)la)población:
N
μ)(x
σ
N
1i
2
i
2
!
=
"
=
Donde =-media-de-la-población
N-=-tamaño de-la-población
xi =-ith valor-de-la-variable-x
μ
egp.up.edu.pe
Varianza de)la)muestra
• Promedio (aproximado)0del0cuadrado de0las0desviaciones de0los
valores respecto a0su media
• Varianza de)la)muestra:
1"n
)x(x
s
n
1i
2
i
2
!
=
"
=
Donde =0media0aritmética
n0=0tamaño de0la0muestra
Xi =0ith valor0de0cada variable0X
X
egp.up.edu.pe
2.3.$Desviación estándar (población)
• Medida de*dispersión generalmente utilizada
• Muestra la*variación respecto a*la*media
• Tiene*las*mismas unidades como los datos originales
• Desviación estándar de*la*población:
N
μ)(x
σ
N
1i
2
i!
=
"
=
egp.up.edu.pe
Desviación estándar de.la.muestra
• Medida de*dispersión generalmente utilizada
• Muestra la*variación respecto a*la*media
• Tiene*las*mismas unidades como los datos originales
• Desviación estándar de*la*muestra:
1"n
)x(x
S
n
1i
2
i!
=
"
=
egp.up.edu.pe
Ejemplo:))Cálculo de)la)desviación
estándar de)la)muestra
Muestra
Dataos (xi)2:2222210222221222222142222215222217222218222218222224
n2=2822222 Media2=2x2=216
4.2426
7
126
18
16)(2416)(1416)(1216)(10
1n
)x(24)x(14)x(12)X(10s
2222
2222
==
!
!++!+!+!
=
!
!++!+!+!
=
!
!
Una2medida de2la2dispersión“promedio”2
alrededor de2la2media
egp.up.edu.pe
Midiendo la)variación
Desviación estándar pequeña
Desviación estándar grande
egp.up.edu.pe
Comparando desviaciones estándar
Media*=*15.5
s*=*3.33811****12****13****14****15******16****17****18****19****20***21
11****12****13******14****15****16****17****18****19****20***21
Data*B
Data*A
Media*=*15.5
s*=*0.926
11****12****13****14****15****16****17****18********19****20***21
Media*=*15.5
s*=*4.570
Data*C
egp.up.edu.pe
Ventajas de)la)Varianza y)Desviación
Estándar
• Cada valor-de-los datos es utilizado para-el-cálculo
• Valores que-se-encuentran más lejos de-la-media-reciben un-peso-
extra
(porque las-desviaciones de-las-media-son-elevadas al-cuadrado)
egp.up.edu.pe
2.4.$Coeficiente de$Variación
• Medidas de+variación relativa
• Siempre en porcentaje (%)
• Muestra la+variación relativa a+la+media
• Se+puede utilizar para+comparar dos+o+más conjuntos+de+
datos con+diferentes unidades
100%
x
sCV !""
#
$
%%
&
'
=
egp.up.edu.pe
Ejemplo:)Comparación del)coeficiente de)
variación
• Acciones A:
• Precio promedio en el2año anterior2=2$50
• Desviación estándar=2$5
• Acciones B:
• Precio promedio en el2año anterior2=2$100
• Desviación estándar =2$5
Las2dos2acciones
tienen la2misma
desviación estándar,2
pero la2acción B2es
menos variable2
respecto a2su precio
10%100%
$50
$5100%
x
sCVA =!=!""
#
$
%%
&
'
=
5%100%
$100
$5100%
x
sCVB =!=!""
#
$
%%
&
'
=
egp.up.edu.pe
Actividad grupal
• Utilizarla.base.de.datos de.adquisiciones para.el.2022.
(archivo Excel.“Datos_compraspublicas_2022”)
• Seguir las instrucciones para.el ejercicio (archivo PDF..
“Ejercicio_clase6”)
egp.up.edu.pe
Fuentes
• Newbold,et,al.,,Statistics,for,Business,and,Economics,,2013

Continuar navegando