Logo Studenta

Apuntes Clases

¡Estudia con miles de materiales!

Vista previa del material en texto

Arqueología Cuantitativa
15/04/20
Capítulo 7: Muestras y poblaciones
¿Cómo podemos usar una muestra para conocer poblaciones que no conocemos?
Algunas ideas sobre muestreo:
· Depende del % respecto total ¿Cómo es posible que una encuesta de 2000 personas pueda representar a un país de 18 millones?: critica no tiene sentido, basada en falta de conocimiento sobre lo que es una muestra estadística.
· ¡¡No es útil!! no se trata de si es útil o no sino de entender para que se debe utilizar este tipo de herramientas
· Arqueología no es ingeniería o ciencia “dura”
· Estas ideas están basadas en ideas erróneas sobre lo que es una muestra y para qué se obtiene.
· El concepto de muestreo puede cambiar la manera o forma en que vemos el trabajo de campo. 
· La forma en que uno analiza va a condicionar la forma en que uno extrae la data. 
¿Qué es el muestreo?
· Obtención de un subgrupo de una población total. Mediante esta muestra podamos reconocer las características de esta población que en esta clase seria básicamente la media y la dispersión de la población. 
· Se obtiene muestras no para hablar de las muestras sino para poder hablar de la población. 
Ejemplo: 
· ¿Qué factores imposibilitan que sea esta la población/universo de, en este caso, infectados?
· Varios, pude ser por capacidad de descubrimiento, que mostraron o no los síntomas, lugares lejanos no alcanzables, etc. 
· ¿Para que nos sirve esta muestra? Sirve para entender la velocidad de contagio. 
· El sesgo que existe es sistemático y continuo y similar si se cambia la data o los métodos de muestreo, ya no sirve. 
¿Por qué muestrear?
· En un mundo ideal, deberíamos estudiar la población. Estudiar muestras para inferir características de la población, tiene errores.
· Lamentablemente no vivimos en un mundo ideal, y estudiar la población (100% de los casos) es imposible
 ¿Por qué no puede ser posible?
· Disponibilidad/accesibilidad de todos los casos
· Costo alto (tiempo y $)
· Los métodos de análisis pueden ser destructivos y la población mundial limitada. 
· En arqueología: casi NUNCA tendremos poblaciones, siempre muestras.
Muestrear tiene ventajas/beneficios
Puedes ahorrar dinero, o maximizar tiempo, puedes preservar sitios, etc.
1) Tamaño de muestra v/s densidad de información por caso (censos y encuestas) 
· Además, hacer estrategias de análisis porque mientras más grandes sea la muestra, menos información pueden tener. 
2) Casi nunca podrán trabajar con poblaciones. Entonces es mejor reconocer que son muestras para poder controlar el error (en lugar de ignorarlo como generalmente se hace)
· Trabajamos con el error, vivimos con eso.
¿Cómo muestrear?
· Muestreo debe ser aleatorio (para que represente adecuadamente a la población)
· ¿se puede repetir los casos? 
· No = muestreo aleatorio sin reemplazo. Porque no ponemos el caso de regreso al bolo de elección. 
· Si = muestreo aleatorio con reemplazo. 
· Ejemplo en minuto 24 del video
· Ejemplo de arqueología: si muestreas artefactos de un lugar, esta OK que sean bordes de la misma vasija
· Si sacamos muestras de artefactos de una zona no van a decir esta vasija con esta es la misma entonces esta la dejo y saco otro, no. Se contabiliza todo porque es probable que pase. 
¿Cómo se generan los números aleatorios?
· Podemos usar una pagina web, Excel usando “tabla aleatoria”, etc. 
Representativita ¿Qué significa?
· Es decir, que la muestra este reflejando realmente las características de la población. 
· La única forma de estar completamente seguros de las características de una población es estudiando la población
· ¿Cómo sabemos que muestra realmente representa a la población? 
· Rpta: Dado que no tenemos la población para comparar, no es posible garantizar la representatividad de la muestra.
· El muestreo aleatorio no es garantía de representatividad, pero nos da la mejor posibilidad para obtener una muestra representativa. 
· ¿Por qué? Por que en una muestra aleatoria cada caso tiene la misma oportunidad o posibilidad de aparecer en la muestra. 
· “Lo más importante es que el muestreo aleatorio nos da una base para estimar qué tan probable es que nuestras inferencias acerca de la población están erradas, y así nos dice cuanta confianza debemos poner en esas inferencias.”
Tipos de muestreo aleatorio
· Simple Uno considera que todos los casos de un universo son homogéneos, y uno saca los casos de modo aleatorio. Cada caso tiene misma oportunidad de salir. 
· Estratificado Porque sabemos que hay subgrupos.
· Agrupado Donde cada elemento no tiene la misma oportunidad. Ej. Recojo de muestras de cerámica en unidades elegidas aleatoriamente. 
Muestreo no-aleatorio
1. Muestreos que la gente generalmente realiza. ¿Qué problemas puede haber de recoger muestras no aleatorias de sitios?
· Puede haber una sobrerrepresentación de cerámica mas vistosa, mas bonita. Es muy subjetivo, muy sesgada. 
· Hay una serie de elementos que condicionan un tipo de recojo que hace que la muestra no sea realmente aleatoria. 
· El sesgo es lo que identifica lo que es una muestra no-aleatoria
· Porque cada caso tiene diferente posibilidad de ser elegido.
· La muestra puede ser sistemáticamente diferente a la población. 
· Los sesgos no se pueden eliminar una vez que la muestra fue elegida. 
· Los sesgos se pueden evitar/eliminar usando muestreos aleatorios.
· Si bien, el muestreo aleatorio evita el sesgo, esto hace que una muestra NO sea representativa.
· Pero la ausencia de sesgo No es garantía que la muestra sea representativa
· Entonces, ¿Cuál es el beneficio de utilizar una muestra aleatoria si esta no me garantiza la representatividad de una población? Sirve para determinar la probabilidad de que no sea representativo. Nos permite medir nuestro error. 
1. Los sesgos pueden afectar algunas dimensiones de data, pero no todas.
2. Se puede comparar muestras con el mismo sesgo.
3. Se puede comparar creando expectativas lógicas. 
Conclusiones
· Se hace lo que se puede con lo que se tiene. Porque siempre será peor hacer nada.
· La población objetivo:
· ¿Estas disponible realmente?
· Cuestionarme sobre el contexto de las colecciones son las que trabajamos. 
Capítulo 8: Diferentes muestras de una misma población
Dado que la muestras son un subgrupo de una población, uno podría sacar múltiples muestras de una población. Eso también significa que puede haber muestras muy representativas de la población como puede haber muestras que sean muy diferentes.
· ¿Qué tan diferentes es esta muestra de acá respecto a la media de la población? la población total tiene un promedio ‘x’, yo quiero obtener muestras que tengan medias similares a esta, para que las muestras sean muy representativas. ¿Cómo comparo esto? Ej. Tenemos muestras de n=1, y queremos ver que tan diferentes son las medias de cada muestra respecto de la población, por lo que se resta la media de esta muestra con la media de la población. (min 54:48)
· Hay mayor probabilidad de tener muestras mas representativas con muestras más grandes. 
· ¿Qué cambia con el tamaño de la muestra? la frecuencia de las muestras no representativas. Porque cambia con el tamaño de la muestra, si tiene muestras mas grandes, es la menos probabilidad de tener muestras que no sean representativas de la población. 
· Y con estas medias sacamos de cada una de las muestras que pueden extraerse de la población, hacemos un lote nuevo.
El lote especial (Ej. Min 1:03:08)
· Lote especial (distribución muestreal de la media). Def. Lote formado con las medias de todas las muestras de tamaño ‘n’ que pueden extraerse de una población. 
· Siempre tiene forma “normal”
· Puede servir para analizar qué tan inusual seria tener una determinada muestra con cierta media.
· Entonces, puede ayudarnos a estimar la probabilidad de elegir al azar una muestra que no sea representativa. 
· Ayuda a estimar la inusualidad.
· Este lote especial tiene algo llamado el error estándar, que ayudar analizar esta inusualidad. 
Erros estándar (SE)
· La media del lote especial es la misma media de la población de la cual fuerontomadas las muestras, siempre.
· = Sabemos además que la media de las medias de todas las posibles muestras de un tamaño dado que se pueden extraer de una determinada población es lo mismo que la media de esa población. 
· La desviación estándar del lote especial es la desviación estándar de la población, dividida por la raíz cuadrada del numero de elementos en la muestra. 
· ¿Para que nos sirve el error estándar? 
· Min. 1:06:20
22/04/20
Las medianas y muestreo
· Estamos hablando de las poblaciones
· ¿Qué hacemos si queremos usar la mediana para estimar la población?
· FALTA
· Para trabajar con la mediana, usamos Re-muestreo: la selección repetida de muestras de la muestra misma
· Dos técnicas: Bootstrap y jacknife
Bootstrap
· Recurso donde se está explotando la muestra para tener muestras nuevas
· Si tenemos una muestra de tamaño, se considera la muestra como la población
1) Se seleccionan min=1000 muestras (con reemplazo) nuevas de tamaño n. 
2) Las medianas de todas las muestras crean un nuevo lote (similar al “lote especial)
3) La mediana de este nuevo lote es igual a la mediana de la muestra original, hay que buscar los intervalos de confianza
4) Intervalo de confianza al P% es igual a los percentiles que incluyen al P% de casos al medio del lote. 
· Se saca la mediana de cada una de las muestras nuevas y se conforma un nuevo lote de medianas
· La mediana de la muestra va a ser una aproximación de la mediana de la población 
· Las medianas de este lote de medianas son igual a las medianas de la muestra.
Ejemplos en el video
Ejemplo libro:
· Muchos casos atípicos que hace difíciles el uso de la media
· Pregunta: Cuanto tiene de mediana la población de la que viene… 
· ¿Qué rango de error hay que asignarle a 28,2 para poder hablar de la población de donde viene la muestra?
· Al 90% de confianza
· Percentil 5% (caso 500 de las 10000 medianas =24,8 ha
Jacknife
· A diferencia del Bootstrap, donde la cantidad de muestra así se repitan los números
· Es recoger la muestra y sistemáticamente se escoge un número que no vaya a entra en la nueva muestra.
· Cada nueva muestra tiene un tamaño de n-1
· No se remuestrea miles, sino que se obtienen tantas muestras nuevas como numero de casos (n) de la muestra original.
· No se repite las muestras.
· Es menos robusto que el Bootstrap
Categorías y proporciones de población 
Similar al cap. 6
¿Cómo nos aproximamos a las proporciones de categorías de una población (en base a una muestra)?
Ejemplo del libro:
2) ¿Cuál es la desviación estándar de nuestra muestra con 13% de puntas de obsidiana?
· Donde, 
· p= proporción de la categoría de interés (expresado en decimales)
· q= (1-p)
· Ejemplo del video
· Tenemos población que varían en su homogeneidad, esto afecta la desviación estándar. 
Arqueología Cuantitativa
 
 
15/0
4/20
 
Capítulo 7: Muestras y poblaciones
 
¿Cómo podemos usar una muestra para conocer poblaciones que no conocemos?
 
Algunas ideas sobre muestreo:
 
o
 
Depende del % respecto total 
à
 
¿Cómo es posible que una encuesta de 2000 
personas
 
pueda representar a un país de 18 millones?: critica no tiene sentido, 
basada en falta de 
conocimiento
 
sobre 
lo que es una muestra estadística
.
 
o
 
¡¡No es útil!! 
à
 
no se trata de si es útil o no sino de
 
ente
nder para que se debe 
utilizar este tipo de herramientas
 
o
 
Arqueología no es ingeniería o ciencia “dura”
 
·
 
Estas ideas están basadas en ideas erróneas sobre lo que es una muestra y para qué se 
obtiene.
 
·
 
El concepto de muestreo puede cambiar la manera o forma en
 
que vemos el trabajo 
de campo. 
 
·
 
La forma en que uno analiza va a condicionar la forma en que uno extrae la data. 
 
¿Qué es el muestreo?
 
·
 
Obtención de un subgrupo de una población total. Mediante esta muestra podamos 
reconocer las características de esta pob
lación que en esta clase seria básicamente la 
media y la dispersión de la población. 
 
·
 
Se obtiene muestras no para hablar de las muestras sino para poder hablar de la 
población. 
 
Ejemplo: 
 
·
 
¿Qué factores imposibilitan que sea esta la población/universo de, en este caso, 
infectados?
 
·
 
Varios, pude ser por capacidad de descubrimiento, que mostrar
on o no los síntomas, 
lugares lejanos no alcanzables, etc. 
 
·
 
¿Para que nos sirve esta muestra? 
à
 
S
irve para entender la velocidad de contagio. 
 
·
 
El sesgo que existe es sistemático y continuo y similar si se cambia la data o los 
métodos de muestreo, ya no sir
ve. 
 
¿Por qué muestrear?
 
·
 
En un mundo ideal, deberíamos estudiar la población. Estudiar muestras para inferir 
características de la población, tiene errores.
 
·
 
Lamentablemente no vivimos en un mundo ideal, y estudiar la población (100% de 
los casos) es 
imposible
 
 
¿Por qué no puede ser posible?
 
·
 
Disponibilidad/accesibilidad de todos los casos
 
Arqueología Cuantitativa 
 
15/04/20 
Capítulo 7: Muestras y poblaciones 
¿Cómo podemos usar una muestra para conocer poblaciones que no conocemos? 
Algunas ideas sobre muestreo: 
o Depende del % respecto total  ¿Cómo es posible que una encuesta de 2000 
personas pueda representar a un país de 18 millones?: critica no tiene sentido, 
basada en falta de conocimiento sobre lo que es una muestra estadística. 
o ¡¡No es útil!!  no se trata de si es útil o no sino de entender para que se debe 
utilizar este tipo de herramientas 
o Arqueología no es ingeniería o ciencia “dura” 
 Estas ideas están basadas en ideas erróneas sobre lo que es una muestra y para qué se 
obtiene. 
 El concepto de muestreo puede cambiar la manera o forma en que vemos el trabajo 
de campo. 
 La forma en que uno analiza va a condicionar la forma en que uno extrae la data. 
¿Qué es el muestreo? 
 Obtención de un subgrupo de una población total. Mediante esta muestra podamos 
reconocer las características de esta población que en esta clase seria básicamente la 
media y la dispersión de la población. 
 Se obtiene muestras no para hablar de las muestras sino para poder hablar de la 
población. 
Ejemplo: 
 ¿Qué factores imposibilitan que sea esta la población/universo de, en este caso, 
infectados? 
 Varios, pude ser por capacidad de descubrimiento, que mostraron o no los síntomas, 
lugares lejanos no alcanzables, etc. 
 ¿Para que nos sirve esta muestra?  Sirve para entender la velocidad de contagio. 
 El sesgo que existe es sistemático y continuo y similar si se cambia la data o los 
métodos de muestreo, ya no sirve. 
¿Por qué muestrear? 
 En un mundo ideal, deberíamos estudiar la población. Estudiar muestras para inferir 
características de la población, tiene errores. 
 Lamentablemente no vivimos en un mundo ideal, y estudiar la población (100% de 
los casos) es imposible 
 ¿Por qué no puede ser posible? 
 Disponibilidad/accesibilidad de todos los casos

Otros materiales