Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
R e c o le c c ió n d e d a to s y d is e ñ o d e e x p e rim e n to s Bioestadística2020 2021 R e c o le c c ió n d e d a to s • Norm alm ente los datos de interés para la bioestadística (y las ciencias biológicas en general) no son recolectados o generados al azar, sino que provienen de un estudio planificado y diseñado. • Si el proceso de generación y/o obtención de los datos fue bien realizado, esos datos m uestralesnos perm itirán cum plir el objetivo ulterior de la estadística, que es extraer conclusiones que puedan considerarse válidas para toda la población, habiendo trabajado solo sobre una pequeña m uestra de esta. Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight E s ta d ís tic a in fe re n c ia l • La inferenciaestadística es el conjunto de m étodos y técnicas que perm iten inducir, a partir de la inform ación proporcionada por una m uestra, cual es el com portam iento de una determ inada población con un riesgo de error m edible en térm inos de probabilidad. Usuario1 Highlight Usuario1 Highlight A s o c ia c ió n y c a u s a lid a d ASO CIACIÓ N • Decim osque dosvariables están asociadas silos valores de una variable tienden a estar relacionadoscon losvaloresde otra variable. • Vinculando esta idea con lo visto en la sección previa,la asociación se vincula con la correlación. • Ya m encionam os que correlación fuerte (asociación fuerte) no necesariam ente im plica causalidad (a m odo de ejem plo,recuerden la fuerte correlación observada entre tasa de divorcio en elperíodo 2000-2009 y elconsum o de m argarina!!). Usuario1 Highlight A s o c ia c ió n y c a u s a lid a d CAUSALIDAD • Decim os que dos variables están causalm ente asociadas su al cam biar el valor de una variable, se m odifica el valor de la otra variable. • Es decir si podem os establecer una relación causa: efecto entre ellas, perm itiéndonos hallar una expresión algebraica que perm ita calcular en form a exacta o aproxim ada los valores de una de las variable en función de la otra, con una finalidad predictiva. • Vinculando este concepto con lo visto en la sección previa, la causalidad se vincula con la regresión. Usuario1 Highlight A s o c ia c ió n y c a u s a lid a d CAUSALIDAD • Cuando tenem os una relación causalentre dos variables,decim os que una de ellasesla variable explicativa (o independiente)y la otra esla variable respuesta (o dependiente). Usuario1 Highlight E je m p lo - A s o c ia c ió n e n tre d o s v a ria b le s (n o c a u s a l) • Lograr discrim inar correctam ente entre estos dos conceptos es clave en estadística (y en la vida en general). • A m odo de ejem plo, tom em os el estudio publicado en “The New England Journal of M edicine” titulado “Consum o de chocolate, función cognitiva, y prem ios Nobel” (M esserli2012). n en g l j m ed 367;16 n ejm .o rg o cto ber 18, 2012 1563 O ccasio n al N o tes D isc u ssio n The principal finding of this study is a surpris- ingly pow erful correlation betw een chocolate intake per capita and the num ber of N obel laure- ates in various countries. O f course, a correla- tion betw een X and Y does not prove causation but indicates that either X influences Y, Y influ- ences X, or X and Y are influenced by a com m on underlying m echanism . H ow ever, since choco- late consum ption has been docum ented to im - prove cognitive function, it seem s m ost likely that in a dose-dependent w ay, chocolate intake provides the abundant fertile ground needed for the sprouting of N obel laureates. O bviously, these findings are hypothesis-generating only and w ill have to be tested in a prospective, ran- dom ized trial. The only possible outlier in Figure 1 seem s to be Sw eden. G iven its per capita chocolate con- sum ption of 6.4 kg per year, w e w ould predict that Sw eden should have produced a total of about 14 N obel laureates, yet w e observe 32. Considering that in this instance the observed num ber exceeds the expected num ber by a fac- tor of m ore than 2, one cannot quite escape the notion that either the N obel Com m ittee in Stockholm has som e inherent patriotic bias w hen assessing the candidates for these aw ards or, perhaps, that the Sw edes are particularly sensitive to chocolate, and even m inuscule am ounts greatly enhance their cognition. A second hypothesis, reverse causation — that is, that enhanced cognitive perform ance could stim ulate countryw ide chocolate con- sum ption — m ust also be considered. It is con- ceivable that persons w ith superior cognitive function (i.e., the cognoscenti) are m ore aw are of the health benefits of the flavanols in dark chocolate and are therefore prone to increasing their consum ption. That receiving the N obel Prize w ould in itself increase chocolate intake countryw ide seem s unlikely, although perhaps celebratory events associated w ith this unique 35302520105 150 0 5 10 15 C hocolate!C onsum ption!(kg/yr/capita) Nobel!Laureates!per!10!Million!Population Poland Sw itzerland Sw eden N orw ay C hina B razil G reece Portugal U nited States G erm any France Finland Italy A ustralia The N etherlands C anada B elgium U nited Kingdom Ireland Spain A ustria D enm ark r= 0.791 P < 0.0001 Japan A ustralia Italy Italy Spain Spain Portugal Japan Japan A ustria D enm ark Figure!1.!C orrelation!betw een!C ountries’!A nnual!Per!C apita!C hocolate!C onsum ption!and!the!N um ber!of!N obel! !Laureates!per!10!M illion!Population. The N ew England Journal of M edicine D ow nloaded from nejm .org at IO W A STA TE U N IV ER SITY on January 22, 2019. For personal use only. N o other uses w ithout perm ission. C opyright © 2012 M assachusetts M edical Society. A ll rights reserved. M á s E je m p lo s d e p u b lic a c io n e s - A s o c ia c ió n (c o rre la c ió n ) e n tre d o s v a ria b le s • Asociación entre consum o de vino y reducción del riesgo de m uerte por ataques cardíacos • Asociación entre políticas públicas y vacunación contra la BCG universal (tuberculosis) e incidencia de CO VID-19 R eproduced w ith perm ission of the copyright ow ner. Further reproduction prohibited w ithout perm ission. W ine, A lcohol, Platelets, and the French Paradox for C oronary H eart D isease R enaud, S The Lancet; Jun 20, 1992; 339, 8808; R esearch Library C ore pg. 1523 C orrelation betw een universal B C G vaccination policy and reduced m orbidity and m ortality for C O VID -19: an epidem iological study Aaron M iller, M ac Josh R eandelar, Kim berly Fasciglione, Violeta R oum enova, Yan Li, and G onzalo H . O tazu* D epartm ent of Biom edical Sciences, N YIT C ollege of O steopathic M edicine, N ew York Institute of Technology, O ld W estbury, N ew York, U SA *C orrespondence to: gotazual@ nyit.edu A bstract C O VID -19 has spread to m ost countries in the w orld. Puzzlingly, the im pact of the disease is different in different countries. These differences are attributed to differences in cultural norm s, m itigation efforts, and health infrastructure. H ere w e propose that national differences in C O VID - 19 im pact could be partially explained by the different national policies respect to Bacillus C alm ette-G uérin (BC G ) childhood vaccination. BC G vaccination has been reported to offer broad protection to respiratory infections. W e com pared large num ber of countries BC G vaccination policies w ith the m orbidity and m ortality for C O VID -19. W e found that countries w ithout universal policies of BC G vaccination (Italy, N ederland, U SA) have been m ore severely affected com pared to countries w ith universal and long-standingBC G policies. C ountries that have a late start of universal BC G policy (Iran, 1984) had high m ortality, consistent w ith the idea that BC G protects the vaccinated elderly population. W e also found that BC G vaccination also reduced the num ber of reported C O VID -19 cases in a country. The com bination of reduced m orbidity and m ortality m akes BC G vaccination a potential new tool in the fight against C O VID -19. Introduction The C O VID -19 pandem ic originated in C hina and it has quickly spread over all continents affecting m ost countries in the w orld. H ow ever, there are som e striking differences on how C O VID -19 is behaving in different countries. For instance, in Italy there has been strong curtailing of social interactions and C O VID -19 m ortality is still high. In contrast, Japan had som e of the earlier cases, but the m ortality is low despite not having adopted som e the m ore restrictive social isolation m easurem ents. These puzzling differences have been adjudicated to different cultural norm s as w ell as differences in m edical care standards. H ere w e propose an alternative explanation: that the country-by-country difference in C O VID -19 m orbidity and m ortality can be partially explained by national policies on Bacillus C alm ette-G uérin (BC G ) vaccination. BC G is a live attenuated strain derived from an isolate of M ycobacterium bovis used w idely across the w orld as a vaccine for Tuberculosis (TB), w ith m any nations, including Japan and C hina, having a universal BC G vaccination policy in new borns 1. O ther countries such as Spain, France, and Sw itzerland, have discontinued their universal vaccine policies due to com paratively low risk for developing M . bovis infections as w ell as the proven variable effectiveness in preventing adult TB; countries such as the U nited States, Italy, and the N etherlands, have yet to adopt universal vaccine policies for sim ilar reasons. Several vaccines including the BC G vaccination have been show n to produce positive “heterologous” or non-specific im m une effects leading to im proved response against other non- m ycobacterial pathogens. For instance, BC G vaccinated m ice infected w ith the vaccinia virus w ere protected by increased IFN -Y production from C D 4+ cells 2. This phenom enon w as nam ed . C C -BY-N D 4.0 International license It is m ade available under a author/funder, w ho has granted m edR xiv a license to display the preprint in perpetuity. is the (w hich w as not peer-review ed) The copyright holder for this preprint . https://doi.org/10.1101/2020.03.24.20042937 doi: m edR xiv preprint Figure 2: Earlier date of the start of vaccination reduces the m ortality rate. Left panel correspond to upper m iddle incom e and high incom e countries w ith current universal BC G vaccination policy. The right panel correspond to countries that do not have a current universal vaccination policy. . C C -BY-N D 4.0 International license It is m ade available under a author/funder, w ho has granted m edR xiv a license to display the preprint in perpetuity. is the (w hich w as not peer-review ed) The copyright holder for this preprint . https://doi.org/10.1101/2020.03.24.20042937 doi: m edR xiv preprint V a ria b le s d e c o n fu s ió n Por qué dos variables parecen estar fuertem ente asociadas, aun cuando sepam os que no existe relación causa:efecto entre ellas? • Aquí tenem os dos posibles respuestas: 1) La prim era es que esa relación puede darse por sim ple azar. 2) Una segunda opción, y que tiene m ucha m ás relevancia en estudios biológicos, es que esa asociación entre dos variables se deba a la presencia de una tercera variable (llam ada “de confusión”) que no estam os tom ando en cuenta y que es la que verdaderam ente tiene una relación causa:efecto con las variables que estam os observando. Usuario1 Highlight Usuario1 Highlight E je m p lo : v a ria b le d e c o n fu s ió n • Si retom am os el trabajo titulado “Consum o de chocolate, función cognitiva, y prem ios Nobel” (M esserli2012). • Tenem os dos variables m edidas: consum o de chocolate y núm ero de prem osNobel ganados, por país. • Una posible tercera variable (de confusión) que no estam os contem plando podría ser el poder adquisitivo de los habitantes de los m encionados países. • Esta tercera variable, que no está contem plada en el estudio de correlación de Figura 1, bien podría estar causando los efectos que vem os. O alguna otra, que no estam os considerando… n en g l j m ed 367;16 n ejm .o rg o cto ber 18, 2012 1563 O ccasio n al N o tes D isc u ssio n The principal finding of this study is a surpris- ingly pow erful correlation betw een chocolate intake per capita and the num ber of N obel laure- ates in various countries. O f course, a correla- tion betw een X and Y does not prove causation but indicates that either X influences Y, Y influ- ences X, or X and Y are influenced by a com m on underlying m echanism . H ow ever, since choco- late consum ption has been docum ented to im - prove cognitive function, it seem s m ost likely that in a dose-dependent w ay, chocolate intake provides the abundant fertile ground needed for the sprouting of N obel laureates. O bviously, these findings are hypothesis-generating only and w ill have to be tested in a prospective, ran- dom ized trial. The only possible outlier in Figure 1 seem s to be Sw eden. G iven its per capita chocolate con- sum ption of 6.4 kg per year, w e w ould predict that Sw eden should have produced a total of about 14 N obel laureates, yet w e observe 32. Considering that in this instance the observed num ber exceeds the expected num ber by a fac- tor of m ore than 2, one cannot quite escape the notion that either the N obel Com m ittee in Stockholm has som e inherent patriotic bias w hen assessing the candidates for these aw ards or, perhaps, that the Sw edes are particularly sensitive to chocolate, and even m inuscule am ounts greatly enhance their cognition. A second hypothesis, reverse causation — that is, that enhanced cognitive perform ance could stim ulate countryw ide chocolate con- sum ption — m ust also be considered. It is con- ceivable that persons w ith superior cognitive function (i.e., the cognoscenti) are m ore aw are of the health benefits of the flavanols in dark chocolate and are therefore prone to increasing their consum ption. That receiving the N obel Prize w ould in itself increase chocolate intake countryw ide seem s unlikely, although perhaps celebratory events associated w ith this unique 35302520105 150 0 5 10 15 C hocolate!C onsum ption!(kg/yr/capita) Nobel!Laureates!per!10!Million!Population Poland Sw itzerland Sw eden N orw ay C hina B razil G reece Portugal U nited States G erm any France Finland Italy A ustralia The N etherlands C anada B elgium U nited Kingdom Ireland Spain A ustria D enm ark r= 0.791 P < 0.0001 Japan A ustralia Italy Italy Spain Spain Portugal Japan Japan A ustria D enm ark Figure!1.!C orrelation!betw een!C ountries’!A nnual!Per!C apita!C hocolate!C onsum ption!and!the!N um ber!of!N obel! !Laureates!per!10!M illion!Population. The N ew England Journal of M edicine D ow nloaded from nejm .org at IO W A STA TE U N IV ER SITY on January 22, 2019. For personal use only. N o other uses w ithout perm ission. C opyright © 2012 M assachusetts M edical Society. A ll rights reserved. V a ria b le s d e c o n fu s ió n • Decim os que las variables de confusión (tam bién llam adas terceras variables), son variables que el investigador no controló o no contem pló y que dañanla validez interna de un estudio. • Se trata de una (o m ás) variable que distorsiona la m edida de la asociación entre otras dos variables. • El resultado de la presencia de una variable de confusión puede ser el surgim iento de un efecto donde en realidad no existe o la exageración de una asociación real (confusión positiva) o, por el contrario, la atenuación de una asociación real e incluso una inversión del sentido de una asociación real (confusión negativa). Usuario1 Highlight Usuario1 Highlight E s tu d io s o b s e rv a c io n a le s y e x p e rim e n ta le s E je m p lo 1 • Una jardinera principiante sabe que las plantas se m ueren si uno no las riega, pero que tam bién m ueren si se las riega dem asiado. Para averiguar cuánta agua toleran sus plantas, decide proceder de la siguiente m anera. • Divide a todas sus plantas (tiene m uchas) en 10 grupos diferentes. A cada grupo la riega con una cantidad diferente de agua: al prim er grupo le pone 1 litro, al segundo 2 litros, al tercero 3, etc. • M antiene este régim en por dos sem anas y luego se fija qué plantas han m uerto o sobrevivido. E s tu d io s o b s e rv a c io n a le s y e x p e rim e n ta le s E je m p lo 2 • Una jardinera principiante sabe que las plantas se m ueren si uno no las riega, pero que tam bién m ueren si se las riega dem asiado. • O currió que una vez llovió en su ciudad durante 7 días seguidos sin parar (algo m uy extraño, ya que esta persona vive en una zona de clim a m uy seco!!) y se le ocurrió una idea: • Para averiguar cuánta agua toleran sus plantas, luego de estos 7 días de lluvia, salió a su jardín y contabilizó cuántas plantas habían m uerto o sobrevivido. E s tu d io s o b s e rv a c io n a le s y e x p e rim e n ta le s E je m p lo s 1 y 2 • Pueden notar que am bos estudios intentar dar solución a la m ism a pregunta (cuánta agua toleran las plantas), y tienen dos variables: cantidad de agua y sobrevida de las plantas (cuántas viven). • Si em bargo, estos estudios están encarados de form a m uy diferente. • Si los leen detenidam ente, verán que en el prim er caso (a) la persona activam ente controla la variable cuyo efecto quiere m edir (es decir, la cantidad de agua) m ientras que en el segundo caso (b) la persona no controla la variable cuyo efecto quiere m edir (nuevam ente, la cantidad de agua) sino que es una observadora pasiva de algo que ha sucedido (m ucha lluvia). E s tu d io s o b s e rv a c io n a le s y e x p e rim e n ta le s E je m p lo 1 • En el caso del estudio (a), si la cantidad de plantas m uertas respecto de las que sobrevivieron al ser regadas con m ucho agua es m ayor que en las m acetas que recibieron m enos agua, la jardinera podría concluir que hay efectivam ente un efecto de la cantidad de agua en la sobrevida de las plantas. • Y de hecho, al haber hecho un gradiente de agua (ya que regó con 1 litro, 2 litros, 3 litros, etc) hasta puede establecer la cantidad de agua que es perjudicial para las plantas. E s tu d io s o b s e rv a c io n a le s y e x p e rim e n ta le s E je m p lo 2 • En el caso del estudio (b), si la jardinera observó un gran núm ero de plantas m uertas luego de 7 días de lluvia, no sería correcto que atribuya esto a la gran cantidad de agua recibida! • Podría deberse a eso, pero tam bién a otras variables no contem pladas (de confusión), que sean las que realm ente estén causando el efecto de interés (por ejem plo, fuerza y tam año de las gotas, que lastim an y m atan plantas pequeñas). E s tu d io s o b s e rv a c io n a le s y e x p e rim e n ta le s E je m p lo s 1 y 2 • Podem os decir que el estudio (a) es de tipo experim entaly, de haber un efecto en la variable respuesta, podem os atribuírselo a la variable explicativa. Es decir, podem os hablar de causalidad. • Por su parte el estudio (b) es de tipo observacionaly, de haber efecto, podem os decir que hay una asociación entre las variables. E s tu d io e x p e rim e n ta l • Es un estudio en el cual el investigador controla activam ente la o las variables explicativas (es decir, de la cual quiere conocer el efecto que genera). • De esta form a, si el experim ento está bien hecho (ahora verem os qué hay que tener en cuenta para considerar que “un experim ento está bien hecho”), es posible establecer relaciones causa:efecto entre variables (causalidad). Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight E s tu d io o b s e rv a c io n a l • Es un estudio en el cual el investigador no controla activam ente el valor de ninguna variable, sino que sim plem ente observa y registra sucesos que ya han ocurrido o que ocurren naturalm ente. • Com o es m uy difícil evitar variables de confusión en los estudios observacionales, NUNCA se pueden utilizar para establecer causalidad. • Sólo podem os hablar de asociación entre variables. à El estudio de asociación de M esserli(2012) es un estudio claram ente observacional Usuario1 Highlight Usuario1 Highlight N o c io n e s a s o c ia d a s a l c o n c e p to d e “ E x p e rim e n to ” Tratam iento • El “tratam iento” es la variable explicativa. Es aquello para lo cual el investigador desea evaluar o m edir qué efecto produce. Para poder estudiar su efecto, el investigador debe variar activam ente los valores del tratam iento (generar varios “niveles” para el tratam iento), y m edir cóm o varía la variable respuesta por efecto de estos cam bios. • En el ejem plo (a) de las plantas, el tratam iento es el riego, y los niveles son: 1 litro, 2 litros, 3 litros… Usuario1 Highlight N o c io n e s a s o c ia d a s a l c o n c e p to d e “ E x p e rim e n to ” Control de las variables que no son de interés para la investigación. • En un experim ento que consiste en ver si la variable independiente tiene un efecto en la variable dependiente, es im portante que lo único que varíe sean esas dos variables. Para eso, es necesario controlar que las otras posibles fuentes de variación no cam bien (fijarlas) o bien, que si varíen lo hagan aleatoriam ente (y no en form a sesgada… recuerden la noción de sesgo que presentam os en la clase 2). Usuario1 Highlight E je m p lo Control de las variables que no son de interés para la investigación. • Un grupo de agrónom os está tratando de estudiar cóm o diferentes tipos de suelos afectan el crecim iento de las plantas. Deciden hacer un experim ento para probar el efecto en el crecim iento de cinco tipos de suelo, los cuales varían en la proporción de arena y arcilla. Preparan cinco lotes, cada uno con un tipo de suelo diferente. Riegan todos los lotes con la m ism a cantidad y frecuencia. En el prim er lote plantan brócoli, en el segundo alfalfa, en el tercero trigo, en el cuarto girasol y en el quinto soja. Al cabo de 15 días m iden el largo de las plantas. E je m p lo Control de las variables que no son de interés para la investigación. • El estudio tiene com o objetivo determ inar el efecto de la com posición del suelo en el crecim iento de las plantas. • Las variables de interés son tipo de suelo (proporciones variables de arena y arcilla, variable independiente, la variable que los agrónom os deciden controlar) y largo de las plantas (variable dependiente, la que esperam os varíe por efecto del cam bio en la variable independiente). • Sin em bargo, hay una fuente de variación que no están contem plando: en los distintos niveles del tratam iento (es decir, en los distintos tipos de suelo) hay especies vegetales diferentes!!! E je m p lo Control de las variables que no son de interés para la investigación. • Si encontram os diferencias en el largo de las plantas no sabrem os si atribuírselas al tipo de suelo, o sim plem ente a que estam os trabajando con especies diferentes, cada una con un ritm o de crecimiento propio de la especie. • Para que este experim ento esté correctam ente realizado, esa variable que no nos interesa (especie vegetal) debería ser fijada, controlada. Es decir, sem brar en todos los lotes la m ism a especie (ejem plo, soja en todos los lotes). • Q ué otras variables hay que tratar de fijar? Todas las que puedan afectar de alguna form a la variable de respuesta: la cantidad de agua que reciben las plantas que están en cada lote, la fecha de siem bra de las plantas en cada lote, Som breo de los lotes, presencia de plagas en los lotes, entre otros. E s n e c e s a rio c o n tro la r a b s o lu ta m e n te to d a s la s v a ria b le s ? • En realidad no, solo las relevantes, aquellas que pueden causar un efecto no deseado en la variable respuesta. • Variables com o el sexo de la persona que va a m edir las plantas, el color de la regadera usada, el m aterial de la regadera, etc son variables irrelevantes para nuestro estudio, así que no necesitan ser controladas. Usuario1 Highlight Usuario1 Highlight A le a to riza c ió n • M uchas veces aquello que investigam os es m uy variable y resulta casi im posible controlar absolutam ente todas las variables entre los distintos niveles del tratam iento. Este es el caso con poblaciones hum anas, y de otros anim ales o plantas fuera del laboratorio/ bioterio. • La form a de evitar que alguna variable que no sea de nuestro interés afecte nuestra variable respuesta es aleatorizando. Q ué significa esto? Asignar el tratam iento a los individuos de m anera aleatoria. Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight E x p e rim e n to a le a to riza d o • Es aquel en el cual el valor de la variable explicativa que va a recibir cada unidad m uetral se asigna aleatoriam ente. • Esto hace que, si hay pequeñas fuentes de variación no controladas, estas sean prácticam ente iguales en todos los niveles del tratam iento, afectando a la variable respuesta en una form a aleatoria, no sesgada (nuevam ente, en caso de no recordarlo, repasen la definición de sesgo). • De esta form a, si un experim ento aleatorizado m uestra una diferencia en la m edida de la variable respuesta entre los niveles del tratam iento, podem os decir que esa relación es causal. Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight T ip o s d e e x p e rim e n to s a le a to riza d o s • Hay m uuuuchos! Aquí verem os algunos de los m ás usados Experim ento com parativo aleatorizado: • Es aquel en el cual asignam os los distintos niveles del tratam iento a cada uno de las unidades m uestrales(generando tantos grupos com o niveles haya). • Hacem os el experim ento, m edim os las variables de respuesta y luego com param os los resultados observados entre los grupos. • Ejem plo de esto es el de (a) la jardinera que divide a sus plantas en grupos y algunas las riega con 1 litro de agua, a otras con 2 litros, a otras con 3 litros. Luego com para la sobrevida entre grupos Usuario1 Highlight T ip o s d e e x p e rim e n to s a le a to riza d o s • Hay m uuuuchos! Aquí verem os algunos de los m ás usados Experim ento de pares o pareado: • Cada unidad m uestralrecibe todos los niveles del tratam iento, pero en orden aleatorio. Al finalizar el experim ento se observa y com paran las diferencias individuales en las variable de respuesta entre los dos tratam ientos. • De este m odo, cada unidad m uestralproporciona dos o m ás datos (un dato por cada nivel del tratam iento). • Ejem plo de esto es m edir el contenido de una planta antes y después de aplicarle un producto quím ico que se supone puede afectar el contenido en clorofila. Usuario1 Highlight C a s o s e s p e c ia le s : G ru p o s d e c o n tro l, p la c e b o s y e s tu d io s c ie g o s . • Supongam os que m ediante un ensayo clínico se desea poner a prueba un nuevo m edicam ento para decidir si es efectivo o no. La form a m ás intuitiva de hacerlo sería sum inistrarlo a un grupo num eroso de personas con el m ism o cuadro clínico y observar el resultado. • Sin em bargo, esto puede resultar engañoso. El hecho de que algunos (todos) los pacientes m ejoraran no im plicaría necesariam ente que el m edicam ento es bueno (y viceversa: si el paciente em peorara no im plicaría que es el m edicam ento es m alo). • Ya hem os visto que existen las variables de confusión! ¿Cóm o saber si no influyeron otros factores? Usuario1 Highlight G ru p o c o n tro l (e n e l e je m p lo e n s a y o c lín ic o ) • Para esto se utiliza el grupo de control. • El investigador divide a los individuos en estudio en dos grupos. En uno de ellos ― el grupo experim ental― se aplica el tratam iento testeado (el nuevo m edicam ento, en este caso). • En el otro ― el grupo de control― no se aplica el tratam iento. • Luego se com paran am bos resultados. Si la proporción de resultados deseados es m ayor en el grupo experim ental que en el grupo de control, entonces el m edicam ento es eficiente. Si es igual, es ineficiente. Y si es m enor, es contraproducente. C o n s id e ra c io n e s d e l g ru p o c o n tro l • Notem os dos cosas: en prim er lugar, que el grupo de control no se utiliza únicam ente en m edicina. Su uso se expande a todas las ram as de la ciencia donde se quieran evaluar los efectos de cierta variable. • Y otra cosa: que no siem pre el control im plica “ausencia de tratam iento”. A veces es im posible no aplicar un tratam iento (ejem plo, si estam os probando la capacidad nutritiva de un nuevo alim ento para peces, el grupo control no puede “no recibir com ida” porque se m uere… en esos casos, el control sería “el alim ento habitual/ com ercial/ m ás com ún” para estos peces). Usuario1 Highlight P la c e b o e n e s tu d io s m é d ic o s • En el caso particular de los tratam ientos m édicos existe lo que se denom ina efecto placebo. Este consiste en que un paciente, por factores m eram ente psicológicos, puede sentirse curado y m ostrar ciertas m ejorías al creer que se le ha adm inistrado un m edicam ento verdadero, aunque en realidad este sea falso. • Por lo tanto, en el caso de que el m edicam ento testeado fuera ineficiente, aún podrían observarse diferencias entre am bos grupos (experim ental y de control) debido a este efecto. Para evitar que esto distorsione las conclusiones del ensayo clínico, es im portante que el grupo de control reciba un placebo (es decir, algo sim ilar al m edicam ento o tratam iento aplicado, pero sin principio activo/droga). Usuario1 Highlight Usuario1 Highlight E stu d io s c ie g o s • Para que funcione el placebo, es necesario que los pacientes del grupo control no sepan que están recibiendo un placebo en vez del m edicam ento real. • Esta técnica se denom ina estudio ciego: es ciego porque ninguno de los participantes (unidades m uestrales) sabe si está recibiendo el m edicam ento o el placebo. Usuario1 Highlight Usuario1 Highlight A te n e r e n c u e n ta re s p e c to d e la re c o le c c ió n d e d a to s Se pueden generalizar las conclusiones obtenidas a la población de estudio La muestrase seleccionó aleatoriamente?No se pueden generalizar las conclusiones obtenidas a la población de estudio Si No Se pueden obtener conclusiones de tipo causa:efecto(causalidad) El tratamiento se asignó al azar a las unidades muestrales? No se pueden obtener conclusiones de tipo causa:efecto(solo asociación) Si No Usuario1 Highlight C ó m o g e n e ra liza r la s c o n c lu s io n e s a u n a p o b la c ió n : G u ía p a s o a p a s o • 1) Especificar la pregunta biológica a la cual querem os dar respuesta. • 2) Buscar inform ación previa y form ular las hipótesis BIO LÓ GICAS nula y alternativa. • 3) Form ular las hipótesis ESTADÍSTICAS nula yalternativa • 4) Determ inar cuáles son las variables im portantes en nuestro interrogante • 5) Determ inar qué tipo de variable es cada una • 6) Diseñar un experim ento que controle o aleatorice las variables de confusión. Usuario1 Highlight C ó m o g e n e ra liza r la s c o n c lu s io n e s a u n a p o b la c ió n : G u ía p a s o a p a s o • 7) En base al núm ero y tipo de variables, las hipótesis a ser probadas, entre otros, elegir la prueba estadística que m ejor se ajusta a nuestros datos. • 8) Si es posible, hacer un análisis de potencia para determ inar cuál es el m ejor tam año m uestralpara nuestro experim ento • 9) Hacer el experim ento • 10) Exam inar si los datos obtenidos del experim ento cum plen con los principios (supuestos) del testestadístico seleccionado • 11) Aplicar el test estadístico elegido, e interpretar los resultados. Usuario1 Highlight 1 ) E s p e c ific a r la p re g u n ta b io ló g ic a a la c u a l q u e re m o s d a r re s p u e s ta . •Las preguntas biológicas debem os form ularlas de m anera tal que puedan ser realm ente respondidas por m edio de experim entos u otro tipo de estudios. •NO sirve hacer preguntas generales com o: a) ¿La sal afecta el crecim iento de las plantas? b) ¿Pueden las plantas vivir en cualquier tipo de suelo? c) ¿Cóm o funciona el sistem a inm une? Usuario1 Highlight Usuario1 Highlight 1 ) E s p e c ific a r la p re g u n ta b io ló g ic a a la c u a l q u e re m o s d a r re s p u e s ta . •Las preguntas biológicastienen que ser acotadas, del estilo: (a) ¿Las begonias regadas con agua con sal crecen m enos en 10 días que begonias regadas con agua sin sal? (b) ¿Q ué relación existe entre la proporción de arena en un suelo y el tiem po de germ inación de las plantas? (c) ¿Si extirpo el tim o a un anim al, cam bia su respuesta inm une? 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a . • Luego de form ular la pregunta biológica específica que querem os responder, viene un proceso de búsqueda de inform ación ya disponible sobre ese tem a en particular (libros, artículos científicos, charla con expertos del tem a, entre otros). • Sobre esa base de conocim iento, se deben form ular las hipótesis biológicas nulas y alternativas. Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a . • Una hipótesis biológica es una afirm ación o declaración acerca de un proceso biológico que hace el investigador, sobre cuál espera que sea el resultado del experim ento. • Esa hipótesis de investigación luego será validada por los datos recolectados en el experim ento o estudio, o refutada. • Una característica general es que una hipótesis de investigación SIEM PRE es una afirm ación. • No puede ser nunca expresada com o una pregunta (no lleva signo de interrogación!), una duda o una creencia personal (“creo que… ”, “m e parece que”, “puede ser que… ”). Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a . • El hecho de pensar cuáles son las dos posibles hipótesis biológicas para determ inado problem a (una nula y una alternativa), nos da certeza de que nuestro experim ento arrojará distintos resultados para diferentes respuestas de nuestra pregunta biológica. • Siem pre hay que teneren cuenta que,porregla,la hipótesisnula plantea que no hay diferencias,m ientras que la hipótesis alternativa norm alm ente plantea lo que elinvestigadorcree que va a suceder(elresultado esperado). Usuario1 Highlight 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a - E je m p lo s Retom ando los ejem plos previos, podríam os plantear las siguientes hipótesis biológicas: a) BEGO NIAS • Hipótesis biológica nula: Las begonias regadas con agua con sal durante 10 días crecen lo m ism o que begonias regadas con agua sin sal • Hipótesis biológica alternativa: Las begonias regadas con agua con sal durante 10 días crecen m enos que begonias regadas con agua sin sal 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a - E je m p lo s Retom ando los ejem plos previos, podríam os plantear las siguientes hipótesis biológicas: b) SUELO ARENO SO • Hipótesis biológica nula: No hay relación entre proporción de arena en suelo y la germ inación de plantas; independientem ente de la concentración de arena en suelo, las plantas germ inan igual. • Hipótesis biológica alternativa: Si hay relación entre proporción de arena en suelo y crecim iento de plantas; a m ayor proporción de arena en suelo, las plantas germ inan antes. 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a - E je m p lo s Retom ando los ejem plos previos, podríam os plantear las siguientes hipótesis biológicas: c) TIM O • Hipótesis biológica nula: El sistem a inm une anim al es independiente del tim o. Se puede extirpar y no generará cam bios en la respuesta inm une • Hipótesis biológica alternativa: Extirpar el tim o cam bia la respuesta inm une en m am íferos. 2 ) B u s c a r in fo rm a c ió n p re v ia y fo rm u la r la s h ip ó te s is B IO L Ó G IC A S n u la y a lte rn a tiv a • Presten atención a lo siguiente: en todos los casos que presentam os, la hipótesis nula habla de ausencia de cam bio. • Respecto de la alternativa, en los dos prim eros casos, la hipótesis alternativa tiene una dirección, un sentido (“las begonias crecen m enos”, “las plantas germ inan antescuando m ayor es la proporción de arena”), m ientras que en el últim o caso la hipótesis alternativa nos habla de “cam bio” pero sin dirección (“cam bia la respuesta inm une”, pero no nos dice si la aum enta o la dism inuye). • Esta dirección que le dam os (o no) a la hipótesis biológica alternativa tam bién depende del objetivo de nuestra investigación Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight 3 ) F o rm u la r la s h ip ó te s is E S T A D ÍS T IC A S n u la y a lte rn a tiv a • Luego de form ular las hipótesis biológicas, que hacían referencia a procesos biológicos, debem os form ular las hipótesis estadísticas que hacen referencia a núm eros (cosas que podem os m edir o contar). • Nuevam ente la hipótesis nula nos plantea la ausencia de cam bio, m ientras que la alternativa nos plantea el cam bio que esperam os que suceda. Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight 3 ) F o rm u la r la s h ip ó te s is E S T A D ÍS T IC A S n u la y a lte rn a tiv a - E je m p lo Retom ando los ejem plos previos, podríam os plantear las siguientes hipótesis estadísticas: a) BEGO NIAS • Hipótesis Estadísticanula: No hay diferencia en el largo de tallo prom edio de begonias regadas con agua con sal durante 10 días respecto de begonias regadas con agua sin sal • Hipótesis Estadísticaalternativa: Si hay diferencias. El tallo de tallo prom edio de begonias regadas con agua con sal durante 10 días es m as corto que el de begonias regadas con agua sin sal 3 ) F o rm u la r la s h ip ó te s is E S T A D ÍS T IC A S n u la y a lte rn a tiv a - E je m p lo Retom ando los ejem plos previos, podríam os plantear las siguientes hipótesis estadísticas: b) SUELO ARENO SO • Hipótesis Estadísticanula: El tiem po m edio desde siem bra hasta germ inación, m edido en días,es igual en sem illas sem bradas en suelos arenosos que en suelos con baja proporción de arena • Hipótesis Estadísticaalternativa: El tiem po m edio desde siem bra hasta germ inación, m edido en días, es m ás corto en sem illas sem bradas en suelos arenosos que en suelos con baja proporción de arena 3 ) F o rm u la r la s h ip ó te s is E S T A D ÍS T IC A S n u la y a lte rn a tiv a - E je m p lo Retom ando los ejem plos previos, podríam os plantear las siguientes hipótesis estadísticas: c) TIM O • Hipótesis Estadísticanula: La m edia de la concentración de linfocitos T en sangre es la m ism a en anim ales con tim o que en anim ales a los cuales se les extirpó el tim o • Hipótesis Estadísticaalternativa: La m edia de la concentración de linfocitos T es la distinta en anim ales con tim o que en anim ales a los cuales se les extirpó el tim o. 3 ) F o rm u la r la s h ip ó te s is E S T A D ÍS T IC A S n u la y a lte rn a tiv a IM PO RTAN TE TEN ER EN CU EN TA • Com o verán, todas las hipótesis estadísticas se plantean sobre cosas m edibles o contables (“largo de tallo”, “tiem po de germ inación”, “concentración de linfocitos T”), y siem pre respetando que la hipótesis nula expresa ausencia de cam bio. • Adem ás, no hacen referencia directa a los valores de esas cosas m edibles, sino a descriptores num éricos de ellos (“largo de tallo prom edio”, “m edia del tiem po de germ inación”, “concentración m edia de linfocitos T) Usuario1 Highlight C o m p a ra c ió n e n tre h ip ó te s is b io ló g ic a s (n u la y a lte rn a tiv a ) y e s ta d ís tic a s (n u la y a lte rn a tiv a ) • Biológica à Hace referencia a un proceso biológico à No es directam ente cuantificable à Hip Nula: ausencia de cam bio biológico, al realizar el experim ento à Hip Alternativa (con o sin dirección: m ayor que, m enor que, diferente… ): el cam bio biológico que el investigador espera observar al realizar el experim ento • Estadística à Hace referencia a una cantidad num érica à Es directam ente cuantificable, usa descriptores num éricos (m edia, proporción, coeficiente de correlación, varianza, pendiente de recta de regresión) à Hip Nula: ausencia de cam bio biológico num érico en las variables al realizar el experim ento à Hip Alternativa (con o sin dirección, m ayor que, m enor que, diferente… ): el cam bio num érico que el investigador espera observar al realizar el experim ento Usuario1 Highlight 4 ) D e te rm in a r c u á le s s o n la s v a ria b le s im p o rta n te s e n n u e s tro in te rro g a n te • Casualm ente en todos los casos m encionados hasta ahora tenem os dos variables (O jo! no siem pre son dos las variables!) • a) Variables en el estudio de BEGO NIAS? • b) Variables en el estudio de SUELO ARENO SO ? • c) Variables en el estudio de TIM O ? Usuario1 Highlight 4 ) D e te rm in a r c u á le s s o n la s v a ria b le s im p o rta n te s e n n u e s tro in te rro g a n te • Casualm ente en todos los casos m encionados hasta ahora tenem os dos variables (O jo! no siem pre son dos las variables!) • a) Variables en el estudio de BEGO NIAS? Largo de tallo y riego con sal (si/no) • b) Variables en el estudio de SUELO ARENO SO ? Proporción de arena en suelo y tiem po de germ inación • c) Variables en el estudio de TIM O ? tim o (presencia/ ausencia) y concentración de linfocitos T en sangre Usuario1 Highlight 5 ) D e te rm in a r q u é tip o d e v a ria b le e s c a d a u n a • Esto ya lo hem os visto previam ente! • a) Tipo de variables en el estudio de BEGO NIAS? • b) Tipo de variables en el estudio de SUELO ARENO SO ? • c) Tipo de variables en el estudio de TIM O ? Usuario1 Highlight 5 ) D e te rm in a r q u é tip o d e v a ria b le e s c a d a u n a • Esto ya lo hem os visto previam ente! • a) Tipo de variables en el estudio de BEGO NIAS? Largo de tallo es cuantitativa continua y riego con sal (si/no) es cualitativa nom inal • b) Tipo de variables en el estudio de SUELO ARENO SO ?Proporción de arena en suelo es cuantitativa continua y tiem po de germ inación tam bién es cuantitativa continua • c) Tipo de variables en el estudio de TIM O ? tim o (presencia/ ausencia) es cualitativa nom inal y concentración de linfocitos T en sangre es cuantitativa continua. Usuario1 Highlight 6 ) D is e ñ a r u n e x p e rim e n to q u e c o n tro le o a le a to ric e la s v a ria b le s d e c o n fu s ió n . • Esto es lo que hem os visto en la clase de hoy! Podem os, a m odo de práctica, intentar reconocer potenciales variables de confusión en cada experim ento! • a) Posibles variables de confusión en el estudio de BEGO NIAS? • b) Posibles variables de confusión en el estudio de SUELO ARENO SO ? • c) Posibles variables de confusión en el estudio de TIM O ? Usuario1 Highlight 6 ) D is e ñ a r u n e x p e rim e n to q u e c o n tro le o a le a to ric e la s v a ria b le s d e c o n fu s ió n . • a) Posibles variables de confusión en el estudio de BEGO NIAS? • La edad de las plantas (que no ocurra, por ejem plo, que reguem os con sal sólo plantas jóvenes y sin sal sólo plantas m ás viejas), la disponibilidad del luz de las plantas (que no ocurra, por ejem plo, que todas las plantas regadas con sal estén en una zona m ás som breada que las plantas regadas sin sal), que la variedad de begonias sea la m ism a (que no ocurra, por ejem plo, que todas las begonias regadas con sal pertenezcan a la variedad “Begonia tuberosa” y que todas las regadas sin sal pertenezcan a otra variedad), que la com posición del suelo sea la m ism a (que no ocurra, por ejem plo, que todas las begonias regadas con sal estén en suelo arenoso y que todas las regadas sin sal estén en suelo arcilloso), tem peratura am biental constante (que no ocurra, por ejem plo, que todas las plantas regadas con sal estén en una zona m ás cálida que las plantas regadas sin sal), etc. Usuario1 Highlight 6 ) D is e ñ a r u n e x p e rim e n to q u e c o n tro le o a le a to ric e la s v a ria b le s d e c o n fu s ió n . IM PO RTANTE • Si en nuestra m uestra observam os algún tipo de variabilidad (ejem plo, tenem os plantas jóvenes y viejas) hay que aleatorizarlas, de m odo que igual cantidad de plantas jóvenes y viejas reciban am bos tratam ientos (sal y no sal). • Lo m ism o con las otras variables. • Si esto no se controla, nuestras conclusiones no tendrán validez porque los grupos a com parar no difieren solo en la variable de interés (sal) sino tam bién en otras variables que no nos interesan. Usuario1 Highlight 6 ) D is e ñ a r u n e x p e rim e n to q u e c o n tro le o a le a to ric e la s v a ria b le s d e c o n fu s ió n . • c) Posibles variables de confusión en el estudio de TIM O ? • Edad de los anim ales (que no ocurra, por ejem plo, que se le extirpó el tim o solo a anim ales viejos, m ientras que los no extirpados son jóvenes), el sexo de los anim ales (que no ocurra, por ejem plo, que se le extirpó el tim o solo a anim ales m achos, m ientras que los no extirpados son hem bras), el estado de salud de los anim ales (que no ocurra, por ejem plo, que se le extirpó el tim o solo a anim ales que ya estaban enferm os, m ientras que los no extirpados son anim ales sanos), etc. 6 ) D is e ñ a r u n e x p e rim e n to q u e c o n tro le o a le a to ric e la s v a ria b le s d e c o n fu s ió n . IM PO RTANTE • Com o verán son m últiples las variables que no nos interesa evaluar, pero que debem os tratar de m antener lo m ás constantes y hom ogéneas entre los tratam ientos aplicados, para que nuestras conclusiones no pierdan validez por estar influidas por terceras variables de confusión. • Y eso solo se lograusando un diseño experim ental adecuado, aleatorizado, de acuerdo a lo visto previam ente en esta m ism a clase. Usuario1 Highlight 7 ) E n b a s e a l n ú m e ro y tip o d e v a ria b le s , la s h ip ó te s is a s e r p ro b a d a s , e n tre o tro s , e le g ir la p ru e b a e s ta d ís tic a q u e m e jo r s e a ju s ta a n u e s tro s d a to s . • En las próxim as clases, aprenderem os a identificar cuál es la m ejor prueba estadística dada la naturaleza de nuestros datos y variables. • Solo nos enfocarem os en m odelos de la estadística param étrica. • Hay otra ram a de la estadística (no param étrica) en la que no incursionarem os. Usuario1 Highlight 8 ) S i e s p o s ib le , h a c e r u n a n á lis is d e p o te n c ia p a ra d e te rm in a r c u á l e s e l m e jo r ta m a ñ o m u e s tra l p a ra n u e s tro e x p e rim e n to • Aprender a calcular el tam año m uestralóptim o para el estudio que querem os realizar es altam ente necesario: la m uestra no debe ser m uy pequeña (que no nos perm ita obtener diferencias significativas, si es que estas existen), ni dem asiado grande (ya que im plicaría un gasto innecesario de recursos). • En las secciones próxim as clases a calcular ese tam año m uestralóptim o, al m enos para algunos tipos de datos. Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight Usuario1 Highlight 9 ) H a c e r e l e x p e rim e n to • Fíjense que “hacer el experim ento” es el paso 9, no el 1 ni el 2. • Es necesario invertir un gran tiem po en pensar, planificar y tom ar decisiones antesde hacer el experim ento. • De esta form a, tendrem os un experim ento cuyos resultados serán fáciles de com prender, de analizar e interpretar, y podrá dar respuesta a la pregunta biológica planteada al inicio. • Lam entablem ente, otro de los principales problem as en la experim entación en ciencias biológicas en general (y que se visibiliza en m últiples publicaciones) es que (por apuro, desconocim iento de estadística, etc), prim ero “se hace el experim ento” y después “se ve com o analizar los datos”. Esto lleva a m últiples problem as Usuario1 Highlight Usuario1 Highlight 1 0 ) E x a m in a r s i lo s d a to s o b te n id o s d e l e x p e rim e n to c u m p le n c o n lo s p rin c ip io s (s u p u e s to s ) d e l test e s ta d ís tic o s e le c c io n a d o • Dentro de los supuestos básicos a considerar se encuentran el de independencia, norm alidad de los datos y hom ogeneidad de varianzas. • Esto tam bién lo verem os con m ás profundidad en las próxim as clases, pero hay que tenerlo en cuenta: si no se cum plen los supuestos, hay que elegir otra prueba estadística. Usuario1 Highlight Usuario1 Highlight 1 1 ) A p lic a r e l te s t e s ta d ís tic o e le g id o e in te rp re ta r lo s re s u lta d o s . • La aplicación de los testsestadísticos hoy en día se hace con softw are. • Lo que ningún softw are puede hacer, y para eso necesitam os tener bien incorporados tanto los conceptos biológicos de interés com o estadísticos, es la interpretación (estadística y biológica) de los m ism os. • En esto nos enfocarem os de ahora en m ás! Verem os pruebas de t, de chi- cuadrado, análisis de la varianza y regresión lineal. Usuario1 Highlight
Compartir