Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
INTELIGENCIA ARTIFICIAL y SOCIEDAD Reflexiones desde la comunicación ● Reporte de Cátedra “Inteligencia Artificial y Tecnologías Algorítmicas”. Maestría en Comunicación Digital Interactiva – Modalidad a distancia- Universidad Nacional de Rosario. Lionel Brossi, Eugenia Rivieri y Ana María Castillo (eds.) Este reporte fue realizado en colaboración con: SERIES IA+SIC Vol. 1 nº1 Marzo, 2021 La ciencia detrás de Google Scholar: las inequidades que esconde el algoritmo de búsqueda para la ciencia latinoamericana Por Romina Kippes15 El uso del motor de búsqueda Google ha incidido tanto en nuestra vida cotidiana que hemos inventado una palabra en su honor. “Googlear” no es, al momento en que se escriben estas líneas, una palabra aceptada por la Real Academia Española pero sí fue considerada como “el verbo más útil” por la Sociedad Americana de Dialectos en el año 2008. A ese punto llega Google en nuestra vida y no es menor su incidencia en la comunidad científica a partir del lanzamiento en 2005 de una de sus variables de búsqueda: Google Scholar (GS). Este buscador indexa artículos de revistas científicas, trabajos publicados en congresos, libros, tesis, tesinas y todo otro documento depositado en algún repositorio, portal, editorial o base de datos, generando listados por tema, por artículo o por autor. ¿Pero qué nos muestran en realidad esos listados? Mientras científicos y científicas se esfuerzan por ver rankeados sus artículos en la primera página de las búsquedas, con la certeza de que su presencia en esa lista los llevará a más clics, más vistos y más citas, GS sigue manteniendo oculto su algoritmo. En su página alega que clasifica los documentos “de la manera en que lo hacen los investigadores, sopesando el texto completo de cada documento, dónde fue publicado, por quién fue escrito, así como con qué frecuencia y qué tan recientemente se ha citado en otra literatura académica” (Google Scholar; la cursiva es mía) pero no indica qué criterios utiliza para ponderar una variable sobre otra. Distintos trabajos realizados a partir de metodologías de ingeniería inversa (Martín-Martín et al, 2016; Bell & Gipp, 2009; Rovira, Guerrero & Codina, 2018) acuerdan en que las citas recibidas son el factor que más moviliza el ranking de los artículos científicos, mientras que los demás factores (como palabras clave en título o interiores) “tienen una influencia mínima” (Rovira et al, 2018). Esto arrastra desigualdades instaladas desde hace años por indicadores como el Factor de Impacto de las revistas o el índice H de los autores, cuya particularidad es basarse en las citas externas de los artículos de manera que la revista con más citas será siempre la que tenga un mayor factor de impacto; y el autor con más citas en igual período de tiempo tendrá un “h” más alto que su par menos citado. Este desequilibrio, en el que los artículos (y autores) más citados son a su vez los más visibles, y por lo pronto más propensos a continuar incrementando sus vistas y citas, se conoce como efecto “bola de nieve” o “efecto Mateo” (Merton, 1968) en alusión a la parábola del Evangelio: “Porque a cualquiera que tiene, se le dará más, y tendrá en abundancia; pero a cualquiera que no tiene, aun lo que tiene se le quitará”. Ese sesgo hoy se multiplica a partir del algoritmo de GS, con el añadido de que el buscador se 15 1 Licenciada en Comunicación Social, maestranda en Comunicación Digital Interactiva por la Universidad Nacional de Rosario. Mi tesis de posgrado trabajará sobre la visibilidad de las revistas científicas en los entornos 2.0. 31 presenta a sí mismo como “la ayuda para encontrar trabajo relevante en todo el mundo de la investigación académica”. Comenzaremos a explicar la cursiva (mía) a continuación. Todo el mundo de la investigación académica La costumbre de citar en el texto del artículo los trabajos de referencia comenzó a mediados del 1800, como una necesidad por mantener la propiedad intelectual de las aportaciones. Las editoriales científicas ganaron rápidamente el terreno de la comunicación de la ciencia, al punto que aun hasta hoy una de las más grandes editoriales del mundo elabora y publica el ranking de revistas a partir de su factor de impacto: es calculado desde 1963 por el Instituto para la Información Científica (Institute for Scientific Information o ISI), hoy propiedad de la editorial Thomson Reuter, y se publican en el Journal Citation Reports16. Esta “valoración diferencial” de las revistas entre sí (Luchilo, 2019) sostiene y promueve la división simbólica de lo que hoy conocemos como la “corriente principal” o mainstream de la ciencia; frente a una corriente periférica, alimentada fundamentalmente por los países del sur. ¿Puede la ciencia dividirse en principal y periférica? En Latinoamérica la creación de revistas científicas respondió a las etapas históricas propias de constitución de nuestros países (Salatino, 2018 y 2019; Rozemblum, 2014). El fortalecimiento de los sistemas universitarios sobre mitad del siglo XX permitió que un importante número de revistas científicas surjan al calor de las editoriales de las casas de estudio que, a diferencia de las universidades europeas y norteamericanas, sustentan el desarrollo científico a través de los salarios de sus docentes e investigadores y de la infraestructura de sus instituciones. Paralelamente, la producción editorial científica de América Latina y el Caribe presenta características singulares que hacen difícil su inclusión en bases de datos internacionales, entre las que se cuentan la madurez de los equipos de investigación, el idioma en el que se publican y las disciplinas como las ciencias sociales (Beigel & Salatino, 2015), que privilegian en numerosas ocasiones el estudio de problemáticas locales. Además, la incidencia presupuestaria para alcanzar los cánones de publicación de las revistas del mainstream, generó circuitos de distribución alternativos (Salatino, 2018 y 2019; Beigel, 2013; Rozemblum, 2014) y, con el tiempo, particularidades diferentes en la ciencia latinoamericana frente al imaginario de ciencia construido por el norte global. Pese a esto, los indicadores “universales” de la ciencia -elaborados por grandes editoriales sobre la imagen de la ciencia eurocéntrica- se utilizan como herramientas de evaluación de investigadores e investigadoras en países como el nuestro, sin que existan otras métricas alternativas que pongan en valor las particularidades de nuestras regiones. 16 Los principales actores del mercado editorial son cuatro empresas: Springer Nature (Alemania), Elsevier (Países Bajos), Wiley (Estados Unidos) y Taylor & Francis (Reino Unido). Según datos del 2015, juntas editan un total de 10.488 revistas de todo el mundo. Dos de ellas administran los rankings de revistas científicas que son tenidos en cuenta en todo el mundo. 32 Hacia la necesidad de nuevos índices para la ciencia latinoamericana Sadin (2017) incorpora el concepto de “administración algorítmica del mundo” para referirse a ese ordenamiento invisible que naturaliza órdenes que no son, en realidad, generados. Las cajas negras que esconden algoritmos de búsqueda como los de GS impiden comprender de qué manera se rankean listados de artículos y por qué se excluyen otros, lo que indirectamente lleva a la construcción simbólica de una ciencia principal y otra ciencia periférica; una ciencia visible y otra invisible. En palabras de Sadin (citado por Biselli, 2018), “poco a poco, emerge una gubernamentalidad algorítmica, y no solamente aquella que permite a la acción política determinarse en función de una infinidad de estadísticas y de inferencias proyectivas, sino incluso aquella que ´a escondidas´ gobierna numerosas situaciones colectivas e individuales”. Hemos visto a lo largo del artículo que las tecnologías basadas en algoritmos (GS) pueden replicar y expandir sesgos humanos, como el de la creación el factor de impacto basado en un “modelo” de ciencia universal y, principalmente, norteamericana. Para evitarlo es necesariocontar con un protocolo y/o políticas regulatorias que lo impidan o “controlen” y, antes que eso, con índices que midan a la ciencia latinoamericana desde la vara de su regionalidad o del impacto social de sus resultados. A los índices como los analizados se suman hoy los indicadores que surgen de la web 2.0, también llamados altmétricas, que proporcionan nuevos datos para el análisis de la actividad científica. La idea que subyace en el funcionamiento de estos nuevos indicadores es que las menciones en blogs, el número de retuits o menciones en una red, o la cantidad de personas que guardan un artículo en un gestor de referencias puede ser una medida válida del uso y repercusión de las publicaciones científicas. Investigaciones recientes comenzaron a estudiar las diferencias entre impactos surgidos de la bibliometría clásica y las altmétricas; y algunas dan cuenta que los artículos que responden más favorablemente a estos índices son aquellos vinculados con “problemas sociales” actuales (Van Noorden, 2012; Salinas et al., 2013). Esto genera un nuevo punto de inflexión en el análisis de la relación de la ciencia con la sociedad, debido a que los canales de respuesta y de impacto desde la publicación de un tema pueden ser inmediatos y directos. La ciencia latinoamericana debe sentar sus propios principios estableciendo algoritmos claras, que ponderen regionalidades, resolución de problemas locales, surgimiento de nuevas ciencias y grupos de estudio ubicados fuera del mainstream; y, por otro lado, considerar lo que las altmétricas arrullan desde sus trincheras en redes sociales: ¿qué importa en las sociedades que vivimos? En esas respuestas puede estar la clave de un nuevo diálogo entre ciencia y sociedad. Referencias ● Alonso-Arévalo, J. (2016). Altmetrics: la integración del impacto científico y el impacto social de la investigación. En Pozo-Cabrera, E., Alonso-Arévalo, J., Gadea, W., Fenger, N., Ledesma-Ayora, M. Epistemología, acceso abierto e impacto de la investigación científica. Cuenca, Ecuador: Universidad Católica 33 de Cuenca. ● Beel, J.; Gipp, B. (2009). Google Scholar’s Ranking Algorithm: The Impact of Citation Counts (An Empirical Study). En Proceedings of the 3rd IEEE International Conference on Research Challenges in Information Science (RCIS’09), Fez, Morocco. ● Beigel, F.; Salatino, M. (2015). Circuitos segmentados de consagración académica: las revistas de Ciencias Sociales y Humanas en la Argentina. Información, cultura y sociedad, vol. 32, pp. 11 a 36. ● Biselli, R. (2018). La humanidad aumentada. La administración digital del mundo. ● Inmediaciones de la Comunicación, vol. 13 (1), pp. 305-308. ● Canales, M.; Lara, C. (2019). Lejos de proteger nuestros datos en América Latina Derechos digitales. Recuperado el 6/07/2020 de: https://www.derechosdigitales.org/12058/lejos-de-proteger-nuestros-datos-en-america-latina/ ● Google Scholar. h ttps://scholar.google.com/scholar/about.html - Consultado el 28 de junio de 2020. ● Gouveia, F. (2016) La altmetría y la interfaz entre ciencia y sociedad. Trabalho, Educação e Saúde, vol.14 no.3 Rio de Janeiro Sept./Dec. 2016 Recuperado de La altmetría y la interfaz entre ciencia y sociedad el revisado el 5 de abril de 2020. ● Luchilo, L. (2019). Revistas científicas: oligopolio y acceso abierto. Revista Iberoamericana de Ciencia, Tecnología y Sociedad, vol. 14 (40), pp. 40 a 79. ● Martín-Martín, A., Orduna-Malea, E., Ayllón, J.; Delgado López-Cózar, E. (2016). Back to the past: on the shoulders of an academic search engine giant. Scientometrics, vol. 107 (3). ● Merton, R. (1968). The Matthew Effect in Science. Science, v. 159 (3810), pp. 56-63 ● Rovira, C.; Guerrero-Solé, F.; Codina, L. (2018). Received citations as a main SEO factor of Google Scholar results ranking. El profesional de la información, v. 27 (3), pp. 559-569. ● Rozemblum, C. (2014). El problema de la visibilidad en revistas científicas argentinas de Humanidades y Ciencias Sociales: Estudio de casos en Historia y Filosofía. Tesis de posgrado. Universidad Nacional de Quilmes. ● Salatino, M. (2018). La estructura del espacio latinoamericano de revistas cientícas. Tesis de doctorado. Universidad Nacional de Cuyo. ● Salatino, M. (2019). Las encrucijadas de las revistas universitarias en Argentina. En Beigel, ● F. y Bekerman F. (eds) Culturas evaluativas. Impactos y dilemas del Programa de Incentivos a Docentes-Investigadores en Argentina (1993-2018). CLACSO. ● Torres-Salinas, D.; Ruiz-Pérez, R.; Delgado-López-Cózar, E. (2009). Google Scholar como herramienta para la evaluación científica. El profesional de la información, septiembre-octubre, v. 18, (5), pp. 501-510. ● Torres-Salinas, D.; Cabezas, A.; Jiménez, E. (2013). Altmetrics: nuevos indicadores para la comunicación científica en la Web 2.0. Comunicar, 41, pp. 53-60. ● Vanti, N.; Casado, E. (2015). La Altmetría como una opción para medir la ciencia de manera más justa y equitativa. Desafíos y oportunidades de las Ciencias de la Información y la Documentación en la era digital. En Actas del VII Encuentro Ibérico EDICIC 2015 (Madrid, 16 y 17 de noviembre de 2015). Universidad 34 https://www.derechosdigitales.org/12058/lejos-de-proteger-nuestros-datos-en-america-latina/ https://scholar.google.com/scholar/about.html http://www.scielo.br/scielo.php?script=sci_serial&pid=1981-7746&lng=en&nrm=iso http://www.scielo.br/scielo.php?script=sci_serial&pid=1981-7746&lng=en&nrm=iso http://www.scielo.br/scielo.php?pid=S1981-77462016000300643&script=sci_arttext&tlng=es http://www.scielo.br/scielo.php?pid=S1981-77462016000300643&script=sci_arttext&tlng=es Complutense de Madrid, Madrid. ● Van Noorden, R. (2012). What were the top papers of 2012 on social media? Nature News Blog. Revisado el 5 de abril de 2020. Disponible en: http://blogs.nature.com/news/2012/12/what-were-the-top-papers-of-2012-on-social-media.ht ml 35 http://blogs.nature.com/news/2012/12/what-were-the-top-papers-of-2012-on-social-media.html
Compartir