Logo Studenta

La_ciencia_detras_de_Google_Scholar_las

¡Estudia con miles de materiales!

Vista previa del material en texto

INTELIGENCIA ARTIFICIAL
y SOCIEDAD
Reflexiones desde la comunicación
● Reporte de Cátedra “Inteligencia Artificial y Tecnologías Algorítmicas”.
Maestría en Comunicación Digital Interactiva – Modalidad a distancia-
Universidad Nacional de Rosario.
Lionel Brossi, Eugenia Rivieri y Ana María Castillo (eds.)
Este reporte fue realizado en colaboración con:
SERIES IA+SIC
Vol. 1 nº1
Marzo, 2021
La ciencia detrás de Google Scholar: las inequidades que esconde el algoritmo de
búsqueda para la ciencia latinoamericana
Por Romina Kippes15
El uso del motor de búsqueda Google ha incidido tanto en nuestra vida cotidiana que hemos
inventado una palabra en su honor. “Googlear” no es, al momento en que se escriben estas líneas, una
palabra aceptada por la Real Academia Española pero sí fue considerada como “el verbo más útil” por
la Sociedad Americana de Dialectos en el año 2008. A ese punto llega Google en nuestra vida y no es
menor su incidencia en la comunidad científica a partir del lanzamiento en 2005 de una de sus
variables de búsqueda: Google Scholar (GS).
Este buscador indexa artículos de revistas científicas, trabajos publicados en congresos, libros, tesis,
tesinas y todo otro documento depositado en algún repositorio, portal, editorial o base de datos,
generando listados por tema, por artículo o por autor. ¿Pero qué nos muestran en realidad esos
listados?
Mientras científicos y científicas se esfuerzan por ver rankeados sus artículos en la primera página de
las búsquedas, con la certeza de que su presencia en esa lista los llevará a más clics, más vistos y más
citas, GS sigue manteniendo oculto su algoritmo. En su página alega que clasifica los documentos “de
la manera en que lo hacen los investigadores, sopesando el texto completo de cada documento, dónde
fue publicado, por quién fue escrito, así como con qué frecuencia y qué tan recientemente se ha citado
en otra literatura académica” (Google Scholar; la cursiva es mía) pero no indica qué criterios utiliza
para ponderar una variable sobre otra.
Distintos trabajos realizados a partir de metodologías de ingeniería inversa (Martín-Martín et al,
2016; Bell & Gipp, 2009; Rovira, Guerrero & Codina, 2018) acuerdan en que las citas recibidas son
el factor que más moviliza el ranking de los artículos científicos, mientras que los demás factores
(como palabras clave en título o interiores) “tienen una influencia mínima” (Rovira et al, 2018).
Esto arrastra desigualdades instaladas desde hace años por indicadores como el Factor de Impacto de
las revistas o el índice H de los autores, cuya particularidad es basarse en las citas externas de los
artículos de manera que la revista con más citas será siempre la que tenga un mayor factor de
impacto; y el autor con más citas en igual período de tiempo tendrá un “h” más alto que su par menos
citado. Este desequilibrio, en el que los artículos (y autores) más citados son a su vez los más visibles,
y por lo pronto más propensos a continuar incrementando sus vistas y citas, se conoce como efecto
“bola de nieve” o “efecto Mateo” (Merton, 1968) en alusión a la parábola del Evangelio: “Porque a
cualquiera que tiene, se le dará más, y tendrá en abundancia; pero a cualquiera que no tiene, aun lo
que tiene se le quitará”.
Ese sesgo hoy se multiplica a partir del algoritmo de GS, con el añadido de que el buscador se
15 1 Licenciada en Comunicación Social, maestranda en Comunicación Digital Interactiva por la Universidad Nacional de Rosario. Mi tesis de posgrado trabajará sobre la visibilidad de las
revistas científicas en los entornos 2.0.
31
presenta a sí mismo como “la ayuda para encontrar trabajo relevante en todo el mundo de la
investigación académica”. Comenzaremos a explicar la cursiva (mía) a continuación.
Todo el mundo de la investigación académica
La costumbre de citar en el texto del artículo los trabajos de referencia comenzó a mediados del 1800,
como una necesidad por mantener la propiedad intelectual de las aportaciones. Las editoriales
científicas ganaron rápidamente el terreno de la comunicación de la ciencia, al punto que aun hasta
hoy una de las más grandes editoriales del mundo elabora y publica el ranking de revistas a partir de
su factor de impacto: es calculado desde 1963 por el Instituto para la Información Científica (Institute
for Scientific Information o ISI), hoy propiedad de la editorial Thomson Reuter, y se publican en el
Journal Citation Reports16.
Esta “valoración diferencial” de las revistas entre sí (Luchilo, 2019) sostiene y promueve la división
simbólica de lo que hoy conocemos como la “corriente principal” o mainstream de la ciencia; frente a
una corriente periférica, alimentada fundamentalmente por los países del sur. ¿Puede la ciencia
dividirse en principal y periférica?
En Latinoamérica la creación de revistas científicas respondió a las etapas históricas propias de
constitución de nuestros países (Salatino, 2018 y 2019; Rozemblum, 2014). El fortalecimiento de los
sistemas universitarios sobre mitad del siglo XX permitió que un importante número de revistas
científicas surjan al calor de las editoriales de las casas de estudio que, a diferencia de las
universidades europeas y norteamericanas, sustentan el desarrollo científico a través de los salarios
de sus docentes e investigadores y de la infraestructura de sus instituciones.
Paralelamente, la producción editorial científica de América Latina y el Caribe presenta
características singulares que hacen difícil su inclusión en bases de datos internacionales, entre las
que se cuentan la madurez de los equipos de investigación, el idioma en el que se publican y las
disciplinas como las ciencias sociales (Beigel & Salatino, 2015), que privilegian en numerosas
ocasiones el estudio de problemáticas locales. Además, la incidencia presupuestaria para alcanzar
los cánones de publicación de las revistas del mainstream, generó circuitos de distribución
alternativos (Salatino, 2018 y 2019; Beigel, 2013; Rozemblum, 2014) y, con el tiempo,
particularidades diferentes en la ciencia latinoamericana frente al imaginario de ciencia construido
por el norte global.
Pese a esto, los indicadores “universales” de la ciencia -elaborados por grandes editoriales sobre la
imagen de la ciencia eurocéntrica- se utilizan como herramientas de evaluación de investigadores e
investigadoras en países como el nuestro, sin que existan otras métricas alternativas que pongan en
valor las particularidades de nuestras regiones.
16 Los principales actores del mercado editorial son cuatro empresas: Springer Nature (Alemania), Elsevier (Países Bajos), Wiley (Estados Unidos) y Taylor & Francis (Reino Unido).
Según datos del 2015, juntas editan un total de 10.488 revistas de todo el mundo. Dos de ellas administran los rankings de revistas científicas que son tenidos en cuenta en todo el
mundo.
32
Hacia la necesidad de nuevos índices para la ciencia latinoamericana
Sadin (2017) incorpora el concepto de “administración algorítmica del mundo” para referirse a ese
ordenamiento invisible que naturaliza órdenes que no son, en realidad, generados. Las cajas negras
que esconden algoritmos de búsqueda como los de GS impiden comprender de qué manera se rankean
listados de artículos y por qué se excluyen otros, lo que indirectamente lleva a la construcción
simbólica de una ciencia principal y otra ciencia periférica; una ciencia visible y otra invisible. En
palabras de Sadin (citado por Biselli, 2018), “poco a poco, emerge una gubernamentalidad
algorítmica, y no solamente aquella que permite a la acción política determinarse en función de una
infinidad de estadísticas y de inferencias proyectivas, sino incluso aquella que ´a escondidas´ gobierna
numerosas situaciones colectivas e individuales”.
Hemos visto a lo largo del artículo que las tecnologías basadas en algoritmos (GS) pueden replicar y
expandir sesgos humanos, como el de la creación el factor de impacto basado en un “modelo” de
ciencia universal y, principalmente, norteamericana. Para evitarlo es necesariocontar con un
protocolo y/o políticas regulatorias que lo impidan o “controlen” y, antes que eso, con índices que
midan a la ciencia latinoamericana desde la vara de su regionalidad o del impacto social de sus
resultados.
A los índices como los analizados se suman hoy los indicadores que surgen de la web 2.0, también
llamados altmétricas, que proporcionan nuevos datos para el análisis de la actividad científica. La
idea que subyace en el funcionamiento de estos nuevos indicadores es que las menciones en blogs, el
número de retuits o menciones en una red, o la cantidad de personas que guardan un artículo en un
gestor de referencias puede ser una medida válida del uso y repercusión de las publicaciones
científicas.
Investigaciones recientes comenzaron a estudiar las diferencias entre impactos surgidos de la
bibliometría clásica y las altmétricas; y algunas dan cuenta que los artículos que responden más
favorablemente a estos índices son aquellos vinculados con “problemas sociales” actuales (Van
Noorden, 2012; Salinas et al., 2013). Esto genera un nuevo punto de inflexión en el análisis de la
relación de la ciencia con la sociedad, debido a que los canales de respuesta y de impacto desde la
publicación de un tema pueden ser inmediatos y directos.
La ciencia latinoamericana debe sentar sus propios principios estableciendo algoritmos claras, que
ponderen regionalidades, resolución de problemas locales, surgimiento de nuevas ciencias y grupos
de estudio ubicados fuera del mainstream; y, por otro lado, considerar lo que las altmétricas arrullan
desde sus trincheras en redes sociales: ¿qué importa en las sociedades que vivimos? En esas
respuestas puede estar la clave de un nuevo diálogo entre ciencia y sociedad.
Referencias
● Alonso-Arévalo, J. (2016). Altmetrics: la integración del impacto científico y el impacto social de la
investigación. En Pozo-Cabrera, E., Alonso-Arévalo, J., Gadea, W., Fenger, N., Ledesma-Ayora, M.
Epistemología, acceso abierto e impacto de la investigación científica. Cuenca, Ecuador: Universidad Católica
33
de Cuenca.
● Beel, J.; Gipp, B. (2009). Google Scholar’s Ranking Algorithm: The Impact of Citation Counts (An Empirical
Study). En Proceedings of the 3rd IEEE International Conference on Research Challenges in Information
Science (RCIS’09), Fez, Morocco.
● Beigel, F.; Salatino, M. (2015). Circuitos segmentados de consagración académica: las revistas de Ciencias
Sociales y Humanas en la Argentina. Información, cultura y sociedad, vol. 32, pp. 11 a 36.
● Biselli, R. (2018). La humanidad aumentada. La administración digital del mundo.
● Inmediaciones de la Comunicación, vol. 13 (1), pp. 305-308.
● Canales, M.; Lara, C. (2019). Lejos de proteger nuestros datos en América Latina Derechos digitales.
Recuperado el 6/07/2020 de:
https://www.derechosdigitales.org/12058/lejos-de-proteger-nuestros-datos-en-america-latina/
● Google Scholar. h ttps://scholar.google.com/scholar/about.html - Consultado el 28 de junio de 2020.
● Gouveia, F. (2016) La altmetría y la interfaz entre ciencia y sociedad. Trabalho, Educação e Saúde, vol.14 no.3
Rio de Janeiro Sept./Dec. 2016 Recuperado de La altmetría y la interfaz entre ciencia y sociedad el revisado el 5
de abril de 2020.
● Luchilo, L. (2019). Revistas científicas: oligopolio y acceso abierto. Revista Iberoamericana de Ciencia,
Tecnología y Sociedad, vol. 14 (40), pp. 40 a 79.
● Martín-Martín, A., Orduna-Malea, E., Ayllón, J.; Delgado López-Cózar, E. (2016). Back to the past: on the
shoulders of an academic search engine giant. Scientometrics, vol. 107 (3).
● Merton, R. (1968). The Matthew Effect in Science. Science, v. 159 (3810), pp. 56-63
● Rovira, C.; Guerrero-Solé, F.; Codina, L. (2018). Received citations as a main SEO factor of Google Scholar
results ranking. El profesional de la información, v. 27 (3), pp. 559-569.
● Rozemblum, C. (2014). El problema de la visibilidad en revistas científicas argentinas de Humanidades y
Ciencias Sociales: Estudio de casos en Historia y Filosofía. Tesis de posgrado. Universidad Nacional de
Quilmes.
● Salatino, M. (2018). La estructura del espacio latinoamericano de revistas cientícas. Tesis de doctorado.
Universidad Nacional de Cuyo.
● Salatino, M. (2019). Las encrucijadas de las revistas universitarias en Argentina. En Beigel,
● F. y Bekerman F. (eds) Culturas evaluativas. Impactos y dilemas del Programa de Incentivos a
Docentes-Investigadores en Argentina (1993-2018). CLACSO.
● Torres-Salinas, D.; Ruiz-Pérez, R.; Delgado-López-Cózar, E. (2009). Google Scholar como herramienta para la
evaluación científica. El profesional de la información, septiembre-octubre, v. 18, (5), pp. 501-510.
● Torres-Salinas, D.; Cabezas, A.; Jiménez, E. (2013). Altmetrics: nuevos indicadores para la comunicación
científica en la Web 2.0. Comunicar, 41, pp. 53-60.
● Vanti, N.; Casado, E. (2015). La Altmetría como una opción para medir la ciencia de manera más justa y
equitativa. Desafíos y oportunidades de las Ciencias de la Información y la Documentación en la era digital. En
Actas del VII Encuentro Ibérico EDICIC 2015 (Madrid, 16 y 17 de noviembre de 2015). Universidad
34
https://www.derechosdigitales.org/12058/lejos-de-proteger-nuestros-datos-en-america-latina/
https://scholar.google.com/scholar/about.html
http://www.scielo.br/scielo.php?script=sci_serial&pid=1981-7746&lng=en&nrm=iso
http://www.scielo.br/scielo.php?script=sci_serial&pid=1981-7746&lng=en&nrm=iso
http://www.scielo.br/scielo.php?pid=S1981-77462016000300643&script=sci_arttext&tlng=es
http://www.scielo.br/scielo.php?pid=S1981-77462016000300643&script=sci_arttext&tlng=es
Complutense de Madrid, Madrid.
● Van Noorden, R. (2012). What were the top papers of 2012 on social media? Nature News Blog. Revisado el 5
de abril de 2020. Disponible en:
http://blogs.nature.com/news/2012/12/what-were-the-top-papers-of-2012-on-social-media.ht ml
35
http://blogs.nature.com/news/2012/12/what-were-the-top-papers-of-2012-on-social-media.html

Continuar navegando