Logo Studenta

Unidad 6 Búsqueda en Internet para Universitarios - Cesar Guillermo Limones Calderón

¡Este material tiene más páginas!

Vista previa del material en texto

Unidad 6. La web semántica 
1. Que vamos a dedicar a la Web Semántica,
2. ¿No te parecería increíble
3. que pudieras consultar
4. a los buscadores de Internet
5. en lenguaje natural?,
6. es decir,
7. que pudieras por ejemplo preguntar:
8. ¿cuál es la noticia más importante
9. esta semana en el tema de migración?
10. y que los resultados
11. correspondieran a lo esperado.
12. Bueno, pues esto es lo que plantea la Web Semántica
13. que algunos vislumbran como
14. el futuro de la Web y que llaman la Web 3.0
15. Para poner en contexto
16. esta idea de la Web Semántica
17. esta semana vamos a ver qué es la Web 1.0,
18. qué es lo que se ha llamado la Web 2.0,
19. y cómo se vislumbra el futuro de la Web,
20. es decir, la Web 3.0.
21. Y también vamos a revisar
22. algunas herramientas ya disponibles
23. de búsqueda semántica.
24. Si bien estas herramientas
25. aún son muy pocas e incipientes,
26. te comparto que para mí y para mis estudiantes
27. un buscador que se llama
28. INTELLIGO
29. ha resultado todo un hallazgo,
30. no sólo porque mapea gráficamente
31. las relaciones entre conceptos,
32. sino porque también nos ha dado ideas
33. de cómo podemos hacer nuevas
34. representaciones gráficas del conocimiento.
1. Para situar la Web Semántica,
2. es necesario hablar de las generaciones de la Web...
3. Generación Web 1.0
4. En una galaxia muy muy lejana, a finales de los 80,
5. se popularizó la Web 1.0
6. Los sitios bajo el dominio
7. de esta generación
8. fueron diseñados para ser de tipo “sólo lectura”,
9. esto solamente
10. permitía a los usuarios
11. acceder al contenido pero no podían modificar,
12. ni comentar,
13. ni compartir la información.
14. Sólo los técnicos especializados
15. conocidos como Webmasters
16. tenían el poder de subir y modificar
17. la información de estos sitios,
18. debido a esto,
19. los usuarios conformaron una Alianza
20. que cambiaría el rumbo de la historia.
21. Sin embargo aún existen sitios
22. bajo el dominio de la Web 1.0.
23. Generación Web 2.0
24. Con el fin de debilitar el Imperio de los Webmasters,
25. surgió la generación Web 2.0...
26. Fue Dale Dougherty o quizá Tim O’Reilly,
27. quien estableció el término Web 2.0,
28. también conocido como “Web social”.
29. Esta nueva generación permite a los usuarios
30. tener un rol más activo para colaborar,
31. intercambiar, modificar y compartir información.
32. Los sitios de esta generación son las redes sociales,
33. los blogs, los wikis y las folksonomías.
34. Los principales ideales
35. de esta generación 2.0 son:
36. Contenidos generados por los usuarios
37. en forma colaborativa y/o individual.
38. Estímulo al potencial de la multitud
39. (inteligencia colectiva).
40. Multiplicación de los datos (big data).
41. Arquitecturas de participación.
42. Los servicios mejoran y “aprenden”
43. mientras más usuarios los utilizan.
44. El efecto red.
45. Aumenta el valor de los servicios
46. mientras más usuarios
47. los usan y compartan.
48. Apertura.
49. Interés total por el acceso abierto a la información.
50. Generación Web 3.0
51. Con el paso del tiempo,
52. la Alianza de los Usuarios
53. ha venido desarrollando
54. una nueva esperanza.
55. Las recientes visiones
56. nos hablan de una evolución
57. hacia la generación Web 3.0.
58. Para su desarrollo se requiere de tecnologías
59. como la Inteligencia artificial,
60. los Datos semánticos,
61. Tecnología geoespacial
62. y los Gráficos 3D.
63. Esta evolución hará que las computadoras
64. entiendan nuestro lenguaje cotidiano
65. gracias a la aparición de la Web Semántica,
66. es decir,
67. que podremos formular preguntas específicas
68. y obtener resultados específicos,
69. por ejemplo:
70. ¿Cuál es el boleto de viaje espacial
71. más barato Naboo-Tatooine,
72. viaje redondo, clase rebelde,
73. para volar entre el 15 y el 30
74. de septiembre en vuelo directo?
75. Las tecnologías que se utilizarán
76. estarán diseñadas para obtener
77. información relevante y pertinente.
78. Un posible predecesor es el agente inteligente
79. que actualmente emplea Amazon
80. para relacionar búsquedas
81. y compras de los usuarios
82. y así sugerir artículos similares.
83. Les seguiremos informando.
84. 
Qué es la web semántica
Si realizamos una búsqueda en Google acerca de la Web Semántica, encontraremos muchos documentos técnicos que se refieren a ontologías, RDF, SPARQL, FOFA y OWL, entre otros tecnicismos que nos dicen poco a los usuarios comunes.
En este curso, que no es para técnicos, evitaremos esa aproximación y trataremos de explicar la Web Semántica en términos accesibles.
Un poco de historia
Para situar la Web Semántica, es necesario hablar de las generaciones de la Web.  
La Web (o la Red), es el servicio más conocido a Internet y ambos términos han pasado a ser prácticamente intercambiables.
Web 1.0
La primera generación de la Web, conocida como Web 1.0, se popularizó a finales de los 80, principios de los 90 y su principal característica es que era de sólo lectura.  Todos los sitios web de esta primera generación surgieron como espacios meramente informativos, en los que los usuarios podían revisar contenidos, pero no interactuar con ellos (modificarlos, comentarlos, preguntar, compartir, etc.).  Sólo los técnicos especializados (webmasters) podían subir información a los sitios web o modificarla.  Hoy día todavía existen numerosas páginas al estilo Web 1.0.
Web 2.0
El término Web 2.0 fue acuñado en 2004 por Dale Dougherty (aunque algunos lo atribuyen a Tim O’Reilly), vice-presidente de O’Reilly Media Inc., para referirse a una nueva generación de desarrollos web, enfocados a usuarios activos y comunidades.  Los principales servicios etiquetados bajo este término fueron las redes sociales, los blogs (y sus variantes audioblogs y videoblogs), los wikis, las folksonomías y en general las herramientas que permitieran colaboración entre usuarios, así como un papel más activo de éstos en la generación e intercambio de información.  La Web 2.0 también se ha denominado web social.
Las principales ideas detrás de la Web 2.0 son:
Contenidos generados por los usuarios en forma colaborativa y/o individual.  Día a día podemos ver ejemplos de esto en YouTube, Instagram, Facebook, etc.
Estímulo al potencial de la multitud (inteligencia colectiva).  Las folksonomías, la curaduría de recursos en línea, son ejemplos de este potencial.
Multiplicación de los datos (big data).  Los datos recolectados por Google, Amazon, eBay, son ejemplo del volumen de información que esta Web 2.0 de usuarios activos genera.
Arquitecturas de participación.  Servicios que mejoran y “aprenden” en tanto más usuarios los utilizan, como el propio buscador de Google o el agente inteligente de Amazon.
El efecto red. Se refiere al incremento en el valor de los servicios en tanto más usuarios los usan y comparten.  Un ejemplo claro es Facebook.
Apertura. Se intensificó el interés por el acceso abierto a la información, que ha desembocado en el movimiento actual de Open Access o Acceso Abierto a los datos.
Web 3.0
La Web 3.0 ya está aquí y se refiere a la evolución de la Web actual a partir de tecnologías como la inteligencia artificial, los datos semánticos, tecnología geoespacial y los gráficos 3D.
Para el presente curso, el aspecto más atractivo de la Web 3.0 es la llamada Web Semántica, que en forma coloquial podríamos decir es una web que entiende nuestro lenguaje cotidiano para hacer búsquedas que arrojen resultados muy específicos.  La Web Semántica permite al usuario preguntar: ¿Cuál es el boleto de avión más barato México-Nueva York, viaje redondo, en clase turista, ¿para volar entre el 15 y el 30 de septiembre en vuelo directo? y obtener un resultado puntual.
La web semántica, según los expertos, utiliza una combinación de diversas tecnologías que permite obtener información mucho más relevante y pertinente con menor esfuerzo por parte del usuario.   En esto tienen mucho que ver los agentes inteligentes, que cada vez están más presentes en nuestras vidas. 
El avance más reciente de Google en este sentido es BERT(Bidirectional Encoder Representations from Transformers), un desarrollo basado en inteligencia artificial que permite que el buscador no sólo reconozca los términos clave de una búsqueda, sino que entienda su contexto de uso. Acude a la sección "Para saber más..." de este tema para mayores detalles.
Un agente inteligente, por ejemplo, es el que usa Amazon para relacionar las búsquedas y las compras que hace un usuario, con las búsquedas y compras de otros y así poder hacer sugerencias que hacen sentido para el consumidor. Otro agente inteligente es algoritmo de Netflix que nos sugiere películas y series con base en nuestros consumos previos y en consumos similares de otros usuarios.
Una manifestación reciente de este tipo de servicio, son los agentes inteligentes conectados a la web, como Alexa, comercializado también por Amazon, Siri de Apple y Google Assistant, cuyas habilidades rebasan por mucho las búsquedas en línea y con quienes podemos comunicarnos en lenguaje natural.
Referencias
Anderson, P. (2007). What is Web 2.0? Ideas, technologies and implications for education, JISC: Reino Unido.
García, J. (2019). Cómo funciona BERT, la inteligencia artificial con la que Google quiere conseguir que su motor de búsqueda nos entienda mejor. Xataka. Recuperado de: https://www.xataka.com/servicios/como-funciona-bert-inteligencia-artificial-que-google-quiere-conseguir-que-su-motor-busqueda-nos-entienda-mejor
1. Inicio de la transcripción. Saltar al final.
2. ¡Rayos!, ya tengo muchísima hambre
3. y se me olvidó el lunch en casa.
4. ¡Oh!, es Miss Wonderly
5. Hola Miss Wonderly, ¿cómo le va?
6. Muy bien Spade, ¿cómo vas con mi encargo?
7. ¿Sobre los especialistas en búsqueda semántica?
8. ¡Sí!
9. Ok, tengo a dos que cubren el perfil
10. y pueden interesarle.
11. ¡Excelente! ¿qué encontraste?
12. El primero de ellos se hace llamar Wolfram Alpha.
13. Opera con lo último en tecnología de la Web 3.0
14. y trabaja para Wolfram Research.
15. Su fortaleza radica en implementar diversos modelos,
16. métodos y algoritmos para calcular grandes volúmenes
17. y variedades de datos
18. de diferentes ámbitos del conocimiento
19. como Matemáticas, Física, Química, Astronomía,
20. y Educación, por mencionar algunos.
21. Responde a consultas y búsquedas de tipo factual
22. y se autodenomina como un “Motor de conocimiento”.
23. ¡Perfecto!
24. Si domina el idioma inglés,
25. no tendrá ningún problema para trabajar con él.
26. Mmm… ¿Y qué me dices del otro?
27. El segundo se llama “Intelligo”
28. o al menos así le conocen en el mundo
29. de los buscadores semánticos,
30. y está al servicio del Observatorio Iberoamericano
31. de la Ciencia, la Tecnología y la Sociedad.
32. Especialista en búsquedas de información científica,
33. tecnológica y educativa,
34. tiene la capacidad de explorar y acceder
35. a grandes bases de datos
36. de revistas académicas como:
37. REDALYC, SciELO, LAReferencia, CSIC y OpenAIre.
38. Mediante algoritmos de clustering y análisis de grafos,
39. genera mapas, listados y gráficos
40. con los principales conceptos
41. extraídos de los documentos.
42. Además del Inglés, también habla
43. en Portugués y Español.
44. Muy bien, te felicito.
45. Espere, aún tengo un tercer prospecto.
46. ¿Perdón?, dijiste que sólo tenías dos perfiles.
47. Así es, pero como le digo,
48. se trata de un prospecto
49. que en un futuro próximo puede interesarle.
50. De acuerdo, sólo por curiosidad,
51. dime ¿de quién se trata?
52. Es una de las hijas del famoso Google,
53. que ​ayudará a descubrir información
54. de forma rápida y fácil,
55. y que promete resultados
56. mucho más completos que su padre.
57. Interesante Spade, ¿qué más sabes?
58. Dicen que uno de sus secretos
59. se basa en aprovechar la inteligencia colectiva
60. que se encuentra en la web,
61. para comprender el mundo de un modo más cercano
62. a cómo lo hace la gente.
63. Fantástico, ¿pero no me has dicho cómo se llama?
64. La conocen como ¡The Knowledge Graph!
65. ¡Buen trabajo! Te llamo más tarde
66. para pasar por la información.
67. De acuerdo Miss, espero su llamada.
68. ¡Adiós!
69. ¡Hasta luego!
70. Listo.
71. Ya no aguanto más,
72. voy por unos tacos a la esquina.
73. 
Algunas herramientas de búsqueda semántica
Wolfram Alpha:
http://www.wolframalpha.com/ 
Aunque en realidad no es un buscador web, Wolfram Alpha es una herramienta Web 3.0, que combina recolección, curación y cómputo de gran variedad de datos.  El objetivo de los desarrolladores es implementar una diversidad de modelos, métodos y algoritmos para computar grandes volúmenes y variedades de datos de muy diversos ámbitos del conocimiento.  El desafío es poner a disposición una herramienta capaz de dar respuesta a consultas y búsquedas de tipo factual.  Se autodenominan como motor de conocimiento.  Por el momento sólo está disponible en inglés.
La cobertura de Wolfram Alpha se divide en cuatro grandes categorías: Matemáticas; Ciencia y Tecnología; Sociedad y Cultura; y Vida Cotidiana. Éstas a su vez incluyen subcategorías que abarcan, entre otras, las siguientes:
· Álgebra
· Geometría
· Estadística
· Física
· Química
· Ingeniería
· Ciencias de la Tierra
· Transportes
· Gente
· Arte y medios
· Alimentos y nutrición
· Historia
· Salud personal
· Ciencia doméstica
· Pasatiempos
· Y hasta Sorpresas…
Intelligo
http://www.explora-intelligo.info/
Se trata de un buscador académico cuyos resultados se presentan en forma de mapas que resumen los principales conceptos extraídos de los documentos recuperados a partir de la consulta ingresada.  Para hacer acercamiento a un mapa basta situarse en la zona blanca del mismo y hacer doble clic o usar el scroll del mouse.  Para navegar el mapa se hace clic y se arrastra, a fin de visualizar sus diferentes partes.  
Intelligo realiza búsquedas en bases de datos de revistas académicas como SciELO y LAReferencia.  Las colecciones están indizadas para maximizar la recuperación de documentos y se subdividen en subcolecciones en español, inglés y portugués.
Los resultados se pueden explorar a partir de los mapas y con base en listados y gráficos que resumen Conceptos, Autores, Editores, Palabras clave y años de publicación.
Los resultados que despliega Intelligo tienen el valor agregado de establecer relaciones entre conceptos y publicaciones en torno a temáticas específicas.
El Gráfico de conocimiento de Google
https://youtu.be/mmQl6VGvX-c
Por último, te presentamos un desarrollo que Google introdujo hace unos años: el Knowledge Graph o Gráfico de Conocimiento.
Hoy día Google ya despliega sus resultados conforme a esta lógica, aunque, desde nuestro punto de vista, se ha quedado corto con relación a las expectativas que generó el video de su lanzamiento en 2012.  Para entender mejor la estructura de estos páneles de información que despliega Google, sugerimos consultar:
El Knowledge Graph de Google: en busca de una respuesta más humana
https://www.mediaclick.es/blog/el-knowledge-graph-de-google-en-busca-de-una-respuesta-mas-humana/
¿Qué es el Knowledge Graph de Google?
https://www.oleoshop.com/blog/google-knowledge-graph
Tema 6. Web semántica
¿Qué es la web semántica?
Web 1.0
Primera generación Web, a finales de los 80s y principios de los 90s
Sitios web informativos de sólo lectura para el usuario, sin interacción
Sólo un Webmaster subía, modificaba y compartía contenido de los sitios
Web 2.0
Segunda generación Web, surge en 2004 y se mantiene a la fecha
Sitios web para generar e intercambiar información entre usuarios activos (individual) y comunidades (colectivo)
Surge el Open Access ante el interés por el acceso abierto a la información
Sitios de colaboración 2.0: YouTube, Instagram, Facebook
Big Data. Gran volumen de información generada por usuarios activos
Web 3.0
Ya están disponibles sus primeros desarrollos, es la tendencia evolutiva de la Web actual
Entiende el lenguaje cotidiano obteniendo resultados puntuales con menor esfuerzo del usuario
Visible en tecnologías: Inteligencia artificial, Datos semánticos, Tecnología geoespacial, Gráficos 3D
Herramientasde búsqueda semántica
Wolfram Alpha
Motor de conocimiento
Combina recolección, curación y cómputo de gran variedad de datos de diversos ámbitos del conocimiento
Sólo disponible en idioma inglés (por el momento)
Intelligo
Buscador académico
Resultados en forma de mapas construido con conceptos principales
Resultados relacionados entre conceptos en torno a temáticas específicas
Busca datos en revistas académicas 
Disponible en los idiomas español, inglés y portugués 
Gráfico de conocimiento de Google
Buscador semántico
Es la evolución de la búsqueda en  Google 
Gráfico masivo de elementos de la vida real, y de sus conexiones para ofrecer resultados más significativos 
PARA SABER MÁS
Codina, L. (2003). La web semántica: una visión crítica. En El profesional de la información, vol. 12, nº 2. Recuperado 5 October 2016, de http://www.elprofesionaldelainformacion.com/contenidos/2003/marzo/16.pdf
García, J. (2019). Cómo funciona BERT, la inteligencia artificial con la que Google quiere conseguir que su motor de búsqueda nos entienda mejor. Xataka. Recuperado de: https://www.xataka.com/servicios/como-funciona-bert-inteligencia-artificial-que-google-quiere-conseguir-que-su-motor-busqueda-nos-entienda-mejor
Martínez Arellano, F., y Amaya Ramírez, M. (2017). El papel de los metadatos en la Web Semántica. Biblioteca Universitaria, 20(1), pp. 3-10. Recuperado de: https://www.redalyc.org/pdf/285/28552770002.pdf
What is Web 2.0? Ideas, technologies and implications for education (TechWatch report) : Jisc. (2016). Webarchive.org.uk. Recuperado 5 October 2016, de http://www.webarchive.org.uk/wayback/archive/20140614202026/http://www.jisc.ac.uk/publications/reports/2007/twweb2.aspx
Wollerton, M. (Agosto 17, 2018). Alexa, Google Assistant and Siri will get smarter this year. Here's how. C|NET Best Products. Recuperado de: https://www.cnet.com/news/siri-vs-alexa-vs-google-assistant/
Actividad Formativa: Explorando la Web Semántica
Instrucciones:
Ingresa a Intelligo Repositorios (http://repos.explora-intelligo.info/) y teclea en el campo de consulta que se encuentra en la parte central superior las palabras clave de tu consulta.
En el menú de la derecha, elige en qué base de datos quieres buscar: SciELO.org o LAReferencia.
Haz clic en el botón "Consultar".
Los resultados se despliegan mostrando:
1. Un gráfico tipo red, en donde los términos aparecen como nodos de diferentes tamaños.  Para explorar este gráfico haz doble clic si necesitas uno o varios acercamientos.
2. Si haces clic en cualquiera de los nodos, te muestra en una ventana flotante los textos relacionados a ese término.  Al hacer clic en un texto, te lleva al mismo en la base de datos que estés consultando (por ejemplo, SciELO).
3. En un recuadro a la izquierda y en las pestañas superiores, se muestran las categorías para filtrar resultados por Autores, Editores, Palabras Clave o Año.
Los/las autores/as, por ejemplo, aparecen en orden de más a menos por número de publicaciones.
Si haces clic en cualquiera de estos/as autores/as, Intelligo mapea en un gráfico los conceptos principales en las publicaciones del/la autor/a y al hacer clic en cualquier nodo se muestran los textos relacionados.
Los demás filtros funcionan en forma similar.
Explora mediante varias búsquedas, cambiando palabras clave, base de datos seleccionada y aplica diferentes filtros.
Después de la exploración responde las siguientes preguntas:
¿Cuál es la relación cantidad-relevancia que identificas en los resultados obtenidos?
Muchos resultados, poco relevantes.
Muchos resultados y bastantes de ellos relevantes.
Ni muchos ni pocos resultados, pero poco relevantes.
Ni muchos ni pocos resultados, aunque la mayoría relevantes.
Pocos resultados y escasa relevancia.
Pocos resultados, pero en general relevantes.
correcto
Respuesta
Correcto:
Muy bien, prueba mismas palabras con otra base de datos del propio menú de Intelligo, tal vez identifiques más resultados.
¿Identificaste nuevas voces autorizada en tu tema?
Sí.
No.
correcto
Respuesta
Correcto:
Excelente. Ahora puedes probar con esos nuevos autores en otros buscadores explorados en semanas previas.
¿Identificas a algún agente editorial que destaque por el volumen de publicaciones asociadas a tu tema?
Sí.
No.
correcto
Respuesta
Correcto:
Muy bien. Ahora puedes buscar si dicho agente editorial tiene un sitio propio en el que puedas buscar o utilizar esta información en otros buscadores explorados en semanas previas.
¿Identificaste nuevas palabras clave para tu tema en la lista de palabras clave que despliega el propio Intelligo?
Sí.
No.
correcto
Respuesta
Correcto:
Magnífico. Ahora experimenta con las nuevas palabras clave que identificaste en otros buscadores revisados en semanas previas.
¿Ubicas un rango de años en que hay más publicaciones de tu tema?
Sí.
No.
correcto
Respuesta
Correcto:
Esto es útil para ubicar la incidencia temporal de tu tema y es un dato que también puedes aprovechar en otros buscadores ya revisados en semanas previas.
Esta generación de la Web se popularizó a finales de los 80, principios de los 90 y su principal característica es que era de sólo lectura.
Web 1.0
Web 2.0
Web 3.0
Web Semántica
SmartWeb
correcto
¿Existen aún sitios al estilo Web 1.0?
No, con la llegada de la Web 2.0 se descontinuó la Web 1.0
Sí, pero son muy difíciles de encontrar. Es necesario recurrir a sitios de archivo como Internet Archive.
Aún existen muchos sitios al estilo Web 1.0 y es fácil toparse con ellos en cualquier búsqueda cotidiana.
Cada vez son menos y están cayendo en desuso porque ya todo es Web 2.0.
correcto
Es un término que se refiere a una nueva generación de desarrollos web, enfocados a usuarios activos y comunidades.
Web 1.0
Web 2.0
Web 3.0
Web Semántica
SmartWeb
correcto
Las redes sociales, los blogs, los wikis, las folksonomías, son ejemplos de:
Web 1.0
Web 2.0
Web 3.0
Web Semántica
SmartWeb
correcto
Las principales ideas detrás de la Web 2.0 son: (la respuesta correcta implica seleccionar varias opciones).
Contenidos generados por los usuarios en forma colaborativa y/o individual.
Inteligencia artificial (agentes inteligentes)
Estímulo al potencial de la multitud (inteligencia colectiva).
Multiplicación de los datos (big data).
Tecnología geoespacial
Arquitecturas de participación.
Gráficos 3D.
El efecto red.
Apertura (acceso abierto).
Datos semánticos.
correcto
Las principales ideas detrás de la Web 3.0 son: (la respuesta correcta implica seleccionar varias opciones).
Inteligencia artificial (agentes inteligentes)
Contenidos generados por los usuarios en forma colaborativa y/o individual.
Estímulo al potencial de la multitud (inteligencia colectiva).
Tecnología geoespacial
Gráficos 3D.
Multiplicación de los datos (big data).
Arquitecturas de participación.
El efecto red.
Apertura (acceso abierto).
Datos semánticos.
correcto
Algunos ejemplos de herramientas al estilo Web 3.0 son: (la respuesta correcta implica seleccionar varias opciones).
Wikipedia
Instagram
Wolfram Alpha
Scoop.it!
Intelligo
Facebook
El Gráfico de conocimiento de Google
YouTube
correcto
Algunos ejemplos de herramientas al estilo Web 2.0 son: (la respuesta correcta implica seleccionar varias opciones).
Intelligo
Wikipedia
Instagram
El Gráfico de conocimiento de Google
Facebook
Scoop.it!
YouTube
Wolfram Alpha

Otros materiales