Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIDAD II: TESAURO Etimológicamente viene del latín y su significación era “tesoro”. Definición que tiene poco que ver con el concepto que tiene hoy para un documentalista, así la norma ISO 2788 / 19866 "Principes directeurs pour létablissement et le devellopement de thesaurus monolingues", nos dice que estos se pueden definir según su función y según su estructura: - Por su función: como un instrumento de control terminológico utilizado para trasponer a un lenguaje más estricto el idioma natural empleado en los documentos y por los indizadores - Por su estructura: es un vocabulario controlado y dinámico de términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento. Por esto podemos decir que se trata de un vocabulario controlado y estructurado al que se llega mediante la selección de términos del lenguaje natural. Queda constituido, por tanto, por una lista de palabras, llamadas “descriptores”, estructuradas de forma que unas se relacionan con otras que también están en el tesauro. Este lenguaje tiene una serie de ventajas, entre las que podríamos destacar su flexibilidad, capacidad de especialización, la multiplicidad de combinaciones que permiten establecer entre los términos de su vocabulario, el alto nivel de control terminológico y su facilidad de revisión y puesto al día. Los tesauros, por lo general, se aplican a una rama del conocimiento en concreto, pero pueden construirse lenguajes que cubran un sector del las ciencias e incluso macrotesauros, que son tesauros de carácter multidisciplinar. Elementos de un tesauro Un tesauro se compone de una base léxica estructurada en relaciones jerárquicas, asociativas y de equivalencia. Las unidades léxicas son: • Descriptores: Son palabras o expresiones incluidas en un tesauro y escogidas del lenguaje natural entre un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento o para formular una búsqueda documental. • No descriptores: Llamados también términos equivalentes o no preferentes. Son sinónimos o cuasi-sinónimos de los descriptores o términos que designan en el lenguaje natural conceptos afines a los que cubren los descriptores. Los no descriptores no pueden ser utilizados para la indización del documento o para formular búsquedas, pero cada uno de ellos reenvía a uno o dos descriptores para representar los conceptos correspondientes, por lo que aumentan la tasa de precisión. Estos términos son puntos de acceso no aceptados que facilitan el paso del lenguaje natural al lenguaje controlado, permitiendo la elección de descriptores pertinentes. • Palabras herramienta: Son descriptores que no tiene significado preciso si los empleamos solos. Son términos que han de ser empleados con un descriptor, al menos. Un tesauro tiene, por lo general, algunos miles de descriptores y varios cientos a varios miles de no descriptores. El término medio es de unas 3.000 unidades léxicas. Tipo de descriptores La tipología de los descriptores se puede dividir en tres: • Por su carga informativa: primarios, secundarios e infraconceptos • Por su cobertura o contenido: onomásticos, geográficos o territoriales, temático o de materias y cronológicos o temporales • Por su composición: simples o unitérmino y compuestos o sintagmáticos A continuación desarrollaremos cada una de las tipologías. Por su carga informativa, pueden ser: • Primarios: término o conjunto de términos que representan un concepto de manera unívoca (no hay duda de lo que queremos decir). Son significativos, relevantes, sin ambigüedades y pueden aparecer aislados sin necesidad de aclaración. Ejemplo: HISTPORIA. • Secundarios: necesitan ir acompañados a otros descriptores. Parecen menos importantes, pero son fundamentales en la estructura del lenguaje. Ejemplo: PRIVATIZACIÓN DE LA INFORMACIÓN. • Infraconceptos: son elementos exentos de significación, pero, acompañados de un descriptor primario o secundario, pueden modificar a éste parcial o completamente. Pueden ser prefijos, sufijos, etc. Ejemplo: SÚPER o MICRO. De acuerdo a su cobertura temática los descriptores pueden ser: • Onomásticos: representan un nombre de persona, de institución, et. Son fáciles de detectar y de recuperar en un texto determina. Ejemplo: OBSERVATORIO ASTRONÓMICO. • Geográficos o territoriales: abarcan todo tipo de conceptos vinculados con lugares y sitios (países, mares, montañas, etc.). Ejemplo: CARIBE. • Temáticos o de materia: son los más difíciles de controlar y estimar y, a la vez, los más importantes. Representan cualquier contenido disciplinar. Ejemplo: ASTRONOMÍA. • Cronológicos o temporales: representan fechas, períodos, etc. Ejemplo: EDAD MEDIA. Por su composición, podemos encontrar descriptores: • Simples o unitérmino: representan conceptos mediante una sola palabra. Por su carácter unívoco, son idóneos para los lenguajes postcoordinados. Ejemplo: ARTE • Compuestos o sintagmáticos: representan un concepto utilizando un sintagma nominal (conjunción de términos unidos por nexos). Se utilizan para eliminar la ambigüedad característica de los descriptores unitérminos. Ejemplo: ARTE PREHISTÓRICO. Cada vez es más común el uso de descriptores sintagmáticos, esto es, términos precoordinados, ya que para la expresión de un concepto o la representación de una noción puede ser necesario combinar varias palabras o términos. Éstos pueden ser combinados en el propio lenguaje del sistema y se hallarán, por lo tanto, precoordinados en el tesauro. O pueden ser combinados o postcoordinados durante la indización o la búsqueda documental. Si no existe un descriptor precoodinado que represente la noción deseada, el indizador tendrá que combinar varios descriptores para caracterizar el documento. En relación con la utilización de términos simples o compuestos, la norma ISO arriba mencionada, dice que, por regla general, los descriptores deben representar en la medida de lo posible términos simples. Las nociones complejas pueden ser descompuestas en términos simples si alguno de los elementos de un término compuesto puede ser aceptado como descriptor. Ejemplo: RECOLECCIÓN DE MIEL (RECOLECCIÓN + MIEL) La misma norma señala que deben mantenerse los términos compuestos como descriptores en los siguientes casos: a) Si la descomposición del término compuesto puede generar problemas de comprensión, por ser conocido en su forma compuesta. Ejemplo: GESTIÓN FINANCIERA b) Si la descomposición puede generar confusión o ambigüedad, y evitar la amplitud semántica. Ejemplo: ALIMENTO PARA PÁJAROS Relaciones entre los descriptores Entre los descriptores se establecen cuatro tipos de relaciones fundamentales: • Asociativas: es el tipo de relación más importante del tesauro por ser la que le define como lenguaje de estructura combinatoria, hecho que le diferencia de otros. Es una relación recíproca que identifica descriptores afines, que no jerárquicos entre sí, sean o no de una misma familia, en una dirección horizontal. Todo descriptor relacionado asociativamente con otro implica que éste, a su vez, mantiene idéntica relación con aquel. Utiliza la notación TR (Término relacionado), en inglés RT (Related Term) Ej.: Etnolingüística Etnografía TR Etnografía TR Etnolingüïstica • Jerárquicas: define los descriptores más genéricos y más específicos, con sus correspondientes clases, especies, familias, partes, etc. A deferencia de los sistemas jerárquicos tradicionales, esta relación se establece en función del resto de las relaciones de un concepto,sin las cuales la jerarquía no siempre sería posible: un descriptor puede tener términos más genéricos o más específicos relacionados con él porque a su vez cuenta con relaciones asociativas, de sinonimia o definitorias que le permiten tener cualquiera de las tres relaciones restantes, sin que al mismo tiempo, ninguna sea excluyente de otras. Las jerarquías de un tesauro son además, mucho más completas porque pueden tener varias escalas. Es una relación recíproca, de modo que un mismo término específico de uno genérico guarda con este una relación inversa. La notación empleada es TG (Término Genérico), en inglés BT (Broad Term) y TE (Término Específico), en inglés NT (Narrow Term). Ej: Etnolingüística Lingüïstica TG Lingüística TE Etnolingüística Sociolingüística • De equivalencia: también llamadas relaciones de sustitución o preferenciales. Dirigen desde el sinónimo, cuasisinónimo o antónimo donde se centra la demanda, hacia el descriptor autorizado o término preferencial. Esta relación supone una traducción del término natural (libre) al artificial (normalizado). Las notaciones de esa relación son: USE y UP (Usado por) o en inglés USE y UF (Use For). USE remite de un término no admitido en el tesauro a un descriptor admitido y UP informa de los términos sinónimos, polisémicos, etc., no admitidos de un descriptor. Ej.: Contador Contable USE Contable UP Contador • Definitorias o aclaratorias: se utilizan para delimitar la aplicación de un descriptor. Puede describir el significado por el cual se va a usar un término con sinonimia, acotar un significado a una única opción excluyendo algún sentido, eliminar ambigüedades, desarrollar siglas o abreviaturas, etc. Se utiliza con las notaciones NA (Nota de Alcance), en inglés SN (Scope Note). Pueden ser de varios tipos: definición completa; definición restringida; inclusión de términos en relación jerárquica con el descriptor; descripción de cómo debe usarse el término en la indización; e historia del descriptor. Formas de presentación de los tesauros Los términos que componen un tesauro y sus relaciones pueden presentarse de varia formas: • Alfabética: contiene descriptores y no descriptores ordenados alfabéticamente. Con cada descriptor aparece el conjunto de sus relaciones semánticas, incluidas toda su jerarquía, es decir, todos los niveles de términos más genéricos y más específicos. Por lo tanto cada entrada tiene: ü Indicación del campo semántico al que pertence un descriptor ü Notas aclaratoias o de aplicación ü Equivalencias semánticas (relación de no desciptores o términos no preferentes) ü Los descriptores genéricos según uno, varios o todos los niveles de jerarquía ascentende ü Los descriptores específicos según uno, varios o todos los niveles de jerarquía descendente ü Los descriptores asociados La indicación detallada de estas relaciones semánticas entre los términos caracteriza al tesauro y lo diferencia de un léxico documental o de un simple glosario. Por ejemplo Agrovoc (tesauro agrícola multilingüe) (3ª ed., Organización de la Naciones Unidas para la Agricultura y la Alimentación-FAO, Roma, 2004). Consulado el 29-04-16 http://aims.fao.org/es/agrovoc • Sistemática: contiene los descriptores estructurados en función de categorías o jerarquías. La parte sistemática ofrece una visión de conjunto de la información contenida en el tesauro y permite conocer en qué medida se ha detallado un tema. Con esta agrupación jerárquica de los descriptores se puede efectuar un control general de los campos temáticos tratados. Para llevar a cabo esta parte, hay que ver posibles relaciones término a término y campo a campo. Los descriptores se sitúan en sus áreas contextuales donde son jerarquizados por categoría semántica y dotados de distintos tipos de relaciones. Así es como después encontraremos a los descriptores rodeados de sus conceptos más próximos. El establecimiento de categorías se puede realizar a partir de facetas o de campos temáticos. Esta agrupación de los descriptores en facetas o temas es fundamental para poder manejar este lenguaje, que puede contar con varios miles de términos. La presentación mediante campos temáticos organiza los conceptos según las relaciones género a especie, al igual que los hacen los sistemas de clasificación jerárquicos. Los descriptores se presentan es esquemas arborescentes con ramificaciones sucesivas sin que, en ocasiones, exista un rigor lógico en su estructura, lo que se justifica en el seno de este lenguaje documental por razones pragmáticas. Por ejemplo Tesauro de educación de unesco-oie (sexta ed., 2a rev., 2007, UNESCO). Consultado el 29-04-16 http://www.ibe.unesco.org/es/unesco-ibe- education-thesaurus • Gráfica: las representaciones gráficas exponen la estructura semántica de cada campo semántico dentro de una hoja de papel. Las tres formas más usuales de representación gráfica son: ü Estructura arborescente ü Diagramas de flechas ü Terminogramas Los tesauros de representación gráfica se complementan con un índice alfabético que contiene notas aclaratorias, reenvíos entre términos preferentes y no preferentes y referencias a términos genéricos, específicos y relacionados; por ello, en este tipo de representación no es necesario asignar símbolos a cada término en particular. Los sistemas gráficos muestran sobre todo las relaciones jerárquicas existentes entre descriptores y, por lo general, los reenvíos hacia términos asociados se indican en los márgenes del esquema gráfico. Ej.: Eurovoc (edición 4.4, Legislación y Publicaciones de la Unión Europea) Consultado el 29-04- 16 http://eurovoc.europa.eu/drupal/?q=es/request&view=mt&mturi=http://eurovoc.europa.eu/1 00163&language=en Índices auxiliares Además de las formas de presentación, es posible incluir en un tesauro un índice permutado y/o índice de términos identificadores. El índice permutado recoge la terminología completa del tesauro y tiene como objetivo concentrar las palabras. Consiste en una simple relación alfabética de los descriptores para facilitar su búsqueda inicial y remitir al usuario, por medio de un código, a la parte semántica. Recibe la denominación “permutado” porque los descriptores y no descriptores sintagmáticos se encuentran en este índice ordenados alfabéticamente tantas veces como términos los componen: así, podemos encontrar los términos compuestos con la ayuda de los demás elementos el sintagma, lo que el orden natural de las palabras que figuran en una simple lista alfabética no permite descubrir. Por ejemplo: Literatura medieval se puede localizar por la (L) de literatura y por la (M) de medieval. La estructura de este tipo de índices es la que diferencia a los tesauros de los léxicos. El índice de identificadores consiste en un listado alfabético de términos, generalmente de uso frecuente en el sistema de información que emplea el tesauro. Se compone de términos onomásticos: nombres propios, nombres de organismos y de instituciones y de topónimos. Los términos que componen este índice se denominan “identificadores” porque se limitan a identificar organismos, nombres de personas o lugares, pero no describen el contenido semántico de los documentos. Bibliografía -GARCÍA GUTIERREZ; Luis Antonio (1983). "Entropía, relevancia y pertinencia del descriptor en el mensaje comunicativo-documental : nota tipo lógica", Documentación de las Ciencias de la Información, v. 7 (en RECURSOS) -GAVILÁN, C. M. Lenguajes documentales. Principales tipos de clasificación. Encabezamientos de materia, descriptores y tesauros [recurso electrónico], http://eprints.rclis.org/14817/1/lendoc.pdf, [consulta: 03 deabril de 2016] (en RECURSOS) -LÓPEZ YEPES, José; OSUNA ALARCÓN, María Rosario (2011).Manual de ciencias de la información y documentación. Madrid : Ediciones Pirámide -MANIEZ, J. (1993), Los lenguajes documentales y de clasificación: concepción, construcción y utilización de los sistemas documentales. Traducción del francés por F. J. Alvarez García, J. F. Herranz Navarra y M. Ramírez Reyes, Fundación Germán Sánchez Ruipérez ; Ediciones Pirámide, Madrid. (en RECURSOS) -MARTINEZ, Ana María (2003). "Tesauro y listas de epígrafes: ¿hacia la integración?", Información, Cultura y Sociedad, n.9 (en RECUROS) -ORERA ORERA, L. (1997). Manual de bibliotecología, Editorial Síntesis, Madrid.[recurso electrónico] http://biblma.pcp.mx/archivos/Manual%20de%20Biblioteconomia.Luisa%20Orera%20Orera1.pdf [consulta: 10 de abril de 2016]
Compartir