Logo Studenta

CUADERNILLO_UNIDAD_II

¡Estudia con miles de materiales!

Vista previa del material en texto

UNIDAD	II:	TESAURO	
	
Etimológicamente	viene	del	latín	y	su	significación	era	“tesoro”.	Definición	que	tiene	poco	que	ver	con	el	
concepto	que	tiene	hoy	para	un	documentalista,	así	la	norma	ISO	2788	/	19866	"Principes	directeurs	
pour	létablissement	et	le	devellopement	de	thesaurus	monolingues",	nos	dice	que	estos	se	pueden	
definir	según	su	función	y	según	su	estructura:	
		
-	Por	su	función:	como	un	instrumento	de	control	terminológico	utilizado	para	trasponer	a	un	lenguaje	
más	estricto	el	idioma	natural	empleado	en	los	documentos	y	por	los	indizadores		
	
-	Por	su	estructura:	es	un	vocabulario	controlado	y	dinámico	de	términos	que	tienen	entre	ellos	
relaciones	semánticas	y	genéricas	y	que	se	aplica	a	un	dominio	particular	del	conocimiento.	
	
Por	esto	podemos	decir	que	se	trata	de	un	vocabulario	controlado	y	estructurado	al	que	se	llega	
mediante	la	selección	de	términos	del	lenguaje	natural.	Queda	constituido,	por	tanto,	por	una	lista	de	
palabras,	llamadas	“descriptores”,	estructuradas	de	forma	que	unas	se	relacionan	con	otras	que	
también	están	en	el	tesauro.	Este	lenguaje	tiene	una	serie	de	ventajas,	entre	las	que	podríamos	destacar	
su	flexibilidad,	capacidad	de	especialización,	la	multiplicidad	de	combinaciones	que	permiten	establecer	
entre	los	términos	de	su	vocabulario,	el	alto	nivel	de	control	terminológico	y	su	facilidad	de	revisión	y	
puesto	al	día.	
	
Los	tesauros,	por	lo	general,	se	aplican	a	una	rama	del	conocimiento	en	concreto,	pero	pueden	
construirse	lenguajes	que	cubran	un	sector	del	las	ciencias	e	incluso	macrotesauros,	que	son	tesauros	de	
carácter	multidisciplinar.	
	
	
Elementos	de	un	tesauro	
	
Un	 tesauro	 se	 compone	 de	 una	 base	 léxica	 estructurada	 en	 relaciones	 jerárquicas,	 asociativas	 y	 de	
equivalencia.	
	
Las	unidades	léxicas	son:	
	
• Descriptores:	 Son	 palabras	 o	 expresiones	 incluidas	 en	 un	 tesauro	 y	 escogidas	 del	 lenguaje	
natural	 entre	 un	 conjunto	 de	 términos	 equivalentes	 para	 representar	 sin	 ambigüedad	 una	
noción	contenida	en	un	documento	o	para	formular	una	búsqueda	documental.	
	
• No	descriptores:	 Llamados	 también	 términos	equivalentes	o	no	preferentes.	Son	sinónimos	o	
cuasi-sinónimos	de	los	descriptores	o	términos	que	designan	en	el	lenguaje	natural	conceptos	
afines	a	 los	que	cubren	 los	descriptores.	Los	no	descriptores	no	pueden	ser	utilizados	para	 la	
indización	del	documento	o	para	formular	búsquedas,	pero	cada	uno	de	ellos	reenvía	a	uno	o	
dos	descriptores	para	representar	los	conceptos	correspondientes,	por	lo	que	aumentan	la	tasa	
de	 precisión.	 Estos	 términos	 son	 puntos	 de	 acceso	 no	 aceptados	 que	 facilitan	 el	 paso	 del	
lenguaje	natural	al	lenguaje	controlado,	permitiendo	la	elección	de	descriptores	pertinentes.	
	
• Palabras	herramienta:	Son	descriptores	que	no	tiene	significado	preciso	si	los	empleamos	solos.	
Son	términos	que	han	de	ser	empleados	con	un	descriptor,	al	menos.	
	
Un	 tesauro	 tiene,	 por	 lo	 general,	 algunos	miles	 de	 descriptores	 y	 varios	 cientos	 a	 varios	miles	 de	 no	
descriptores.	El	término	medio	es	de	unas	3.000	unidades	léxicas.	
	
	
	
	
Tipo	de	descriptores	
	
La	tipología	de	los	descriptores	se	puede	dividir	en	tres:	
• Por	su	carga	informativa:	primarios,	secundarios	e	infraconceptos	
• Por	su	cobertura	o	contenido:	onomásticos,	geográficos	o	territoriales,	temático	o	de	materias	
y	cronológicos	o	temporales	
• Por	su	composición:	simples	o	unitérmino	y	compuestos	o	sintagmáticos	
	
A	continuación	desarrollaremos	cada	una	de	las	tipologías.	
	
Por	su	carga	informativa,	pueden	ser:	
	
• Primarios:	 término	o	conjunto	de	 términos	que	 representan	un	concepto	de	manera	unívoca	
(no	 hay	 duda	 de	 lo	 que	 queremos	 decir).	 Son	 significativos,	 relevantes,	 sin	 ambigüedades	 y	
pueden	aparecer	aislados	sin	necesidad	de	aclaración.	Ejemplo:	HISTPORIA.	
• Secundarios:	necesitan	ir	acompañados	a	otros	descriptores.	Parecen	menos	importantes,	pero	
son	 fundamentales	 en	 la	 estructura	 del	 lenguaje.	 Ejemplo:	 PRIVATIZACIÓN	 DE	 LA	
INFORMACIÓN.	
• Infraconceptos:	 son	elementos	exentos	de	significación,	pero,	acompañados	de	un	descriptor	
primario	o	secundario,	pueden	modificar	a	éste	parcial	o	completamente.	Pueden	ser	prefijos,	
sufijos,	etc.	Ejemplo:	SÚPER	o	MICRO.	
	
De	acuerdo	a	su	cobertura	temática	los	descriptores	pueden	ser:	
	
• Onomásticos:	representan	un	nombre	de	persona,	de	institución,	et.	Son	fáciles	de	detectar	y	
de	recuperar	en	un	texto	determina.	Ejemplo:	OBSERVATORIO	ASTRONÓMICO.	
• Geográficos	 o	 territoriales:	 abarcan	 todo	 tipo	 de	 conceptos	 vinculados	 con	 lugares	 y	 sitios	
(países,	mares,	montañas,	etc.).	Ejemplo:	CARIBE.	
• Temáticos	 o	 de	 materia:	 son	 los	 más	 difíciles	 de	 controlar	 y	 estimar	 y,	 a	 la	 vez,	 los	 más	
importantes.	Representan	cualquier	contenido	disciplinar.	Ejemplo:	ASTRONOMÍA.	
• Cronológicos	o	temporales:	representan	fechas,	períodos,	etc.	Ejemplo:	EDAD	MEDIA.	
	
Por	su	composición,	podemos	encontrar	descriptores:	
	
• Simples	 o	 unitérmino:	 representan	 conceptos	 mediante	 una	 sola	 palabra.	 Por	 su	 carácter	
unívoco,	son	idóneos	para	los	lenguajes	postcoordinados.	Ejemplo:	ARTE	
• Compuestos	 o	 sintagmáticos:	 representan	 un	 concepto	 utilizando	 un	 sintagma	 nominal	
(conjunción	 de	 términos	 unidos	 por	 nexos).	 Se	 utilizan	 para	 eliminar	 la	 ambigüedad	
característica	de	los	descriptores	unitérminos.	Ejemplo:	ARTE	PREHISTÓRICO.	
	
Cada	vez	es	más	común	el	uso	de	descriptores	sintagmáticos,	esto	es,	términos	precoordinados,	ya	que	
para	 la	 expresión	 de	 un	 concepto	 o	 la	 representación	 de	 una	 noción	 puede	 ser	 necesario	 combinar	
varias	palabras	o	términos.	Éstos	pueden	ser	combinados	en	el	propio	lenguaje	del	sistema	y	se	hallarán,	
por	 lo	 tanto,	 precoordinados	 en	 el	 tesauro.	 O	 pueden	 ser	 combinados	 o	 postcoordinados	 durante	 la	
indización	o	la	búsqueda	documental.	
	
Si	 no	 existe	 un	 descriptor	 precoodinado	 que	 represente	 la	 noción	 deseada,	 el	 indizador	 tendrá	 que	
combinar	varios	descriptores	para	caracterizar	el	documento.	
	
En	relación	con	la	utilización	de	términos	simples	o	compuestos,	la	norma	ISO	arriba	mencionada,	dice	
que,	por	regla	general,	los	descriptores	deben	representar	en	la	medida	de	lo	posible	términos	simples.	
Las	nociones	complejas	pueden	ser	descompuestas	en	términos	simples	si	alguno	de	los	elementos	de	
un	 término	 compuesto	 puede	 ser	 aceptado	 como	 descriptor.	 Ejemplo:	 RECOLECCIÓN	 DE	 MIEL	
(RECOLECCIÓN	+	MIEL)	
	
La	 misma	 norma	 señala	 que	 deben	 mantenerse	 los	 términos	 compuestos	 como	 descriptores	 en	 los	
siguientes	casos:	
a) Si	 la	 descomposición	 del	 término	 compuesto	 puede	 generar	 problemas	 de	 comprensión,	 por	
ser	conocido	en	su	forma	compuesta.	Ejemplo:	GESTIÓN	FINANCIERA	
b) Si	 la	descomposición	puede	generar	confusión	o	ambigüedad,	y	evitar	 la	amplitud	semántica.	
Ejemplo:	ALIMENTO	PARA	PÁJAROS	
	
	
Relaciones	entre	los	descriptores	
	
Entre	los	descriptores	se	establecen	cuatro	tipos	de	relaciones	fundamentales:	
	
• Asociativas:	 es	el	 tipo	de	 relación	más	 importante	del	 tesauro	por	 ser	 la	que	 le	define	como	
lenguaje	 de	 estructura	 combinatoria,	 hecho	 que	 le	 diferencia	 de	 otros.	 Es	 una	 relación	
recíproca	 que	 identifica	 descriptores	 afines,	 que	 no	 jerárquicos	 entre	 sí,	 sean	 o	 no	 de	 una	
misma	 familia,	 en	una	dirección	horizontal.	 Todo	descriptor	 relacionado	asociativamente	 con	
otro	 implica	 que	 éste,	 a	 su	 vez,	mantiene	 idéntica	 relación	 con	 aquel.	 Utiliza	 la	 notación	 TR	
(Término	relacionado),	en	inglés	RT	(Related	Term)	Ej.:	
	
Etnolingüística	 	 	 Etnografía	
TR	Etnografía	 	 	 TR	Etnolingüïstica	
	
• Jerárquicas:	define	los	descriptores	más	genéricos	y	más	específicos,	con	sus	correspondientes	
clases,	 especies,	 familias,	 partes,	 etc.	 A	 deferencia	 de	 los	 sistemas	 jerárquicos	 tradicionales,	
esta	relación	se	establece	en	función	del	resto	de	las	relaciones	de	un	concepto,sin	las	cuales	la	
jerarquía	no	 siempre	 sería	posible:	un	descriptor	puede	 tener	 términos	más	genéricos	o	más	
específicos	relacionados	con	él	porque	a	su	vez	cuenta	con	relaciones	asociativas,	de	sinonimia	
o	 definitorias	 que	 le	 permiten	 tener	 cualquiera	 de	 las	 tres	 relaciones	 restantes,	 sin	 que	 al	
mismo	 tiempo,	 ninguna	 sea	 excluyente	 de	 otras.	 Las	 jerarquías	 de	 un	 tesauro	 son	 además,	
mucho	más	completas	porque	pueden	tener	varias	escalas.	Es	una	relación	recíproca,	de	modo	
que	 un	mismo	 término	 específico	 de	 uno	 genérico	 guarda	 con	 este	 una	 relación	 inversa.	 La	
notación	 empleada	 es	 TG	 (Término	 Genérico),	 en	 inglés	 BT	 (Broad	 Term)	 y	 TE	 (Término	
Específico),	en	inglés	NT	(Narrow	Term).	Ej:	
	
Etnolingüística	 	 	 Lingüïstica	
TG	Lingüística	 	 	 TE	Etnolingüística	
Sociolingüística	
	
	
• De	equivalencia:	también	llamadas	relaciones	de	sustitución	o	preferenciales.	Dirigen	desde	el	
sinónimo,	 cuasisinónimo	 o	 antónimo	 donde	 se	 centra	 la	 demanda,	 hacia	 el	 descriptor	
autorizado	 o	 término	 preferencial.	 Esta	 relación	 supone	 una	 traducción	 del	 término	 natural	
(libre)	al	artificial	(normalizado).	Las	notaciones	de	esa	relación	son:	USE	y	UP	(Usado	por)	o	en	
inglés	USE	y	UF	(Use	For).	USE	remite	de	un	término	no	admitido	en	el	tesauro	a	un	descriptor	
admitido	 y	 UP	 informa	 de	 los	 términos	 sinónimos,	 polisémicos,	 etc.,	 no	 admitidos	 de	 un	
descriptor.	Ej.:	
	
Contador	 	 Contable	
USE	Contable	 	 UP	Contador	
	
• Definitorias	 o	 aclaratorias:	 se	 utilizan	 para	 delimitar	 la	 aplicación	 de	 un	 descriptor.	 Puede	
describir	el	significado	por	el	cual	se	va	a	usar	un	término	con	sinonimia,	acotar	un	significado	a	
una	 única	 opción	 excluyendo	 algún	 sentido,	 eliminar	 ambigüedades,	 desarrollar	 siglas	 o	
abreviaturas,	etc.	Se	utiliza	con	las	notaciones	NA	(Nota	de	Alcance),	en	inglés	SN	(Scope	Note).	
Pueden	ser	de	varios	tipos:	definición	completa;	definición	restringida;	inclusión	de	términos	en	
relación	 jerárquica	 con	 el	 descriptor;	 descripción	 de	 cómo	 debe	 usarse	 el	 término	 en	 la	
indización;	e	historia	del	descriptor.	
Formas	de	presentación	de	los	tesauros	
	
Los	términos	que	componen	un	tesauro	y	sus	relaciones	pueden	presentarse	de	varia	formas:	
	
• Alfabética:	 contiene	 descriptores	 y	 no	 descriptores	 ordenados	 alfabéticamente.	 Con	 cada	
descriptor	 aparece	 el	 conjunto	 de	 sus	 relaciones	 semánticas,	 incluidas	 toda	 su	 jerarquía,	 es	
decir,	todos	los	niveles	de	términos	más	genéricos	y	más	específicos.	Por	lo	tanto	cada	entrada	
tiene:	
ü Indicación	del	campo	semántico	al	que	pertence	un	descriptor	
ü Notas	aclaratoias	o	de	aplicación	
ü Equivalencias	semánticas	(relación	de	no	desciptores	o	términos	no	preferentes)	
ü Los	 descriptores	 genéricos	 según	 uno,	 varios	 o	 todos	 los	 niveles	 de	 jerarquía	
ascentende	
ü Los	 descriptores	 específicos	 según	 uno,	 varios	 o	 todos	 los	 niveles	 de	 jerarquía	
descendente	
ü Los	descriptores	asociados	
La	indicación		detallada	de	estas	relaciones	semánticas	entre	los	términos	caracteriza	al	tesauro	
y	lo	diferencia	de	un	léxico	documental	o	de	un	simple	glosario.	Por	ejemplo	Agrovoc	(tesauro	
agrícola	 multilingüe)	 (3ª	 ed.,	 Organización	 de	 la	 Naciones	 Unidas	 para	 la	 Agricultura	 y	 la	
Alimentación-FAO,	Roma,	2004).	Consulado	el	29-04-16	http://aims.fao.org/es/agrovoc	
	
• Sistemática:	contiene	 los	descriptores	estructurados	en	función	de	categorías	o	 jerarquías.	La	
parte	 sistemática	 ofrece	 una	 visión	 de	 conjunto	 de	 la	 información	 contenida	 en	 el	 tesauro	 y	
permite	conocer	en	qué	medida	se	ha	detallado	un	tema.	Con	esta	agrupación	jerárquica	de	los	
descriptores	se	puede	efectuar	un	control	general	de	los	campos	temáticos	tratados.	
Para	 llevar	 a	 cabo	 esta	 parte,	 hay	 que	 ver	 posibles	 relaciones	 término	 a	 término	 y	 campo	 a	
campo.	
Los	 descriptores	 se	 sitúan	 en	 sus	 áreas	 contextuales	 donde	 son	 jerarquizados	 por	 categoría	
semántica	y	dotados	de	distintos	tipos	de	relaciones.	Así	es	como	después	encontraremos	a	los	
descriptores	rodeados	de	sus	conceptos	más	próximos.	
El	establecimiento	de	categorías	se	puede	realizar	a	partir	de	facetas	o	de	campos	temáticos.	
Esta	 agrupación	 de	 los	 descriptores	 en	 facetas	 o	 temas	 es	 fundamental	 para	 poder	manejar	
este	lenguaje,	que	puede	contar	con	varios	miles	de	términos.	
La	presentación	mediante	campos	temáticos	organiza	los	conceptos	según	las	relaciones	
género	a	especie,	al	igual	que	los	hacen	los	sistemas	de	clasificación	jerárquicos.	Los	
descriptores	se	presentan	es	esquemas	arborescentes	con	ramificaciones	sucesivas	sin	que,	en	
ocasiones,	exista	un	rigor	lógico	en	su	estructura,	lo	que	se	justifica	en	el	seno	de	este	lenguaje	
documental	por	razones	pragmáticas.	Por	ejemplo	Tesauro	de	educación	de	unesco-oie	(sexta	
ed.,	2a	rev.,	2007,	UNESCO).	Consultado	el	29-04-16	http://www.ibe.unesco.org/es/unesco-ibe-
education-thesaurus	
	
• Gráfica:	 las	 representaciones	 gráficas	 exponen	 la	 estructura	 semántica	 de	 cada	 campo	
semántico	dentro	de	una	hoja	de	papel.	Las	tres	formas	más	usuales	de	representación	gráfica	
son:	
ü Estructura	arborescente	
ü Diagramas	de	flechas	
ü Terminogramas	
Los	tesauros	de	representación	gráfica	se	complementan	con	un	índice	alfabético	que	contiene	
notas	 aclaratorias,	 reenvíos	 entre	 términos	 preferentes	 y	 no	 preferentes	 y	 referencias	 a	
términos	genéricos,	específicos	y	 relacionados;	por	ello,	en	este	 tipo	de	representación	no	es	
necesario	asignar	símbolos	a	cada	término	en	particular.	
Los	 sistemas	 gráficos	 muestran	 sobre	 todo	 las	 relaciones	 jerárquicas	 existentes	 entre	
descriptores	y,	por	lo	general,	los	reenvíos	hacia	términos	asociados	se	indican	en	los	márgenes	
del	esquema	gráfico.		
Ej.:	Eurovoc	(edición	4.4,	Legislación	y	Publicaciones	de	la	Unión	Europea)	Consultado	el	29-04-
16	
http://eurovoc.europa.eu/drupal/?q=es/request&view=mt&mturi=http://eurovoc.europa.eu/1
00163&language=en	
	
	
Índices	auxiliares	
	
Además	de	las	formas	de	presentación,	es	posible	incluir	en	un	tesauro	un	índice	permutado	y/o	índice	
de	términos	identificadores.	El	índice	permutado	recoge	la	terminología	completa	del	tesauro	y	tiene	
como	objetivo	concentrar	las	palabras.	Consiste	en	una	simple	relación	alfabética	de	los	descriptores	
para	facilitar	su	búsqueda	inicial	y	remitir	al	usuario,	por	medio	de	un	código,	a	la	parte	semántica.	
	
Recibe	la	denominación	“permutado”	porque	los	descriptores	y	no	descriptores	sintagmáticos	se	
encuentran	en	este	índice	ordenados	alfabéticamente	tantas	veces	como	términos	los	componen:	así,	
podemos	encontrar	los	términos	compuestos	con	la	ayuda	de	los	demás	elementos	el	sintagma,	lo	que	
el	orden	natural	de	las	palabras	que	figuran	en	una	simple	lista	alfabética	no	permite	descubrir.	Por	
ejemplo:	Literatura	medieval	se	puede	localizar	por	la	(L)	de	literatura	y	por	la	(M)	de	medieval.	La	
estructura	de	este	tipo	de	índices	es	la	que	diferencia	a	los	tesauros	de	los	léxicos.	
	
El	índice	de	identificadores	consiste	en	un	listado	alfabético	de	términos,	generalmente	de	uso	
frecuente	en	el	sistema	de	información	que	emplea	el	tesauro.	Se	compone	de	términos	onomásticos:	
nombres	propios,	nombres	de	organismos	y	de	instituciones	y	de	topónimos.	Los	términos	que	
componen	este	índice	se	denominan	“identificadores”	porque	se	limitan	a	identificar	organismos,	
nombres	de	personas	o	lugares,	pero	no	describen	el	contenido	semántico	de	los	documentos.	
Bibliografía	
-GARCÍA	GUTIERREZ;	Luis	Antonio	(1983).	"Entropía,	relevancia	y	pertinencia	del	
descriptor	en	el	mensaje	comunicativo-documental	:	nota	tipo	lógica",	
Documentación	de	las	Ciencias	de	la	Información,	v.	7	(en	RECURSOS)	
-GAVILÁN,	C.	M.	Lenguajes	documentales.	Principales	tipos	de	clasificación.	
Encabezamientos	de	materia,	descriptores	y	tesauros	[recurso	
electrónico],	http://eprints.rclis.org/14817/1/lendoc.pdf,	[consulta:	03	deabril	
de	2016]	(en	RECURSOS)	
-LÓPEZ	YEPES,	José;	OSUNA	ALARCÓN,	María	Rosario	(2011).Manual	de	ciencias	
de	la	información	y	documentación.	Madrid	:	Ediciones	Pirámide	
-MANIEZ,	J.	(1993),	Los	lenguajes	documentales	y	de	clasificación:	concepción,	construcción	y	utilización	
de	los	sistemas	documentales.	Traducción	del	francés	por	F.	J.	Alvarez	García,	J.	F.	Herranz	Navarra	y	M.	
Ramírez	Reyes,	Fundación	Germán	Sánchez	Ruipérez	;	Ediciones	Pirámide,	Madrid.	(en	RECURSOS)	
-MARTINEZ,	Ana	María	(2003).	"Tesauro	y	listas	de	epígrafes:	¿hacia	la	integración?",	Información,	
Cultura	y	Sociedad,	n.9	(en	RECUROS)	
-ORERA	ORERA,	L.	(1997).	Manual	de	bibliotecología,	Editorial	Síntesis,	Madrid.[recurso	electrónico]	
http://biblma.pcp.mx/archivos/Manual%20de%20Biblioteconomia.Luisa%20Orera%20Orera1.pdf	
[consulta:	10	de	abril	de	2016]

Continuar navegando