- Perchè usare un thesaurus?
- [[#Perchè usare un thesaurus?#Indexing|Indexing]]
- [[#Perchè usare un thesaurus?#Ricerca|Ricerca]]
- Componenti
- [[#Componenti#Index term|Index term]]
- [[#Componenti#Index term relationship|Index term relationship]]
Thesaurus
Raccolta di parole importanti in un certo dominio di conoscenza. Ad ogni parola è relazionata una lista di parole, come ad esempio variazioni comuni, derivate da una relazione di sinonimità. eg: wordnet
I thesauri possono essere generati manualmente da esperti, automaticamente da collezioni di documenti o unendo più thesauri, oppure semi-automaticamente con l’aiuto di esperti di dominio. Per thesauri automatici, serve un Word sense disambiguation.
Perchè usare un thesaurus?
Tramite thesauri, si ha un vocabolario controllato, per fare indexing e ricerche.
Ha una particolare importanza l’utilizzo in specifici domini come ad esempio la medicina o la legge.
Indexing
Viene utilizzato per normalizzare i concetti che vengono indicizzati, ridurre il rumore e identificare i termini da indicizzare con una semantica chiara.
Ricerca
Assiste l’utente per una corretta formulazione della query.
Componenti
Index term
Denota un concetto, che è l’unità semantica di base. Possono essere parole individuali o insiemi di parole.
Index term relationship
Composte solitamente da sinonimi o quasi sinonimi.
- BT: Broader term
- NT: Narrower term
- RT: Related term