• Perchè usare un thesaurus?
    • [[#Perchè usare un thesaurus?#Indexing|Indexing]]
    • [[#Perchè usare un thesaurus?#Ricerca|Ricerca]]
  • Componenti
    • [[#Componenti#Index term|Index term]]
    • [[#Componenti#Index term relationship|Index term relationship]]

Thesaurus

Raccolta di parole importanti in un certo dominio di conoscenza. Ad ogni parola è relazionata una lista di parole, come ad esempio variazioni comuni, derivate da una relazione di sinonimità. eg: wordnet

I thesauri possono essere generati manualmente da esperti, automaticamente da collezioni di documenti o unendo più thesauri, oppure semi-automaticamente con l’aiuto di esperti di dominio. Per thesauri automatici, serve un Word sense disambiguation.

Perchè usare un thesaurus?

Tramite thesauri, si ha un vocabolario controllato, per fare indexing e ricerche.

Ha una particolare importanza l’utilizzo in specifici domini come ad esempio la medicina o la legge.

Indexing

Viene utilizzato per normalizzare i concetti che vengono indicizzati, ridurre il rumore e identificare i termini da indicizzare con una semantica chiara.

Ricerca

Assiste l’utente per una corretta formulazione della query.

Componenti

Index term

Denota un concetto, che è l’unità semantica di base. Possono essere parole individuali o insiemi di parole.

Index term relationship

Composte solitamente da sinonimi o quasi sinonimi.

  • BT: Broader term
  • NT: Narrower term
  • RT: Related term