Similarità
Metrica abbastanza lasca. Due parole sono simili se condividono una o più feature.
Path based measures
Due concetti sono simili se sono vicini nella gerarchia del thesauro. I concetti hanno una distanza di 1 da se stessi.
Path distance similarity
Basato sul cammino più breve che collega i sensi nella tassonomia “is-a”
Wu-Palmer similarity
Basato sulla profondità dei due sensi nella tassonomia e quella del Least Common Subsumer (anchestor più specifico).
Information-content measures
La similarità tra due sensi è relazionata alle informazioni comuni. Più i due sensi hanno in comune, più sono simili.
è la probabilità che una parola selezionata randomicamente da un corpus, sia una istanza del concetto .
Information content: L’information content è alto quando è un senso raro, mentre è basso quando è un senso frequente.
Resnik similarity
Resnik similarity
Si basa sull’information content del Lowest common subsimer, ovvero il nodo più specifico dell’ancestor.