Similarità

Metrica abbastanza lasca. Due parole sono simili se condividono una o più feature.

Path based measures

Due concetti sono simili se sono vicini nella gerarchia del thesauro. I concetti hanno una distanza di 1 da se stessi.

Path distance similarity

Basato sul cammino più breve che collega i sensi nella tassonomia “is-a”

Wu-Palmer similarity

Basato sulla profondità dei due sensi nella tassonomia e quella del Least Common Subsumer (anchestor più specifico).

Information-content measures

La similarità tra due sensi è relazionata alle informazioni comuni. Più i due sensi hanno in comune, più sono simili.

è la probabilità che una parola selezionata randomicamente da un corpus, sia una istanza del concetto .

Information content: L’information content è alto quando è un senso raro, mentre è basso quando è un senso frequente.

Resnik similarity

Resnik similarity

Si basa sull’information content del Lowest common subsimer, ovvero il nodo più specifico dell’ancestor.