Word sense disambiguation

Significa associare una data parola in un testo ad una definizione basandosi sul contesto.

Step:

  1. determinare tutti i possibili sensi
  2. assegnare ad ogni occorrenza di una parola il senso appropriato

Per prima cosa si deve adottare un thesaurus o un dizionario. Successivamente si analizza il contesto. Ci sono due approcci:

  • bag of words si inferisce il contesto analizzando le parole intorno alla parola di cui si vuole trovare il senso
  • relational information oltre all’approccio bag of words, qui si estraggono anche la distanza tra le parole

Il contesto per ogni nome è l’insieme degli altri nomi nella frase.

La confidenza di scegliere il senso per la parola è influenzato dalla frequenza di quel senso, e dalla similarità tra e il senso di tutti i nomi nel contesto.

La similarità tra due sensi è influenzata da:

  • distanza nella gerarchia degli iponimi di wordnet (path based similarity) Prendendo gli altri nomi () nel contesto, si considera ogni senso di ognuno (). Aggiungendo alla confidenza la similaritĂ  tra e il senso di , nome piĂą simile a .
  • se si adotta un approccio relazionale, allora si usa la distanza tra le parole coinvolte