Word sense disambiguation
Significa associare una data parola in un testo ad una definizione basandosi sul contesto.
Step:
- determinare tutti i possibili sensi
- assegnare ad ogni occorrenza di una parola il senso appropriato
Per prima cosa si deve adottare un thesaurus o un dizionario. Successivamente si analizza il contesto. Ci sono due approcci:
- bag of words si inferisce il contesto analizzando le parole intorno alla parola di cui si vuole trovare il senso
- relational information oltre all’approccio bag of words, qui si estraggono anche la distanza tra le parole
Il contesto per ogni nome è l’insieme degli altri nomi nella frase.
La confidenza di scegliere il senso per la parola è influenzato dalla frequenza di quel senso, e dalla similarità tra e il senso di tutti i nomi nel contesto.
La similarità tra due sensi è influenzata da:
- distanza nella gerarchia degli iponimi di wordnet (path based similarity) Prendendo gli altri nomi () nel contesto, si considera ogni senso di ognuno (). Aggiungendo alla confidenza la similaritĂ tra e il senso di , nome piĂą simile a .
- se si adotta un approccio relazionale, allora si usa la distanza tra le parole coinvolte