WordNet è un database semantico-lessicale per la lingua inglese elaborato dal linguista George Armitage Miller presso l'Università di Princeton, che si propone di organizzare, definire e descrivere i concetti espressi dai vocaboli.

L'organizzazione del lessico si avvale di raggruppamenti di termini con significato affine, chiamati "synset" (dalla contrazione di synonym set), e del collegamento dei loro significati attraverso diversi tipi di relazioni chiaramente definite. All'interno dei synset le differenze di significato sono numerate e definite.

Il lessico è disponibile gratuitamente on-line e il medesimo metodo è stato applicato anche alle varie lingue europee nell'ambito del progetto EuroWordNet, finanziato dalla Comunità europea (1996-1999). Il lessico per la lingua italiana è stato sviluppato dall'Istituto di linguistica computazionale del CNR a Pisa (diversamente dal suo omologo da cui trae l'idea non è pubblicamente scaricabile).

Nel 2006 il database per la lingua inglese conteneva circa 150.000 parole organizzate in più di 115.000 synset, la maggior parte dei quali sono connessi ad altri synset da relazioni semantiche.

WordNet attualmente è usato nel ramo informatico (in particolar modo nelle università), per lo sviluppo di sistemi WSD Word sense disambiguation.

Classificazione

[modifica | modifica wikitesto]

Le relazioni semantiche variano in funzione del tipo di parola e includono:

Voci correlate

[modifica | modifica wikitesto]

Collegamenti esterni

[modifica | modifica wikitesto]
Controllo di autoritàVIAF (EN179937683 · LCCN (ENn97120839 · GND (DE4392196-6 · J9U (ENHE987007588640205171