ISO 639 è uno standard internazionale per la classificazione delle lingue naturali e dei gruppi di lingue, e attribuisce loro un codice identificativo univoco.

Lo scopo dell'ISO 639 è creare un catalogo universalmente riconosciuto di codici convenzionali che vengono univocamente associati alle singole lingue senza ambiguità. Il termine lingua include tutte le forme di comunicazione linguistica tra persone (sono esclusi i linguaggi uomo-macchina), comprendendo lingue estinte o storiche, gruppi linguistici (o macro-lingue), varianti linguistiche, dialetti come anche forme di comunicazione non parlata come la lingua dei segni.

L'ISO 639 è stato approvato per la prima volta nel 1967, ma si compone di differenti sezioni (numerate da -1 a -6) che sono state pubblicate e aggiornate più volte nel corso degli anni fino al XXI secolo estendendo di volta in volta la precedente versione ISO. Gli standard più comunemente utilizzati sono l'ISO 639-1 e l'ISO 639-3.

I codici identificatori forniti dall'ISO 639 possono essere utilizzati in molti ambiti e applicazioni, ad esempio per indicare in che lingua è scritto un testo o un sito web, per identificare la lingua di provenienza di un termine definito in un dizionario, le lingue gestite da un software, la denominazione di una località ecc. Per questo motivo l'ISO 639 trova largo impiego nel campo dell'informatica, del web design e nella gestione degli archivi bibliografici.

Caratteristiche dei codici

[modifica | modifica wikitesto]

I codici ISO individuano le seguenti lingue:

Tipi (per lingue individuali):

Codici bibliografici e terminologici:

ISO 639-1

[modifica | modifica wikitesto]

Questa sezione utilizza codici di 2 lettere (alpha-2) per identificare le principali lingue (o famiglie di lingue) del pianeta, fornendo un catalogo generale di massima che si compone di 136 elementi.

Si tratta di codici largamente diffusi e utilizzati internazionalmente per riferirsi soprattutto alle principali lingue del mondo (ad esempio: (EN) , (IT) , (DE) , eccetera). Si tratta di lingue che per la maggior parte sono presenti nella letteratura contemporanea.

La versione aggiornata di questo standard è stata pubblicata nel 2002, e l'ultimo codice identificativo aggiunto dopo la pubblicazione risale al 2003.

ISO 639-2

[modifica | modifica wikitesto]

La catalogazione più generale dell'ISO 639-1 è approfondita nell'ISO 639-2, che utilizza codici di 3 lettere (alpha-3) per consentire un maggior numero di combinazioni possibili e permettere una maggiore differenziazione nel numero e nel tipo di lingue. Oltre alle singole lingue, l'ISO 639-2 fornisce inoltre codici identificativi per le famiglie linguistiche (ad esempio le lingue sino-tibetane o le lingue celtiche) e per le cosiddette macro-lingue, per i dialetti, per lingue estinte, antiche o artificiali. Il termine macro-lingua (in inglese macrolanguage) si riferisce a un oggetto che in certi contesti può per praticità di analisi venire considerato come un'unica lingua, ma che in realtà è un insieme che raccoglie dei sottotipi evoluti (come è il caso del cinese che raccoglie sottotipi eterogenei e distinti come il cantonese, o del pashtu). La catalogazione delle macro-lingue viene perfezionata a partire dal successivo standard ISO 693-3.

L'indice ISO 639-2 comprende 464 codici identificativi.

Questo indice è stato sostanzialmente superato dalla catalogazione ancor più estesa e dettagliata fornita dall'ISO 639-3. Ad eccezione delle famiglie linguistiche (che vengono per la maggior parte recuperate nell'ISO 639-5), infatti tutti gli elementi dell'ISO 639-2 sono stati ricodificati e inseriti nell'ISO 639-3.

Pubblicato per la prima volta nel 1998, è stato aggiornato con nuovi elementi fino al 1999.

ISO 639-3

[modifica | modifica wikitesto]

L'ISO 639-3 ha l'obiettivo di costruire un indice generale e il più dettagliato possibile, che comprenda qualunque tipo di lingua naturale esistente al mondo.

L'indice ISO 639-3 assegna codici di 3 lettere (alpha-3) a un vasto catalogo di lingue moderne, antiche, estinte e persino artificiali, per un totale di 7776 elementi.

L'ISO 639-3 è progettato per non entrare in conflitto con l'ISO 639-2. Per questo, tutti gli elementi presenti nell'ISO 639-2 sono dotati di un nuovo codice identificativo (ad eccezione delle famiglie linguistiche, escluse dall'ISO 639-3 e reintrodotte solo nel più tardo ISO 693-5).

lingua codice
639-1
codice
639-2
Dominio
639-3
codice
639-3
Inglese en eng a sé stante eng
Tedesco de ger/deu a sé stante deu
Arabo ar ara macrolingua ara
a sé stante arb + altri
Lingua cinese zh chi/zho[1][2] macrolingua zho
Mandarino a sé stante cmn
Cantonese a sé stante yue
Min Nan a sé stante nan

L'ISO 639-3 è stato pubblicato nel 2007.

Novità dell'ISO 639-3

[modifica | modifica wikitesto]

L'ISO 639-3 rappresenta un tentativo di costruzione di un indice delle lingue assai più dettagliato, che come i precedenti tiene conto della letteratura prodotta nelle varie lingue, ma si differenzia nel cercare di rendere conto in maniera più articolata della situazione concreta delle lingue parlate. Le principali caratteristiche dell'ISO 639-3 sono:

ISO 639-4

[modifica | modifica wikitesto]

Questo documento stabilisce le linee guida per l'utilizzo dell'ISO 639, e contiene i criteri per l'attribuzione dei codici linguistici. Anche le sezioni 1, 2, 3 e 5 dell'ISO 639 contengono istruzioni relative a come applicare lo standard, ma la sezione 4 intende fornire una descrizione complessiva ed esaustiva delle regole di utilizzo e delle linee guida presupposte da questa codifica ISO.

Il documento è stato pubblicato nel 2010.

ISO 639-5

[modifica | modifica wikitesto]

L'ISO 639-5 utilizza codici di 3 lettere (alpha-3) per codificare un totale di 114 famiglie linguistiche e gruppi linguistici, siano essi viventi o estinti. Premesso che lo standard codifica soltanto una minima parte di tutte le famiglie linguistiche adoperate dalla linguistica, va precisato che il documento presuppone le seguenti definizioni:

In particolare, secondo l'ISO 639-5 gli appartenenti a un gruppo linguistico non devono essere necessariamente linguisticamente correlati. Con l'espressione "in determinate circostanze" si intende che le due lingue possono essere caratterizzate da vicinanza geografica, affinità di utilizzo, o venire raggruppati seguendo categorie e criteri che prescindono da quelli strettamente linguistici.

Lo standard è stato pubblicato nel 2008. Per un tentativo di codificare le famiglie linguistiche in maniera più esaustiva, si può vedere lo standard ISO 639-6.

ISO 639-6

[modifica | modifica wikitesto]

L'ISO 639-6 utilizzava codici identificativi di 4 lettere (alpha-4) e nomi specifici per costruire un indice generale delle famiglie linguistiche, delle singole lingue e delle singole varianti linguistiche riconosciute all'interno di ciascuna lingua identificata, siano esse linguae viventi, estinte o artificiali. Lo standard includeva anche i gruppi linguistici, secondo la stessa definizione che ne era stata data nell'ISO 639-5.

La grande novità dello standard ISO 639-6 stava nell'esser stato progettato avendo in mente l'inserimento delle cosiddette varietà linguistiche: l'indice era stato progettato per codificare tutte le varianti linguistiche attualmente conosciute, e per garantire spazio sufficiente a future espansioni e nuovi inserimenti. Il codice avrebbe dovuto assicurare la compatibilità "all'indietro" con i codici ISO 639 precedentemente già pubblicati.

Lo standard è stato pubblicato nel 2009, ma è stato ritirato nel 2014. Allo stato attuale, pertanto, il tentativo più generale di attribuire codici identificativi alle lingue conosciute rimane l'ISO 639-3.

Note

[modifica | modifica wikitesto]
  1. ^ report del sito Ethnologue per il codice ISO 639 "zho" Archiviato il 12 settembre 2014 in Internet Archive. su ethnologue.com
  2. ^ ISO639-3 su SIL.org

Voci correlate

[modifica | modifica wikitesto]

Altri progetti

[modifica | modifica wikitesto]

Collegamenti esterni

[modifica | modifica wikitesto]
  Portale Linguistica: accedi alle voci di Wikipedia che trattano di linguistica