ISKO Italia. Documenti

Il Gruppo Web semantico (2000-2005)

Una comunità di apprendimento per condividere un metodo di lavoro, repository di glossari bilingue in progress in linea, revisione degli standard ISO 2788 e 5964

by Paola Capitani [1]

<paolacapitani@libero.it>


Apprendere non significa imparare delle cose,
ma dai "significati" delle cose
(John Dewey)

Premessa

Per gestire la conoscenza, nell'accezione più vasta del termine, gioca un ruolo essenziale la terminologia, elemento basilare di tutti i flussi comunicativi e della conoscenza stessa. La terminologia, ovvero condivisione di concetti -"vocaboli ed espressioni proprie di una determinata scienza, arte, disciplina" (Devoto-Oli) - consente la comprensione, la comunicazione e l'interazione attraverso una condivisione di obiettivi e contenuti. Le mappe concettuali, le ontologie, i gruppi semantici, le gerarchie e le relazioni sono i concetti con i quali fare i conti, non solo per ottenere quella necessaria comprensione all'interno delle stesse aree tematiche, ma per dialogare con operatori di diverse aree geografiche. L'Europa è un insieme in continua evoluzione e l'assetto internazionale "a 25" ha portato a maggio 2004, nuovi paesi sullo scenario comune della comunicazione e della cooperazione con un conseguente obbligato dialogo multilinguistico [2].

La rete è dominata dalla scienza dell'informazione (information science), dove termini quali knowledge management [3], data mining, metadata, web semantico, mappe concettuali, ontologie sono spesso interpretati e tradotti in diverse maniere, contribuendo ad aumentare le definizioni esistenti. [4]

Negli anni '80 per partecipare ai progetti comunitari era obbligatorio usare strumenti multilingue di recupero per condividere i concetti e i termini tra aree geografiche differenti e tra ceppi linguistici diversi. Durante la collaborazione all'aggiornamento del thesaurus Europeo dell'Educazione (che utilizzava riferimenti tratti dal thesaurus Europeo della Formazione [5] e dal thesaurus Eurovoc [6]) si consultavano strumenti terminologici del settore quale il thesaurus ERIC [7] e i thesauri europei UNESCO, IBE, ILO [8] . Tutti strumenti di controllo terminologico che fornivano una diversa definizione per i termini trattati e anche strutture gerarchiche non coincidenti.

La definizione del concetto, la sua univoca accezione, la corretta traduzione e quindi la struttura gerarchica dei termini (in sovraordinati, sottordinati), l'attribuzione di termini correlati, di sinonimi e la collocazione all'interno di una classe di appartenenza, per facilitare la comprensione del significato e soprattutto la condivisione con altri paesi. La traduzione del concetto nelle lingue di riferimento era la basilare reciprocità terminologica prevista, per consentire l'utilizzo da parte degli utenti della comunità europea ed un allineamento alle diverse esigenze di interpretazione.

Negli anni '90 una nuova rete europea sull'Istruzione Superiore [9] costruiva un sistema di condivisione dei metodi di raccolta dati e una terminologia controllata (thesaurus Ortelius in 15 lingue), grazie alla paritetica collaborazione in un sistema di rete. L'Italia era l'agenzia di riferimento nazionale, con il compito di coordinamento tecnico (redazioni manuali, costruzione thesaurus, prodotti di informazione, ecc.), in stretta collaborazione con i rappresentanti di tutti i paesi comunitari presenti nel sistema. Alla realizzazione partecipavano, oltre alla BDP e ai Paesi della UE, l'Università di Firenze, la Casa Editrice Giunti e la Olivetti, costruendo un sistema di rete rappresentato dalle componenti essenziali (ricerca scientifica, editoria e tecnologia) oltre che dai rappresentanti nazionali delle agenzie dei paesi partner (quelli che all'epoca erano della UE).

Criteri e metodi di lavoro

Per ottenere uno strumento normalizzato, il thesaurus Ortelius si è basato sugli standard ISO [10], utilizzando i concetti scaturiti dalle basi dati nazionali, i cui termini venivano usati in ciascuna lingua nazionale, utilizzando la lingua inglese come lingua di scambio o lingua franca, comune a tutti i paesi, e quindi asse terminologica per le traduzioni e le interpretazioni concettuali. Alla suddivisione tematica, stabilita dalla UE per le basi dati scientifiche [11] sono stati applicati i principi della normativa ISO per la revisione delle versioni linguistiche, per rivedere le liste terminologiche adottate fino a quel momento dai singoli paesi comunitari.

Il gruppo di lavoro, operante nell'allora Biblioteca di Documentazione Pedagogica (oggi INDIRE [12]), si è assunto l'onere della revisione terminologica (scomposizione dei termini composti, disambiguazione dei concetti, verifica delle sinonimie, integrazione con Scope Note (definizioni), distinzione tra plurale/singolare. Dopo la prima fase di lavoro i termini venivano rinviati alle singole agenzie nazionali per la revisione nella lingua di appartenenza. Sorgeva il problema della sovrapposizione terminologica di alcune lingue comuni a più stati (inglese, per Regno Unito e Irlanda), tedesco (per Germania e Austria), francese (per Francia, Lussemburgo, Belgio). Poiché si poteva prevedere solo una versione linguistica è stata demandata ai paesi coinvolti la soluzione ideonea, prevedendo comunque una sola versione linguistica, eventualmente con una serie di rinvii da non descrittori a descrittori [13]. Si ricorda che, anche ai fini informatici, è previsto un solo campo per ogni versione linguistica, opportunamente contrassegnato dal codice ISO, di due lettere, per il paese.

Erano esclusi dal sistema europeo alcuni termini significativi per un solo paese, ma non condivisi dagli altri: in questo caso i termini relativi a concetti nazionali venivano inseriti in un campo aggiuntivo, oggetto di ricerca separata, e quindi su liste distinte.

Nei progetti terminologici multilingue il significato "condivisione" è basilare: occorre effettuare una serie di aggiustamenti per trovare quel minimo comune denominatore basilare per tutti i partner, nessuno escluso. Lavorare con equilibrio e praticità, seguendo criteri e norme, ma anche accettando compromessi utili a soluzioni non sempre ortodosse, ma che rispondono, tuttavia, all'obiettivo fissato.

Nel 2003 il Progetto PERINE [14] ha consentito di verificare una volta ancora l'importanza di condividere un strumento terminologico comune (sempre il già citato thesaurus EUDISED) con la possibilità di indicizzare siti web nell'area educativa, utilizzando descrittori comuni a più realtà linguistiche.

In tutti i lavori di controllo terminologico la conoscenza della lingua inglese aiuta a utilizzare le numerose risorse già presenti e ad adottare le traduzioni più consone e corrette. Inoltre l'uso di un apposito software di gestione memorizza selezioni, criteri, definizioni, fonti, per gestire le diverse relazioni. Le relazioni gerarchiche sono sempre duplici, se non molteplici, per cui un software in grado di apportare modifiche e aggiunte è essenziale per evitare traduzioni differenti per lo stesso concetto. Un esempio tipico in area economica può essere il termine Management, in alcuni sistemi utilizzato con il calco inglese, in altri sistemi tradotto con il termine Amministrazione, in altri con il termine Gestione, e in altri ancora convivono i tre termini con differente significato. Da qui l'importanza di definire il singolo concetto in maniera univoca, collegarlo ad un'area e quindi strutturare una gerarchia: sembrano ovvie considerazioni ma se si consultano alcune basi economiche si registra subito che l'ovvio non appartiene a questo settore.

Purtroppo ancora l'uso della lingua inglese, tra gli addetti ai lavori, non è diffusa come dovrebbe, e spesso addirittura osteggiata, vista come un pericolo per il "dolce lessico nazionale". In questo contributo non si affrontano gli equilibrismi stilistici narrativi, ma una modalità di dialogo, sintetica, scarna, operativa, che, grazie proprio a una lingua di scambio (attualmente l'inglese) consente di far interagire persone di diversa provenienza. Un esempio per tutti, durante l'ultimo seminario sul multilinguismo a Bolzano (maggio 2005), i 70 partecipanti presenti rappresentavano circa 20 diversi ceppi linguistici. L'unica lingua usata è stata la lingua inglese, in quanto consentiva a tutti di poter comprendere ed esprimersi, evitando incomprensioni e ambiguità, confusioni e carenza comunicativa: tutto qua. L'italiano resta sempre una bellissima lingua, parlata e compresa, attualmente nel mondo della rete, da una piccola comunità, che non rappresenta l'interesse e la ricerca potenzialmente presente, ma ancora scarsamente utilizzata.

Il Gruppo web semantico <www.indire.it/websemantico>

è un gruppo di lavoro in rete, attivo dal gennaio 2000, per la condivisione di risorse informative (thesauri, ontologie, mappe concettuali, multilingui) e soprattutto per la definizione di criteri comuni di lavoro, finalizzati ad un reciproco scambio di conoscenze. Ad oggi sono coperte le seguenti aree tematiche:

Nel forum sono attualmente i seguenti glossari: biblioteche scolastiche, comunicazione, e-learning, economia, educazione, formazione, knowledge management, open culture, terminologia e traduzione oltre ai link con il CNR/ITTIG (<http://www.ittig.cnr.it/Index.htm>) per l'area giuridica, e all'Istituto Internazionale Polimoda (<www.polimoda.com>) per il settore moda.

I glossari sono in progress, aggiornati continuamente in base alla terminologia e ai concetti emergenti nella pubblicistica dei settori di appartenenza e corredati dalle traduzioni vigenti nelle specifiche aree. Un particolare collegamento è in corso con la Biblioteca Nazionale Centrale di Firenze, per la revisione del nuovo Soggettario che avrà una struttura gerarchica ISO standard. Sono in corso sperimentazioni di verifica sia sui contenuti che sulle traduzioni, utilizzando i glossari che provengono prevalentemente dal mondo della ricerca e dall'utenza in generale.

Il sito del Gruppo è in fase di aggiornamento, con l'inclusione della home page in francese, tedesco e spagnolo. è in programmazione la pubblicazione degli interventi alle tavole rotonde del 2004 e del 2005 che saranno pubblicate in formato digitale sul sito della Università di Castellanza (<www.liuc.it>) a cura di Piero Cavaleri.

La prossima tavola rotonda dovrebbe essere presso la LIUC a Castellanza nell'ottobre del 2005. Per informazioni consultare il forum del sito <www.indire.it/websemantico>.

Note

[1] Consulente per servizi informativi e gestione di linguaggi controllati (traduzione dello standard ISO 2788 e parte della 5127), coordina dal gennaio 2000 il Gruppo di lavoro "Semantica e terminologia nei portali" (<http.//www.indire.it/websemantico>). Autrice di saggi, manuali e articoli quali thesauri e ontologie in "Biblioteche Oggi", 2005; Gestione della conoscenza e formazione, in Partecipare la scienza, a cura di Adriana Valente e Daniela Luzi, Roma, Biblink editori, 2004; "Il servizio informativo. Iter di formazione e proposte di gestione" (Milano, Editrice Bibliografica, 2003); modulo e-learning La biblioteca a scuola,(<http://www.giuntiscuola.it>), partecipa al Gruppo di lavoro sulla formazione degli Information Professional (<www.aldus.unipr.it/master/preparare.html/> e <www.math.unipr.it/~biblio/NPG/NPG.html>), al Gruppo Qualità della formazione in ambito AIF Sezione toscana (<www.aifonline.it> Sezione Toscana), al Gruppo Comunicazione e TQM (<www.eucluster.net>). In stampa Formazione e KM.

[2] Dall'articolo "thesauri e ontologie" su "Biblioteche Oggi" 2005.

[3] Ai fini degli argomenti trattati in questo contributo si intende knowledge management come "insieme che comprende organizzazione, gestione, analisi, diffusione e ricerca delle informazioni".

[4] Sul tema i convegni degli ultimi mesi: La formazione in terminologia, 29 e 30 aprile a Portico di Romagna Assiterm e Università di Bologna, Bilinguism and multilinguism and cognition, 19 – 21 maggio - Bolzano su bilinguismo e terminologia, 27-29 giugno a Milano il convegno Openculture organizzato da AICA e varie università.

[5] <www.cedefop.gr>

[6] Sono i tre thesauri europei, rispettivamente sull'educazione, sulla formazione e sulle politiche comunitarie. Vedere in merito la bibliografia citata nel volume Paola Capitani, "Il servizio informativo. Iter di formazione e proposte di gestione" op.cit.

[7] <http://www.csc.com/> ERIC Processing & Reference Facility, Computer Sciences Corporation, 4483-A Forbes Boulevard, Lanham, MD, 20706 Phone: 301-552-4200 Toll-Free: 800-799-3742 Fax: 301-552-4700 E-mail:info@ericfac.piccard.csc.com

[8] Vedere i rispettivi siti web e in particolare la bibliografia sul thesaurus nel volume Paola Capitani, "Il servizio informativo. Iter di formazione e proposte di gestione" op.cit

[9] Ortelius, base dati comunitaria sulla tematica della Istruzione Superiore in Europa, gestita dalla Biblioteca di Documentazione Pedagogica (oggi INDIRE) <www.indire.it> supportata dalle agenzie nazionali dei paesi della UE. Ha prodotto un thesaurus in 15 lingue sulle tematiche dei corsi di laurea universitari esistenti allora in Europa.

[10] Standard ISO 2788, 5964, rispettivamente Linee guida per la gestione di thesauri monolingue e multilingue, tradotti a cura dell'UNI, Istituto Nazionale di Normazione, via Battistotti Sassi,5 – Milano (<http://www.unicei.it>).

[11] Gazzetta Ufficiale L 189, 13 luglio 1991, che prevede le seguenti aree tematiche: Scienze Umane, Scienze Sociali, Scienze Esatte, Scienze Biomediche, Scienze Applicate.

[12] <http.//www.indire.it>

[13] Non descrittore è il termine non autorizzato, presente nella lista di riferimento, che rinvia al termine autorizzato o preferito, detto descrittore, utilizzato in sede di indicizzazione.

[14] PERINE, Pedagogical and Educational Research Information Network for Education, <www.perine.org> finanziato dalla Commissione Europea, prevede la costituzione di una rete di informazione sulla e per la ricerca educativa in Europa. Il progetto coinvolge in questa fase 8 paesi europei, tra i quali l'Italia, che partecipa con Indire (<http.//www.indire.it>).


Il Gruppo Web semantico (2000-2005) : una comunità di apprendimento per condividere un metodo di lavoro, repository di glossari bilingue in progress in linea, revisione degli standard ISO 2788 e 5964 / by Paola Capitani ; a cura di Emanuela Casson = (ISKO Italia. Documenti) -- <http://www.iskoi.org/doc/gruppo.htm> : 2005.11.14 - 2006.01.02 -