ISKO Italia. Documenti

Organizzazione della conoscenza

Come mi vuoi, settoriale o interoperabile?

da AIDA informazioni, 33: 2015, n. 3-4, p. 153-156

di Claudio Gnoli

Molto del dibattito corrente sulle istituzioni della memoria (biblioteche, archivi e musei, sempre più spesso raccolti nella sigla LAM) sta enfatizzando le potenzialità della condivisione di dati attraverso il Web semantico: le informazioni catalografiche, tradizionalmente espresse in formati specifici come il MARC utilizzabili solo all'interno di strumenti appositi come un opac, si preparano ora a salpare per il grande mare della Rete, dove potranno mescolandosi con informazioni di ogni altro genere. Le bottiglie in cui le infiliamo prima di abbandonarle al loro destino sono i library linked data, ovvero i formati di marcatura come RDF, che rendono i vecchi dati bibliografici capaci di interagire con dati di altra provenienza, come un repertorio geografico, delle tavole scientifiche oppure Wikipedia.

Questo scenario, che viene di solito descritto con toni profetici, tuttavia permette un'interoperabilità dei dati solamente dal punto di vista tecnico: una classe Dewey o il nome controllato di un autore vengono ora rappresentati come stringhe sintatticamente corrette e manipolabili in una ricerca "semantica" (nel senso del Web semantico, non dell'indicizzazione semantica!). Di per sé esso non garantisce affatto che sia interoperabile anche il contenuto di queste informazioni [C. Gnoli, Biblioteche oggi, 32: 2014, n. 5, p. 9-16]. Una classe Dewey espressa come linked data rimarrà una sequenza di cifre senza particolare significato, finché non venga riconnessa allo schema a cui appartiene.

Ecco quindi che va crescendo la consapevolezza del ruolo che nel Web semantico devono necessariamente svolgere i KOS (knowledge organization systems, spesso chiamati in questi contesti, con un po' di confusione, anche “vocabolari controllati” o “ontologie”), che comprendono i buoni vecchi soggettari, tassonomie, tesauri e classificazioni. Di questi aspetti continua a occuparsi la serie di workshop europei, americani e ora anche asiatici accomunati dalla sigla NKOS, ossia networked KOS; inoltre, riprendendo la preziosa funzione del vecchio repertorio web di KOS curato da Traugott Koch, è ora nato grazie ad Andreas Ledl dell'Università di Basilea il Basel Register of Thesauri, Ontologies and Classifications (BARTOC) [bartoc.org] che già elenca e descrive oltre 1500 KOS, dai classici Library of Congress Subject Headings alla AlgaeBase Taxonomy. D'altra parte, enfatizzare l'incommensurabilità fra i concetti di dominî diversi sembra in contraddizione con gli scopi del Web semantico, nel quale qualsiasi dato dovrebbe poter dialogare con qualsiasi altro a patto di essere espresso in RDF. A che ci serve l'interoperabilità tecnica se poi rimane una chimera l'interoperabilità concettuale?

Mi pare chiaro che le risposte a tale questione siano da cercare appunto nell'organizzazione della conoscenza. Sono davvero inesistenti i rapporti fra KOS di dominî diversi? Non è poi così vero, se lo sviluppo di classificazioni generali quali Dewey e CDU ha avuto stretti rapporti con quello della classificazione degli strumenti musicali di Hornbostel e Sachs, come ha mostrato Deborah Lee [in W. Babik ed., Knowledge organization in the 21st century, Ergon, 2014, p. 200-207]. Ma allora che cosa si può fare per riconnettere fra loro i contenuti dei diversi KOS, ossia come si usa dire con un anglismo per mapparli fra loro? È interessante a questo proposito che il recente standard ISO 25964 Thesauri and interoperability with other vocabularies preveda, tra le classiche relazioni di equivalenza tra termini, la possibilità di equivalenze parziali o di equivalenza fra un termine di un KOS (es. inland waterways) e l'insieme di due termini di un altro (es. rivers e canals). Questo dovrebbe permettere di mappare almeno approssimativamente termini i cui campi semantici siano sovrapposti solo in parte. È vero che KOS diversi modellano il mondo in modi differenti, ma è pure vero che possiamo modellare le differenze stesse (gli inuit e gli scozzesi avranno anche mille termini per indicare tipi diversi di neve, ma l'italiano dal canto suo permette di costruire perifrasi che li approssimano discretamente bene).

Perché la conoscenza a 360 gradi dei filosofi antichi si è nel tempo segmentata in settori, più o meno impermeabili fra loro? Con quale criterio essi sono stati definiti? Quando studiavo scienze naturali, per passare da una lezione a un'altra dovevamo spostarci velocemente fra il polo biologico e il dipartimento di scienze della Terra ubicato qualche via più in là. Giunto il semestre del corso di paleontologia, mi stupii che le aule e gli studi dei suoi docenti si trovassero nel settore geologico e non in quello biologico: in fin dei conti, non si trattava in entrambi i casi di studiare organismi? Ma di fatto, giacché i fossili si rinvengono dentro strati di roccia, i paleontologi utilizzano tecniche e terminologie simili a quelli dei geologi, mentre comunicano assai poco coi biologi... Le discipline sono quindi una suddivisione della conoscenza che riflette solo in parte i fenomeni studiati, mentre ha a che fare specialmente con approcci e metodi, ossia con il punto di vista da cui i fenomeni vengono considerati.

È noto che già gli allievi della scuola di Aristotele, in particolare Andronico di Rodi, organizzarono le sue opere in una sequenza canonica dando origine a discipline come la logica e la fisica (ta physikà "le cose naturali"). Grande influenza sul Medioevo ebbe la suddivisione delle arti liberali adottata dall'erudito Marziano Capella: grammatica, dialettica, retorica (il Trivio), aritmetica, geometria, astronomia e musica ovvero armonia (il Quadrivio); a queste si aggiungevano la medicina e architettura, che però nell'allegorica festa nuziale descritta da Marziano non hanno diritto di parola per mancanza di tempo. L'albero delle discipline fu in séguito sviluppato e aggiornato da Francesco Bacone, dagli enciclopedisti francesi, da Ampère, Comte e molti altri; da queste suddivisioni tradizionali è derivato anche l'impianto delle classificazioni bibliografiche, come quelle di Dewey (baconiana) e di Bliss (comtiana).

Questi modi di "fare a pezzi il mondo", per usare l'espressione di Roberto Poli, sono arbitrari oppure in qualche modo fondati? Idealmente, l'ontologo dovrebbe procedere come il bravo macellaio citato da Platone, che sa tagliare le parti della carne lungo i loro giunti naturali, anziché arbitrariamente per traverso, ottenendo in questo modo fette più morbide. Per quanto molta letteratura degli ultimi anni insista sulle differenze tra le tassonomie prodotte da culture diverse, trascurandone invece gli aspetti comuni, dei “giunti naturali” sembrano in qualche modo esistere: sono quelli che separano classi di fenomeni descrivibili secondo gli stessi insiemi di categorie. Se cioè la categoria del metabolismo risulta applicabile sia a un'alga che a un essere umano ma non a un'opera letteraria, non è tanto perché ve la applichi arbitrariamente un biologo, ma perché alghe e umani appartengono ad una stessa classe naturale, quella degli organismi viventi. Dei sistemi generali di categorie si occupano filosofi ontologi come Nicolai Hartmann o Herman Dooyeweerd, le cui ricerche offrono principî generali applicabili dagli sviluppatori di KOS.

D'altronde, nemmeno le discipline di origine più antica e apparentemente lontana sono prive di relazioni fra loro. Nel XII secolo il teologo Ugo di San Vittore osservò che il commercio, classificato fra le arti pratiche, può però appartenere anche alla retorica, considerando che di essa il commercio fa ampio uso per le sue tecniche di eloquenza — come oggi ci insegna fin troppo bene la pubblicità [H. Olson, Knowledge organization, 37: 2010, n. 2, p. 121-138]. Anche tra le discipline moderne è possibile individuare reticoli di relazioni significative, come si intuisce scorrendo l'Indice relativo della Classificazione Dewey. L'architettura è elencata dalla Dewey nell'ambito delle arti, ma i libri di architettura contengono molti riferimenti ai più prosaici principi dell'edilizia, che appartiene invece al ramo delle scienze applicate, ed è a sua volta connessa alle leggi strutturali dell'ingegneria civile e quindi alla fisica statica e alla matematica. Si può dire che fra queste cinque discipline esista una serie di relazioni di dipendenza.

Le interfacce di ricerca di biblioteche e archivi cartacei o digitali dovrebbero evidenziare queste relazioni fra discipline diverse, offrendo agli utenti la possibilità di ulteriori percorsi di navigazione nell'albero del sapere anziché applicarlo soltanto come una gerarchia rigida che limita alle sole connessioni verticali, come gli uffici di un'organizzazione troppo burocratica. Con Laura Pusterla e altri colleghi della Biblioteca della scienza e della tecnica dell'Università di Pavia, stiamo cercando di applicare questa idea a uno strumento di ricerca battezzato SciGator [scigator.unipv.it]: alla classica esplorazione sistematica delle classi Dewey, SciGator affianca il suggerimento di expanded queries che includano tra i risultati le classi connesse a quella prescelta ma appartenenti a rami diversi della gerarchia. All'architetto, in fin dei conti, potrebbe risultare utile anche qualche testo di edilizia.

 


Come mi vuoi, settoriale o interoperabile? = ISKO Italia. Documenti. Organizzazione della conoscenza. 11 — <http://www.iskoi.org/doc/rubrica11.htm> : 2023.08.10 -