ISKO Italia. Documenti

Classificare la documentazione locale
Giornata di studio
San Giorgio di Nogaro (UD) : 17 dicembre 2005

Variazione locale e comunicabilità globale

Eugenio Gatto

versione provvisoria

Il pervasivo influsso di Ranganathan

Le tesi esposte da Ranganathan non hanno trovato applicazioni pratiche, se non quelle da lui stesso adottate. Di conseguenza, non è possibile riferirsi a qualcosa di pratico da far vedere. Tuttavia, le sue idee, anche se conosciute spesso solo superficialmente, sono state così pervasive che dopotutto hanno influenzato numerose applicazioni. Non è detto che queste applicazioni si riconoscano esattamente in quanto diceva Ranganathan, ma in ogni caso riapplicano cose che sono state sistematizzate da lui molto chiaramente. Ranganathan si è occupato di questi argomenti per 50 anni a partire dal 1928, ma non ha mai visto direttamente l'applicabilità all'automazione di quanto aveva inventato e fatto. Il lavoro sulla classificazione fatto da Ranganathan è particolarmente interessante, perché rappresenta una sistemazione fondamentale. Le classificazioni hanno subito un momento di oscuramento dopo l'arrivo dell'automazione, dell'information retrieval, e di applicazioni come la ricerca per parole chiave su testo libero. Ora, vista l'enormità dell'universo della conoscenza che si deve trattare, le classificazioni stanno riacquistando importanza, perché ci si rende conto che è indispensabile utilizzare strumenti più potenti e quindi più strutturati rispetto alle applicazioni dei primi database.

Leggere Ranganathan è una cosa relativamente complessa perché le sue tesi sono state formulate in un arco di 50 anni e ogni opera tiene conto di quello che è stato pensato nel frattempo. Sembra il contrario di quello che si chiede a una classificazione, dalla quale si vorrebbe stabilità e sicurezza. La Colon Classification è poco apprezzata e ancor meno utilizzata proprio perché sembra non dare nessuna sicurezza. Non è, volutamente, una classificazione enumerativa e quindi non fornisce un dizionario di soluzioni preconfezionate, ma richiede sempre a chi la applica la costruzione dei numeri in base alle regole stabilite. Si potrebbe affermare che la Colon Classification non è uno schema di classificazione, ma una metaclassificazione. La parte più importante è quella degli strumenti concettuali e pratici con cui si costruiscono le notazioni, piuttosto che le tavole pratiche da applicare direttamente ai documenti.

Postulati, leggi, canoni e devices

L'idea di Ranganathan era di applicare, per la costruzione della classificazione, un metodo che lui chiama postulazionale. Ranganathan era un matematico e quindi sapeva che se qualcosa viene costruito a partire da postulati e procedendo per teoremi con un metodo deduttivo, alla fine funziona, nel senso che è coerente in se stesso. Se poi non risponde allo scopo, allora, come qualunque matematico sa, si cambiano i postulati adottandone di altri che siano funzionali. Tutte le matematiche e le geometrie sono equivalenti; tutte seguono un metodo deduttivo da postulati e sono quindi coerenti in se stesse. Che siano poi funzionali allo scopo, questo dipende dai postulati che si usano.

La classificazione è uno strumento estremamente adatto per l'applicazione del metodo deduttivo: prende l'uno e lo divide in modo gerarchico e possibilmente perfetto. Il termine classificazione indica appunto la divisione in classi ognuna disgiunta dalle altre.

Tutta l'opera di Ranganathan può essere considerata come un enorme sistema di classificazione dei concetti che usa e che propone.

Innanzitutto ci sono le leggi. Le leggi sono i principi fondamentali; valgono per ogni campo di applicazione e devono essere rispettate nello stabilire i canoni di ciascun campo. I canoni si riferiscono ai singoli campi di applicazione, valgono per quel campo e sono buoni se rispettano le leggi. I canoni servono per valutare se sono utili gli artifici che si usano per realizzare gli scopi: gli artifici sono i devices.

Le cinque leggi sono note a tutti:

  1. I libri sono fatti per essere usati
  2. A ogni lettore il suo libro
  3. A ogni libro il suo lettore
  4. Non si faccia perder tempo ai lettori
  5. Ogni biblioteca è un organismo in crescita

L'ultima legge è stata formulata in diverse versioni; le più vecchie dicono "le biblioteche sono come organismi in crescita" mentre nelle ultime si dice che "le biblioteche sono organismi in crescita", riconoscendo quindi alle biblioteche una vita propria.

Le leggi hanno applicazioni profondissime, per esempio "a ogni lettore il suo libro" significa accettare il punto di vista del lettore e dare a ogni lettore lo strumento per trovare il suo libro. Non significa semplicemente trovare dei clienti per i libri che sono stati comprati...

Leggi, canoni e devices sono graduati: ciascuno di loro è più importante dei successivi; se c'è un conflitto tra leggi, vale quella che viene prima.

Ordinamento e modularità

Per Ranganathan la classificazione implica anche l'ordinamento: non si tratta solo di una divisione in classi disgiunte, in compartimenti stagni, ma anche di un ordinamento tra le classi. Stabilire l'ordine è quindi fondamentale, ma è anche un procedimento molto difficile: se ho 4 oggetti le permutazioni sono 4! cioè 24, se ne ho 5 sono 120. Gli x lettori di una biblioteca vorrebbero vedere i libri ordinati in x! modi diversi; è evidente che ci vogliono dei compromessi. I compromessi devono rispettare la 4a legge "non far perdere tempo ai lettori" e quindi la scelta deve cadere sulla sistemazione che può soddisfare la maggior parte degli usi. Ranganathan comunque non pensa a soluzioni definitive, ma anzi sostiene che le cose possono cambiare e che in questo caso dovrà cambiare anche la classificazione.

Il paragone che utilizza Ranganathan per parlare della classificazione è il Meccano, gioco molto in voga negli anni '20 e '30: è costituito da sbarrette modulari e da una serie di bulloni per collegarle. L'idea di fondo è quella della modularità. La semantica è fondamentalmente abbastanza povera se ci si limita ai concetti fondamentali: se si riesce ad ottenere i pezzetti giusti per esprimere i concetti di base, combinandoli poi insieme si riesce ad esprimere qualunque concetto, anche il più complesso. L'idea è antica: già Leibniz si era fatto influenzare dalle tecniche combinatorie cinesi, che stanno alla base di quella che noi oggi chiamiamo numerazione binaria e di cui abbiamo una realizzazione pratica nei calcolatori. Leibniz desiderava un linguaggio simbolico per la filosofia che consentisse di esprimere i concetti con simboli matematici per dedicarsi poi alla discussione sulle equazioni e risparmiarsi invece quella sui significati delle parole. Le classificazioni si pongono lo stesso obbiettivo, cioè rappresentare la realtà con dei simboli ed evitare così ogni problema linguistico.

Della classificazione Dewey Ranganathan riconosce la straordinaria capacità di esprimere una vasta quantità di concetti, ma allo stesso tempo anche i notevoli limiti derivanti dalla povertà di uno strumento essenzialmente enumerativo. Si rende conto anche della differenza strutturalista tra langue e parole e definisce quindi i criteri per superare il livello della langue, della forma prescrittiva della lingua come codificazione, dal momento che egli è interessato alla parole, all'applicazione pratica: la classificazione deve diventare parole, l'applicazione pratica che serve in quel caso specifico.

Qui veniamo alla localizzazione. La Colon Classification è piena di artifici, cioè di strumenti pratici che hanno la funzione di consentire a ciascuna biblioteca la possibilità di scegliere la propria soluzione, anche in deviazione dall'ufficialità dello schema collettivo, e rispondere ai propri scopi in quel determinato momento. È l'esempio che aveva fatto Gnoli a proposito della categoria preferita: se una biblioteca si occupa di economia ferroviaria, il numero più o meno lungo che nella classificazione rappresenta l'economia ferroviaria viene abbreviato in un'unica cifra. Naturalmente le abbreviazioni si applicano solo a simboli di almeno due cifre: in questi casi, può risultare utile abbreviare una notazione. Allo stesso tempo, se si è scelto opportunamente il simbolo con cui sostituirla, si ottiene anche di darle priorità rispetto a tutte le altre. L'abbiamo visto con la @ di Gnoli. Questo è naturalmente conveniente, nel senso che è evidentemente conveniente rappresentare per primo l'oggetto di cui si occupa la biblioteca.

Il presupposto per l'ordinamento classificato è la sequenza filiatoria, cioè il generale viene prima del particolare; è quello che in informatica si chiama linearizzazione di un albero. Per ottenere la linearizzazione di una gerarchia perfetta che prosegue per ramificazione si decide come comportarsi ogni volta che si incontra una ramificazione, per esempio si può decidere di prendere prima il ramo di sinistra e poi quello di destra, se si tratta di una ramificazione binaria, altrimenti si prende il primo ramo, poi il secondo, poi il terzo e così via. È quello che facciamo con qualunque classificazione: una struttura multidimensionale viene rappresentata sugli scaffali linearizzata, con il risultato che le cose che si somigliano si troveranno nello stesso scaffale.

I calcolatori ci liberano molto da queste necessità fisiche, ma normalmente non ci danno gli strumenti per rappresentare sullo schermo il raggruppamento che ci interessa, cioè la nostra ricerca; al contrario, la nostra ricerca viene rappresentata per mezzo delle singole schede, visualizzate una per una. Nell'esempio di Gnoli, invece, vediamo che la classificazione è allo stesso tempo anche il raggruppamento e corrisponde a quello che sarebbe l'ordinamento fisico dei documenti sugli scaffali.

Questi principi molto generali sono applicati in qualunque classificazione, ma l'unico ad averli spiegati compiutamente è stato Ranganathan. Il risultato è la Colon Classification, una classificazione purtroppo non usata, ma la cui applicazione incontrerebbe molti problemi in meno di qualunque altro sistema: basti considerare l'esiguità dei volumi che la raccolgono e pensare invece ai 4 volumi della CDD o ai 12 volumi della LC.

Anche la CC usa le cifre, come altre classificazioni. Ranganathan si è accorto della diversa applicazione delle cifre 0 e 9 nella CDD e ha assegnato a quelle cifre un uso diverso, stabilendo a priori che le cifre utilizzate come cifre significative fossero solo 8. Questo accade anche nella CDD, e anzi Ranganathan lo ha desunto proprio da qui, ma a differenza di Dewey ha codificato questo principio.

L'ospitalità delle notazioni decimali

Mentre le cinque leggi valgono per ogni branca della biblioteconomia, ogni branca ha invece propri canoni. Nel caso della classificazione uno dei canoni più importanti è l'ospitalità nella catena, hospitality in chain. La catena è la sequenza di caratteristiche che si decide di attribuire a qualcosa per individuare la classe. Per esempio: nella tavola geografica si parte dal mondo intero, che è diviso per continenti, in ogni continente ci sono le nazioni, in ogni nazioni ci sono le regioni e così via. Queste sono le caratteristiche usate per determinare quella classe. Si deve tenere presente che le cose cambiano, in certi casi anche molto in fretta, e quindi è necessario che le catene siano ospitali cioè che consentano l'inserimento di concetti nuovi nel posto giusto, nella catena già esistente, senza disturbare il resto. Ospitalità significa possibilità di inserzione in qualunque punto della catena a qualunque livello; in particolare devo poter completare la classificazione cioè spingerla a qualunque livello man mano che sia necessario andare a concetti sempre più fini.

Importantissima è l'ospitalità in mezzo, e questa possibilità è fornita già da Dewey nel suo sistema. La caratteristica decimale della CDD, infatti, riguarda in particolare il fatto che le cifre si usano come nella mantissa, cioè come le cifre che si mettono dopo la virgola nei numeri decimali; con un'espressione forse più semplice da capire, sono allineate a sinistra, come le lettere, e non a destra, come i numeri. Questa è una soluzione strepitosa per risolvere il problema dell'inserimento di nuovi numeri: questa rappresentazione è infatti quella dei numeri reali, e la matematica dei numeri reali ci insegna che l'insieme dei numeri compresi tra 0 e 1 è infinito ed isomorfo, cioè il numero di oggetti che stanno tra 0 e 1 è uguale al numero di oggetti che stanno tra 0 e 8. Tra 0,2 e 0,3 è possibile inserire per esempio 0,25 e poi ancora 0,251 tra 0,25 e 0,3, e così via.

Aggiungendo le cifre in fondo si arriva all'idea del troncamento, cioè alla possibilità di togliere cifre a destra arrivando a classi superiori, meno dettagliate. Questo vale finché viene rispettato il canone di modulazione, che riguarda la scelta delle caratteristiche che si usano quando si scende nella catena. Ci sono sempre diverse possibilità: nel caso delle patate le caratteristiche da considerare sono per esempio il colore del fiore, la pelosità del picciolo, la forma delle foglie. Possono essere caratteristiche concomitanti: quella certa patata ha sempre il fiore di colore giallo e ha sempre il picciolo peloso. Bisogna quindi decidere quale caratteristica utilizzare per operare le suddivisioni; la scelta dipende dalla materia da classificare e dalla conoscenza della materia da parte del classificatore. Linneo ha utilizzato delle caratteristiche apparentemente illogiche e inconsistenti, come il numero dei petali per la sistematizzazione dei fiori. In realtà, a distanza di secoli, la classificazione proposta da Linneo è utilizzata ancora con pochissime modifiche: naturalmente i criteri applicati oggi sono diversi, ma evidentemente la conoscenza che Linneo aveva della materia considerata era tale per cui i criteri da lui scelti sono risultati davvero efficaci per una corretta rappresentazione.

Soluzioni di notazione per le lingue

Consideriamo ora le tavole delle lingue nella CDD e nella CC. L'ordinamento delle lingue nelle due tavole è molto simile; quello che è invece completamente diverso è la notazione usata. Inoltre, al contrario della CDD, dove abbiamo visto che volendo forzare la classificazione per rappresentare situazioni specifiche si ottengono notazioni incongrue, nella CC è possibile localizzare la tavola delle lingue e quindi rispettare il diritto di ogni biblioteca di trattare in modo speciale la propria collezione.

Dewey aveva chiara la classificazione delle lingue: l'ordine in cui le lingue sono elencate nella tavola della CDD corrisponde infatti alla corretta gerarchia, prima le lingue indoeuropee, quindi le lingue germaniche, poi il tedesco. Se si osserva l'estensione delle notazioni si direbbe invece il contrario: il concetto di "lingue indoeuropee" sembra infatti coestensivo di "inglese" o di "lingue germaniche". In una classificazione ci si aspetta che venga utilizzato sempre un numero di cifre pari alle suddivisioni applicate per costruire la catena. In questo caso, quindi: prima divisione "lingue indoeuropee", seconda divisione "lingue germaniche", terza divisione "inglese". Allo stesso modo anche l'italiano deve avere tre cifre. Quello che Dewey applica è semplicemente un artificio notazionale, e non concettuale, per rappresentare tutte le lingue nelle 8 cifre a sua disposizione e allo stesso tempo dare una notazione breve e la priorità alla lingua preferita. La tavola delle lingue della CDD denuncia in modo plateale l'artificiosità e lo scopo bassamente pratico di Dewey e dei suoi successori nel definire questi numeri.

Nella gerarchia delle lingue, al primo livello ci sono almeno le lingue indoeuropee, le lingue dravidiche e le lingue semitiche. Non abbiamo in verità libri "in lingue indoeuropee" e a volte una classe di questo tipo viene usata per inserire libri in più lingue, con un artificio che consiste nello schiacciare in una classe superiore un gruppo di concetti che sarebbero più articolati. Le notazioni usate in questo modo si chiamano telescopiche nel senso che più livelli sono ripiegati a mo' di telescopio in un livello superiore. Nel secondo livello ci sono le lingue germaniche, le lingue slave, le lingue romanze. Al terzo livello c'è un certo ordine in cui la CDD vuole vedere per prima la lingua inglese. Trattandosi comunque di una convenzione, questo può essere accettabile, anche se effettivamente un ordine di questo tipo non risponde a gerarchie di tipo storico o scientifico, ma solo all'esigenza pratica di vedere, sugli scaffali, per primi i libri in lingua inglese. Ad ogni modo, scegliendo le notazioni opportune, e anche rispettando il criterio gerarchico delle famiglie linguistiche, i libri in inglese potrebbero comunque essere collocati per primi. Nel nostro esempio, possiamo assegnare al primo livello il numero 1, senza l'ulteriore specificazione "indoeuropee", poi 11 "germaniche" e poi 111 "inglese", 112 "tedesco". Applicando questo criterio si ottiene lo stesso ordinamento della CDD, ma con la notazione corretta.

A livello di parole, cioè di classificazione applicata, qualunque classificazione è enumerativa, ma nel costruire le singole etichette alcune sono espressive dei livelli che stanno sotto e dei passaggi compiuti per arrivare a quell'etichetta. Queste classificazioni si dicono espressive, le altre ordinali, perché sono funzionali per dare l'ordine giusto ma non per esprimere i passaggi concettuali compiuti. La Classificazione Bliss è di questo genere; serve a garantire che i libri siano disposti nell'ordine giusto, ma i suoi numeri di per sé non hanno alcun significato, sono solo come dei numeri di catalogo senza struttura interna.

In una classificazione massimamente espressiva, cioè che riesca ad esprimere attraverso i numeri tutti i passaggi compiuti, posso smontare tutta la notazione partendo da destra e ricostruire tutto l'albero. I numeri della Colon Classification sono espressivi; la CC è fondamentalmente la grammatica e la sintassi con cui si esprime una classificazione di quel genere. Ranganathan si è interessato molto di più delle viti e dei bulloni del Meccano, cioè dei connettori, piuttosto che delle barrette che viti e bulloni tengono insieme, cioè delle tavole. Il primo simbolo, e anche unico per le prime quattro edizioni della CC, utilizzato con funzione di connettore è stato il colon (due punti), da cui per l'appunto la Colon Classification prende il nome.

A questo punto bisogna ricordare le categorie fondamentali di Ranganathan: Personalità, Materia, Energia, Spazio, Tempo. Il postulato è che sia utile vedere la semantica incasellata in queste cinque categorie fondamentali. La categoria più importante è l'Energia, che dà lo snodo principale; è a questa categoria che Ranganathan attribuiva i due punti, che dividono quindi la parte sinistra del numero (PM) dalla destra (EST).

Andando avanti Ranganathan si accorse che era utile che tutte le faccette avessero un proprio connettore per evitare ambiguità e introdusse quindi la virgola (,) per la Personalità, il punto e virgola (;) per la Materia, i due punti (:) per l'Energia, il punto (.) per lo Spazio, l'apice (') per il Tempo. I connettori dicono in quale thesaurus bisogna andare a cercare quel numero per sapere il concetto corrispondente (thesaurus e classificazione sono la stessa cosa, una classificazione è un insieme di thesauri: si tratta di lessici specifici convenzionali e che quindi devono dichiarare le convenzioni a cui si ispirano).

Discipline e livelli di integrazione

Colon Classification è una classificazione per discipline e non per livelli integrativi, ma è stupefacente vedere quanto corrispondano gli ordinamenti nelle due classificazioni; questo dipende dal fatto che alla base ci sono dei criteri sensati che evidentemente danno luogo a ordinamenti corrispondenti. È l'isomorfismo di Linneo: Linneo contava i petali, Ranganathan guardava la pratica scientifica delle discipline correnti, ILC si riferisce alle classificazioni naturalistiche che si basano sull'evoluzionismo; nella pratica però tutte pervengono allo stesso risultato.

Nella Colon Classification ci sono 26 classificazioni diverse, tutte svolte con lo stesso strumento, ma ciascuna con le proprie tavole e il proprio modo di classificare, perché ciascuna va nella direzione decisa da quella disciplina. Un esempio chiarissimo è quello fornito dalle tavole degli accoppiamenti teorico-applicativi: fisica (classe C) - ingegneria (classe D), botanica (classe I) - agricoltura (J) e silvicoltura (JX), zoologia (K) - zootecnia (KZ). Le tavole di queste coppie sono tra loro diversissime perché l'ordinamento più utile è diverso: nelle classi applicative la priorità è data alle cose che si coltivano o si allevano di più, nelle classi teoriche l'ordinamento è un altro. In agricoltura la divisione delle piante si basa sulla parte della pianta che è economicamente utile; in botanica la classificazione è quella della sistematica botanica. Ciononostante Ranganathan riesce ad applicare la mnemonica seminale, cioè ad attribuire le stesse cifre ad alcuni significati fondamentali, che così sono rappresentati sempre dallo stesso numero anche in classi diverse.

Localizzazione

Andiamo ora ai criteri di localizzazione. In certe tavole che sono di utilità generale ci sono dei concetti di per sé vuoti che poi hanno un'applicazione pratica diversa a seconda dei contesti in cui vengono utilizzati. Nella tavola geografica, per esempio, le cifre significative sono solo quelle dal 4 al 9, di cui il 9 con un significato speciale. 1 è il mondo in generale, è quindi una classe telescopica; 4, 5, 6, 7 e 8 sono continenti, cioè parti del mondo intero. La scelta di non elencarli sotto l'1 è data dal fatto che tutti i continenti fanno parte del mondo intero; sarebbe inutile sprecare una cifra per ribadire questo concetto, quindi anziché 14 si usa solo 4. Il 2 è la madrepatria, cioè la nostra nazione, e il 3 la nazione favorita, cioè quella su cui abbiamo il maggior numero di libri nella nostra biblioteca. L'uso di 2 e 3 è opzionale, se coincidono si utilizza un numero solo, naturalmente.

Questi sono concetti locali; di conseguenza bisogna considerare il problema della globalizzazione: la nostra classificazione non è esportabile perché la mia classificazione friulana, che usa il 2 per indicare il Friuli, non andrà bene in Sardegna, dove il 2 sarà utilizzato per la Sardegna. La regola che Ranganathan avrebbe indicato per risolvere il problema se fosse vissuto all'epoca dei calcolatori sarebbe stata che ogni volta che esco da casa devo tradurre la mia classificazione e farla ridiventare internazionale. Nel caso delle lingue, la localizzazione si attua con un trattino: se la mia biblioteca è quasi completamente costituita da letteratura inglese, posso sostituire con un trattino le tre cifre 111 che rappresentano la lingua inglese. In questo modo vengono abbreviate moltissime notazioni.

I book numbers

La Colon Classification non si occupa solo del contenuto concettuale, ma anche della collocazione dei materiali; prevede infatti che le etichette abbiano una seconda parte, il book number, che serve a dare collocazione univoca e contiene informazioni che non riguardano il contenuto concettuale del documento, ma che sono comunque rilevanti per gli utenti. La faccetta principale di questa seconda parte è la lingua in cui è scritto il documento. Di conseguenza, l'etichetta riesce ad esprimere sia la lingua originaria del documento sia la lingua del documento che si trova nella mia collezione. Nella CC è sempre possibile mettere in relazione due concetti diversi, come in questo caso. Al contrario, nella CDD questo procedimento è spesso vietato, perché potrebbe dar luogo a numeri equivoci.

Il book number serve a dare, all'interno della stessa classe, un ordine utile all'utente. Ranganathan prevede che un numero di classificazione sia diviso in tre parti: un nucleo centrale, il book number, e una terza parte che è la collezione di appartenenza. La collezione può cambiare nel tempo, perché i libri possono essere spostati all'interno della biblioteca: in questo caso, la parte da cambiare è soltanto la terza, mentre le prime due parti rimangono le stesse. Seconda e terza parte dell'etichetta fanno di un simbolo che è sostanzialmente un "simbolo da bibliografia", perché si riferisce al contenuto concettuale del documento, un "simbolo da biblioteca", completo di identificazione univoca del volume e di collocazione. Secondo Ranganathan è questa l'unica differenza tra bibliografia e biblioteconomia.

Allo stesso modo, Ranganathan ritiene che soggettazione e classificazione non siano procedimenti diversi, dal momento che l'analisi concettuale da compiere sul contenuto del documento è la stessa. La soggettazione, quindi, non è altro che la descrizione verbale dei simboli di classificazione.

 


Variazione locale e comunicabilità globale / Eugenio Gatto ; Lorena Zuccolo, Claudio Gnoli : cura = (Classificare la documentazione locale : giornata di studio : San Giorgio di Nogaro (UD) : 17 dicembre 2005) = (ISKO Italia. Documenti) -- <http://www.iskoi.org/doc/locale3.htm> : 2006.01.20 - 2006.01.23 -