ISKO Italia. Documenti

Le dimensioni dell'informazione
Giornata di studio AIB Piemonte-ISKO Italia
Torino. Biblioteca civica Geisser : 12 giugno 2004

Soggettazione a faccette

Carlo Revelli

Buongiorno. Dopo questa presentazione sono un po' imbarazzato, perché dovrei cominciare dalle basi cartacee, che mi sono più familiari. C'è la necessità di una continuazione, non di una rottura fra i due problemi.

In questa voce (che è una voce dell'Enciclopedia tascabile e non è un volume autonomo), l'autore mette in evidenza giustamente la difficoltà di sperimentare uno schema nuovo in presenza di altri schemi ben documentati, con una storia alle spalle. Forse la storia di questi schemi ben documentati fa sì che i sistemi stessi scricchiolino un poco, ma d'altra parte sono datati, irrimediabilmente secondo alcuni, mentre secondo altri sono ancora accettabili: basti pensare all'utilizzazione della Classificazione decimale Dewey per la scaffalatura aperta.

D'altra parte le difficoltà di una classificazione -- e di un soggettario -- globale che comprenda l'intero scibile sono state discusse molte volte: per motivi filosofici prima di tutto, ma poi semplicemente per la difficoltà di trovare una coerenza strutturale all'interno di classi troppo diverse per poter essere presentate in modo coerente. Interessante a questo proposito è l'invito di Gnoli, nel caso di un'applicazione a campi limitati, di cominciare a sviluppare per proprio conto un sistema a faccette -- senza dimenticare però il problema, che è di sempre ma che oggi è particolarmente sentito per la tipologia delle pubblicazioni e della comunicazione, di appoggiarsi a una classificazione o a uno strumento generale di informazione, che consenta degli interventi in campi collaterali alla classe studiata: collegamenti che oggi sono sempre più probabili per l'accentuarsi dei casi di interdisciplinarietà.

Certo, se vogliamo volgerci all'indietro per considerare la storia della classificazione -- ma io preferirei chiamarla soggettazione: la classificazione non è altro che una soggettazione che ha una certa direzione -- l'analisi del contenuto concettuale dei documenti ha sempre evidenziato la necessità di una distinzione per categorie: Gnoli ricorda Bacone, ricorda d'Alembert... Di d'Alembert sono formidabili le prime pagine dell'introduzione all'Encyclopédie: si vedono già in nuce degli elementi che saranno poi gli isolati di Ranganathan.

D'altra parte non è una novità: possiamo andare indietro fino a Platone, quando cita Socrate a proposito del fatto che una parola può avere diversi significati; certo Platone non dice che una parola poteva appartenere a diverse classi. Già qualcosa del genere lo dice d'Alembert: altro problema su cui tornerò, che permette di non considerare come aspetti nettamente staccati la classificazione e la soggettazione alfabetica. La stessa struttura dell'Encyclopédie, che ovviamente è un'enciclopedia alfabetica, nasce da una classificazione. D'Alembert parla ampiamente di questo problema, e all'interno delle voci dell'Encyclopédie troviamo i "vedi anche", troviamo i collegamenti, quella classificazione nascosta che non è poi tanto nascosta, almeno se si guarda quello che ha scritto d'Alembert. Quindi questi contatti fra la classificazione e la soggettazione alfabetica ci sono sempre stati: pensiamo alla storia dell'enciclopedia dal Medioevo.

Ma per parlare consapevolmente di faccette bisogna giungere a Ranganathan e al Classification research group [CRG nel seguito]. Già nel 1957 il CRG, come ricorda giustamente Gnoli citando il congresso di Dorking del 1957, aveva pubblicato un memorandum sulla necessità della classificazione a faccette. Vickery, che era membro del CRG, nel 1960 ha pubblicato un volumetto sulla classificazione a faccette, prezioso, leggibile con gusto ancora oggi; dodici anni più tardi è stato tradotto e pubblicato in italiano, forse il primo libro sull'argomento che i bibliotecari di una certa età hanno letto.

Se posso aprire una parentesi, è curioso ricordare che pochi anni dopo Ranganathan il termine faccetta è stato usato dal sociologo Guttman, che non aveva niente a che fare con Ranganathan: l'uno e l'altro si ignoravano, e tutti e due in campi diversi hanno usato l'espressione faccetta. È un esempio di quella undiscovered public knowledge, come ebbe a definirla Swanson, e ne hanno scritto Davidson e Clare Beghtol. A questo c'è un riferimento che ho visto proprio adesso nel sito dell'ISKO, nel concetto di knowledge organization: il problema importante della scoperta di conoscenza pubblica non conosciuta, perché trattata in materie di cui ci si occupa separatamente: il chimico o il medico si interessa degli effetti di una sostanza su un'altra, e poi si scopre che in psicologia un certo effetto si ritrova. Questo è successo. In psichiatria una certa malattia può essere curata usando i risultati di una scoperta nel campo chimico. Sono scoperte casuali, che tirano in ballo un'altra parola che è estremamente diffusa e che è tipica del nostro tempo: la serendipity, la scoperta casuale di qualche cosa.

D'altra parte il percorso della parola faccetta lo conosciamo: una parola ritornata dalle nostre parti dopo aver girato un po' dappertutto per l'Europa. La sfaccettatura del diamante era già chiamata facette in Francia al principio del 1600, e la ritroviamo nella letteratura francese: recentemente mi è capitato di trovarla in "Madame Bovary", parlando di sfaccettatura del diamante -- naturalmente, con la deformazione professionale che mi caratterizza, quando trovo qualcosa che possa avere qualche riferimento me lo segno.

Ma nella classificazione decimale troviamo già delle sfaccettature: non so fino a che punto possiamo parlare di faccette, ma insomma, certamente le ultime due edizioni della CDD hanno utilizzato questo sistema in alcuni punti, e uno lo cita Gnoli: nella musica abbiamo proprio uno 0 e un 1 utilizzati per il lavoro di sintesi; il che non è nuovo della classificazione decimale, ma questa volta è fatto con un indicatore di faccetta. E se n'è aggiunta un'altra applicazione nell'ultima edizione: la fisiologia -- fisologia non umana, fisiologia delle scienze naturali -- dove con un 1 e con un 2 si distinguono rispettivamente gli animali e le piante. Questi sono veri e propri indicatori di faccetta, consapevoli. Un po' inconsapevole poteva essere l'utilizzazione dello 0, che in certi casi ha valore di indicatore di faccetta, ma non possiamo attribuire a Dewey una conoscenza, una mentalità che non poteva essere certamente quella dell'ultimo quarto dell'Ottocento. Per esempio un'analisi per faccette, puramente teorica, che tornava a delle soluzioni che giocano sul numero degli zeri, è quella di Tartaglia, che ha proprio provato ad analizzare come per faccette la Classificazione decimale Dewey...

Certo, più impegnata in direzione della sfaccettazione è la CDU, che già in passato, con l'impiego di segni particolari per funzione, permetteva di riconoscere determinate categorie di pubblicazione, legate per esempio alla lingua, alla data, alla forma e anche (se nessuno si scandalizza: forse tu [rivolto a Gatto] ti puoi scandalizzare) in parte con indicatori di fase, con l'indicazione dei due punti, che permettono il collegamento di insiemi di concetti appartenenti a classi diverse.

Io non so poi se strutture che sono state accusate -- secondo me a torto -- di essere quasi esclusivamente enumerative, ma che certamente sono troppo limitatamente sintetiche, come la Classificazione decimale, come il Soggettario di Firenze, possono sopportare lo choc di una cultura drastica di riconoscimento delle faccette; e questo vale per tutte le applicazioni della soggettazione.

Certamente dobbiamo mettere in evidenza i due aspetti della suddivisione per categorie. Uno è l'espressione del soggetto -- con simboli di classificazione o con una stringa di parole, ma il problema è sempre a monte: l'identificazione del soggetto. L'altro è la possibilità di ricuperare tutti i termini che sono espressi dalla formula (a parole o con altri segni, o con numeri o con lettere), riconoscere quindi tutti i concetti che stanno all'interno di un soggetto. È questo il grande problema che è stato affrontato da Farradane e da altri, già dagli anni Trenta. C'è un sogno che in ambiente cartaceo (non soltanto per la soluzione verbale) non è del tutto irrealizzabile, ma è limitato comunque ad archivi poco consistenti: forse qualcuno ricorda -- certamente ricordi personali quelli che ho io -- per averne letto cos'era il Peek-a-boo, che comportava comunque la postcoordinazione, non era in ambiente precoordinato, ma aveva il presupposto di avere una quantità molto limitata di documenti, non certamente i documenti di una biblioteca generale. Oppure pensiamo alla rete dei collegamenti sintattici dei soggettari, che è forzatamente limitata: non tutti i concetti espressi in una grande biblioteca possono essere recuperabili dall'interno grazie ai collegamenti sintattici, si tratta anche di trovare una misura conveniente, e la misura conveniente è abbastanza limitata nel catalogo cartaceo. Ma il sogno è completamente realizzabile invece nel catalogo in linea, che consente la ricerca per qualunque termine o per qualunque raggruppamento di termini riconoscibili entro la stringa; bisogna soltanto che la notazione sia in grado di permettere questo riconoscimento.

Quindi abbiamo qui due aspetti. Da un lato, un'espressione -- siamo sempre in campo precoordinato -- che indichi compiutamente il soggetto, indipendentemente dal tipo di raggruppamento dell'informazione, che può essere una classificazione o una soggettazione alfabetica; il problema sta, ripeto, a monte: si tratta di identificare il soggetto, riconoscere i concetti che lo compongono, metterli insieme in un qualche modo, molto rigoroso o meno rigoroso a seconda delle teorie. Ma poi questo non basta: consente di riconoscere il soggetto, ma si tratta poi di ricuperare tutte le informazioni.

Nel catalogo cartaceo si partiva dal primo elemento: l'indicazione di classe nella classificazione, l'indicazione di personalità nella soggettazione alfabetica (non che non ci fosse nella classe, ma non era ovviamente la prima posizione). Tutti gli altri venivano dopo, non potevano essere cercati salvo che con qualche accorgimento, qualche collegamento. Nel catalogo in linea questo dev'essere possibile. Non è sufficiente quindi riconoscere il soggetto, ma occorre permettere il ricupero delle informazioni di tutti i concetti.

E in questo aspetto noi possiamo notare una serie di cose su cui gli informatici non sempre sono d'accordo, perché possono pensare anche ad altri tipi di comunicazione. Ma per quanto riguarda le biblioteche, la necessità di una struttura informativa precoordinata, anche se oramai è stata messa in discussione, è inevitabile in una biblioteca di carattere generale. Poi ci sono altre condizioni in cui si preferisce passare direttamente all'informazione postcoordinata, che dà anche meno fastidi, perché l'informazione precoordinata non obbliga soltanto a riconoscere tutti i concetti che compongono il soggetto, ma obbliga anche a metterli insieme con qualche criterio, e quindi è una complicazione in più, di cui molte persone vorrebbero fare a meno. Ma il catalogo in linea permette, dovrebbe permettere la ricerca postcoordinata, cioè cercare dei termini, delle parole, delle espressioni che non stanno all'inizio della formula del soggetto, cercarne anche più d'una e metterle assieme: tutti i soggetti che contengono le parole Liguria e coltivazione, per esempio: nessuna delle due sarà in prima posizione, ma messe insieme devono saltare fuori tutte quante.

Secondo me, in forma necessaria, bisogna proprio pensare che il catalogo in linea, che è in grado teoricamente di dare certe informazioni, le dia in effetti: la stringa di soggetto (mi riferisco in particolare alla stringa alfabetica, ma il problema non cambia sostanzialmente) dev'essere visibile, deve fungere da filtro per la ricerca. I nostri cataloghi in linea incominciano ad essere abbastanza densi; non così lo erano alcuni anni fa, quando già erano molto densi in altri paesi che hanno fatto esperimenti di questo genere. Da noi vediamo un poco quello che capita nella ricerca in Internet: se si cerca una parola o anche un insieme di parole abbastanza conosciute, saltano fuori migliaia di risposte, in cui non ci si salva: si scelgono le prime e si lascia perdere il resto. È quell'information overload, quella stanchezza, quella saturazione di informazione che ci può permettere di arrivare a considerare al massimo un certo numero di risposte. Occorre quindi avere già, a una domanda, non i documenti che contengono la risposta alla domanda, ma le stringhe di soggetto che possono presentare dei documenti; questo ci darà la possibilità di fare un filtro alle richieste: secondo me è una condizione indispensabile in un catalogo generale. Poi si tratterà di studiare il problema: se nella risposta i documenti sono quattro, la macchina può presentarli subito, ma siccome normalmente la risposta è molto elevata, dovrebbe presentare come possibilità di filtro l'elenco dei soggetti.

Quindi, la possibilità di estrarre da una notazione di classificazione la notazione di faccette specifiche porta in realtà al recupero dei termini interni di un soggetto: il problema non cambia, noi dovremmo sempre pensare alla soluzione... Certo, come diceva il solito Wittgenstein, non esiste pensiero senza parola, ma dovremmo pensare ad individuare il soggetto e a formulare l'insieme dei concetti che lo compongono in una maniera asettica.

Quanto poi alla successione, l'organizzazione delle informazioni è molto discutibile... Le Regeln für den Schlagwortkatalog tedesche, per esempio, hanno una successione che io non oserei chiamare faccette, ma che volendo possiamo anche chiamare così: P = persona (persona non come personalità, come individuo), G = geografia o etnografia, S = oggetto, Z = tempo, F = forma: se abbiamo un libro sulla tipologia dei vini liguri avremo "Liguria -- vini", cosa che farebbe rizzare tutti i capelli a un soggettatore italiano. In S = oggetto ce ne possono essere molti: possiamo trovare, non so, una differenza, una relazione tutto-parte. Ma in fondo possiamo anche mettere in ordine alfabetico. Però le RSWK presuppongono l'insieme, sono una struttura precoordinata. Esattamente dal lato opposto troviamo la struttura proposta dal GRIS, che è estremamente rigorosa nella sua analisi logica del soggetto.

Gnoli mette giustamente in evidenza la Bliss: è importantissima la Classificazione bibliografica di Bliss. In particolare vi suggerirei di vedere "Introduction and auxiliary schedules", quel volume che parla della composizione del soggetto indipendentemente dalla destinazione dell'informazione: certo che poi si riferisce alla classificazione, ma la successione delle faccette dà una successione che è accettabilissima. Qui possiamo dire che sono faccette veramente, grazie anche al lavoro del CRG, che nella seconda edizione ha trasformato completamente quella che era la classificazione originale. Per la soggettazione alfabetica, naturalmente la soluzione è diversa: una volta riconosciuto il soggetto, la classificazione ha un suo comportamento e la soggettazione alfabetica un altro. Non ha per esempio la gerarchia che ha la classificazione, tranne che, se un termine deve essere spiegato dal termine della classe superiore, allora lo si usa -- ma è semplicemente un problema linguistico. La successione gerarchica nella soggettazione alfabetica non c'è; ma soprattutto, la classificazione incomincia con l'identificazione della classe, e la classe non è una faccetta: le faccette vengono dopo.

La classificazione è una griglia: non è detto che il soggetto debba essere esclusivamente e sempre specifico, può non esserlo per le caratteristiche della classificazione. È una griglia che indica un àmbito concettuale nel quale si inserisce il concetto: occupando completamente quell'àmbito, oppure standoci all'interno, galleggiandoci dentro. Tipico caso i nomi di persona, che non sono compresi nella classificazione: sono all'interno dell'oggetto. Invece la classificazione alfabetica non è una griglia: può indicare i soggetti specifici. La classificazione, a seconda di quella che si usa, non è detto che possa consentire di esprimere tutti i concetti che compongono un soggetto; la Classificazione decimale è piena di casi di questo genere: le tavole di precedenza, precedenza "prima uno o poi l'altro" ma sovente "questo invece di quell'altro".

Quindi non è che la soluzione sia identica, ma l'individuazione del soggetto deve stare a monte della destinazione, e quindi prima della connessione è da affrontare il problema dell'analisi del soggetto e della sintesi. Gli stessi suggerimenti del GRIS, certo, sono stati fatti per la soggettazione alfabetica, ma possono anche essere accettati come indicazione di faccette. D'altra parte il termine faccetta è un po' ambiguo, sospeso tra categorie sintattiche e semantiche come ha scritto Maltese. Probabilmente, delle cose che ho detto alcune persone inorridiranno, ma per noi la faccetta è un'altra cosa, si tratta di un riconoscimento di categorie.

D'altra parte la separazione tra classificazione e soggettazione alfabetica non è mai stata intesa in modo assoluto, se non altro per l'indice alfabetico degli isolati nella classificazione e per la rete dei collegamenti nella soggettazione alfabetica. Oggi poi, in particolare con le applicazioni in rete, l'avvicinamento è senz'altro ancora più forte: l'applicazione della Dewey in rete ha accanto a sé delle soluzioni verbali che permettono veramente di avvicinarla ulteriormente a questo aspetto di indicizzazione alfabetica. Giustamente per ragioni di studio le due cose possono essere anche tenute separate, ma qui vediamo che costituiscono un insieme. Certo, come ho detto le due soluzioni non possono essere sempre identiche, ma in entrambi i casi si deve partire da un riconoscimento del soggetto.

A questo punto possiamo andare a fare delle considerazioni conclusive su un argomento che forse esula un po' dal nostro, ma che sento doveroso toccare. Se noi individuiamo un soggetto storico, sociale, religioso, la sua espressione verbale di conseguenza non potrà corrispondere a un simbolo di classificazione che sta nella classe della letteratura. Ecco l'interpretazione del 4 per i saggi di letteratura, che è una forma letteraria, non un contenuto di soggetto! E prova ne abbiamo che in una scaffalatura aperta, se noi insistiamo a classificare in letteratura delle opere che valgono anche letterariamente ma che hanno un soggetto, toglieremo nella parte della classificazione un libro (un'informazione, un disco, quello che sarà: un documento) che appartiene a quel soggetto, che è stato messo da un'altra parte dove nessuno lo troverà -- a meno che lo cerchi in un catalogo per autori, conoscendo l'autore. Se un libro parla dei rapporti dei paesi islamici con la cultura occidentale e viene messo in letteratura, mancherà quell'informazione dal settore della politica o dal settore della religione, e inoltre non lo si troverà, perché un lettore non lo va a cercare in letteratura.

Questo fa parte di un altro capitolo che riguarda la preparazione professionale, che è troppo intesa secondo me allo studio degli strumenti normativi -- e qualche volta anche questi sono trascurati, in omaggio all'outsourcing. Un programma lombardo, per esempio, fatto conoscere in un grande congresso, ha detto espressamente "norme ... per i bibliotecari": "catalogazione" non c'è più, perché tanto ci sono altri che se ne interessano. Chi sono questi altri? Sono bibliotecari pure loro! Ma lasciamo stare queste anomalie: comunque ci si ferma allo studio degli strumenti normativi senza considerare il perché delle norme, questo è importante. Carpenter è noto in Italia per aver fatto un libro sugli enti collettivi, ma ha scritto parecchie cose; fu allievo di Lubetsky, morto l'anno scorso a centoquattro anni d'età: quando aveva cento anni gli hanno dedicato un congresso per festeggiarlo. Carpenter ha scritto recentemente che il suo maestro sosteneva la necessità di comprendere le ragioni delle norme, pena la banalizzazione della professione.

>> Gettandosi nella mischia / Claudio Gnoli

 


Soggettazione a faccette / Carlo Revelli = (Le dimensioni dell'informazione : giornata di studio AIB Piemonte-ISKO Italia : Torino : 12 giugno 2004 : atti / a cura di Caterina Barazia e Claudio Gnoli = (ISKO Italia)) -- <http://www.iskoi.org/doc/dimensioni1.htm> : 2004.10.15 - 2006.01.05 -