Libero o controllato? (KO in AIDAinfo)

ISKO Italia. Documenti

Come mi vuoi, libero o controllato?

da AIDA informazioni, 25: 2007, n. 1-2, p. 123-126

di Claudio Gnoli

Negli ultimi due anni, numerosi sono stati gli eventi pubblici nei cui titoli compaiono termini nuovi quali "collaborative indexing", "social tagging", "folksonomies" e simili. Dapprima limitati a circoli di appassionati sviluppatori di siti web e architetti dell'informazione, questi temi sono poi gradualmente stati recepiti anche in contesti più tradizionali: all'importante congresso annuale dell'American Society for Information Science and Technology, svoltosi a Austin lo scorso novembre, il workshop dello Special interest group on Classification Research aveva per titolo "Social classification: panacea or pandora?"; questa espressione è una buona sintesi delle speranze e insieme dei dubbi che i nuovi software per l'indicizzazione cooperativa stanno suscitando.

L'idea di base è che il contenuto di un insieme di risorse informative, disponibili sul Web, venga indicizzato mediante le etichette (tag) che i loro stessi fruitori liberamente scelgono di assegnarvi. Un po' come se in biblioteca, restituendo un libro preso a prestito, il lettore consegnasse anche un'intestazione di soggetto che secondo lui ne rappresenta il contenuto, e questa venisse allora inserita nel catalogo. Si tratta dunque di un sistema di organizzazione della conoscenza, anche se fino ad ora decisamente insolito. La sua diffusione è resa possibile dalle recenti tecnologie che facilitano agli utenti la scrittura direttamente sul Web, senza passare attraverso gli ostici comandi FTP usualmente necessari per aggiornare un file in rete: la stessa idea è alla base dei blog, i diari online ai quali i lettori possono aggiungere i loro commenti, e dei wiki, i sistemi per la scrittura collettiva che hanno permesso la creazione di quella nuova meraviglia della Rete che è la Wikipedia. Nel nostro caso, il lettore che accede a un documento sul Web, per esempio un'immagine di piazza del Campo a Siena, oltre a visionarlo può decidere di contrassegnarlo con delle parole che la sua mente associa a quel contenuto, come Siena o piazza, ma anche palio o luoghi incantevoli.

Come spesso succede, all'inizio queste diavolerie sono state usate più che altro dai loro stessi creatori: molti dei siti indicizzati in modo collaborativo trattano proprio di architettura dell'informazione, così come molti nuovi sistemi di classificazione vengono sperimentati su bibliografie di biblioteconomia, che altre comunità di lettori troverebbero noiosissime... Questo tipo di strumento, infatti, presuppone che il lettore abbia tempo e voglia di cimentarsi anche con l'indicizzazione, e ovviamente i più motivati saranno gli stessi appassionati della sperimentazione del sistema.

Oggi però non mancano esempi notevoli di applicazione del social tagging: uno di essi è Flickr, un sito molto noto in tutto il mondo sul quale chiunque può liberamente depositare le proprie fotografie e contrassegnarle con qualche tag: dopodiché, oltre a visualizzarle, i visitatori possono a loro volta contribuire a indicizzarle. Qualche decina di foto scattate durante il secondo incontro ISKO Italia all'Università di Milano Bicocca (un altro caso di autoreferenzialità...) si possono trovare su Flickr, per iniziativa di Bonaria Biancu e Susanna Dal Porto, attraverso i tag isko, iskoi, iskoi06, iskoi2 e bicocca. Naturalmente, il tag bicocca potrebbe portare anche ad altre immagini che abbiano a che fare in qualche modo con l'Università di Milano Bicocca, e magari anche ad immagini di una catapecchia rimasta in piedi sull'Appennino marchigiano.

Questi esempi cominciano a suggerirci quali siano i pro e i contro del social tagging. Tra i primi c'è il fatto che chiunque possa contribuire all'indicizzazione, cosicché i lettori si sentano coinvolti nel mantenimento delle risorse, a cui possono partecipare con una tecnologia "democratica". Emanuele Quintarelli, uno dei primissimi in Italia ad accorgersi del potenziale innovativo di questi sistemi, intitola perciò "Folksonomies: power to the people" un suo articolo introduttivo che ha riscosso parecchio successo. Alla stessa idea fa riferimento il neologismo folksonomy, contrazione di folk e taxonomy, ossia "tassonomia popolare". Questo sviluppo dal basso del sistema piace anche a coloro che contestano i sistemi standard per l'organizzazione della conoscenza (come la Classificazione decimale di Dewey o i Library of Congress subject headings) in quanto veicoli di imposizione delle strutture del pensiero dominanti — inevitabilmente quelle dell'Occidente contemporaneo, filoamericano, maschilista e così via (si vedano il libro di Hope Olson "The power to name", Kluwer 2002, e il lavoro di Francesca Severino, insignito dell'EADI prize, sulla definizione del termine development nei tesauri internazionali).

Anche gli svantaggi, però, sono chiari. I tag associati a ciascun documento si accumulano formando delle "nubi" che non hanno alcuna sistematicità. È vero che in molti casi il loro insieme può complessivamente dare un'idea del contenuto che tutti insieme descrivono. Ma è vero anche che altri documenti analoghi potrebbero essere stati etichettati in tutt'altro modo. Questo significa che cercando il tag bicocca otterremo sì molti documenti che in qualche modo hanno a che fare con la parola bicocca, ma ce ne sfuggiranno anche molti altri indicizzati con etichette diverse, quali università o unimib. In altre parole, la nube di tag non è un vocabolario controllato.

La funzione dei vocabolari controllati, come i soggettari e i tesauri, è proprio raccogliere i concetti sotto intestazioni standard, alle quali i termini non preferiti rinviino, permettendo così di effettuare ricerche precise ed esaustive. Gli indicizzatori professionisti che usano sistemi standard rischieranno forse qualche accusa di bigottismo reazionario, ma almeno producono un'informazione attendibile e completa. A parere di alcuni il controllo del vocabolario rimane uno strumento indispensabile, ed è forse per questo che il coordinatore del Gruppo di ricerca sull'indicizzazione per soggetto dell'AIB non riesce neppure ad articolare la parola folksonomy, con il suo arduo aggregato di consonanti, tanto ne sente geneticamente estraneo il significato!

Il problema del controllo del vocabolario, d'altronde, nasce ogni volta che si prova a delegare l'indicizzazione agli autori stessi, dai quali non si può pretendere né la competenza né il tempo per applicare con cura dei sistemi di organizzazione raffinati. È quello che è già successo negli anni scorsi con l'introduzione dei metadati per descrivere il contenuto delle pagine web, e poi dell'autoarchiviazione di articoli negli archivi aperti, al momento della quale viene richiesto all'autore di classificare sommariamente il proprio scritto. Ed è quello che succede già da parecchi decenni con le parole-chiave assegnate dagli autori. Non c'è da stupirsi che, in tutti questi casi, gli indici risultanti siano poco strutturati e coerenti; sono comunque meglio del niente che è la reale alternativa, quando abbiamo a che fare con basi-dati di decine di migliaia di documenti in continuo accrescimento: chi infatti potrebbe pagare degli indicizzatori professionisti capaci di applicare ad esse un vocabolario controllato? Se rinunciate al fai-da-te e chiamate uno specialista, il lavoro di cui avete bisogno riuscirà senz'altro meglio, ma in compenso dovrete pagarlo.

Nel caso delle tassonomie popolari, l'indicizzazione è affidata, oltre che agli autori, anche ai lettori stessi, ed è questa la loro novità. Tradizionalmente, invece, l'indicizzatore è un terzo, un intermediario fra autore e lettore; e come ha osservato Riccardo Ridi (Metadata e metatag: l'indicizzatore a metà strada fra l'autore e il lettore, congresso The digital library, Bologna 1999), la sua terzietà offre sia il valore aggiunto della competenza che quello della neutralità, almeno per quanto riguarda le motivazioni che lo muovono, allo stesso modo di un giudice che media tra accusa e difesa. Quando invece è l'autore a inserire i metadati, egli potrebbe alterarli a proprio vantaggio, come succede nelle descrizioni di quarta di copertina che esagerano l'attualità e la completezza del tema trattato nel libro in vendita, o nei siti commerciali delle aziende che millantano di essere le uniche nel territorio X ad offrire Y. La questione di chi sia a compiere l'indicizzazione assume allora anche un aspetto deontologico. Dietro i sedicenti democratici non potrebbero nascondersi dei populisti? Il dibattito infuria, raggiungendo anche il gruppo di discussione dei bibliotecari italiani ("Google e folksonomy", in AIB-CUR, settembre 2006).

Nel frattempo, anche gli stessi sostenitori dell'indicizzazione cooperativa si rendono conto del problema di cui soffrono i propri strumenti: dalle loro discussioni infatti emerge regolarmente la questione della qualità degli indici, e in diversi suggeriscono di contemperare l'alimentazione dal basso con qualche forma minimale di coordinamento e gestione dei linguaggi. Così la Wikipedia si è dotata di una redazione centrale con maggiori poteri, e il progetto Facetag di Emanuele Quintarelli, Andrea Resmini e Luca Rosati [facetag.org] propone di convogliare i tag entro faccette che ne strutturino meglio la semantica...

Come mi vuoi, libero o controllato? = ISKO Italia. Documenti. Organizzazione della conoscenza. 3 — <http://www.iskoi.org/doc/rubrica3.htm> : 2016.04.06 -