ISKO Italia. Documenti

Le dimensioni dell'informazione
Giornata di studio AIB Piemonte-ISKO Italia
Torino. Biblioteca civica Geisser : 12 giugno 2004

Le faccette in architettura dell'informazione

Luca Rosati

Buongiorno a tutti, in questo mio intervento vorrei mostrare soprattutto delle applicazioni della classificazione a faccette al Web, e al trattamento delle informazioni negli ambienti digitali in genere (anche aziendali ad esempio).

Il termine faccetta

Devo dire che il termine faccetta non è ambiguo solo in italiano ma lo è anche in inglese, perché viene ormai adoperato per riferirsi a un approccio che pur ispirandosi alla logica delle faccette si distanzia tuttavia (anche vistosamente) dalla teoria originaria -- quella codificata da Ranganathan prima e dal CRG poi. E se da una parte questa libertà può essere anche giusta (nel senso di un giusto adattamento al contesto digitale), dall'altra è anche opportuno per chi si occupa di Web confrontarsi maggiormente con coloro che da più tempo si interessano di classificazione del sapere.

In enoteca: ovvero, per uno scenario del problema

Ora vorrei entrare nel vivo dell'argomento partendo da un problema, un problema oggettivo di tutti i giorni che, però, in un contesto digitale si intensifica. Ho inserito nelle diapositive questa citazione di Borges, un autore che mi piace molto e che trovo particolarmente attuale, visto che oggi viviamo un drammatico sovraffollamento informativo. Nel racconto "La biblioteca di Babele", tratto dalla raccolta "Finzioni", questo aspetto è espresso molto bene attraverso l'allegoria della biblioteca-labirinto. Lo scenario che mi sono divertito a rappresentare nella slide che vedete riflette questo genere di problema, un problema di trovabilità. Si tratta di una situazione di cui sono stato realmente spettatore in un'enoteca di Perugia (sono appassionato di vini), vicino a casa mia.

in enoteca

Pensiamo allora a una elegante enoteca, in periodo natalizio, in cui tre diversi clienti si recano per acquisti. Tutti, evidentemente, cercano del vino; tutti, probabilmente, hanno scelto questo negozio non a caso, sapendo che possiede etichette selezionate, da veri enofili. Ognuno di questi clienti ha un'esigenza diversa, che determina un diverso modo di ricerca del vino. E poiché negli scaffali dell'enoteca i vini sono collocati per regione di appartenenza, ciascuno di questi clienti "particolari" è costretto a rivolgersi al commesso di turno. Questo fatto è sintomatico: una classificazione monodimensionale (cioè basata su un solo criterio di classificazione -- in questo caso, quello dell'appartenenza geografica) si rivela quantomeno limitata nel caso di utenti che manifestino esigenze particolari, e che non conoscano già (almeno in parte) la "materia" (nel nostro caso, il vino).

E allora, ecco che il primo cliente (a sinistra, nella figura) vorrebbe un vino che in qualche modo rispecchi le caratteristiche della propria fidanzata. Il secondo (al centro) ha già le idee più chiare: ha sentito parlare molto bene della cantina di Donnafugata e vuole assolutamente assaggiare un vino di questa cantina, non importa molto quale. Il terzo cliente cerca invece un vino che si abbini bene con il filetto al pepe verde.

Immaginiamo ora gli stessi personaggi alle prese con un catalogo elettronico, strutturato alla stessa maniera (per appartenenza geografica dei vini): senza inservienti a cui chiedere, come se la caverebbero? Come ovviare, allora, a questo tipo di problemi? Ecco: la classificazione a faccette, o le forme di organizazzione che ad essa si ispirano, possono aiutarci a risolvere proprio questo genere di difficoltà.

Ognuno di noi cerca in modo diverso in base alle proprie esigenze: l'obiettivo che guida la nostra ricerca influisce moltissimo sul modo in cui cerchiamo. Perfino la stessa persona, a seconda degli obiettivi e dei contesti, cerca -- in tempi diversi -- in modo diverso. E quindi questo complica notevolmente il problema: che per essere fronteggiato esige sistemi adattivi, capaci cioè di adattarsi a tale diversità di esigenze e profili di pubblico. Per far questo è necessario garantire un accesso all'informazione secondo più sentieri: ecco quindi affacciarsi il concetto di multidimensionalità. La classificazione a faccette incarna perfettamente questa logica multidimensionale -- non è un caso che Eugenio Gatto propone l'etichetta di classificazione multidimensionale come alternativa a classificazione a faccette (traduzione letterale dell'inglese faceted classification).

Applicazioni (spurie?) della classificazione a faccette al web

InformeDesign <http://www.informedesign.umn.edu> è un catalogo di risorse bibliografiche sul tema dell'architettura e del design, curato dall'Università del Minnesota.

una schermata di InformeDesign

Per la catalogazione, il sito sfrutta un sistema che si ispira nella logica alla classificazione a faccette (pur non applicandola nella sua forma ortodossa). Una medesima fonte bibliografica, infatti, è associata a più categorie ed è perciò reperibile (trovabile) mediante diversi percorsi, complementari fra loro. In questo caso ne abbiamo tre: Spaces, Issues, Occupants, che fungono da principali cancelli di ingresso alle risorse. Li vediamo subito evidenziati in homepage, come tasti di colore giallo, in alto a destra. Ciascuna di questa sorta di macrocategorie si scinde poi al suo interno in faccette e fuochi. Lo schema completo di classificazione è visibile selezionando la voce All categories dal menu principale (a sinistra). Quando si seleziona un item (proviamo ad esempio a cercare "Le Corbusier"), vengono indicati (come Keywords) tutte i fuochi a cui la risorsa è associata. Il sito sfrutta anche un thesaurus, che permette anche una relazione fra questi concetti, la gestione delle varianti sinonimiche e così via.

Un altro esempio che ho portato è il progetto Flamenco <http://bailando.sims.berkeley.edu/flamenco.html>, curato dall'Università di Berkeley: un motore di ricerca e una directory organizzati col criterio delle faccette. Flamenco è un acronimo che sta per "FLexible information Access using MEtadata in Novel COmbinations".

una schermata di Flamenco

Il problema dei sistemi di ricerca cosiddetti full-text consiste nel fatto che essi si limitano a cercare l'occorrenza di una parola o di una stringa all'interno di un insieme di documenti. Così facendo, questi motori vanno incontro a due ordini principali di problemi:

  1. estraggono documenti o risorse che poco hanno a che vedere con quello che stiamo cercando; queste risorse vengono però segnalate semplicemente perché presentano una o più occorrenze della stringa cercata;
  2. all'opposto, il motore non trova documenti pertinenti all'argomento di interesse, perché nel documento la stringa o parola cercata non occorre (ma compaiono sue varianti o sinonimi).

Per ovviare a questo tipo di problema è necessario adottare dei sistemi semantici che fungano da indirizzatori per i motori di ricerca: servono quelle che si chiamano ontologie, cioè dei sistemi che mettano in relazione fra loro i concetti. E i sistemi a faccette (o quelli che vi si ispirano nella logica) sono particolarmente indicati in tal senso, risultando comodi non solo per la classificazione, ma anche per la possibilità che offrono di associare fra loro concetti diversi. È la strada seguita dal progetto Flamenco. Nel sito relativo ci sono due diverse demo che mostrano il funzionamento di questo particolare motore:

Accedendo alla demo, si nota subito la presenza di una doppia via:

Esaminando meglio la logica di questa directory, si intuisce tuttavia una differenza sostanziale rispetto a quelle di Yahoo o Google cui più siamo abituati: si intuisce infatti che ciascun ramo di essa rappresenta un percorso di accesso alternativo alla stessa collezione di items. Ovvero più facce (o faccette) della medesima collezione. In questo caso, quindi, ciascun ramo della directory (rappresentato visivamente con un diverso colore) rappresenta non tanto un contenitore ma un descrittore semantico (una proprietà o aspetto). Ogni ramo quindi costituisce una faccetta dell'intera collezione.

La selezione progressiva che è possibile effettuare sfogliando la directory corrisponde, a ben vedere, a una sorta di filtraggio: una volta operata una prima selezione (attraverso la scelta di una delle voci della directory) è sempre possibile raffinare ulteriormente la ricerca (all'interno del sottoinsieme estratto) utilizzando le altre faccette che vengono sempre ripresentate assieme ai risultati. In termini bibliotecari, ciò corrisponde a un processo di post-coordinazione (possibilità di associare fra loro i soggetti in una specifica combinazione nella fase di interrogazione, vale a dire a posteriori).

Anche il motore di ricerca associato alla directory lavora in modo simile (ecco in cosa consiste la sua novità): quando si opera una ricerca diretta, esso non esegue una semplice ricerca full-text, ma si appoggia a questa rete concettuale soggiacente (vale a dire il sistema di classificazione a faccette) per estrarre i risultati.

Anche le banche dati di immagini della Fondazione Getty utilizzano un sistema simile a questo (ispirato quindi, nella sua logica, alla classificazione a faccette), in combinazione con un vocabolario controllato.

una schermata di Creative Getty images

Si veda ad es. il sito <http://creative.gettyimages.com/source/home/home.aspx>: quando si cerca un lemma che è ambiguo, il sistema chiede all'utente a quale accezione del termine è interessato (provate ad es. a cercare "Lego"); inoltre, una volta raggiunta la scheda di dettaglio di una immagine, il sistema presenta accanto ad essa tutti i metadati (cliccabili) associati a quell'immagine, distinti per "faccetta" di appartenenza (l'uso delle virgolette è d'obbligo, visto che non si tratta di faccette nel senso più ortodosso, pure se la loro logica si ispira in buona misura a quella della classificazione a faccette elaborata in ambito bibliotecario). In questo modo, è possibile trovare altre immagini, correlate a quella corrente, in base ai vari parametri di classificazione.

Questo sistema di metadati è in effetti il risultato di un progetto di ricerca patrocinato dalla fondazione Getty con l'obiettivo di individuare un sistema di classificazione specifico per le opere d'arte, e ispirato nella sua impostazione di fondo alla classificazione a faccette <http://www.getty.edu/research/conducting_research/standards>.

Circolarità dell'informazione

Dal mio punto di vista, questo meccanismo di correlazione (che le faccette permettono di esaltare al massimo) è molto importante: un aspetto cruciale a cui l'architettura dell'informazione per il Web dovrebbe dare molta importanza è infatti quello di fornire al visitatore (una volta che egli abbia raggiunto un certo item) ulteriori spunti di navigazione o approfondimento attraverso un meccanismo di collegamenti incrociati: è ciò che io chiamo circolarità dell'informazione. Non sempre chi sta facendo una ricerca ha semplicemente l'obiettivo di trovare un oggetto specifico (known-item seeking); molto spesso ha invece l'esigenza di acquisire maggiori informazioni o risorse possibili su un dato argomento (exhaustive seeking), o al contrario non sa bene cosa sta cercando (exploratory seeking) [Rosenfeld - Morville, Information architecture for the World wide web, 2nd ed.].

Applicazioni (spurie?) della classificazione a faccette al software

iTunes <http://www.apple.com/itunes/> è il software sviluppato da Apple per scaricare, archiviare e ascoltare musica. L'interfaccia presenta in alto, bene in evidenza, tre finestre: genere, artista, album, che fungono da cancelli di ingresso principali.

una schermata di iTunes

Anche iTunes sfrutta un sistema di metadati che, pur non potendosi definire a faccette in senso stretto, della classificazione a faccette condivide tuttavia la logica, permettendo di ritrovare uno stesso elemento mediante più parametri, variamente combinabili fra loro. Così, una volta operata una prima selezione (scegliendo ad es. artista > Keith Jarrett), anche il contenuto delle altre finestre (genere, album) si aggiorna automaticamente mostrando solo i generi e gli album correlati al sottoinsieme selezionato (l'artista Keith Jarrett). Così con due, tre passaggi al massimo, anche all'interno di un'ampia gamma di brani, è possibile selezionare agevolmente quello di interesse. Ritroviamo quindi anche qui quel meccanismo del filtraggio visto a proposito del progetto Flamenco.

Nella colonna di sinistra dell'interfaccia è possibile creare raggruppamenti personalizzati di brani, definendo opportune combinazioni di metadati (es. brani di Keith Jarrett in trio). Fisicamente, tutti i file musicali risiedono in un'unica libreria, senza alcuna classificazione di sorta, ma attraverso il sistema di metadati ogni file musicale può essere associato e visualizzato sotto diverse categorie contemporaneamente: io me ne sono costruite alcune riprendendo la fisiologia medievale degli umori; ma potrei anche scegliere di visualizzare i miei brani in base al contesto d'uso (musica per lavorare, la musica per studiare etc.), creando - alla fine - un insieme potenzialmente infinito di categorizzazioni. Apple ha brevettato questa interfaccia, e la stessa logica è stata applicata al nuovo sistema operativo Mac OS X Tiger. Anche il nuovo Windows Longhorn <http://www.winsupersite.com/longhorn> sarà basato su un file system di nuova concezione, per cui sarà possibile ricercare ogni file attraverso una vasta gamma di metadati, e creare a piacimento cartelle virtuali che -- come nel caso di iTunes -- incarnino di volta in volta una particolare combinazione di metadati.

Concludo con un'autocitazione: Trovabile <http://trovabile.org>. Un raccoglitore di approfondimenti sull'architettura dell'informazione a cui ho provato ad applicare la classificazione a faccette.

Si tratta di una realizzazione piuttosto spuria: le faccette utilizzate non si rifanno in modo rigoroso allo schema generale di Ranganathan o a quello del Classification Research Group; né adottano un ordine di citazione standard (come la teoria vorrebbe). Claudio Gnoli (che mi ha fornito diverse delucidazioni sulle questioni più tecniche) mi ha fatto via via notare alcuni errori, che ho cercato di correggere. Tuttavia, procedendo con l'inserimento e la classificazione di nuovi articoli, io stesso mi sono reso conto di alcune incoerenze nell'attuale sistema di classificazione, che ho intenzione infatti di rivedere.

Trovabile presenta una combinazione di struttura gerarchica e struttura a faccette. Il menu principale adotta infatti una tradizionale ripartizione di tipo gerarchico, con la possibilità di scelta fra tre macroaree (Articoli, Euristiche per la AI, Mailing list). La struttura a faccette compare una volta selezionata la categoria Articoli, colme navigazione di secondo livello di questa macroarea.

Verso un nuovo concetto di navigazione?

La contaminazione fra scienze bibliotecarie e scienze dell'informazione sta mettendo in crisi anche categorie "classiche" dell'usabilità o dell'architettura dell'informazione, come i concetti di orientamento e di posizione dell'utente all'interno di un sito. L'abbandono di una logica gerarchica a favore di una multidimensionale come quella a faccette, ci pone di fronte a un nuovo concetto di spazio. Mi spiego meglio. Spesso nei siti si adotta il cosiddetto "tracciamento a briciole di pane" per rappresentare il percorso che l'utente ha compiuto all'interno del sito: ad es. home > sezione 1 > sottosezione 2 etc.

È stata per prima Sofia Postai a sottolineare che le briciole di pane mal si adattano a esprimere un sistema a faccette. In un sistema a faccette, infatti, ogni item di una collezione è associato contemporaneamente a più categorie, le quali giacciono però tutte sul medesimo livello: come rappresentare allora un contesto simile? Per Trovabile, l'idea è stata di rappresentare la "collocazione" di ciascun articolo evidenziando tutti i parametri (i.e. fuochi) a cui l'item è associato, in questo modo:

Argomenti:

Inoltre, Trovabile sfrutta appieno la logica multidimensionale propria delle faccette per proporre, una volta selezionato un item, un insieme di articoli o concetti correlati a quello corrente, secondo quel principio di circolarità (cui accennavo prima) che consente, trovato un elemento, di reperirne altri semanticamente correlati.

La classificazione a faccette fra accessibilità e architettura dell'informazione

Abuso ancora soltanto di cinque minuti per sottolineare alcuni nessi che mi stanno particolarmente a cuore: come quello fra accessibilità e architettura dell'informazione. Sono qui Maurizio Rosati e Carlo Fortunato di CSI Piemonte, con cui ho avuto la soddisfazione di lavorare sulle problematiche inerenti la classificazione dei servizi erogati dalla pubblica amministrazione. Oggi si parla molto di accessibilità, ma questa non può essere disgiunta dalla architettura dell'informazione. Se noi parliamo di mero accesso, come dice Boscarol, vale a dire la possibilità di accedere fisicamente a una risorsa, allora può forse bastare osservare un insieme di norme, quelle che il W3C ci offre, e risolviamo il problema. Ma a che vale se un utente accede a un servizio ma poi non naviga o non trova quello che cerca, perché l'organizzazione del sito è carente? Quindi, anche l'accessibilità (intesa nel suo senso più pieno) non è disgiunta dalle tematiche che abbiamo trattato finora. E qui mi ricollego al criterio degli "eventi della vita" proposto dal governo italiano per la classificazione dei servizi al cittadino <http://www.italia.gov.it/servlet/[...]>.

Qual è il problema di questo schema? La sua monodimensionalità (uso di un unico criterio di classificazione per tutti i servizi). Così, se esso funziona bene per alcuni servizi, non va ugualmente bene per altri. A mio parere, è in casi come questo che la classificazione a faccette dimostra pienamente tutto il suo potenziale. Un approccio più corretto potrebbe essere proprio quello di un accesso sfaccettato ai servizi, laddove il criterio per eventi della vita rappresenti una delle facce possibili del sistema. Verso questo approccio si muove il sito inglese DirectGov <http://www.direct.gov.uk/Homepage/fs/en>: non abbiamo ancora uno schema a faccette vero e proprio, ma i diversi riquadri che appaiono in homepage suggeriscono comunque una diversa logica di accesso ai servizi -- senz'altro più funzionale a quella monodimensionale degli eventi della vita.

Pierfranco Minsenti

Grazie mille a Luca Rosati per averci fatto vedere degli esempi che trovo molto interessanti e convincenti, anche se sicuramente ci sono molte cose di cui discutere, qualcuno può sembrare fatto meglio... E soprattutto per aver posto l'accento sulla accessibilità, sulla usabilità, che è un punto di vista che nei trattati che leggiamo noi di classificazione, struttura a faccette, per adesso non è mai stato preso in considerazione, perché il tema dell'accessibilità, dell'usabilità, è stato sviluppato adesso, per le risorse digitali, per il Web, forse però è proprio da qui che si potrebbe ripartire per considerare anche il problema della classificazione a faccette e la sua utilizzazione negli opac bibliotecari, che è poi l'argomento che ci interessa di più.

>> A righe o a quadretti?... / Eugenio Gatto

 


Le faccette in architettura dell'informazione / Luca Rosati = (Le dimensioni dell'informazione : giornata di studio AIB Piemonte-ISKO Italia : Torino : 12 giugno 2004 : atti / a cura di Caterina Barazia e Claudio Gnoli = (ISKO Italia. Documenti)) -- <http://www.iskoi.org/doc/dimensioni3.htm> : 2005.06.07 - 2006.01.06 -