ISKO Italia. Partecipazione al GRIS2

Organizzazione semantica e recupero per soggetto nell'epoca del Web 2

Seminario GRIS con la collaborazione di ISKO Italia
Roma. Centro congressi Europa : 20 ottobre 2006

resoconto


Nell'ambito del 53esimo congresso dell'Associazione italiana biblioteche, il Gruppo di ricerca sull'indicizzazione per soggetto (GRIS) ha organizzato in collaborazione con ISKO Italia un seminario dedicato al recupero per soggetto nei cataloghi in rete delle biblioteche (opac).

Il seminario è stato introdotto da Massimo Rolle (GRIS), che ha ribadito la posizione del GRIS circa l'importanza dell'uso di vocabolari controllati come strumento essenziale per guidare gli utenti al recupero delle informazioni pertinenti alle loro ricerche. Questa idea è in controtendenza rispetto alla diffusione della ricerca nel Web tramite strumenti che utilizzano semplici parole sciolte, come i motori di ricerca o le folksonomies [che insieme ai blog, ai wiki e ad altre tecnologie concorrono a formare il cosiddetto Web 2].

Il GRIS ha voluto invitare i rappresentanti delle ditte italiane produttrici di software per opac ad un confronto su questi temi, in particolare nel momento in cui la Biblioteca nazionale centrale di Firenze (BNCF) sta mettendo a punto il Nuovo Soggettario, un vocabolario controllato che recepisce sani principi della teoria dell'indicizzazione e si propone come strumento di riferimento per il lavoro delle biblioteche italiane. Che cosa intendono fare i produttori di software per supportare il lavoro dei catalogatori e le ricerche degli utenti che dovranno utilizzare il Nuovo Soggettario?

Claudio Gnoli (ISKO Italia) ha ricordato le caratteristiche dell'indagine "Opac semantici", avviata nel 2003 dalle Università di Pavia e Venezia in collaborazione col GRIS. L'iniziativa ha messo a punto una lista di controllo per la valutazione dell'efficacia degli accessi semantici in un campione significativo di opac italiani. I risultati della prima tornata di rilevamenti sono stati già pubblicati e discussi nel 2004 in diverse presentazioni e articoli.

Da allora, anche grazie al contributo di Aida Slavic e Giulia Visintin, è stata mantenuta aggiornata l'ampia bibliografia internazionale sul tema. Tra i contributi più recenti, sono significativi quello di Wouter Schallier, pubblicato negli atti del congresso internazionale ISKO di Londra 2004,  sul lavoro per migliorare gli accessi per soggetti e per classi CDU nell'opac dell'Università di Lovanio; e quello di Ágnes Hajdu Barát, pubblicato negli atti del congresso internazionale ISKO di Vienna 2006, che indagando gli accessi semantici in alcuni importanti opac nazionali e universitari ungheresi ha constatato una gamma di situazioni simile a quella italiana. Anche Zumer, Clavel-Merrin & Landry, nell'ambito di un recentissimo rapporto IFLA sui cataloghi delle biblioteche nazionali di un insieme di paesi europei, ne hanno esaminato le funzioni di ricerca per soggetto.

Fin dall'inizio dell'indagine, il GRIS ha indicato come funzione raccomandabile degli opac la ricerca per termine e stringa, nella quale l'utente dapprima può ottenere una lista di termini controllati corrispondenti a una parola da lui immessa, quindi, scegliendo uno di questi, può passare a una lista di stringhe di soggetto che contengono quel termine, e da queste alle registrazioni bibliografiche corrispondenti. Infatti, come chiarito in altre sedi da Andrea Fabbrizzi (GRIS), un termine isolato dal contesto della sua stringa di soggetto non serve a chiarire il contenuto di un documento. L'indagine ha mostrato come purtroppo nessun opac realizzi veramente la ricerca per termine e stringa, e solo pochi vi si avvicinino offrendone una per parola e stringa, ossia in cui le voci elencate non sono termini controllati ma soltanto parole contenute nelle stringhe di soggetto, non necessariamente significative. Fabbrizzi ha evidenziato altresì come la causa del problema risieda a monte, cioè nel formato con il quale le voci di soggetto sono registrate nelle basi-dati degli opac: se a questo livello non sono contrassegnati i singoli termini, è inevitabile che questi non saranno neppure ricercabili nell'opac.

Nuovi risultati dell'indagine "Opac semantici" sono quindi stati presentati da Emanuela Casson (ISKO Italia), che nel settembre 2006 ha rilevato la situazione degli opac delle biblioteche nazionali e di quelli a copertura nazionale. I primi non erano stati coperti dall'indagine del 2003.

Non tutte le 9 biblioteche nazionali italiane hanno un opac proprio: quelle di Torino e Potenza sono ricercabili solo all'interno di un catalogo collettivo, e quella di Cosenza non sembra avere alcun opac. Le biblioteche nazionali con opac più semantici (sebbene con risultati non molto superiori alla media generale italiana) sono quelle di Napoli, Potenza e Firenze: per quest'ultima si riscontrano differenze fra l'interfaccia vecchia e quella nuova, che è leggermente meno semantica ma offre la novità del "Navigatore Dewey".

Per i cataloghi a copertura nazionale (cioè comprendenti biblioteche ubicate in più di una regione) i risultati sono simili a quelli del 2003. Novità significative sono la comparsa di Internet culturale, una nuova interfaccia dell'Indice SBN che offre accessi semantici migliori di quelle preesistenti, e il netto miglioramento ottenuto dall'opac dell'Università cattolica con il passaggio al software Millennium.

A questo punto, Anna Lucarelli (BNCF) ha illustrato lo stato di sviluppo del prototipo del Nuovo Soggettario, che sarà presto pubblicato sottoforma di CD-ROM contenente una chiave per l'accesso alla base-dati in rete. Nello spazio di lavoro riservato della BNCF sono già visibili le voci del prototipo, ciascuna corredata delle informazioni tipiche dei tesauri, ossia di collegamenti ai termini più generici, più specifici e associati, di note d'àmbito e della categoria e faccetta di appartenenza, di note sulla storia del termine nel precedente Soggettario e suoi aggiornamenti, e sulle fonti repertoriali (dizionari, enciclopedie, tesauri) utilizzate per definirlo. L'interfaccia, basata sul software AgroVoc della FAO, permette anche di visualizzare l'albero gerarchico a cui ciascun termine appartiene.

La parola è passata quindi ai rappresentanti delle aziende che hanno risposto all'invito, tra tutte quelle elencate nell'Annuario prodotti e servizi dell'AIB.

Cinzia Colacicco e Liliana Morotti (Atlantis) hanno ricordato come la catalogazione in ALEPH si appoggi sul formato UNIMARC, e renda quindi in parte possibile marcare i termini contenuti nelle stringhe di soggetto mediante i simboli per i sottocampi [Andrea Fabbrizzi ha formulato una proposta per parametrizzare ALEPH 500 in funzione del Nuovo Soggettario]. Hanno quindi discusso i risultati di un'indagine promossa da OCLC presso gli utenti delle biblioteche, che evidenzia come essi tendano sì ad attribuire valore di attendibilità alle informazioni di fonte bibliotecaria, ma preferiscano invece usare i motori di ricerca per la loro maggiore intuitività e velocità: occorrerebbe quindi che gli opac guardino agli esempi di Google e strumenti analoghi per semplificare le loro funzioni di ricerca, pur mantenendo il maggior valore del loro patrimonio informativo. Come ha poi fatto notare durante la discussione Serena Spinelli, il contesto in cui veniva condotta quest'indagine era relativo a risorse elettroniche non meglio definite, il che può in parte giustificare le risposte.

Francesca Romiti (Data Management) ha informato sull'impegno in corso per migliorare ulteriormente le funzioni semantiche degli opac Sebina [che in effetti risultano mediamente tra i migliori rilevati nell'indagine], in particolare nella nuova versione SOL: Sebina Open Library, sperimentata fra l'altro nell'opac del Polo SBN della Romagna.

Stefano Minardi (H&T) si è rammaricato che diverse biblioteche nazionali utilizzino software autoprodotti, auspicando invece che informatici e bibliotecari conservino i loro ruoli distinti, e uniscano le loro forze per produrre strumenti più efficaci. [Peraltro la maggiore semanticità è stata misurata proprio in opac autoprodotti.]

Gabriele Lunati e Simone Falteri (Ifnet) hanno presentato Lexicon, un nuovo software per la gestione di tesauri.

Claudio Kutufà (Nexus), riconoscendo la complessiva povertà degli accessi semantici negli opac, ha argomentato che questa dipende anche dalla scarsità di risorse oggi disponibili presso le biblioteche per la catalogazione semantica.

Tiziana Possemato (Prime Source) ha mostrato la semanticità di alcuni cataloghi che utilizzano il prodotto AquaBrowser Library, che consente di visualizzare, dopo la ricerca, le relazioni tra termini controllati di un tesauro come "word cloud".

La discussione che è seguita, condotta da Massimo Rolle, ha visto interventi di Serena Spinelli (Università di Bologna), Stefano Gambari (Biblioteche del comune di Roma) e Carlo Revelli.

 


Organizzazione semantica e recupero per soggetto nell'epoca del Web 2 : seminario GRIS con la collaborazione di ISKO Italia : resoconto / [Claudio Gnoli, Emanuela Casson] = (ISKO Italia. Partecipazione al GRIS2) -- <http://www.iskoi.org/doc/gris06.htm> : 2006.10.30 -