BID: textos universitaris de Biblioteconomia i Documentació

Número 3, desembre 1999


Disseny i creació de bases de dades bibliogràfiques amb CDS/ISIS: l'experiència de SABA-DOC
Ernest Abadal Falgueras
Coordinador del projecte
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
abadal@fbd.ub.es

Maribel Cuadrado Benítez
Coordinació informàtica
Servei de Documentació d'Història Local de Catalunya
Universitat Autònoma de Barcelona
maribel.cuadrado@uab.es

Jesús Gascón García
Coordinació tècnica
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
gascon@fbd.ub.es

Ester Omella Claparols
Col·laboradora
Centre d'Estudis i Recursos Culturals
Diputació de Barcelona
omellace@diba.es


Resum

Es descriu el procés de disseny i creació de bases de dades bibliogràfiques amb el programa CDS/ISIS. Es tracta de la base de dades SABA-DOC, principal producte del projecte Centres de Documentació i Biblioteques de Sabadell en Xarxa (CDSX, <http://www.ajsabadell.es/cdsx>). La base de dades conté referències bibliogràfiques dels fons documentals de diverses entitats de Sabadell i els registres referits a Sabadell provinents de la base de dades del Servei d'Història Local de Catalunya, de la UAB. Es comenten aspectes de l'estructura de la base de dades, del seu manteniment i de la interfície de consulta des del web. S'hi inclou també una primera avaluació dels resultats obtinguts fins ara.


1  Introducció

Aquest text explica una experiència concreta de creació d'una base de dades bibliogràfica amb el programa CDS/ISIS. Per tal de contextualitzar-lo, descriurem breument el projecte del qual forma part i també farem referència al programa informàtic que s'ha utilitzat.

Centres de Documentació i Biblioteques de Sabadell en Xarxa (CDSX)1 és un projecte impulsat per l'Ajuntament de Sabadell, amb la cooperació de la Diputació de Barcelona. El seu objectiu principal és controlar el màxim d'informació bibliogràfica disponible a les biblioteques i centres de documentació d'entitats de Sabadell, integrant-la en una base de dades única i posant-la a l'abast del públic. Un cop s'hagin organitzat i informatitzat els fons d'aquestes entitats, tots els ciutadans podran conèixer-los i accedir-hi més fàcilment. El model d'organització proposat per a aquests centres els incorpora, d'alguna manera, al sistema de biblioteques del municipi.

El principal producte resultant del projecte és, a hores d'ara, una base de dades bibliogràfica, SABA-DOC, on hi ha catalogats aquests fons documentals. El manteniment de la base de dades va a càrrec de cadascuna de les entitats adscrites al projecte. La consulta de la base de dades es pot fer localment, des de la seu de cada entitat i des de la biblioteca pública, o en línia, mitjançant el web, des de qualsevol altre lloc.

El programa que s'utilitza per a la creació i explotació de la base de dades és el CDS/ISIS, tal com es va acordar després de valorar les opcions que es presentaven en l'estudi preliminar que es va elaborar per avaluar la viabilitat del projecte.2 Entre els seus trets es va tenir en compte que s'ajusta a les especificacions tècniques del projecte i que necessita uns requeriments informàtics mínims.

CDS/ISIS és un sistema de gestió documental desenvolupat per la Unesco l'any 1985 en el marc del Programa General d'Informació (PGI) que s'actualitza periòdicament des d'aleshores. Té versions MS-DOS (versió 3.0 de juny 1993), UNIX i Windows (versió 1.3 de febrer de 1999), totes mantingudes per la Unesco. Hi ha també molts programes complementaris, la majoria d'ús gratuït, que l'enriqueixen. La manca d'assistència tècnica per part del proveïdor se supleix amb l'existència de grups d'usuaris. Així, a Catalunya es va fundar el 1992 el Gumic (Grup d'Usuaris de Microisis de Catalunya), amb l'objectiu de potenciar l'intercanvi de coneixements i experiències amb el programa. D'altra banda, hi ha molts webs a Internet que ofereixen informació sobre el programa3 i hi ha una llista de distribució molt activa i útil que va ser creada el 1993 (URL <http://www.bib.wau.nl/isis/isislist.html>). S'utilitza molt a Llatinoamèrica i a diverses regions d'Europa (per exemple, a la regió italiana de la Toscana). Té més de 20.000 usuaris registrats arreu del món.4


2  La base de dades SABA-DOC

2.1 Descripció general

SABA-DOC és una base de dades que agrupa (com si fos una mena de catàleg col·lectiu) totes les bases de dades dels centres de documentació que formen part del projecte CDSX. És de tipus bibliogràfic i descriu els fons documentals d'aquests centres, que eren, al maig de 1999, els següents: l'Acadèmia Catòlica, l'ADENC (Associació per a la Defensa dels Espais Naturals de Catalunya), el Conservatori Municipal de Música, la Lliga pels Drets dels Pobles, i la Unió Excursionista de Sabadell. També conté els registres referits a Sabadell que formen part de la base de dades del Servei d'Història Local de la Universitat Autònoma de Barcelona (Fons d'Història Local).5 El maig de 1999 la base de dades comptava amb 13.380 registres.

La base de dades disposa de diversos models de registre per tal d'acollir els diferents tipus de documents que hi pugui haver en els centres: monografies, publicacions en sèrie, parts de monografies, parts de publicacions en sèrie, documents d'arxiu. La seva estructura disposa de quatre tipus de camps: camps de control, de localització, descriptius i de contingut.

SABA-DOC té un caràcter multidisciplinari. Les principals àrees temàtiques que s'hi tracten són: ciència política i relacions internacionals, ecologia i medi ambient, excursionisme i muntanyisme, història local, música i religió cristiana (corresponents als àmbits d'especialització de les diferents entitats que formen el consorci). A mesura que s'hi vagin incorporant noves entitats s'anirà ampliant l'abast temàtic de la base de dades.

Tot i que es tracta d'entitats de Sabadell, l'àmbit geogràfic dels documents no se centra únicament en el municipi sinó que s'hi poden trobar documents que fan referència a altres àrees geogràfiques.6

La llengua de la base de dades és el català: és la llengua que s'utilitza en els camps temàtics (indexació, classificació, resum) i de control. Els camps descriptius, en canvi, es formalitzen directament amb les informacions que consten al document (que poden estar escrites en diversos idiomes).

El perfil de l'usuari a qui s'adreça aquesta iniciativa es pot caracteritzar de la manera següent:

Cal, per tant, que les tasques de promoció tinguin una incidència especial en aquests sectors.

Els serveis i productes bàsics de la base de dades són:

Finalment, cal tenir present que cada entitat ha de transferir els seus registres per tal que puguin ser carregats a la base de dades central (SABA-DOC). Aquí és on apareixen els problemes típics d'un catàleg col·lectiu sense un manteniment rigorós: la manca d'homogeneïtat en els registres provinents de centres diversos i analitzats amb criteris no sempre coincidents. Tot i que es disposa d'un manual de procediment7 per intentar minimitzar les divergències, ja es va descartar, d'entrada, arribar a l'homogeneïtzació plena dels encapçalaments de matèria o descriptors.8


2.2 Estructura (diccionari de dades)

La proposta presentada ha volgut facilitar i simplificar al màxim l'entrada de registres a la base de dades, sense que això impliqui, però, una disminució de qualitat de la base de dades ni de les possibilitats de recuperació de la informació. Això explica el següent:

No obstant això, l'estructura de la base de dades s'ha dissenyat tenint en compte la del format CATMARC —pel que fa a l'equivalència d'etiquetes i subcamps—, amb l'objectiu de garantir la flexibilitat en l'intercanvi de dades amb altres centres i sistemes documentals.9

D'altra banda, la problemàtica i les necessitats de cada centre participant han suposat la creació i la incorporació a la base de dades de camps específics no previstos inicialment, que donin solució a les seves demandes específiques (per exemple, el camp «Nota d'escala» per als documents cartogràfics de la Unió Excursionista).

A la taula 1 es detalla el que s'anomena diccionari de dades, és a dir, la informació sobre els camps i les especificacions dels camps que s'han previst, i s'ofereix la següent informació de cada camp:

Taula 1. Estructura de la base de dades

Etiqueta Nom del camp Subcamps Indexació (tècniques i forma)

1

Nivell d'anàlisi

 

  • Sencer

2

Data d'entrada

 

 

3

Analista

 

  • Sencer

4

Observacions

 

 

5

Ubicació

  • Biblioteca
  • Signatura
  • Registre
  • Observacions
  • Subcamps:
    Biblioteca
  • Amb literal (TO=)
    Signatura/Topogràfic

6

Control de duplicats

 

 

7

MFN

 

 

8

Designació del material

 

  • Sencer

13

Font registre

 

  • Sencer

10

Ref. parts monografies

  • Autor
  • Títol
  • Lloc publicació
  • Editorial
  • Any publicació
  • Pàgines
  • Subcamp:
    Any de publicació

11

Ref. articles de revista

  • Títol revista
  • Volum i número
  • Dia/mes
  • Any de publicació
  • Pàgines
  • Subcamps:
    Títol revista
    Any de publicació
  • Amb literal (PP=)
    Títol revista

21

ISBN

 

 

22

ISSN

 

 

99

Encapçalament

 

 

100

Autors personals

  • Nom
  • Cognoms
  • Responsabilitat
  • Nom pseudònim
  • Cognom pseudònim
  • Subcamps:

  • Cognoms, Nom (responsabilitat)
    Cognoms pseudònim, Nom
  • Per paraules

110

Autors corporatius

  • Àrea geogràfica
  • Entitat
  • Subentitat
  • Subcamps:
    Àrea geogràfica. Entitat. Subentitat
  • Per paraules

111

Congrés/Jornada

  • Nom
  • Número
  • Any
  • Lloc
  • Subcamp:

  • Nom congrés o jornada
  • Per paraules

112

Productor

  • Àrea geogràfica
  • Entitat
  • Subcamps:
    Àrea geogràfica. Entitat
  • Per paraules

700

Altres responsabilitats

  • Nom
  • Cognoms
  • Responsabilitat
  • Subcamps:
    Cognoms, Nom (responsabilitat)
  • Per paraules


240

Títol uniforme

  • Títol
  • Altres
  • Per paraules

245

Títol

  • Títol
  • Subtítol
  • Per paraules

250

Edició

 

 

255

Numeració revista

 

 

259

Lloc de publicació

 

  • Sencer
  • Amb literal (LP=)

260

Editor

 

  • Sencer
  • Amb literal (PU=)

261

Data de publicació

 

  • Sencer

300

Descripció física

 

 

440

Col·lecció

  • Col·lecció
  • Número
  • Subcamp:
    Col·lecció
  • Per paraules

500

Notes generals

 

 

501

Nota de títol

 

  • Paraules significatives

502

Nota de periodicitat

 

 

503

Nota d'accés remot

  • URL
  • Data de consulta

 

504

Nota d'escala

 

  • Sencer

505

Nota de contingut

 

  • Per paraules

550

Llengua

 

  • Sencer

513

Resum

 
  • Per paraules

600

Descriptors personals

  • Nom
  • Cognoms
  • Subcamps:
    Cognoms, nom
  • Per paraules

610

Descriptors corporatius

  • Àrea geogràfica
  • Entitat
  • Subentitat
  • Subcamps:
    Àrea geogràfica. Entitat. Subentitat
  • Per paraules

650

Descriptors

 

  • Sencer
  • Per paraules

653

Descriptors geogràfics

 

  • Sencer
  • Per paraules

660

Àrea temàtica

 

  • Sencer
  • Per paraules


La taula 2 indica la manera com s'agrupen els índexs de la base de dades.

Taula 2. Índexs de la base de dades

Etiquetes de l'índex

Camps i subcamps Etiquetes dels camps

Autors personals

  • Autors personals
  • Altres responsabilitats

100
700

Autors corporatius

  • Autors corporatius
  • Productors
  • Congrés/jornada

110
112
111

Títol

  • Títol uniforme
  • Títol i subtítol

240
245

Descriptors personals

  • Descriptors personals

600

Descriptors corporatius

  • Descriptors corporatius

610

Descriptors matèries

  • Descriptors matèries

650

Descriptors geogràfics

  • Descriptors geogràfics

653

Àrea de coneixement

  • Àrea temàtica

660

Data de publicació

  • Any de publicació
  • Referència parts de monografies
  • Referència articles de revista

261
10^e
11^d

Publicació en sèrie

  • Referència articles de revista

11^a

Llengua

  • Llengua

550

Designació del material

  • Designació del material

8

Col·lecció

  • Col·lecció

440^a

Lloc de publicació

  • Lloc de publicació

259

Editor

  • Editor

260

Nivell d'anàlisi

  • Nivell d'anàlisi

1

Resum

  • Resum

513

Ubicació

  • Ubicació

5^a, 5^b

Notes

  • Nota de títol
  • Nota d'escala
  • Nota de contingut

501
504
505

Analista

  • Analista

3

Font del registre

  • Font del registre

13


Els formats de visualització que s'han definit són els següents: