De comeback van de KB-code
5 juli 2016 Arno Kuipers Over de KB

Oude trefwoorden gereanimeerd! Duizenden onderwerpsingangen in de KB-catalogus zijn opeens veel zichtbaarder geworden. Oude codes van de cataloguskaartjes van De Systematische Catalogus van de KB zijn vertaald naar Nederlandse woorden. De complete hiërarchie van dit classificatiesysteem is bovendien vertaald naar een nieuwe thesaurus. Niet alleen is de catalogus op deze manier verrijkt met betere ingangen, de ‘nieuwe oude trefwoorden’ kunnen ook hun diensten gaan bewijzen voor Delpher en andere digitale toepassingen.

Trefwoorden

Wie de laatste tijd wel eens wat heeft opgezocht in de KB-catalogus, heeft het waarschijnlijk al opgemerkt: er verschijnen opeens nieuwe lange reeksen met trefwoorden. Zo blijkt Eugène Mallets publicatie De l’essence des passions uit 1877 opeens te behoren tot de rubriek ‘Gevoelsleven en emoties’ en die rubriek blijkt gerangschikt onder ‘Afzonderlijke stromingen en onderwerpen’ van de Psychologie, die weer onderdeel is van de algemene categorie ‘Psychiatrie en psychologie’. Eugène Mallet deelt het setje ‘Gevoelsleven en emoties’ met 164 andere treffers, waaronder bijvoorbeeld de Philosophie du rire van Paul Scudo en De invloed van het gevoel op de redelijkheid van het denken van A.M. Benders. In een volstrekt andere categorie is nu duidelijk dat de bundel Reminiscences van Edith Kenyon uit 1935 hoort bij ‘Speciale vormen van maatschappelijke zorg’, namelijk die van lichamelijk gehandicapten. Ook als er meerdere talen in het geding zijn, is de uniformerende rol van deze nieuwe trefwoorden heel handig. Bij de rubriek ‘Ironie’ (onderdeel van ‘Levenshoudingen’) in de categorie Cultuurfilosofie zijn nu bijvoorbeeld zestien titels te vinden uit vijf verschillende talen.

Ironische treffers

Lijstje treffers uit de rubriek Cultuurfilosofie/Levenshoudingen/Ironie

De Systematische Catalogus

Kasten met de kaartenbakken van de KB-code in de leeszaal.

Systematische catalogus

Deze nieuwe trefwoorden zijn eigenlijk helemaal niet nieuw, integendeel: sommige zijn al bijna een eeuw oud. De ‘nieuwe’ trefwoorden zijn namelijk de vertalingen naar gewone Nederlandse woorden van de beknopte codes die er eerst in hun eentje stonden, zoals ‘0050 dd’ of ‘298 madz’. Deze codes komen uit het oude systeem voor de onderwerpsontsluiting van de KB: De Systematische Catalogus van de Koninklijke Bibliotheek, in onze wandelgangen ook wel de KB-code genoemd. De codes stammen uit de tijd van vóór de digitalisering en het internet. De beknoptheid vindt daar dan ook mede haar oorsprong: de indelingen moesten op cataloguskaarten worden getypt die in lange lades werden ondergebracht. Een korte code als ‘50 eg’ vergt heel wat minder tijd en plaatsruimte dan een woordenreeks als Occulte wetenschappen – Parapsychologie - Hekserij -Moderne hekserij/satanisme (twintig treffers). Wie wel eens het KB-gebouw bezoekt, kan deze cataloguskaarten nog steeds bezichtigen, want de meterslange rijen kasten van de Systematische catalogus staan nog steeds in de algemene leeszaal (en worden ook nog steeds geraadpleegd!)

Alleen code
Alleen code

De KB-code vroeger: alleen een code

Code met vertaling

De KB-code nu: met vertaling

Vertaalslag

Gelukkig hoefde ik voor elke code niet telkens de kaartenbakken te raadplegen, want in principe was de KB-code beschikbaar als online instrument. Dat is te danken aan een aantal oude KB-rotten dat rond 1990 goed heeft opgelet. De oude systematische codes zijn toen meegenomen tijdens het overtypen van de kaarten (‘retro-catalogisering’) voor de toen nieuwe digitale online publiekscatalogus. Maar deze duistere code alleen was natuurlijk niet heel erg publieksvriendelijk. Je moest al behoorlijk goed zijn ingewijd in de oude KB-systemen om hier gebruik van te kunnen maken. Daarom is nu een enorme vertaalslag gemaakt door de oude codes te vertalen naar heldere Nederlands woorden.

Thesaurus

Ogenschijnlijk lijkt het vertalen van deze codes een eenvoudige klus, maar dat was het allesbehalve. De volledige hiërarchische boomstructuur van de KB-code moest namelijk worden overgezet. De hoofdrubriek bevat soms duizenden titels, het laagste soms maar enkele. En het is niet zo dat je bijvoorbeeld ermee kunt volstaan om de code voor ‘Proza’ uit 473 d eenvoudig te vertalen naar het woord ‘Proza’, want ‘Proza’ hangt onder verschillende takken van de classificatie. Engelse en Duitse letterkunde hebben zo bijvoorbeeld hun eigen Proza-rubrieken per tijdvak, die enkel zijn te herkennen aan de bovenliggende hoofdrubrieken. De dikkere takken van de boom, tot en met de stam, moeten dus steeds mee getoond worden omdat je anders extreem zou versimpelen. Daarom zijn alle codes omgezet naar een thesaurus. Deze nieuwe thesaurusstructuur biedt per rubriek steeds ingang tot sets van gelijkaardige titels. Dit was vooral zo’n ingewikkelde klus omdat van statische lijsten op papier een dynamische database moest worden gebouwd en in die statische lijsten natuurlijk heel veel typefouten en andere hobbels schuilden. Dat deze klus toch is geklaard, is te danken aan mijn uitmuntende collega’s Teunis van Lopik, Frank Peeters en vooral databasetovenaar Erik Vos.

Thesaurusstructuur
Thesaurusstructuur

De verwante ingangen van de subrubriek 'Sino-Tibetaanse en Mon-Khmer talen'

P.C. Molhuysen
P.C. Molhuysen

Grondlegger van de Systematische Catalogus van de KB

P.C. Molhuysen

De KB-code of Systematische Catalogus is eigenlijk de nationale Nederlandse variant van de Library of Congres Classification (LCC) uit Washington, maar hij is ook verwant aan Dewey’s Decimale Classificatie (DDC) en de Universele Decimale Classificatie (UDC) van de geniale Belg Paul Otlet. DDC uit 1876 is de oudste, LCC en UDC volgden rond 1900. Al deze systemen ontstonden in de tijd dat de bibliotheekwetenschap door de groeiende stroom aan publicaties en de stormachtig groeiende collecties nieuwe, efficiëntere ontsluitingssystemen met onderwerpsingangen moest uitdenken. Alleen een alfabetische catalogus op naam van auteurs was al lang niet meer voldoende. De KB-code maakt ook deel uit van deze beweging. De aanzetten tot een eigen Systematische Catalogus werden al gegeven door Willem Byvanck, de Bibliothecaris van de KB in de jaren 1895-1921, maar hij kwam tot volledige wasdom in de tijd van Byvankcs opvolger Philipp Christiaan Molhuysen, Bibliothecaris van de KB van 1921 tot 1937.

Bibliotheek zonder Metadata
Bibliotheek zonder Metadata

Bibliotheek zonder Metadata

Bibliotheek met Metadata
Bibliotheek met Metadata

Bibliotheek met Metadata

Wij wel, Google niet

Met dit soort classificatiesystemen en onderwerpsontsluitingen heeft de bibliotheek dan ook iets in handen wat Googlebooks bijvoorbeeld niet heeft. Er wordt wel eens gedacht dat de digitalisering dit soort oude catalogus-trefwoorden obsoleet zou maken. Zelfs in bibliotheekland hoor je wel eens zeggen dat als de boel gedigitaliseerd is ‘mensen het toch wel vinden’ en dat de oude cataloguskennis niet meer nodig is. In die redenering is digitalisering een oogoperatie en catalogus-metadata de blindenstok die weggegooid kan worden als de patiënt eenmaal kan zien. Het is echter eerder andersom. Ook in het gedigitaliseerde domein zijn categorieën nodig waarmee je meerdere publicaties uit een collectie kunt groeperen. Voor de groeiende zee aan gedigitaliseerd materiaal zijn eigenlijk alleen maar meer navigatiemiddelen nodig. Juist om die uitdijende en dieper wordende digitale zeeën te kunnen bevaren zijn boeien, vuurtorens, vaarroutes, radars, sleepnetten, hengels en loodsen nodig. Het gebrek aan goede metadata in Googlebooks wordt daarom ook al jaren betreurd, bijvoorbeeld door Laura Miller die in 2010 in een overzichtsartikel getiteld ‘The trouble with Googlebooks’ al stelde dat naast alle prijzenswaardige nieuwe mogelijkheden van de digitale wereld het nog steeds belangrijk is om de ‘oude’ metadata ook te blijven benutten: ‘In time, you could generate all kinds of interesting new classifications, too, but you have to have the old ones’ (cursivering van mij).

Indeeling van den Systematischen Catalogus van de Koninklijke Bibliotheek, 1929
Indeeling van den Systematischen Catalogus van de Koninklijke Bibliotheek, 1929

Veelgebruikt werkexemplaar van een vakreferent van de KB, enkele decennia geleden

KB-code in Delpher
De KB-code in Delpher

Voor Delpher moet de vertaalslag nog gemaakt worden.

Reacties

Helemaal een tekst naar 'mijn hart'!

Wellicht voor jou interessant om ter onderbouwing het KB-rapport van Eric Sieverts (een oude rot in het vak, maar inmiddels ook een pensionado) uit 2004 te lezen: Inhoudelijk toegankelijk maken van hybride bibliotheekcollecties / http://sieverts.pbworks.com/f/rapport-KB.pdf

In de samenvatting concludeert Sieverts: "Aangezien de beste full-text retrieval nog altijd geen panacee biedt voor alle soorten zoekgebruik, lijkt gecontroleerde ontsluiting van alle materiaal op een vrij algemeen niveau, in combinatie met free-text zoeken op specialistische onderwerpen, op dit moment de beste oplossing te bieden om zowel de algemene zoeker als de specialistische wetenschappelijke zoeker voldoende aan zijn trekken te laten komen."

Ik stuit er helaas bij bijna elke dag die ik aan onderzoek besteed nog altijd op dat websites te weinig metadata aanbieden en/of deze onvoldoende geïndexeerd hebben. Diepgaand onderzoek is nog altijd afhankelijk van het uitproberen van een hele waslijst aan zoekvragen en -technieken. Ik ben bv nog geen enkele search engine tegengekomen die "snapt" dat veel "hugenoten" feitelijk "walen" waren. Misschien dat kb-code deze onderwerpen wat vindbaarder maakt met behulp van trefwoorden als "geschiedenis", "vlucht", "reformatie", "calvinisme", "16e eeuw", "Zuidelijke Nederlanden" etc. Zowel te veel als te weinig zoekwoorden opgeven kan het aantal hits beperken of de verkeerde kant uitsturen. Het zoeken naar niet alleen het optimale aantal, maar ook de optimale combinatie blijft mensenwerk. Ik verwacht in de toekomst wel dat er ooit algoritmes komen die uit mijn getoonde interesses nieuwe suggesties zullen destilleren waar ik zelf nooit op gekomen zou zijn, vergelijkbaar met software die datingsites en reclame-aanbieders nu al gebruiken... Maar elke stap voorwaarts wordt uiteraard met gejuich ontvangen.

Reageer op deze blog

Plain text

  • Geen HTML toegestaan.
  • Adressen van webpagina's en e-mailadressen worden automatisch naar links omgezet.
  • Regels en paragrafen worden automatisch gesplitst.
Bij het indienen van dit fomulier gaat u akkoord met het privacybeleid van Mollom.