Plakkaten classificeren met de computer?

28 juni 2019 Annemieke Romein Digitale geesteswetenschappen

Researcher-in-residence Annemieke Romein is op zoek naar vroegmoderne regelgeving in plakkaatboeken (±1500-1800): regels tegen bijvoorbeeld bedelaars, over veiligheid, en ter stimulering van de economie. Met KB-collega’s onderzoekt zij of, en zo ja, hoe een computerprogramma dit werk kan overnemen. Kan een computer teksten herkennen die regelgeving bevatten, en onderscheid maken tussen regelgeving rond religie, dijkwezen etc.?

Als postdoctoraal onderzoeker in Gent onderzoek ik zowel handgeschreven als gedrukte regelgeving in de Nederlanden. Mijn onderzoek richt zich op dit moment voornamelijk op de gewesten Vlaanderen en Holland in de periode 1576 (Pacificatie van Gent) tot 1702 (Spaanse Successieoorlog), waarbij ik onderzoek waarover regels werden gepubliceerd. Ik ben in het bijzonder geïnteresseerd in veiligheid en publieke orde, mede omdat dit thema’s zijn die op dit moment actueel zijn. Wanneer je echter een selectie van regelgeving wilt gebruiken, dien je wel het geheel door te lopen en dit te beoordelen. Daardoor kwam bij mij de vraag op, of de computer te trainen is om deze taak over te nemen. Ik ben dan ook erg blij dat ik voor een onderzoeksproject van zes maanden bij de Koninklijke Bibliotheek in Den Haag mag werken. Mijn interesse in vroegmoderne wetsteksten werd al in 2005 gewekt toen een professor mij een Duits artikel liet lezen dat veronderstelde dat in landen zonder vorst geen plakkaten gepubliceerd zouden kunnen zijn. Echter, zo constateerde deze professor, in de bibliotheek lagen wel degelijk veel plakkaatboeken.

Anoniem, ‘Gezicht op de Nieuwe Kerk te Amsterdam’ (1693-1694). Prenttekening; ets en roulette (Rijksmuseum)
Anoniem, ‘Gezicht op de Nieuwe Kerk te Amsterdam’ (1693-1694). Prenttekening; ets en roulette (Rijksmuseum)
Detail: plakkaten naast de kerkdeur
Detail: plakkaten naast de kerkdeur

Plakkaten (ook wel bekend als ordonnanties) werden om die reden op ‘bekende plekken’ aangeplakt. Op deze manier was de regelgeving officieel vastgesteld, net zoals het tegenwoordig nodig is om vastgestelde wetten in de Staatscourant te publiceren. De Gewestelijke Staten vonden het daarnaast belangrijk om een selectie van de door hen goedgekeurde regels te laten herdrukken in plakkaatboeken. Deze vormden een bron voor juristen zodat zij eenvoudig regels konden nazoeken. De boeken geven dus geen volledig overzicht van alle uitgevaardigde regels, maar vormen een selectie van de regels die het gewestelijk bestuur de moeite waard vond.

Regelgeving in een federatie

De Republiek, maar ook de Habsburgse Nederlanden, waren federaties van autonome staten. In de Republiek waren de Staten-Generaal soeverein en in de gewesten hadden de Gewestelijke Staten de hoogste macht. De stadhouder was feitelijk een ambtenaar in dienst van deze instellingen. De Habsburgse Nederlanden verschilden van de Republiek in het opzicht dat een soevereine vorst (de koning van Spanje) de hoogste macht had, maar de Gewesten hadden ook daar nog een zekere mate van vrijheid. Zij moesten controleren of regelgeving niet botste met lokale gewoonten en gebruiken. Tóch wordt, als je in de geschiedenisboeken kijkt, de vroegmoderne geschiedenis veelal afgeschilderd als een spel tussen vorstenhuizen. Het gevolg is dat republieken, zoals de Republiek der Zeven Verenigde Nederlanden en Zwitserland zelden genoemd als de politiek-institutionele en juridische kant wordt beschreven. Dit vind ik een interessant gegeven: we wéten dus eigenlijk gewoon heel weinig over hoe de verschillende gewesten daadwerkelijk bestuurd werden en we hebben geen complete overzichten van de wetgeving. In België zijn ze hier veel verder mee, omdat zij een ‘Koninklijke Commissie voor de Uitgave van Oude Wetten en Verordeningen’ hebben, die als doel heeft alle oude regels op te zoeken en te publiceren. Zulke bronnenpublicaties in de vorm van boeken, vormen daar een rijke bron van informatie voor onderzoekers. Deze Belgische commissie is al rond 1846 begonnen en geeft dit soort publicaties nog altijd in boekvorm uit.

Hoe groot was het verschil in regelgeving tussen Holland en Vlaanderen?

In Nederland zijn we dus nog niet zo ver dat er überhaupt een bronnenoverzicht (per gewest) bestaat en dus kunnen we moeilijk uitspraken doen hoe over hoe de regelgeving in de Lage Landen onderling en met andere gebieden samenhing. Dat fascineert mij, omdat mijn huidige onderzoek in Gent aanleiding geeft om te denken dat het verschil tussen Holland en Vlaanderen – die beide op handel gericht waren, niet heel erg groot was. Hieruit blijkt vooralsnog dat het door een vorst (indirect) bestuurde Vlaanderen en het gewest Holland als onderdeel van de Republiek niet zo enorm verschilden als soms wordt voorgespiegeld.

Computertechnieken

Om dit verschil te kunnen onderzoeken, is een eerste, belangrijke stap in het Researcher-in-Residence-project het verbeteren van de leesbaarheid van de vroegmoderne werken in druk. Als mens kunnen wij de teksten vrij goed lezen, al is werk in een gotische drukletter uitdagender dan in romein. De computer vindt het vooralsnog allemaal best lastig. In het Google Books-project is gewerkt met OCR-herkenning en blijkt dat de tekst die je probeert te kopiëren in een tekstverwerkingsprogramma onbruikbaar is vanwege de grote hoeveelheid verkeerd gelezen tekens.

Dit heeft dan ook een direct gevolg voor het kunnen zoeken op trefwoorden in de tekst. Daarom maken we in dit project gebruik van Handwritten Text Recognition. Deze techniek is in het bijzonder in het Europees gefinancierde READ-project ontwikkeld, en heeft het programma Transkribus opgeleverd. Dit programma wordt getraind door middel van transcripties (het handmatig overtypen van een handschrift of, in ons geval, drukwerk). Daardoor wéét de computer hoe bepaalde tekens weergegeven worden in een bepaald handschrift. Bovendien kan het programma in de tekens in een context plaatsen want het kijkt naar complete regels en niet naar individuele tekens. Een N-Gram op de achtergrond onthoudt veel voorkomende lettervolgordes (bijvoorbeeld dat een ‘q’ altijd wordt gevolgd door een ‘u’).

Doordat wij de computer feitelijk voor de gek houden door te stellen dat ons drukwerk een handschrift is (maar dan wel een héél regelmatig handschrift) zal het in staat zijn om de tekst veel beter te herkennen dan wanneer er alleen maar gekeken wordt naar individuele tekens (zoals bij Optical Character Recognition). Ik had van deze techniek gehoord, maar ze zelf nog nooit toegepast op drukwerk en ik werd nieuwsgierig. Kunnen we op die manier dan misschien alle plakkaatboeken (binnen het project zijn er zo’n 100 verzameld) veel beter doorzoekbaar gaan maken? Waar ik in mijn huidige project in Gent zelf labels zit te plakken op alle individuele teksten, vroeg ik mij af of de computer hier nu ook in getraind kan worden. Kan de computer getraind worden om te begrijpen waarom ik bepaalde keuzes heb gemaakt, en kan hij deze kennis toepassen in andere plakkaatboeken? Tijdens mijn project bij de KB probeer ik hier een antwoord op te vinden.

Jan Abrahamsz. Beerstraten, ‘Het Paalhuis en de Nieuwe Brug te Amsterdam in de winter’ (1640- 1666). Olieverf op doek (Rijksmuseum)
Jan Abrahamsz. Beerstraten, ‘Het Paalhuis en de Nieuwe Brug te Amsterdam in de winter’ (1640- 1666). Olieverf op doek (Rijksmuseum)
Detail: plakkaten aan de muur van het Paalhuis
Detail: plakkaten aan de muur van het Paalhuis