Historische cijfers
Van 1895 tot 2019 publiceerde Onderzoek en Statistiek jaarboeken met tabellen. Ter gelegenheid van het 130-jarige bestaan van O&S bouwde ik een applicatie waarmee je de jaarboeken kunt doorzoeken en de tabellen met cijfers kan exporteren.
Om dit mogelijk te maken, zijn de ingescande jaarboeken opgeknipt in losse pdf-pagina's die zijn opgeslagen in een database. Ik gebruikte Google Document AI om teksten en tabellen op de pagina's te herkennen en toe te voegen aan de database. Google bleek vrij goed te zijn in het herkennen en vullen van de tabellen maar had wel moeite met samengevoegde cellen. Daarom controleren we alle tabellem met de hand voordat we ze beschikbaar stellen aan het publiek. De website zelf is een Next.js applicatie.