Last van metadata

Vinden van informatie is misschien wel dè reden van het bestaan van de DIVer en de archivaris. In het dagelijkse werk is het van belang om direct over de juiste informatie te beschikken, die authentiek, integer en volledig moet zijn. Als daar aan getwijfeld wordt is het einde zoek. Volgens een onderzoek uit 2011 kost het zoeken naar informatie ca. 1850 euro per jaar, per werknemer. Een aardig bedrag waar je leuke dingen voor kan doen. De enorme hoeveelheid aan informatie die tegenwoordig beschikbaar is, maakt het voor de eenvoudige werknemer niet makkelijk de weg te vinden. Het lijkt vaak op het zoeken naar een naald in een hooiberg of erger nog zoeken naar een naald die in verschillende hooibergen kan liggen. In Nederland hebben we met z’n allen ontzettend veel informatie, maar in de meeste gevallen is er nog geen verbinding tussen die data waardoor we die data niet kunnen delen.

Gelukkig zijn er daarom mensen die opgeleid zijn om met zoeken te helpen en die snappen hoe informatie zo moet worden opgeborgen dat met minimale inspanning de juiste informatie gevonden wordt. Het is alleen wel noodzaak dat er bijvoorbeeld op een gestructureerde manier wordt gewerkt en dat informatie met bijvoorbeeld metadata terug vindbaar wordt. Helaas gaat het hier nog steeds mis.

Al diverse malen ben ik het volgende tegengekomen. Een leverancier van een documentmanagement systeem die tegen een klant zegt dat het systeem werkt als in Google. Vul een zoekterm in en het juiste document staat op het scherm. Dit alles dankzij full text retrieval, het systeem leest alle documenten en levert direct de gevraagde brief. Dus het is niet langer nodig om een brief te voorzien van allerlei nadere informatie. Metagegevens toevoegen is niet nodig! Uit de zelfde praktijk weet ik inmiddels dat dergelijke verkoopargumenten alleen werken in een geconditioneerde testomgeving. Een database gevuld met slechts enkele honderden documenten zal sneller een goed resultaat laten zien dan een database waar miljoenen documenten in geplaatst zijn. En dan zijn metadata onontbeerlijk. Hoe vervelend het voor een gebruiker ook is om een document te registreren, het is pure noodzaak. Dit is echter geen nieuws voor de DIV-er die weet dit als geen ander.

Desondanks gebeurt het dan toch dat metadata niet, of onvoldoende worden toegepast. Dankzij versie beheer is het mogelijk om verschillende versies te bewaren en van elkaar te onderscheiden. Helaas komt het vaak voor dat het niet duidelijk is dat er nog meer versies van een document bestaan. Een probleem dat in de papieren wereld vrijwel niet op te lossen viel maar in de digitale wereld wel kan worden aangepakt door het toepassen van de juiste metadata. 

Als het toepassen van metadata zo handig, nee noodzakelijk is, voor het ordenen, terugvinden en beheren van informatie waarom maken mensen er dan nog steeds een rommeltje van en proberen zo weinig mogelijk metadata toe te voegen. Een van de belangrijkste oorzaken is dat het extra werk is. En voor documenten die nog onder handen zijn, niet nodig. Die vind je toch wel terug en is het niet beter om de software de documenten te laten beheren en metadateren?  Dit is wat de archivaris van de Verenigde Staten zegt over het archiveren van e-mails in het Witte Huis:

David Ferriero, the nation’s archivist, said Tuesday that he was uncomfortable with letting White House staff members decide whether their electronic messages from personal accounts were work-related and must be saved. Mr. Ferriero told a House hearing that official communications sent from a presidential employee’s personal device, using personal accounts, must be preserved under the law, but that a staff member gets to determine what is official. Asked whether he was comfortable with a voluntary system, he replied, “Any time there is human intervention, then I’m not comfortable”.