En ny studie från Högskolan i Skövde visar att många offentliga verksamheter brister i sin dokumenthantering. Viktig information riskerar att gå förlorad. Komplexitet och oklarheter kring dokumentstandarder är några av anledningarna menar Thomas Fischer, lektor i datalogi vid Högskolan i Skövde. 

I samband med långsiktig arkivering av digitala textdokument behövs standardiserade format som är utformade för lång livslängd. Ett sådant exempel är PDF/A-1b. 

Det är dock krångligt att hantera de tekniska specifikationerna av ett sådant format. Det leder ofta till en rad oklarheter när ett format ska tolkas. Det i sin tur leder till att det är svårt att skapa programvara som på ett korrekt sätt kan skriva och läsa filer i specifika format, något som även gäller för PDF/A-1. 

–Det är tekniskt komplicerat att implementera en teknisk specifikation av ett format i programvara, speciellt när specifikationen är mångtydig och kan tolkas på olika sätt. Vår forskning visar att det inte går att förlita sig på att en enskild programvara följer en viss standard både på grund av tolkningsfel och implementeringsbrister, säger Thomas Fischer. 

Endast 0,1 procent av dokumenten klarade en kontroll 

I studien har forskarna studerat hur svenska lärosäten arkiverat doktorsavhandlingar mellan åren 2007 – 2016. Av totalt 21 611 PDF-filer är det endast omkring sex procent av filerna som hävdar att de överensstämmer med PDF/A-1b. Av dessa är det dock bara 14 stycken som till fullo klarar en kontroll av överensstämmelse med standarden. Därmed är den långsiktiga arkiveringen inte säkerställd och information riskerar att i framtiden gå förlorad. 

För organisationer i offentlig sektor är detta en nyckelfråga, menar forskarna bakom studien. Kommer PDF-filer som lagras på lång sikt fortfarande kunna läsas, återges eller bearbetas enligt avsikten från deras skapare när originalprogramvaran inte längre är tillgänglig? 

– En långsiktigt god förvaltning förutsätter användning av format som har implementeras i öppen programvara. Den kompletta källkoden till programvaran behöver finnas tillgänglig under villkor som möjliggör långsiktig förvaltning av såväl dokument som programvara, säger Björn Lundell, professor i datavetenskap vid Högskolan i Skövde. 

Leder till inlåsningseffekter 

Forskningen visar att det finns ett antal brister i analyserade programvaror som till del är en konsekvens av brister i det implementerade formatet. Mycket talar för att tekniskt komplicerade format, på sikt, kommer att leda till oönskade inlåsningseffekter och hinder för att olika system ska kunna fungera tillsammans och kunna kommunicera med varandra. 

Rekommendationer till offentliga verksamheter 

Baserat på resultaten i studien ger forskarna en rad rekommendationer till offentliga verksamheter. Offentliga organisationer måste öka den interna medvetenheten om vikten av att använda format av god teknisk kvalité. Formaten behöver uppfylla definitionen av öppen standard enligt statens offentliga utredning 2009:86 och ha implementerats i öppen programvara. Under upphandlingsprocessen behöver även de offentliga verksamheterna ställa krav på bättre stöd för PDF/A-1, menar forskarna. 

– Målet måste vara att slutanvändare av olika programvaror korrekt ska kunna skapa filer i öppna format för vilka det existerar en god implementation i öppen programvara, säger Björn Lundell.

Kontakt

Thomas Fischer, lektor i datalogi vid Högskolan i Skövde
Tel: 0500-44 83 79
E-post: thomas.fischer@his.se

Björn Lundell, professor i datavetenskap vid Högskolan i Skövde
Tel: 0500-44 83 19
E-post: bjorn.lundell@his.se

Vi är en modern högskola som präglas av en öppen och välkomnande atmosfär, förstklassiga utbildningar och internationellt konkurrenskraftig forskning. En plats där vi gör framsteg, varje dag.