Fødevarebranchen har længe haft hygiejne, egenkontrol og smiley’s inde på livet.
I forhold til IT dukker ordet datakvalitet op i ny og næ – traditionelt i forbindelse med at noget er gået grueligt galt, og det skal der gøres noget ved.
Der er dog tegn i sol og måne på at datakvalitet bliver taget mere og mere alvorligt.
Som jeg ser det går det sådan at virksomhederne bevæger sig frem i forskellig takt langs en vej med følgende milepæle for datakvalitet (Data Quality):
• Data Quality 0.0 er stadet, hvor der aldrig gøres rent. Data hældes fortrinsvis ukritisk ind i systemerne og udtræk og analyser bliver herefter.
• Data Quality 1.0 er stadet hvor der foretages datavask. Det sker ofte i form af batch kørsler, hvor lagrede data tilrettes, struktureres og beriges med henblik på at kunne anvendes til et givet formål.
• Data Quality 2.0 er stadet med vedholdende god datahygiejne. Data kontrolleres så tæt på kilden som muligt og vedligeholdes i en stand, som opfylder alle givne formål i virksomheden.
I en nylig offentliggjort undersøgelse fra Gartner siges det:
• Pengene fosser stadig ud af virksomhederne som følge af utilstrækkelig datahygiejne
• Det er svært for virksomhederne at udnytte værktøjer til forbedret datahygiejne
Undersøgelsen er gengivet mere uddybende (på engelsk) her.
Spørgsmålet om brugervenlige datakvalitetsværktøjer har for nylig været diskuteret på DataQualityPro her.
Dette er til dels en gengivelse af en brugerblog på Computerworld fra den 27. august 2009:
Skrevet af Henrik Liliendahl Sørensen