Vad är ett Datalager (Data Warehouse)?

Syftet med ett beslutsstöd är förenklat att:

  1. hämta in data,
  2. omvandla data till information,
  3. få ut information till organisationen som beslutsstödet avser att stödja,
  4. generera ny kunskap hos informationsmottagaren

Den första och andra punkten är traditionellt datalagrets uppgift att hantera.

Ett datalager (engelska: Data Warehouse) är en databas som sammanför stora mängder affärsdata från normalt flera olika datakällor. Datalagret har en struktur som är optimerad för att kunna lagra stora mängder historisk data oftast anordnad i dimensions- och faktatabeller.

Nedan konceptuella bild visar vad som ingår i ett beslutsstöd med datalagret utmarkerat. Ett Data Mart innehåller en delmängd av data från det underliggande datalagret och tas oftast fram för att uppfylla de specifika behov av information som en avdelning inom organisationen har.

Övergripande skiss över ett beslutsstöd

Genom att bygga upp ett datalager kan man lösa flera vanligen förekommande problem i försystemen som t.ex.

  • Accessproblem – data kan av olika anledningar vara svåra att få åtkomst till för alla slutanvändare. Ett grundläggande krav på ett datalager är att information går att få åtkomst till – på ett datasäkert och effektivt sätt.
  • Belastningsproblem – genom att sänka belastningen på försystemen förbättras responstiderna för slutanvändare och andra system som skapar data i försystemen. Man kan t.ex. definiera att datalagret endast får ladda data från försystemen på natten eller under andra perioder på dygnet när belastningen är låg. Applikationer som går emot datalagret kan då laddas om ofta utan att störa försystemen
  • Förståelseproblematik – datatermer kan göras mer förståeliga genom att mappas till nya och mer lättförståeligt döpta fält
  • Förändringshastighet – i datalagret kan nya affärsregler snabbare implementeras än vad som oftast är möjligt i ett affärssystem. Behoven i organisationen tenderar förändras snabbare än vad IT-avdelningen hinner med att genomföra de förändringar som behövs.
  • Datakvalité – data från olika försystem kan av olika anledningar vara av skiftande kvalité. Vanligt är att försystemen satts i drift vid olika tillfällen och utifrån olika behov vilket gjort att datamodeller och databeskrivningarna skiljer sig åt. Genom att samla data i ett datalager skapas en version av sanningen som alla använder sig av. För att säkerställa att data är jämförbar samt har en jämn och förväntad kvalité utifrån uppställda krav måste data transformeras (Transform i ETL processen) . Denna aktivitet i ett datalagerprojekt är oftast mycket tidsödande. Läs mer om begreppet Datakvalité

Kommentera