Indata är lösningen för bra BI-projekt

Ämnet Bi (Business Intelligence) kan diskuteras med olika infallsvinklar, tekniker och metoder. Diskussioner i ämnet kan bli detaljrika och belysa intressanta åsikter. Att få data att flöda in och ut är centralt i alla BI projekt. Detta tillsammans med effekten av redovisning skapar nytta för verksamheten. Då kan beslut och vägval göras baserad på fakta från den data som analyseras. Men många Bi-projekt fastnar. Oftast handlar det om otydliga krav och dålig datakvalitet.

Jasmin Zejnilagic är utvecklare och har erfarenhet inom området.

”Vad är BI för dig?”

För mig är Business Intelligence ett finare ord för ”dataomvandling” på ren svenska. Inom BI pratar vi om ETL, vilket står för ”Extract, Load, Transform” och syftar på just den processen där data skall skyfflas från ett system till ett annat. Denna omvandlade data används vanligen av verksamheten för att få ut olika mätvärden, rapporter och grafer.

”Min erfarenhet av BI-projekt är att allt fastnar och handlar till slut om indata. Håller du med?”

På sätt och vis, min erfarenhet av BI-projekt utifrån en utvecklares perspektiv är att det alltid handlar om indata. Indata-problematiken kan differentiera sig från projekt till projekt; dock är de vanligaste problemen att man inte har koll på hur data lagras i källsystem(en), nyckelinformation saknas i systemet i fråga, man saknar specifikation eller rent av inte har tillgång till data i fråga då den ägs/förvaltas av en tredjepart.

”Hur lyckas man med att få bra indata till sitt BI-projekt?”

Kommunikation, standarder och stickprov. Vad menar jag med det? Att så tidigt som möjligt kunna ha en öppen och rak dialog mellan projektägaren, förvaltaren av databasen/data och BI konsulten där man kommer överens om:

  • Var nödvändig data finns, vilken format den lagras i och datatyperna som används
  • Hur data skall kunna läsas ut (fil, databasåtkomst, SFTP, etc..)
  • När data skall läsas ut från källsystemet
  • Mellanlagringsformat när man utför transformeringen av data (ETL)
  • Datatyperna och formatet det ”tvättade” datat skall lagras i

För att säkerställa att indata håller rätt kvalité är det under projektets gång väldigt viktigt att man gör stickprov och återkopplar snarast till förvaltaren av data om det skulle visa sig att det t.ex. lagras fel data i en kolumn eller att man inte följer specifikationen.

Tack Jasmin ( https://se.linkedin.com/in/jasminz )