Starten met big data: van ambitie naar inzicht

Steeds meer organisaties hebben de ambitie om actief big data in te zetten. Deze organisaties staan voor een grote uitdaging: hoe kom je van die verschillende datastromen tot een bruikbaar inzicht en dus waarde voor de business? Dagelijks werk ik met diverse organisaties aan deze uitdaging via bijvoorbeeld pilots. Daarbij komen twee aspecten regelmatig terug. Hoe pak ik het technisch inhoudelijk aan? En hoe pak ik het organisatorisch aan? In dit blog deel ík mijn ervaring over deze pilots en geef ik wat gerichte adviezen.

Datagedreven en informatiegestuurd werken
De ambitie om big data in te zetten, is vaak onderdeel van het beleid om datagedreven en informatiegestuurd te werken. Organisaties beseffen dat het benutten van beschikbare realtime datastromen en het analyseren van de enorme hoeveelheden aan data dat daaruit voorkomt, antwoorden kan bieden op vraagstukken waar ze al langer mee worstelen. Het geef inzicht zoals nooit tevoren. Het besef of de ambitie moet nu daadwerkelijk worden omgezet naar een concreet plan van aanpak. Maar welke technische en procesmatig stappen zijn daarvoor nodig?

HET TECHNISCHE ASPECT
Bij het werken met realtime en big data hanteren we technisch inhoudelijk vaak de volgende stappen om tot inzicht te komen.

Stap 1: Verwerk de data
Het binnenhalen en verwerken of bewerken van realtime data met ArcGIS GeoEvent Server. Met deze realtime verwerking kunnen we ook realtime gebeurtenissen detecteren en op basis hiervan alarmeringen inrichten in een bedrijfsproces op de kaart, in dashboards of andere middelen zoals sms of e-mail. Denk hierbij aan het detecteren van overschrijdingen van bepaalde waarden bij statische sensoren of aan het binnenkomen of verlaten van bepaalde gebieden bij dynamische sensoren zoals gps signalen.

Stap 2: Sla de data op
De realtime data die binnen wordt gehaald, kan tevens opgeslagen worden in de Spatiotemporal Big Data Store. Deze database is gebaseerd op ElasticSearch-technologie, waarmee een enorme hoeveelheid data extreem efficiënt opgeslagen kunnen worden. Heeft de organisatie al ergens anders big data opgeslagen? Dan kunnen we hier ook op aansluiten of deze data overbrengen naar de Spatiotemporal Big Data Store. Voordeel van dit laatste is (de naam zegt het al) dat de data over ruimte (spatio) en tijd (temporal) bekeken kan worden vanuit deze database.

Stap 3: Visualiseer het resultaat
Aangezien de Spatiotemporal Big Data Store automatisch on-the-fly de data over tijd en ruimte kan aggregeren en visualiseren is het eenvoudig om patronen over tijd en ruimte te ontdekken in de kaart.

Stap 4: Analyseer patronen en krijg inzicht
Ten slotte is het zaak om de waargenomen patronen door middel van verdere analyse hard te maken of op basis van de opgeslagen data nieuwe analyses uit te voeren voor verder inzicht. Met GeoAnalytics Server is het mogelijk om tijd-ruimte-analyses die we kennen vanuit het GIS, ook uit te voeren op big data door serverkracht te benutten bij de berekeningen.

HET ORGANISATORISCHE ASPECT
Organisatorisch zijn er natuurlijk veel afhankelijkheden per organisatie. Toch is er een aantal succesfactoren te definiëren.

Stap 1: Begin klein
Begin vanuit een vraag, niet meteen vanuit de businesswaarde. Als het antwoord gevonden is, valt vaak pas te bepalen hoeveel waarde het antwoord voor de business heeft. Klein beginnen kan goed in de vorm van een pilot. Hiervoor bieden wij vanuit Esri bijvoorbeeld het Sense Data Lab aan. Dit is een complete GIS-omgeving die we beschikbaar stellen ten behoeve van pilots met organisaties die de waarde van realtime en big data GIS willen verkennen.

Stap 2: Zorg voor de beschikking over kennis en tools
De GIS-tools zijn dus beschikbaar in het Sense Data Lab. GIS-tooling aanvullen met andere niet ruimtelijke analyse tools kan helpen. Zo heeft elke tool bepaalde sterke punten waar we gebruik van kunnen maken. Ook is het goed om de kennis van betrokkenen multidisciplinair te laten zijn.

Stap 3: Opschalen van de uitgewerkte analyse
Nadat de analyse compleet is uitgedacht en succesvol is uitgevoerd op een subset van de data, is het zaak om de analyse te herhalen op de complete dataset. Daarbij kan zo nodig de rekenkracht ook opgeschaald worden door het toevoegen van servers.

Stap 4: Successen delen en borgen binnen de organisatie
Na een succesvolle pilot delen we de successen van de pilot binnen de organisatie en denken we met de organisatie mee over meer vraagstukken die met de inzet van big data beantwoord kunnen worden. Tevens bespreken we hoe we de opgedane kennis kunnen borgen binnen de organisatie en welke tools de organisatie permanent tot zijn beschikking wil hebben.

Zo starten we met een enkele vraag waar de organisatie al langer mee worstelt en eindigen we met een omgeving die klaar is voor meer big data vraagstukken.  Zo kan er actief big data ingezet worden en datagedreven en informatiegestuurd gewerkt worden.

Meer informatie
Wilt u meer informatie over hoe u realtime data of big data effectief kunt inzetten in uw organisatie? Neem voor meer informatie contact met mij op via contact@esri.nl.

Wilt u de potentie van realtime data of big dat verkennen? Dat kan nu in het Sense Data Lab. Esri Nederland heeft dit lab ingericht zodat organisaties snel, veilig en in vrijheid de potentie van realtime en big data GIS kunnen verkennen in de vorm van pilots.

Volgend Artikel

GIS onmisbaar bij efficiënt samenwerken, maar het is en blijft mensenwerk

Lees dit artikel