Regelmatig kom ik bij opdrachtgevers die een vraag hebben waarvoor data-analyse en -visualisatie een oplossing kan zijn. Het zijn bijna altijd vragen met een sterke locatiecomponent en waarvoor je van veel “dingen” iets moet weten; of het nu gaan om alle werklocaties in een gebied, alle geschikte plekken voor laadpalen of het optimale tracé voor een nieuw warmtenet. Het formuleren van dergelijke “datavragen” is nog knap ingewikkeld, zeker ook omdat een goede vraagstelling van grote invloed is op de offerte en dus de oplossing. In de praktijk zijn er drie stappen te nemen om tot een goede “datavraag” te komen.

Het formuleren van een goede vraagstelling begint bij het achterhalen van de onderzoekseenheid: waar wil je nu echt wat van weten? Deze vraag is behoorlijk lastig, zeker als je niet weet wat je er vervolgens mee wil doen. Voor gemeentes brengen wij in kaart welke plekken in de stad als eerste aardgasvrij kunnen worden. Aanvankelijk deden wij deze analyse op gebouwniveau: we presenteerden welke gebouwen kansrijk zijn om van het gas af te gaan. Daar kan je dan gelijk aan de slag. Tegenwoordig aggregeren we die gebouwen al gelijk tot “vlekken” op de kaart, en doen we steeds meer eerst een algemene uitspraak op buurtniveau, voordat we naar de gebouwen gaan. Het blijkt namelijk dat in dit stadium van de energietransitie men terugdeinst van al te concrete kansen.

Het tweede waar je zicht op moet krijgen is de schaal. Vaak krijg ik de vraag om heel veel te weten te komen van relatief weinig objecten, bijvoorbeeld alle denkbare eigenschappen van vijf gebouwen. In zo’n geval kan je beter even bellen met de eigenaren, want data-analyse biedt dan weinig inzicht. Als je daarentegen vijf eigenschappen wil weten van alle gebouwen in Nederland is dat geen probleem. Zo kwam de Ontwikkelmaatschappij Utrecht bij ons met de vraag om potentiële locaties voor vastgoedtransformatie in kaart te brengen. Locaties kan natuurlijk van alles zijn. Al snel bakenden we dat af tot gebouwen in de provincie Utrecht, en toen weer tot gebouwen die werklocaties huizen of kunnen huizen, en ten slotte nog verder door die gebouwen eruit te halen die tevens woningen hebben. Van deze gebouwen hebben we een stuk of dertig eigenschappen geïnventariseerd of berekend. Dit maakte de opgave een stuk beter behapbaar en hielp de opdrachtgever ook in het fijnslijpen van hun vraag.

Het derde punt waar opdrachtgevers vaak tegenaan hikken is de data. Daarover bestaan de meest achterhaalde en curieuze veronderstellingen. Er zijn toch geen data. De data moeten we aanschaffen. De data zijn te complex. De data zijn verouderd. Allemaal zaken waar men kennelijk al veel over heeft nagedacht zonder ook maar eenmaal een data-adviseur naar de zaak te laten kijken. Alsof de familie op voorhand de chirurg gaat onderwijzen in de moeilijkheden van moeders operatie. Een goed voorbeeld in deze categorie komt van afvalenergiebedrijf HVC. Zij willen de financiële haalbaarheid van nieuwe warmtenetten toetsen. Vroeger was de dataverzameling voor dit soort studies een omvangrijke exercitie, waarbij per flat- en kantoorgebouw de metrages en installaties geïnventariseerd moesten worden. HVC gaf mij het vertrouwen hier iets op te verzinnen. Dankzij open data en GIS kan ik nu voor hen op modelmatige wijze van iedere willekeurige locatie in Nederland een eerste indruk geven van de financiële haalbaarheid voor een warmtenet. In dit kader wil ik ook wel kwijt dat dataverzameling niet meer van deze tijd is. Er zijn data, heel veel zelfs, van goede kwaliteit en veelal als open data beschikbaar. Zeker in het domein van de leefomgeving en energietransitie.

Kortom, het loont altijd om een data-adviseur te betrekken in je zoektocht. Vaak weet je niet dat je een vraag hebt die met data-analyse en -visualisatie goed beantwoord kan worden. Ga niet zelf proberen die vraagstelling te perfectioneren, daarmee verdoe je je tijd en mis je kansen. Een goede data-adviseur kent jouw vakgebied en spreekt jouw taal. Samen kom je tot de juiste vraag.

Gepubliceerd: 04-12-2017