KennisBite #3 Data snacken

KennisBite #3 | 20 april 2020 – 13.00 tot 13.45 uur
Ervaringen met Data Science Presentatie: Gert Jan Hagen en Rene Neijmeijer (Springco) en Jan Theunissen (De Alliantie)
Data, we zijn er inmiddels goed mee bekend, we beginnen te begrijpen dat we er ‘iets’ mee kunnen, sommigen onder ons zijn al enthousiast, velen van ons willen meer weten. Daarom een KennisBite over data én de science.

Jan Theunissen werkt als innovatiestrateeg bij De Alliantie, daar zijn ze dol op data. Zo dol dat de organisatie inmiddels datagedreven is aldus Jan. Wat betekent dat ze zich bij De Alliantie verdiepen in hun klanten (en hun data), zowel de huidige als de toekomstige, en daarop producten en diensten maken (of aanpassen) die beter aansluiten bij de behoeftes van hun klanten. Win-win dus. Dat klinkt goed en data hebben we allemaal, maar nu de ‘science’ achter die data.
Hiervoor werkt hij samen met Springco Urban Analytics. Zij zijn gespecialiseerd in data-georiënteerde vraagstukken op het gebied van de woon- en leefomgeving. We maken kennis met Gert Jan Hagen en Rene Neijmeijer. Gert Jan is de oprichter van Springco, een kundig en enthousiaste man die in het kort de mogelijkheden en expertise van Springco schetst. Rene is data-scientist bij Springco. Hij komt uit de psychologie en heeft veel ervaring met statistiek en methodologie, wat hem nu goed van pas komt.

Jan deelt twee onderzoeksvragen met ons in deze KennisBite en Rene Neijmeijer legt uit hoe ze bij Springco data-science technieken inzetten om tot antwoorden te komen.
De eerste vraag is: Hoe ziet de financiële positie van onze huurders eruit?
Leefbaarheid en passend wonen is een belangrijk en actueel vraagstuk in de woningcorporatiesector. Inzicht in de financiële positie van je huurders kan dan bepalend zijn voor je beleid voor leefbaarheid, toewijzing en inzet van middelen. Daarnaast wilde De Alliantie ook hun aannames toetsen ten aanzien van duurzaamheid. Bijvoorbeeld: zijn klanten met een financieel ongezonde positie minder geneigd mee te gaan in de duurzaamheidsopgave? Al met al een mooie case en we zijn heel benieuwd naar de uitleg van Rene.

Want wat kun je weten je over de financiële positie van je klanten? Wat is het besteedbare inkomen per woning, interessante vraag; we hebben Rene nodig voor de antwoorden.
In dit geval bestaat het besteedbaar inkomen uit het netto inkomen + de huurtoeslag. Huurtoeslag kun je berekenen aan de hand van de belastingdienst rekenregels, maar netto inkomen weet je niet als woningcorporatie, hiervoor wordt machine learning met interne/externe validatie ingezet. De uitgavenkant is zo nodig nog ingewikkelder om te bepalen. Springco gebruikt hiervoor cijfers van het Nibud. Dan nog de post woonlasten: energie (berekend met input van CBS energieverbruik per postcodegebied, wat door Springco teruggerekend wordt op basis van oppervlakte en ander openbare gegevens) gemeentelijke belastingen (input vanuit de gemeentelijke rekenregels) en water. De uitkomsten van deze drie blokken, inkomen minus uitgaven en woonlasten bepaald het maandelijks overschot/tekort. In de hieronder gedeelde presentatie kun je zien uit welke bronnen de diverse data komen. Tot zover het saaie gedeelte van de platte data, die aan elkaar gekoppeld worden in bijvoorbeeld Excel. Het enige wat hier belangrijk is om de data goed aan elkaar te koppelen en om de definities ervan te weten.

Dat roepen wij van CorpoNet wel vaker, gezamenlijk dezelfde gegevensdefinities toepassen maakt ‘data-science’ mogelijk! Oftewel heb je je gegevens eenmaal goed gedefinieerd (beschrijvend) dan kun je er voor jouw organisatie belangrijke informatie uithalen (analyse). Want simpelweg gegevens alleen zorgen niet voor informatie.

Rene gaat nog wat dieper in op het aspect machine learning, hij gebruikt daarvoor vaak R of Python (beide programmeertalen voor complexe data analyse). Het voert te ver om deze dia’s in dit verslag mee te nemen, bekijk vooral de presentatie en uiteraard zijn ze bij Springco bereid je het hele verhaal te laten zien.
Het is in ieder geval fascinerend om te zien hoe alle elementen (data) bij elkaar, opgeteld en afgetrokken en samengevoegd naar complexniveau een mooi kaartje oplevert waar je in één oogopslag de financiële positie van je huurders in beeld gebracht ziet.
Eénmaal de financiële positie per huurder / complex bepaald kun je nog veel meer analyses halen uit dat cijfer. Ook hiervan toont Rene enkele voorbeelden.

Tijd voor vragen, die inmiddels via de chat gesteld zijn. Eén vraag springt eruit: namelijk in hoeverre blijft De Alliantie ‘binnen de lijntjes’ als het gaat om ethische kwesties. Is er een soort waakhond, die waarschuwt als je een bepaalde grens overschrijdt? Denk nog even aan het SyRI project in Rotterdam. Jan geeft aan dat er na een flinke zoektocht een goed mechanisme is bedacht. Het overkoepelende project Klantinzicht bevat sowieso een security officer en een privacy officer en er is een klankbordgroep opgericht met medewerkers van De Alliantie die meedenken bij dit soort vraagstukken.
Belangrijke vraag en goed om te zien dat er bewustzijn op dit punt is. Als we dit altijd meenemen in onze jacht naar efficiency, verdienmodellen en wat dies meer zij dan komt het wel goed.

Verduurzamen van het bezit, CO2 neutraal in 2050, is een actuele en grote opgave voor woningcorporaties. De volgende vraag die Jan namens De Alliantie inzichtelijk wilde krijgen was: Hoe staan onze klanten tegenover duurzaamheid en in hoeverre zijn ze bereid hiervoor zelf financieel te investeren?
Waarom wil je dat weten? Duurzaamheidsambities realiseren doe je samen met je klanten en daarvoor heb je passende producten nodig (mass customization). Vaak geldt 70% toestemming van de huurders bij verduurzamingsproject, je wilt pilots doen in buurten die openstaan voor verduurzaming. Kortom inzicht in de houding van je klanten ten op zichte van verduurzaming is behoorlijk interessant. Rene neem ons mee!
Dat doet hij en hij vertelt ons dat Springco hiervoor een enquête heeft ingezet om data te verzamelen. Die enquête bevatte vier onderwerpen en de vraag aan de deelnemers was in hoeverre dit belangrijk voor hun was. Vervolgens kan de uitkomst gekwantificeerd worden naar een duurzaamheidsscore. Deze score kun je vervolgens linken aan andere gegevens zoals bijvoorbeeld opleiding, leefstijl, inkomen of samenstelling van het huishouden. Dat levert interessante kaartjes op. Voor Jan en zijn team leverde een grafiek waarin per complex de duurzaamheidsscore wordt weergegeven, waardevolle input voor de plannen van het komende jaar. Daarnaast gaf de grafiek met duurzaamheidsprofielen een goed inzicht in de verdeling van de huurders naar overtuigd, twijfelaars tot niet geïnteresseerd (om diverse redenen). De door Springco toegepaste text mining gaf De Alliantie diepere inzichten in de motieven van de voornoemde profielen.

Nog een interessante vraag van een van de deelnemers: Hoe meet je het effect van deze innovatieve instrumenten oftewel helpt dit (duurzaamheidsscore/profiel) ons werkelijk, zijn onze duurzaamheidsinitiatieven daadwerkelijk efficiënter?
Jan geeft aan dat ze bij De Alliantie nog niet zover zijn om de effectiviteit te meten, dat komt in een later stadium aan bod. Gert Jan legt uit dat er al wel een correlatie is tussen de duurzaamheidsscore en het gemak van het te bereiken draagvlak (70% toestemming). Dat blijkt uit een analyse van Sprinco over een groot aantal complexen van meerdere woningcorporaties. Het is achteraf gemeten en daardoor een indicatie dat het iets zegt, maar nog niet hoeveel het zegt. Jan beaamt dit, De Alliantie heeft ook een achteraf meting gedaan en ziet dezelfde correlatie.

Alles bij elkaar opgeteld en geanalyseerd kunnen we zeggen: Data science bij Springco kunnen ze er goed mee overweg en in deze KennisBite is veel kennis gedeeld zowel door Jan Theunissen als Gert jan Hagen en Rene Neijmeijer. Dank daarvoor!

Tot slot: Het begint met je data op orde hebben! In dat geval is het misschien leuk om nog eens dit interview met Maike Jansen te (her)lezen.

Tot zover, tot de volgende KennisBite. Bekijk de agenda voor de volgende sessies.