data wetenschap inzetten om optimale verpleeghuislocaties te vinden:
Geavanceerde data wetenschappelijke oplossingen - in combinatie met ervaren landmakelaars - vergroten de kans op het verwerven van verzorgingshuislocaties met een hoge bezettingsgraad.
Het kiezen van een optimale locatie voor een verpleeghuis is niet eenvoudig.
Een goede verzorgingshuislocatie moet aan honderden complexe omgevings- en locatievereisten voldoen om een duurzame bezettingsgraad te bereiken. Met gemiddelde bewonerskosten van £1.500 per week in een concurrerende markt, is er weinig ruimte voor fouten.
Traditioneel hebben grondkopers tientallen jaren van zuurverdiende ervaring, beschikbare openbare en commerciële data en inzichten van lokale agenten gebruikt om complexe beslissingen over grondinvesteringen te onderbouwen. Maar uit data op nationaal niveau blijkt dat bijna 40% van de woningen de gewenste bewoningsdrempel (meer dan 80%) niet haalt na 5 jaar exploitatie.
Mensen kunnen de enorme hoeveelheden micro- en macro-economische data van alle postcodes in Engeland & Wales niet verwerken, en dit maakt het bijna onmogelijk om de complexe correlaties en relaties die bestaan tussen de honderden datasets te identificeren. Menselijke ervaring kan ons het grootste deel van het antwoord geven, maar in combinatie met de kracht van de data wetenschap kan dit tot aanzienlijke verbeteringen leiden.
Arca Blanca werd benaderd door een grote Britse bouwer en exploitant van verzorgingshuizen om de kennis en ervaring van hun landmakelaars te combineren met onze data wetenschappelijke capaciteiten en vastgoed data platform. Door deze samenwerking bouwden we een krachtig Machine Learning model dat gebruik maakt van zowel interne data van de klant (zoals individuele prestaties van verzorgingshuizen) als van meer dan 450 externe data bronnen (demografisch, micro- en macro-economisch) over de afgelopen 30 jaar.
De Machine Learning-oplossing
1) De bezetting in de loop van de tijd analyseren
We hebben onderzocht hoe waarschijnlijk het is dat een verpleeghuis in de komende 5 jaar een bezetting van meer dan 80% bereikt, door veranderingen in de bezetting in de loop van de tijd te analyseren.
Om een robuuste prognose van de bezetting mogelijk te maken, zijn externe data zoals demografische data over rijkdom, geografie en de groene ruimte-index van het gebied essentieel en moeten deze gecombineerd worden met de interne data van het verpleeghuis. Wij hebben vastgesteld dat een maandelijkse cadans van interne bezettingsupdates het meest voordelig is, omdat dit helpt bij het identificeren en minimaliseren van seizoensinvloeden.
2) Het juiste algoritme identificeren
Voor elke tijdsperiode (in dit geval maandelijks) kunnen we het probleem bekijken als ‘categoriseren’ (“Zal de bezetting 80% zijn aan het einde van het 5e jaar? Ja of Nee”) of ‘voorspellen’: (“Welke % van de woning zal bezet zijn aan het einde van het 5e jaar?”). Daarnaast kunnen we de laatste methode gebruiken om de bezettingstrends gedurende de 5 jaar te voorspellen - een methode die de voorkeur geniet wanneer de beschikbaarheid van data beperkt is.
Om voorspellingen met een hoge nauwkeurigheid te bereiken, moet de gekozen benadering gekoppeld worden aan technieken zoals hyperparameter tuning en kruisvalidatie om de juiste parameters voor het model te identificeren om de voorspellingsnauwkeurigheid op nieuwe/onvoorziene data te maximaliseren.
3) Het model valideren
Het algoritme is getraind op meer dan 5 jaar interne en externe data - maar het moet ook getest worden op nauwkeurigheid voor data die het nog niet eerder ‘gezien’ heeft. Dit wordt gedaan door een paar locaties waarvan we de historische bezetting al kennen apart te zetten en deze door het getrainde model te laten lopen. Om dit te bereiken regresseren we het model naar de historische datum waarop de locaties operationeel werden om te zien wat het model op dat moment zou hebben voorspeld en wat er uiteindelijk werd bereikt. Het absolute verschil tussen de werkelijke bezetting en de voorspelde bezetting wordt de voorspellingsfout genoemd. Het model moet met behulp van een iteratieve aanpak worden bijgesteld om deze fout zo laag mogelijk te houden.
Dit model werd getest op een grote verscheidenheid aan locaties en heeft een gemiddelde foutmarge van slechts 9% - aanzienlijk beter dan de huidige door mensen gemaakte voorspellingen. Dit is een ongelooflijk resultaat gezien de historische variaties in data kwaliteit en beschikbaarheid.
4) Vertrouwen in het model opbouwen
Modellen voor machinaal leren bevinden zich op een spectrum tussen een hoge mate van verklaarbaarheid (white box) en een hoge mate van nauwkeurigheid (black box). Bij Arca Blanca streven we naar een middenweg tussen deze twee. Zonder verklaarbaarheid wordt de acceptatie van het model complex, omdat het met argwaan zal worden bekeken. Een gebrek aan nauwkeurigheid creëert hetzelfde probleem op een andere manier.
Bij dit project hebben we gestreefd naar een extreem hoog niveau van nauwkeurigheid, maar hebben we gezorgd voor een mate van vertrouwen in de uitvoer op basis van beschikbaarheid van data, aanwezigheid van uitschieters en algemeen vertrouwen in de uitvoer op basis van statistische intervallen. Dit wordt aangevuld door significante niveaus van lokaal data die een sterke relatie hebben met de uitkomsten. Samen geven deze een overtuigend beeld van de betrouwbaarheidsniveaus in de uitkomsten en wat deze uitkomsten kan bepalen.
Veranderende manieren van werken
Onze klant heeft het model aangenomen als een essentieel onderdeel van zijn investeringscommissies. Wij bouwden een dashboard op maat om snellere en nauwkeurigere besluitvorming tijdens bestuursvergaderingen mogelijk te maken (ter vervanging van de omslachtige huisweergave), zodat zij live scenario's kunnen uitvoeren en grote aantallen potentiële locaties kunnen afwijzen zonder dat er langdurige en kostbare onderzoeken of bezoeken ter plaatse nodig zijn. Alle mogelijkheden voor grondaankoop worden nu snel geprioriteerd; zowel de lokale data als de modeloutputs vormen een dagelijkse en essentiële ondersteuning voor het grondaankoopteam.
Belangrijk is dat de organisatie Machine Learning en het potentieel dat het biedt, heeft omarmd - niet als een bedreiging voor banen en werkwijzen, maar als een essentieel hulpmiddel om unieke voordelen te creëren in een complexe en uitdagende beleggingsmarkt.
“De complexiteit van het interpreteren van honderden variabelen om hun relatie tot succes te bepalen, benadrukt de behoefte aan AI-gestuurde modellen om menselijke besluitvorming te verbeteren.”
Beslissingsondersteuning, niet besluitvorming
Het combineren van meerdere data bronnen kan een uitgebreid inzicht geven in de verschillende factoren die de bezettingsgraad bepalen. In een specifieke use case voor een bouwer van bejaardentehuizen ontdekten we dat indicatoren van nabijgelegen zwembaden een van de top 5 factoren waren die de bezettingsgraad bepaalden - iets wat een landagent gemakkelijk over het hoofd kan zien! De complexiteit van het interpreteren van talloze demografische kenmerken, zwembaden, groenindicatoren en honderden andere variabelen om hun relatie tot succes te bepalen, benadrukt de behoefte aan AI-gestuurde modellen om menselijke besluitvorming te verbeteren.
Waar AI-modellen tekortschieten, met name in de vastgoedsector, is bij het interpreteren van irrationeel menselijk gedrag. Oudere bewoners zijn misschien bereid om grotere afstanden af te leggen voor een verzorgingstehuis als ze dichter bij vrienden of familieleden zijn, misschien verhuizen ze om een zoon of dochter te volgen die net van woonplaats is veranderd voor een nieuwe baan. Misschien hebben ze geen familie en willen ze verder naar het zuiden verhuizen voor het “betere” weer en de duidelijk superieure kwaliteit van de plaatselijke fish & chips.
Het is ook van cruciaal belang om te erkennen dat niet alle regio's van het Verenigd Koninkrijk over robuuste demografische data-verzamelingen beschikken of deze op dezelfde manier catalogiseren (Schotland is een opmerkelijk verschil). AI-modellen kunnen ook alleen variabelen analyseren waarvoor robuuste historische data van hoge kwaliteit bestaat - het kan de kwaliteit van een uitzicht vanaf een bepaalde locatie of de vriendelijkheid van de managers van de verzorgingshuizen niet meten. Het kan de kwaliteit van het eten in concurrerende verzorgingshuizen niet meten of de specifieke kwaliteiten van de tuin van een tehuis of hun activiteitenprogramma begrijpen. Daarom moeten de inherente beperkingen van deze AI-tools begrepen worden. Ze kunnen niet de enige bron van informatie zijn bij het nemen van beslissingen. Totdat mensen stoppen met het nemen van irrationele beslissingen, zullen AI ervaren landagenten (nog) niet vervangen. Ze vullen menselijke besluitvorming eerder aan dan dat ze deze vervangen.
Uiteindelijk vereist een succesvolle implementatie van modellen voor het voorspellen van de bezettingsgraad een evenwichtige aanpak die data-driven inzichten integreert met menselijke expertise en begrip. Het gebruik van hyperlokale demografische, macro-, retail-, zakelijke en vastgoed data om bezettingsgraden te voorspellen gaat veel verder dan de verzorgingshuissector en kan worden toegepast op andere activaklassen (studentenhuisvesting, kantoren, retail, I&L enz.). Marketingteams kunnen dit concept gebruiken om gerichte campagnes te plannen op basis van de bevolkingsdichtheid van specifieke locaties en om een beter inzicht te krijgen in het ideale aantal eenheden of kamers en hun optimale prijsniveaus. Door de kracht van grote data te benutten, kunnen leidinggevenden beter geïnformeerde beslissingen nemen en hun activiteiten optimaliseren.
Dit project werd uitgevoerd door een gezamenlijk team van Management Consultants, Data Wetenschappers en Technologen over een periode van 16 weken in constante samenwerking met het team van de klant. Het project bestond uit twee fasen. De eerste bestond uit het bouwen van een relatief goedkope, low commitment Proof of Concept over een periode van 4 weken om ervoor te zorgen dat er een nauwkeurig model gebouwd kon worden, terwijl de tweede fase van 12 weken bestond uit het versterken van het model met extra data bronnen en robuustere algoritmen en het bouwen van een op maat gemaakt dashboard voor interactie met gebruikers.

BLOG






