Einsatz der data-Wissenschaft, um optimale Standorte für Pflegeheime zu finden:
Die fortschrittlichen wissenschaftlichen Lösungen von data - in Kombination mit erfahrenen Grundstücksvermittlern - erhöhen die Wahrscheinlichkeit, Standorte mit hoher Auslastung für Pflegeheime zu erwerben.
Die Wahl eines optimalen Standorts für ein Pflegeheim ist nicht einfach.
Ein guter Standort für ein Pflegeheim muss Hunderte von komplexen Umwelt- und Standortanforderungen erfüllen, um eine nachhaltige Belegungsrate zu erreichen. Bei durchschnittlichen Bewohnerkosten von £1.500 pro Woche gibt es auf einem wettbewerbsintensiven Markt wenig Spielraum für Fehler.
Traditionell haben Käufer von Grundstücken jahrzehntelange, hart erarbeitete Erfahrungen, verfügbare öffentliche und kommerzielle data und Erkenntnisse von lokalen Maklern genutzt, um komplexe Investitionsentscheidungen für Grundstücke zu treffen. Aber data auf nationaler Ebene zeigt, dass fast 40% der Häuser nach 5 Jahren nicht die gewünschte Belegungsschwelle erreichen (über 80%).
Der Mensch ist nicht in der Lage, die riesigen Mengen an mikro- und makroökonomischen data zu verarbeiten, die über alle Postleitzahlen in England und Wales hinweg existieren, und das macht es fast unmöglich, die komplexen Korrelationen und Beziehungen zu erkennen, die zwischen den Hunderten von data-Sätzen bestehen. Die menschliche Erfahrung kann uns die meisten Antworten liefern, aber in Verbindung mit der Macht der data-Wissenschaft kann sie zu erheblichen Verbesserungen führen.
Arca Blanca wurde von einem großen britischen Pflegeheimbauer und -betreiber angesprochen, um das Wissen und die Erfahrung seiner Grundstücksmakler mit unseren wissenschaftlichen data-Fähigkeiten und Immobilien data platform zu verbinden. Im Rahmen dieser Zusammenarbeit haben wir ein leistungsfähiges Modell für maschinelles Lernen entwickelt, das sowohl interne data-Daten des Kunden (wie z.B. die Leistung einzelner Pflegeheime) als auch über 450 externe data-Quellen (demografische, mikro- und makroökonomische Daten) aus den letzten 30 Jahren nutzt.
Die Lösung für maschinelles Lernen
1) Analyse der Belegung im Laufe der Zeit
Wir wollten herausfinden, wie wahrscheinlich es ist, dass ein Pflegeheim innerhalb der nächsten 5 Jahre eine Belegung von mehr als 80% erreicht, indem wir die Veränderungen der Belegung im Laufe der Zeit analysierten.
Um eine solide Belegungsprognose zu ermöglichen, sind externe data wie demografische data zu Wohlstand, Geografie und dem Grünflächenindex des Gebiets unerlässlich und müssen mit den internen data des Pflegeheims kombiniert werden. Wir haben festgestellt, dass eine monatliche Aktualisierung der internen Belegungszahlen am vorteilhaftesten ist, da dies hilft, saisonal bedingte Effekte zu erkennen und zu minimieren.
2) Identifizierung des richtigen Algorithmus
Für jeden Zeitraum (in diesem Fall monatlich) können wir das Problem entweder als ‘Kategorisierung’ (“Wird die Belegung am Ende des 5. Jahres 80% betragen? Ja oder Nein”) oder als ‘Vorhersage’ betrachten: (“Welche % der Wohnungen werden am Ende des 5. Jahres belegt sein?”). Darüber hinaus können wir den letztgenannten Ansatz wählen, um die Belegungsentwicklung über die 5 Jahre hinweg vorherzusagen - eine bevorzugte Methode, wenn data nur begrenzt verfügbar ist.
Um eine hohe Vorhersagegenauigkeit zu erreichen, muss der gewählte Ansatz mit Techniken wie Hyperparameter-Tuning und Kreuzvalidierung gekoppelt werden, um die richtigen Parameter für das Modell zu ermitteln und die Vorhersagegenauigkeit bei neuen/unbekannten data zu maximieren.
3) Validierung des Modells
Der Algorithmus wurde mit internen und externen data-Daten aus über 5 Jahren trainiert. Er muss aber auch auf seine Genauigkeit bei data getestet werden, die er noch nicht ‘gesehen’ hat. Dazu legen wir einige Standorte beiseite, für die wir die historische Belegung bereits kennen, und lassen sie durch das trainierte Modell laufen. Zu diesem Zweck regressieren wir das Modell auf das historische Datum, an dem die Standorte in Betrieb genommen wurden, um zu sehen, was es zu diesem Zeitpunkt vorhergesagt hätte und was schließlich erreicht wurde. Die absolute Differenz zwischen der tatsächlichen Belegung und der vorhergesagten Belegung wird als Vorhersagefehler bezeichnet. Das Modell muss mit einem iterativen Ansatz abgestimmt werden, um diesen Fehler so gering wie möglich zu halten.
Dieses Modell wurde an einer Vielzahl von Standorten getestet und weist eine durchschnittliche Fehlerquote von nur 9% auf - deutlich besser als die derzeitigen von Menschen gemachten Vorhersagen. Dies ist ein unglaubliches Ergebnis, wenn man die historischen Schwankungen bei der Qualität und Verfügbarkeit von data bedenkt.
4) Vertrauen in das Modell aufbauen
Modelle des maschinellen Lernens bewegen sich in einem Spektrum zwischen einem hohen Grad an Erklärbarkeit (White Box) und einem hohen Grad an Genauigkeit (Black Box). Bei Arca Blanca bemühen wir uns um einen goldenen Mittelweg zwischen diesen beiden Möglichkeiten. Ohne Erklärbarkeit wird die Annahme des Modells schwierig, da es mit Misstrauen behandelt wird. Ein Mangel an Genauigkeit schafft das gleiche Problem auf eine andere Art und Weise.
Bei diesem Projekt haben wir ein extrem hohes Maß an Genauigkeit angestrebt, aber auch einen Grad an Vertrauen in die Ergebnisse auf der Grundlage der Verfügbarkeit von data, des Vorhandenseins von Ausreißern und des allgemeinen Vertrauens in die Ergebnisse auf der Grundlage von statistischen Intervallen angegeben. Ergänzt wird dies durch signifikante Werte von lokalem data, die eine starke Beziehung zu den Ergebnissen haben. Zusammen ergibt sich ein überzeugendes Bild des Vertrauens in die Ergebnisse und der möglichen Ursachen für diese Ergebnisse.
Veränderte Arbeitsweisen
Unser Kunde hat das Modell als wichtigen Bestandteil seiner Investitionsausschüsse übernommen. Wir haben ein maßgeschneidertes Dashboard entwickelt, das eine schnellere und präzisere Entscheidungsfindung in den Vorstandssitzungen ermöglicht (und die umständliche Hausansicht ersetzt), so dass sie Live-Szenarien durchführen und eine große Anzahl potenzieller Standorte ablehnen können, ohne dass langwierige und kostspielige Untersuchungen oder Standortbesichtigungen erforderlich sind. Alle Möglichkeiten zum Landerwerb werden nun schnell priorisiert. Das lokale data sowie die Ergebnisse des Modells sind eine tägliche und wichtige Unterstützung für das Landerwerbsteam.
Wichtig ist, dass das Unternehmen das maschinelle Lernen und das Potenzial, das es bietet, angenommen hat - nicht als Bedrohung für Arbeitsplätze und Arbeitsweisen, sondern als wesentliches Werkzeug, um einzigartige Vorteile in einem komplexen und anspruchsvollen Investmentmarkt zu schaffen.
“Die Komplexität der Interpretation von Hunderten von Variablen, um ihre Beziehung zum Erfolg zu definieren, unterstreicht den Bedarf an KI-gesteuerten Modellen zur Verbesserung der menschlichen Entscheidungsfindung.”
Entscheidungshilfe, nicht Entscheidungsfindung
Die Kombination mehrerer data-Quellen kann ein umfassendes Verständnis der verschiedenen Faktoren bieten, die die Belegungsrate beeinflussen. In einem speziellen Anwendungsfall für einen Anbieter von Seniorenwohnungen fanden wir heraus, dass Indikatoren für nahegelegene Schwimmbäder zu den 5 wichtigsten Faktoren für die Belegung gehörten - etwas, das ein Makler leicht übersehen kann! Die Komplexität der Interpretation zahlreicher demografischer Merkmale, Schwimmbäder, Grünflächenindikatoren und Hunderter anderer Variablen, um deren Beziehung zum Erfolg zu definieren, verdeutlicht den Bedarf an KI-gesteuerten Modellen zur Verbesserung der menschlichen Entscheidungsfindung.
Wo KI-Modelle, insbesondere im Immobiliensektor, versagen, ist bei der Interpretation irrationaler menschlicher Verhaltensweisen. Ältere Menschen sind vielleicht bereit, für ein Pflegeheim in größere Entfernungen zu fahren, wenn sie näher bei Freunden oder Verwandten sind. Vielleicht ziehen sie auch um, um einem Sohn oder einer Tochter zu folgen, die gerade für einen neuen Job den Wohnort gewechselt haben. Vielleicht haben sie keine Verwandten und wollen wegen des “besseren” Wetters und der eindeutig besseren Qualität der örtlichen Fish & Chips weiter in den Süden ziehen.
Es ist auch von entscheidender Bedeutung, dass nicht alle Regionen des Vereinigten Königreichs über robuste demografische data verfügen oder diese auf dieselbe Weise katalogisieren (Schottland ist ein bemerkenswerter Unterschied). KI-Modelle können auch nur Variablen analysieren, für die robuste, qualitativ hochwertige historische data existieren - sie können nicht die Qualität der Aussicht von einem bestimmten Standort oder die Freundlichkeit der Pflegeheimleiter messen. Es kann nicht die Qualität des Essens in konkurrierenden Pflegeheimen messen oder die besonderen Qualitäten des Gartens eines Heims oder den Zeitplan seiner Aktivitäten verstehen. Die inhärenten Grenzen dieser KI-Tools müssen also verstanden werden. Sie können nicht die einzige Informationsquelle für die Entscheidungsfindung sein. Solange der Mensch nicht aufhört, irrationale Entscheidungen zu treffen, wird die KI (noch) nicht an die Stelle erfahrener Makler treten. Sie ergänzen die menschliche Entscheidungsfindung, anstatt sie zu ersetzen.
Letztendlich erfordert die erfolgreiche Implementierung von Belegungsvorhersagemodellen einen ausgewogenen Ansatz, der data-driven Erkenntnisse mit menschlichem Fachwissen und Verständnis verbindet. Die Nutzung hyperlokaler demografischer, makroökonomischer, einzelhandels-, geschäfts- und immobilienbezogener data-Daten zur Vorhersage der Belegung geht weit über die Pflegeheimbranche hinaus und kann auch auf andere Anlageklassen (Studentenwohnheime, Büros, Einzelhandel, I&L usw.) angewendet werden. Marketingteams können dieses Konzept nutzen, um gezielte Kampagnen auf der Grundlage der Bevölkerungsdichte an bestimmten Standorten zu planen und die ideale Anzahl von Einheiten oder Zimmern und deren optimale Preisgestaltung besser zu verstehen. Indem sie sich die Möglichkeiten des großen data zunutze machen, können Führungskräfte besser informierte Entscheidungen treffen und den Betrieb optimieren.
Dieses Projekt wurde von einem gemeinsamen Team aus Unternehmensberatern, Wissenschaftlern und Technologen von Data über einen Zeitraum von 16 Wochen in ständiger Zusammenarbeit mit dem Kundenteam durchgeführt. Das Projekt wurde in zwei Phasen durchgeführt. Die erste bestand darin, über einen Zeitraum von 4 Wochen einen relativ kostengünstigen und unverbindlichen Proof of Concept zu erstellen, um sicherzustellen, dass ein genaues Modell erstellt werden konnte, während die zweite Phase von 12 Wochen darin bestand, das Modell mit zusätzlichen data-Quellen und robusteren Algorithmen zu stärken und ein maßgeschneidertes Dashboard zu erstellen, mit dem die Benutzer interagieren können.

BLOG






