Wohin mit der Pflege: data Wissenschaft zur Ermittlung optimaler Pflegeheimstandorte

Autor

Christopher de Gruben

Senior Data Beratungsleiter Artefact UK

Einsatz der data Wissenschaft, um optimale Standorte für Pflegeheime zu finden:

Die fortschrittlichen wissenschaftlichen Lösungen von data - kombiniert mit erfahrenen Grundstücksvermittlern - erhöhen die Wahrscheinlichkeit, Standorte für Pflegeheime mit hoher Auslastung zu erwerben.

Die Wahl eines optimalen Standorts für ein Pflegeheim ist nicht einfach.

Hat sie die richtige demografische Zusammensetzung der Bevölkerung?
Gibt es ausreichende Verkehrsverbindungen?
Genug grüne und blaue Flächen?
Ist die Wohndichte angemessen?
Wie weit werden Einwohner und Besucher reisen?
Ist die Luftverschmutzung zu hoch?
Ist der wesentliche Einzelhandel zu Fuß erreichbar?

Ein guter Standort für ein Pflegeheim muss Hunderte von komplexen Umwelt- und Standortanforderungen erfüllen, um eine nachhaltige Belegungsrate zu erreichen. Bei durchschnittlichen Bewohnerkosten von 1.500 Pfund pro Woche ist auf einem wettbewerbsintensiven Markt wenig Spielraum für Fehler vorhanden.

Traditionell nutzen Grundstückskäufer ihre jahrzehntelange Erfahrung, die verfügbaren öffentlichen und kommerziellen data und die Erkenntnisse lokaler Makler, um komplexe Investitionsentscheidungen für Grundstücke zu treffen. Auf nationaler Ebene data zeigt sich jedoch, dass fast 40 % der Heime nach 5 Betriebsjahren nicht die gewünschte Auslastung (über 80 %) erreichen.

Menschen können die riesigen Mengen an mikro- und makroökonomischen Daten data über alle Postleitzahlen in England und Wales nicht verarbeiten, was es nahezu unmöglich macht, die komplexen Korrelationen und Beziehungen zu erkennen, die zwischen den Hunderten von Datensätzen bestehen. Menschliche Erfahrung kann uns den größten Teil der Antworten liefern, aber in Verbindung mit der Leistung der Wissenschaft data kann sie zu erheblichen Verbesserungen führen.

Arca Blanca wurde von einem großen britischen Pflegeheimbauer und -betreiber angesprochen, um das Wissen und die Erfahrung seiner Grundstücksmakler mit unseren data wissenschaftlichen Fähigkeiten und unserer data Plattform für Immobilien zu verbinden. Im Rahmen dieser Zusammenarbeit haben wir ein leistungsfähiges Modell für maschinelles Lernen entwickelt, das sowohl interne data (z. B. die Leistung einzelner Pflegeheime) als auch über 450 externe data Quellen (demografische, mikro- und makroökonomische) aus den letzten 30 Jahren nutzt.

Die Lösung für maschinelles Lernen

1) Analyse der Belegung im Zeitverlauf

Wir wollten herausfinden, wie hoch die Wahrscheinlichkeit ist, dass ein Pflegeheim in den nächsten 5 Jahren eine Auslastung von über 80 % erreicht, indem wir die Veränderungen in der Auslastung im Laufe der Zeit analysierten.

Um eine zuverlässige Belegungsprognose zu ermöglichen, sind externe data wie die demografische data über Wohlstand, Geografie und den Grünflächenindex des Gebiets unerlässlich und müssen mit dem internen data des Pflegeheims kombiniert werden. Wir haben festgestellt, dass eine monatliche Aktualisierung der internen Belegungszahlen am vorteilhaftesten ist, da dies hilft, saisonbedingte Effekte zu erkennen und zu minimieren.

2) Identifizierung des richtigen Algorithmus

Für jeden Zeitraum (in diesem Fall monatlich) können wir das Problem entweder als "Kategorisierung" ("Wird die Belegung am Ende des fünften Jahres 80 % betragen? Ja oder Nein") oder als "Vorhersage" betrachten: ("Wie viel % der Wohnung wird am Ende des fünften Jahres belegt sein?"). Darüber hinaus können wir den letztgenannten Ansatz wählen, um die Belegungsentwicklung über den gesamten Zeitraum von 5 Jahren vorherzusagen - eine bevorzugte Methode, wenn data nur begrenzt verfügbar ist.

Um eine hohe Vorhersagegenauigkeit zu erreichen, muss der gewählte Ansatz mit Techniken wie Hyperparameter-Tuning und Kreuzvalidierung gekoppelt werden, um die richtigen Parameter für das Modell zu ermitteln und die Vorhersagegenauigkeit bei neuen/unbekannten data zu maximieren.

3) Validierung des Modells

Der Algorithmus wurde anhand interner und externer Daten aus über 5 Jahren data trainiert, muss aber auch auf seine Genauigkeit bei data getestet werden, die er noch nicht "gesehen" hat. Dies geschieht, indem wir einige Standorte, für die wir die historische Belegung bereits kennen, beiseite legen und sie durch das trainierte Modell laufen lassen. Dazu regressieren wir das Modell auf das historische Datum, an dem die Standorte in Betrieb genommen wurden, um zu sehen, was es zu diesem Zeitpunkt vorhergesagt hätte und was schließlich erreicht wurde. Die absolute Differenz zwischen der tatsächlichen Belegung und der vorhergesagten Belegung wird als Vorhersagefehler bezeichnet. Das Modell muss in einem iterativen Ansatz angepasst werden, um diesen Fehler so gering wie möglich zu halten.

Dieses Modell wurde an einer Vielzahl von Standorten getestet und weist eine durchschnittliche Fehlerquote von nur 9 % auf - deutlich besser als die derzeitigen von Menschen gemachten Vorhersagen. Angesichts der historischen Schwankungen bei der Qualität und Verfügbarkeit von data ist dies ein unglaubliches Ergebnis.

4) Vertrauen in das Modell aufbauen

Modelle des maschinellen Lernens bewegen sich in einem Spektrum zwischen einem hohen Grad an Erklärbarkeit (White Box) und einem hohen Grad an Genauigkeit (Black Box). Bei Arca Blanca bemühen wir uns um einen goldenen Mittelweg zwischen diesen beiden. Ohne jegliche Erklärbarkeit wird die Übernahme des Modells schwierig, da es mit Misstrauen behandelt wird. Ein Mangel an Genauigkeit schafft das gleiche Problem auf eine andere Art und Weise.

Bei diesem Projekt strebten wir ein extrem hohes Maß an Genauigkeit an, gaben aber auch einen gewissen Grad an Vertrauen in die Ergebnisse auf der Grundlage der Verfügbarkeit von data, des Vorhandenseins von Ausreißern und des allgemeinen Vertrauens in die Ergebnisse auf der Grundlage statistischer Intervalle. Ergänzt wird dies durch ein beträchtliches Maß an lokaler data , die einen starken Bezug zu den Ergebnissen hat. Zusammen ergibt sich ein überzeugendes Bild des Vertrauens in die Ergebnisse und der möglichen Ursachen für diese Ergebnisse.

Veränderte Arbeitsweisen

Unser Kunde hat das Modell als wichtigen Bestandteil seiner Investitionsausschüsse eingeführt. Wir haben ein maßgeschneidertes Dashboard entwickelt, das eine schnellere und präzisere Entscheidungsfindung in Vorstandssitzungen ermöglicht (und die umständliche Hausansicht ersetzt), so dass sie Live-Szenarien durchführen und eine große Anzahl potenzieller Standorte ablehnen können, ohne dass langwierige und kostspielige Untersuchungen oder Ortsbesichtigungen erforderlich sind. Alle Landerwerbsmöglichkeiten werden nun schnell nach Prioritäten geordnet; die lokale data sowie die Modellergebnisse sind eine tägliche und wichtige Unterstützung für das Landerwerbsteam.

Wichtig ist, dass die Organisation das maschinelle Lernen und das Potenzial, das es bietet, angenommen hat - nicht als Bedrohung für Arbeitsplätze und Arbeitsweisen, sondern als unverzichtbares Instrument zur Schaffung einzigartiger Vorteile in einem komplexen und anspruchsvollen Investmentmarkt.

"Die Komplexität der Interpretation von Hunderten von Variablen, um ihre Beziehungen zum Erfolg zu definieren, unterstreicht den Bedarf an AI-gesteuerten Modellen, um die menschliche Entscheidungsfindung zu verbessern."

Entscheidungshilfe, nicht Entscheidungsfindung

Die Kombination mehrerer data Quellen kann ein umfassendes Verständnis für die verschiedenen Faktoren bieten, die die Belegungsrate beeinflussen. In einem speziellen Anwendungsfall für einen Anbieter von Seniorenwohnungen fanden wir heraus, dass Indikatoren für nahe gelegene Schwimmbäder zu den 5 wichtigsten Faktoren für die Belegung gehörten - etwas, das ein Makler leicht übersehen kann! Die Komplexität der Interpretation zahlreicher demografischer Merkmale, Schwimmbäder, Grünindikatoren und Hunderter anderer Variablen, um deren Beziehung zum Erfolg zu definieren, verdeutlicht den Bedarf an AI-gesteuerten Modellen zur Verbesserung der menschlichen Entscheidungsfindung.

Wo AI Modelle versagen, insbesondere im Immobiliensektor, ist bei der Interpretation irrationaler menschlicher Verhaltensweisen. Ältere Menschen sind vielleicht bereit, für ein Pflegeheim in größere Entfernungen zu ziehen, wenn sie näher bei Freunden oder Verwandten wohnen, oder sie folgen ihrem Sohn oder ihrer Tochter, die gerade wegen eines neuen Arbeitsplatzes den Wohnort gewechselt haben. Vielleicht haben sie keine Verwandten und wollen wegen des "besseren" Wetters und der eindeutig besseren Qualität der örtlichen Fish & Chips weiter in den Süden ziehen.

Es ist auch von entscheidender Bedeutung, dass nicht alle Regionen des Vereinigten Königreichs über eine solide demografische data Sammlung verfügen oder diese auf die gleiche Weise katalogisieren (Schottland ist ein bemerkenswerter Unterschied). AI Modelle können auch nur Variablen analysieren, für die solide, qualitativ hochwertige historische data existieren - sie können nicht die Qualität der Aussicht von einem bestimmten Standort oder die Freundlichkeit der Pflegeheimleiter messen. Es kann nicht die Qualität des Essens in konkurrierenden Pflegeheimen messen oder die besonderen Qualitäten des Gartens eines Heims oder den Zeitplan der Aktivitäten verstehen. Daher müssen die inhärenten Grenzen dieser AI Instrumente verstanden werden. Sie können nicht die einzige Informationsquelle für die Entscheidungsfindung sein. Solange Menschen nicht aufhören, irrationale Entscheidungen zu treffen, wird AI (noch) nicht an die Stelle erfahrener Landwirte treten. Sie ergänzen die menschliche Entscheidungsfindung und ersetzen sie nicht.

Letztendlich erfordert die erfolgreiche Implementierung von Belegungsprognosemodellen einen ausgewogenen Ansatz, der data Erkenntnisse mit menschlichem Fachwissen und Verständnis verbindet. Die Nutzung von hyperlokalen demografischen, makroökonomischen, Einzelhandels-, Geschäfts- und data zur Vorhersage von Belegungsraten geht weit über die Pflegeheimbranche hinaus und kann auch auf andere Anlageklassen (Studentenwohnheime, Büros, Einzelhandel, I&L usw.) angewendet werden. Marketingteams können dieses Konzept nutzen, um gezielte Kampagnen auf der Grundlage der Bevölkerungsdichte an bestimmten Standorten zu planen und die ideale Anzahl von Einheiten oder Zimmern und deren optimale Preisgestaltung besser zu verstehen. Durch die Nutzung umfangreicher data können Führungskräfte fundiertere Entscheidungen treffen und den Betrieb optimieren.

Dieses Projekt wurde von einem gemeinsamen Team aus Unternehmensberatern, Data Wissenschaftlern und Technologen über einen Zeitraum von 16 Wochen in ständiger Zusammenarbeit mit dem Kundenteam durchgeführt. Das Projekt wurde in zwei Phasen durchgeführt. In der ersten Phase wurde über einen Zeitraum von 4 Wochen ein relativ kostengünstiger und unverbindlicher Konzeptnachweis erstellt, um sicherzustellen, dass ein genaues Modell erstellt werden konnte. Die zweite Phase von 12 Wochen bestand darin, das Modell mit zusätzlichen data Quellen und robusteren Algorithmen zu stärken und ein maßgeschneidertes Dashboard zu erstellen, mit dem die Benutzer interagieren können.

Kontakt