Utilisation de data pour déterminer les emplacements optimaux des maisons de retraite :
Des solutions avancées data , associées à l'expertise d'agents immobiliers chevronnés, augmentent les chances d'acquérir des terrains destinés à des maisons de retraite affichant un taux d'occupation élevé.
Il n'est pas facile de choisir un emplacement idéal pour une maison de retraite.
Pour garantir un taux d'occupation durable, un établissement d'hébergement pour personnes âgées de qualité doit répondre à des centaines d'exigences complexes en matière d'environnement et d'emplacement. Avec un coût moyen de 1 500 £ par semaine et par résident sur un marché concurrentiel, la marge d'erreur est minime.
Traditionnellement, les acquéreurs fonciers s'appuient sur des décennies d'expérience durement acquise, sur data publiques et commerciales disponibles data sur les conseils d'agents immobiliers locaux pour prendre des décisions complexes en matière d'investissement foncier. Or, data nationales data près de 40 % des logements n'atteignent pas les taux d'occupation souhaités (supérieurs à 80 %) après cinq ans d'exploitation.
Les êtres humains ne sont pas en mesure de traiter les énormes quantités de data micro- et macroéconomiques data pour l'ensemble des codes postaux d'Angleterre et du Pays de Galles, ce qui rend pratiquement impossible l'identification des corrélations et des relations complexes qui existent entre ces centaines d'ensembles de données. L'expérience humaine peut nous fournir la plupart des réponses, mais associée à la puissance de data , elle peut déboucher sur des améliorations significatives.
Arca Blanca a été sollicitée par un important promoteur et exploitant britannique de maisons de retraite afin de combiner l'expertise et l'expérience de ses agents immobiliers avec nos compétences data et data immobilières. Dans le cadre de cette collaboration, nous avons développé un modèle d'apprentissage automatique performant qui exploite à la fois data internes du client data telles que les performances individuelles des maisons de retraite) et plus de 450 data externes (démographiques, micro- et macroéconomiques) couvrant les 30 dernières années.
La solution d'apprentissage automatique
1) Analyse de l'occupation au fil du temps
Nous avons cherché à déterminer la probabilité qu'une maison de retraite atteigne un taux d'occupation supérieur à 80 % au cours des cinq prochaines années, en analysant l'évolution de ce taux au fil du temps.
Pour établir des prévisions d'occupation fiables, il est indispensable de disposer de data externes, data que data démographiques data le niveau de richesse, la géographie et l'indice d'espaces verts de la région, qui doivent être combinées avec data internes de l'établissement d'hébergement pour personnes âgées. Nous avons constaté qu'une mise à jour mensuelle des données internes sur l'occupation était la plus efficace, car cela permet d'identifier et de minimiser les effets liés à la saisonnalité.
2) Choisir le bon algorithme
Pour chaque période (mensuelle dans le cas présent), nous pouvons aborder le problème soit sous l'angle de la « catégorisation » (« Le taux d'occupation sera-t-il de 80 % à la fin de la 5e année ? Oui ou non »), soit sous l'angle de la « prévision » (« Quel pourcentage du logement sera occupé à la fin de la 5e année ? »). De plus, nous pouvons adopter cette dernière approche pour prévoir les tendances d'occupation sur l'ensemble des cinq années – une méthode privilégiée lorsque data sont limitées.
Pour obtenir des prévisions d'une grande précision, l'approche choisie doit être associée à des techniques telles que le réglage des hyperparamètres et la validation croisée, afin d'identifier les paramètres appropriés pour le modèle et d'optimiser ainsi la précision des prévisions sur data nouvelles ou non observées.
3) Validation du modèle
L'algorithme est entraîné sur plus de cinq ans de data internes et externes data mais sa précision doit également être testée sur data n'a jamais « vues » auparavant. Pour ce faire, nous sélectionnons quelques sites dont nous connaissons déjà l'historique d'occupation et les soumettons au modèle entraîné. Nous procédons alors à une régression du modèle sur la date historique à laquelle ces sites sont entrés en service, afin de comparer ses prévisions à ce moment-là avec les résultats réels. La différence absolue entre le taux d'occupation réel et le taux d'occupation prévu est appelée « erreur de prédiction ». Le modèle doit être ajusté à l'aide d'une approche itérative afin de maintenir cette erreur aussi faible que possible.
Ce modèle a été testé sur un large éventail de sites et affiche un taux d'erreur moyen de seulement 9 %, ce qui est nettement supérieur aux prévisions actuelles établies par des humains. Il s'agit là d'un résultat remarquable, compte tenu des variations historiques observées en matière de data et de disponibilité data .
4) Renforcer la confiance dans le modèle
Les modèles d'apprentissage automatique se situent sur un spectre allant d'un haut degré d'explicabilité (boîte blanche) à un haut niveau de précision (boîte noire). Chez Arca Blanca, nous nous efforçons de trouver un juste milieu entre ces deux extrêmes. Sans aucune explicabilité, l'adoption du modèle devient complexe, car celui-ci sera considéré avec méfiance. Un manque de précision pose le même problème, mais d'une manière différente.
Dans le cadre de ce projet, nous avons cherché à atteindre un niveau de précision extrêmement élevé, tout en indiquant des degrés de confiance pour les résultats en fonction de la disponibilité des data, de la présence de valeurs aberrantes et de la fiabilité générale des résultats sur la base d'intervalles statistiques. Ces informations sont complétées par un volume important de data locales étroitement data aux résultats. Ensemble, ces éléments brossent un tableau clair des niveaux de confiance associés aux résultats et des facteurs susceptibles de les influencer.
L'évolution des méthodes de travail
Notre client a intégré ce modèle comme un élément clé de ses comités d'investissement. Nous avons développé un tableau de bord sur mesure afin de permettre une prise de décision plus rapide et plus précise lors des réunions du conseil d'administration (en remplacement de la « vision interne » trop lourde), ce qui leur permet de simuler des scénarios en temps réel et d'écarter un grand nombre de sites potentiels sans avoir à mener des études ou des visites sur place longues et coûteuses. Toutes les opportunités d'acquisition foncière sont désormais rapidement classées par ordre de priorité ; les data locales data que les résultats du modèle constituent un soutien quotidien et indispensable pour l'équipe chargée de l'acquisition foncière.
Il est important de noter que l'organisation a su tirer parti de l'apprentissage automatique et du potentiel qu'il offre, non pas comme une menace pour l'emploi et les méthodes de travail, mais comme un outil essentiel pour se forger des avantages concurrentiels sur un marché de l'investissement complexe et exigeant.
« La complexité liée à l'interprétation de centaines de variables pour déterminer leur incidence sur la réussite met en évidence la nécessité de recourir à des modèles basés sur l'intelligence artificielle afin d'améliorer la prise de décision humaine. »
Aide à la décision, et non prise de décision
La combinaison data plusieurs data permet d'acquérir une compréhension globale des différents facteurs qui influencent les taux d'occupation. Dans le cas concret d'un promoteur immobilier spécialisé dans les maisons de retraite, nous avons constaté que la présence de piscines à proximité figurait parmi les cinq principaux facteurs déterminants du taux d'occupation – un élément qu'un agent immobilier peut facilement négliger ! La complexité liée à l'interprétation de nombreuses caractéristiques démographiques, de la présence de piscines, des indicateurs d'espaces verts et de centaines d'autres variables afin de définir leur lien avec la réussite souligne la nécessité de recourir à des modèles basés sur l'IA pour améliorer la prise de décision humaine.
Là où les modèles d'IA pèchent, notamment dans le secteur immobilier, c'est dans l'interprétation des comportements humains irrationnels. Des personnes âgées pourraient être prêtes à parcourir de plus longues distances pour rejoindre une maison de retraite si celle-ci se trouve plus près de leurs amis ou de leurs proches ; peut-être déménageront-elles pour suivre un fils ou une fille qui vient de changer de région pour un nouvel emploi. Peut-être n'ont-elles pas de famille et souhaitent-elles s'installer plus au sud pour profiter d'un « meilleur » climat et de la qualité nettement supérieure du fish & chips local.
Il est également essentiel de reconnaître que toutes les régions du Royaume-Uni ne disposent pas data démographiques fiables ni data les répertorient de la même manière (l'Écosse constituant une exception notable). De plus, les modèles d'IA ne peuvent analyser que les variables pour lesquelles data historiques fiables et de qualité ; ils ne peuvent pas évaluer la qualité de la vue depuis un site particulier ni l'amabilité des responsables des maisons de retraite. Ils ne peuvent pas évaluer la qualité de la nourriture dans les maisons de retraite concurrentes ni apprécier les qualités particulières du jardin d'un établissement ou de son programme d'activités. Il faut donc bien comprendre les limites inhérentes à ces outils d'IA. Ils ne peuvent pas constituer la seule source d'information dans la prise de décision. Tant que les humains continueront à prendre des décisions irrationnelles, l'IA ne remplacera pas (encore) les agents immobiliers expérimentés. Elle complète la prise de décision humaine plutôt que de la remplacer.
En fin de compte, la mise en œuvre réussie de modèles de prévision du taux d'occupation nécessite une approche équilibrée qui allie les informations data à l'expertise et à la compréhension humaines. L'utilisation de data hyperlocales (démographiques, macroéconomiques, commerciales, d'affaires et immobilières) data prévoir les taux d'occupation dépasse largement le secteur des maisons de retraite et peut s'appliquer à d'autres catégories d'actifs (logements étudiants, bureaux, commerces, industries et loisirs, etc.). Les équipes marketing peuvent tirer parti de ce concept pour planifier des campagnes ciblées en fonction de la densité de population de lieux spécifiques, ainsi que pour mieux comprendre le nombre idéal d'unités ou de chambres et leurs niveaux de prix optimaux. En exploitant la puissance du big data, les dirigeants peuvent prendre des décisions mieux informées et optimiser leurs opérations.
Ce projet a été mené par une équipe interdisciplinaire composée de consultants en gestion, de Data et de technologues, sur une période de 16 semaines, en collaboration étroite avec l'équipe du client. Le projet s'est déroulé en deux phases. La première consistait à élaborer une preuve de concept à faible coût et sans engagement sur une période de 4 semaines afin de s'assurer qu'un modèle précis pouvait être construit, tandis que la deuxième phase, d'une durée de 12 semaines, consistait à renforcer le modèle à l'aide de data supplémentaires et d'algorithmes plus robustes, ainsi qu'à créer un tableau de bord sur mesure permettant aux utilisateurs d'interagir avec le système.

BLOG






