Where to care: deploying data science to find optimal care home locations

Autor

Christopher de Gruben

Director senior de consultoría Data Artefact Reino Unido

Despliegue de la ciencia data para encontrar ubicaciones óptimas para las residencias de ancianos:

Las soluciones científicas avanzadas data, combinadas con agentes de la propiedad experimentados, aumentan la probabilidad de adquirir emplazamientos para residencias geriátricas de alta ocupación.

Elegir un emplazamiento óptimo para una residencia de ancianos no es fácil.

¿Tiene la demografía de población adecuada?
¿Hay suficientes conexiones de transporte?
¿Suficientes espacios verdes y azules?
¿Es adecuada la densidad de viviendas?
¿Hasta dónde se desplazarán los residentes y los visitantes?
¿Son demasiado altos los niveles de contaminación atmosférica?
¿Es accesible a pie el comercio minorista esencial?

Un buen emplazamiento para una residencia de ancianos debe cumplir cientos de complejos requisitos medioambientales y de ubicación para lograr una tasa de ocupación sostenible. Con un coste medio para el residente de 1.500 libras semanales en un mercado competitivo, hay poco margen para el error.

Tradicionalmente, los compradores de suelo han utilizado décadas de experiencia adquirida con esfuerzo, el data público y comercial disponible y las opiniones de los agentes locales para fundamentar las complejas decisiones de inversión en suelo. Pero la data a nivel nacional muestra que casi 40% de las viviendas no alcanzan los umbrales de ocupación deseados (más de 80%) tras 5 años de funcionamiento.

Los seres humanos no pueden procesar las enormes cantidades de data microeconómicos y macroeconómicos existentes en todos los códigos postales de Inglaterra y Gales, y esto hace casi imposible identificar las complejas correlaciones y relaciones que existen entre los cientos de data. La experiencia humana puede darnos la mayor parte de la respuesta, pero unida al poder de la ciencia data puede conducir a mejoras significativas.

Arca Blanca fue contactada por un gran constructor y operador de residencias geriátricas del Reino Unido para aunar los conocimientos y la experiencia de sus agentes inmobiliarios con nuestras capacidades científicas data y data platform inmobiliario. Gracias a esta colaboración, construimos un potente modelo de aprendizaje automático que aprovecha tanto la data interna del cliente (como el rendimiento individual de las residencias geriátricas) como más de 450 fuentes externas de data (demográficas, microeconómicas y macroeconómicas) que abarcan los últimos 30 años.

La solución del aprendizaje automático

1) Analizar la ocupación a lo largo del tiempo

Nos propusimos averiguar la probabilidad de que una residencia lograra una ocupación superior a 80% en los próximos 5 años analizando los cambios en la ocupación a lo largo del tiempo.

Para hacer posible una previsión sólida de la ocupación, es esencial disponer de data externas como las demográficas sobre riqueza, geografía e índice de espacios verdes de la zona, que deben combinarse con las data internas de la residencia. Identificamos una cadencia mensual de actualización de la ocupación interna como la más beneficiosa, ya que ayuda a identificar y minimizar los efectos causados por la estacionalidad.

2) Identificar el algoritmo adecuado

Para cada periodo de tiempo (mensual en este caso), podemos considerar el problema como de ‘categorización’ (“¿La ocupación será 80% al final del 5º año? Sí o No”) o de ‘predicción’: (“¿Qué % de la vivienda estará ocupada al final del 5º año?”). Además, podemos adoptar este último enfoque para predecir las tendencias de ocupación a lo largo de los 5 años, un método preferido cuando la disponibilidad de data es limitada.

Para lograr predicciones de gran precisión, el enfoque elegido debe combinarse con técnicas como el ajuste de hiperparámetros y la validación cruzada para identificar los parámetros adecuados para que el modelo maximice la precisión de la predicción en data nuevos/no vistos.

3) Validación del modelo

El algoritmo se ha entrenado con más de 5 años de data interna y externa, pero también hay que probar su precisión con data que no haya ‘visto’ antes. Esto se hace apartando unos cuantos sitios de los que ya conocemos la ocupación histórica y pasándolos por el modelo entrenado. Para ello, realizamos una regresión del modelo a la fecha histórica en que los emplazamientos entraron en funcionamiento para ver qué habría predicho en ese momento y qué se consiguió finalmente. La diferencia absoluta entre la ocupación real y la prevista se denomina error de predicción. El modelo debe ajustarse mediante un enfoque iterativo para mantener este error lo más bajo posible.

Este modelo se probó en una amplia variedad de yacimientos y presenta una tasa de error media de sólo 9%, significativamente mejor que las predicciones actuales realizadas por el hombre. Se trata de un resultado increíble dadas las variaciones históricas en la calidad y disponibilidad de data.

4) Crear confianza en el modelo

Los modelos de aprendizaje automático existen en un espectro entre altos grados de explicabilidad (caja blanca) y altos niveles de precisión (caja negra). En Arca Blanca nos esforzamos por alcanzar un término medio entre ambos. Sin ningún grado de explicabilidad, la adopción del modelo se vuelve compleja, ya que será tratado con recelo. La falta de precisión crea el mismo problema de una forma diferente.

En este proyecto nos esforzamos por alcanzar un nivel de precisión extremadamente alto, pero proporcionamos grados de confianza en los resultados basados en la disponibilidad de data, la presencia de valores atípicos y la confianza general en los resultados basada en intervalos estadísticos. Esto se complementa con niveles significativos de data local que tienen una fuerte relación con los resultados. En conjunto, todo ello dibuja una imagen convincente de los niveles de confianza en los resultados y de lo que puede impulsar estos resultados.

Cambiar la forma de trabajar

Nuestro cliente ha adoptado el modelo como componente fundamental de sus comités de inversión. Construimos un cuadro de mandos a medida para permitir una toma de decisiones más rápida y precisa en las reuniones de la junta directiva (en sustitución de la engorrosa vista de la casa), de modo que puedan ejecutar escenarios en vivo y descartar un gran número de emplazamientos potenciales sin necesidad de largas y costosas investigaciones o visitas a los emplazamientos. Ahora se priorizan rápidamente todas las oportunidades de adquisición de terrenos; tanto el data local como los resultados del modelo constituyen un apoyo diario y esencial para el equipo de adquisición de terrenos.

Es importante destacar que la organización ha adoptado el aprendizaje automático y el potencial que ofrece, no como una amenaza para los puestos de trabajo y las formas de trabajar, sino como una herramienta esencial para crear ventajas únicas en un mercado de inversión complejo y desafiante.

“La complejidad de interpretar cientos de variables para definir sus relaciones con el éxito pone de relieve la necesidad de modelos impulsados por la IA para mejorar la toma de decisiones humana”.”

Apoyo a la decisión, no toma de decisiones

La combinación de múltiples fuentes data puede ofrecer una comprensión exhaustiva de los diversos factores que impulsan las tasas de ocupación. En un caso de uso particular para un constructor de residencias de ancianos, descubrimos que los indicadores de piscinas cercanas eran uno de los 5 principales factores impulsores de la ocupación, ¡algo que un agente inmobiliario puede pasar por alto fácilmente! La complejidad de interpretar numerosas características demográficas, piscinas, indicadores de verdor y cientos de otras variables para definir sus relaciones con el éxito pone de relieve la necesidad de modelos impulsados por la IA para mejorar la toma de decisiones humana.

Donde los modelos de IA se quedan cortos, en particular en el sector inmobiliario, es en la interpretación de los comportamientos humanos irracionales. Los ancianos pueden estar dispuestos a recorrer distancias mayores para ir a residencias si están más cerca de amigos o parientes, quizá se muden para seguir a un hijo o una hija que acaba de cambiar de geografía por un nuevo trabajo. Tal vez no tengan parientes y quieran mudarse más al sur por el “mejor” clima y la calidad claramente superior del fish & chips local.

También es crucial reconocer que no todas las regiones del Reino Unido disponen de una sólida recopilación de datos demográficos data ni los catalogan de la misma manera (Escocia es una diferencia notable). Asimismo, los modelos de IA sólo pueden analizar variables para las que existe data histórico robusto y de calidad: no puede medir la calidad de una vista desde un lugar concreto ni la amabilidad de los gerentes de las residencias de ancianos. No puede medir la calidad de la comida en residencias de ancianos competidoras ni comprender las cualidades particulares del jardín de una residencia o su programa de actividades. Por ello, hay que comprender las limitaciones inherentes a estas herramientas de IA. No pueden ser la única fuente de información en la toma de decisiones. Hasta que los humanos dejen de tomar decisiones irracionales, la IA no sustituirá (todavía) a los agentes del territorio experimentados. Complementan la toma de decisiones humana en lugar de sustituirla.

En última instancia, la aplicación con éxito de modelos de predicción de la ocupación requiere un enfoque equilibrado que integre los conocimientos data-driven con la experiencia y la comprensión humanas. La utilización de datos demográficos hiperlocales, macroeconómicos, comerciales, empresariales e inmobiliarios data para predecir los niveles de ocupación va mucho más allá del sector de las residencias geriátricas y puede aplicarse a otras clases de activos (alojamientos para estudiantes, oficinas, comercios, I&L, etc.). Los equipos de marketing pueden aprovechar este concepto para planificar campañas específicas basadas en la densidad de población de lugares concretos, así como comprender mejor el número ideal de unidades o habitaciones y sus niveles óptimos de precios. Aprovechando el poder del gran data, los ejecutivos pueden tomar decisiones mejor informadas y optimizar las operaciones.

Este proyecto fue dirigido por un equipo conjunto de consultores de gestión, científicos y tecnólogos de Data durante un periodo de 16 semanas en constante colaboración con el equipo del cliente. El proyecto se desarrolló en dos fases. La primera de ellas consistió en construir una Prueba de Concepto de coste y compromiso relativamente bajos durante un periodo de 4 semanas para garantizar que se podía construir un modelo preciso, mientras que la segunda fase, de 12 semanas, consistió en reforzar el modelo con fuentes data adicionales y algoritmos más robustos y construir un cuadro de mandos a medida con el que pudieran interactuar los usuarios.

Contáctenos

Dónde cuidar: despliegue de la ciencia data para encontrar ubicaciones óptimas de residencias de ancianos