Heatmap of Predicted Walk Scores throughout Seattle, WAVivo en Seattle y recientemente me he mudado a un barrio diferente. Según los algoritmos patentados de Walk Score, me he trasladado del 9º barrio más transitable de Seattle al 30º. Todavía puedo ir a pie a una cafetería y a un barbero, pero eso es todo. Puedo decir que me he trasladado a un barrio considerablemente menos transitable, pero no está claro cómo cuantificar la magnitud o lo que entra en una puntuación de transitabilidad.
He utilizado previamente la API de Walk Score como una fuente de datos para predecir la agrupación de ubicaciones de scooters eléctricos. Walk Score es un sitio web que toma una dirección y calcula una medida de su transitabilidad en una escala de 0 a 100 utilizando algoritmos propios y varios flujos de datos.
Como alguien que disfruta caminando para llegar a los sitios (¡y haciendo senderismo!), he sentido curiosidad por saber qué es lo que alimenta estos algoritmos propios que generan una puntuación de transitabilidad. Me propuse hacer las siguientes preguntas:
- ¿Se puede aplicar ingeniería inversa a los algoritmos patentados de Walk Score?
2. ¿Qué características son importantes en la construcción de una puntuación de transitabilidad?
Para responder a estas preguntas, construí un conjunto de datos personalizado mediante la recopilación de un conjunto diverso de datos granulares de la ciudad de Seattle y datos de la API de Walk Score para entrenar modelos de aprendizaje automático para predecir una puntuación de transitabilidad. Pude entrenar un modelo que alcanzó un R² de 0,95 en los datos del conjunto de pruebas. El R-cuadrado explica la medida en que la varianza del conjunto de características explica la varianza de la puntuación de caminabilidad.
En esencia, fui capaz de hacer ingeniería inversa a la metodología de Walk Score y recrear los algoritmos patentados que impulsan su puntuación de caminabilidad. Las características más importantes para la transitabilidad de un lugar son el número de restaurantes en un radio de 1000 metros, la densidad de población en ese tramo censal, el número de supermercados en un radio de 1000 metros y la proximidad en metros a la zona comercial más cercana.