Voici quelques réflexions au sujet d’un système de prédiction/recommandation pour les vélos Toulouse et vélo’v de Lyon:
L’idée principale est de pouvoir faire une prévision ( avec un indice de confiance ) à 1 jour (maximum) du nombre de places disponibles / de vélos disponibles pour une station donnée, en fonction de quelques paramètres ( jour, heure, météo, ville )
Une idée complémentaire serait d’avoir la possibilité pour l’utilisateur cycliste de « noter » la station, d’ajouter des commentaires/avis : » Pas assez de vélo le samedi soir » …
Quelles données?:
- Les données ouvertes des stations de vélos fournies par JCDecaux (par ville)
- https://developer.jcdecaux.com/#/home
- https://developer.jcdecaux.com/#/opendata/vls?page=getstarted
GET https://api.jcdecaux.com/vls/v1/stations?contract={contract_name}&apiKey={api_key}
Quelles stratégies ?:
- Time series
- Classification non supervisée (k-means)
- Régressions
- Autres
Quels outils ?:
- mongodb et json (geojson)
- R boite à outil du statisticien + modules ( Forecast …)
- bigml , dataiku
Quelques travaux de recherches et publications:
« Predicting Bikeshare System Usage Up to One Day Ahead »
Romain Giot [CNRS Labrit Univ Bordeaux 1] , Raphael Cherrier [Qucit.com]
https://hal.archives-ouvertes.fr/hal-01065983/document
« Cyclists Pedal Faster On Wednesdays, Reveals Smart Bike Data »
« Characterizing the speed and paths of shared bicycles in Lyon »
http://arxiv.org/pdf/1011.6266v1.pdf
Challenges Kaggle :
https://www.kaggle.com/c/bike-sharing-demand
http://www.evanvanness.com/post/100217670076/neuralnet-r-package-neural-network-to-predict
Quelques stats sur les vélos en accès partagé: (source Statista)
You will find more statistics at Statista