Vélos et open data

Voici quelques réflexions au sujet d’un système de prédiction/recommandation pour les vélos Toulouse et vélo’v de Lyon:

L’idée principale est de pouvoir faire une prévision ( avec un indice de confiance ) à 1 jour (maximum) du nombre de places disponibles / de vélos disponibles pour une station donnée, en fonction de quelques paramètres  ( jour, heure, météo, ville )

Une idée complémentaire serait d’avoir la possibilité pour l’utilisateur  cycliste  de « noter » la station, d’ajouter des commentaires/avis :  » Pas assez de vélo le samedi soir » …

Quelles données?:

GET https://api.jcdecaux.com/vls/v1/stations?contract={contract_name}&apiKey={api_key}

Quelles stratégies ?:

  • Time series
  • Classification non supervisée (k-means)
  • Régressions
  • Autres

Quels outils ?:

  • mongodb et json (geojson)
  • R boite à outil du statisticien + modules ( Forecast …)
  • bigml , dataiku

Quelques travaux de recherches et publications:

« Predicting Bikeshare System Usage Up to One Day Ahead »

Romain Giot [CNRS Labrit Univ Bordeaux 1] , Raphael Cherrier  [Qucit.com]

https://hal.archives-ouvertes.fr/hal-01065983/document

« Cyclists Pedal Faster On Wednesdays, Reveals Smart Bike Data »

http://www.technologyreview.com/view/421862/cyclists-pedal-faster-on-wednesdays-reveals-smart-bike-data/

« Characterizing the speed and paths of shared bicycles in Lyon »

http://arxiv.org/pdf/1011.6266v1.pdf

 

Challenges Kaggle :

https://www.kaggle.com/c/bike-sharing-demand

http://www.evanvanness.com/post/100217670076/neuralnet-r-package-neural-network-to-predict

Quelques stats sur les vélos en accès partagé: (source Statista)

Infographic: Bike-Sharing Is Taking Off Around the World | Statista

You will find more statistics at Statista