Liste des articles
17 mars 2020
Introduction à la reconstruction de données : l’exemple de la piste cyclable fermée à Montréal
Partager cet article

Il y a quelques mois, Matt qui travaille au bureau de Montréal a du faire un détour sur son trajet à vélo : une section de l’aménagement cyclable était fermée pour travaux. A l’entrée des travaux, les cyclistes étaient redirigés vers une rue adjacente.

Redirection juste avant le compteur

La section de la piste bidirectionnelle fermée pour travaux se trouve être à l’endroit où un compteur permanent ZELT est installé. Alors que le compteur est entièrement fonctionnel, la redirection du flux de cyclistes a fait qu’aucun comptage n’a été enregistré pendant les 9 jours où la piste a été fermée. Le mois de décembre 2019 a été plus chaud qu’en moyenne, et les pistes cyclables ont été correctement déneigées grâce à la forte volonté des services, ce qui aurait du entrainer un trafic d’environ 400 passages en semaine, et 200/jour le week-end.

Et pourtant, zéro comptage enregistrés ! Le trou dans les données est visible sur la Page Publique de la ville de Montréal, pour ce compteur ZELT en particulier, et pour la Page Publique qui affiche les données de tous les compteurs de la ville.

Ce type de déviation lors de travaux est le genre d’événements pour lesquels les Eco-Alertes ont été créées. Grâce aux Eco-Alertes, si vous bénéficiez de la transmission automatique des données, un e-mail vous est envoyé automatiquement dès que vos données de comptage enregistrent une variation anormale.  Une période de 9 jours sans aucune donnée peut en effet avoir un impact important sur les chiffres agrégés, comme les moyennes hebdomadaires ou mensuelles. Avec des données manquantes, les comparaisons journalières, hebdomadaires, mensuelles, ou annuelles peuvent être faussées. La base de toute analyse sur les données est d’avoir des données de base validées, correctes et fiables.

 

Notre service de reconstruction de données peut résoudre ce problème

C’est pour ce genre de situation que notre service de reconstruction de données peut vous aider ! Développé en collaboration avec l’université de McGill à Montréal, notre outil de reconstruction de données est capable de reconstruire des trous dans les données avec une marge d’erreur de 5%.

Nous utilisons des techniques robustes pour garantir que les anomalies sur les données sont détectées et que les reconstructions minimisent le risque d’erreur. Une bonne pratique est de reconstruire les données en se basant sur des compteurs de référence. Pour valider et reconstruire les données, nous utilisons un processus en sept étapes, qui s’appuie sur une méthodologie publiée dans un article scientifique revu par les pairs. Voici le processus :

  1. Calcul des coefficients journaliers/horaires pour chaque site de comptage permanent
  2. Calcul de la corrélation entre tous les couples possibles de sites de référence/site à reconstruire
  3. Choix des sites de comptage les plus similaires
  4. Calcul du ratio des coefficients journaliers/horaires
  5. Définition du seuil et indication des jours où la reconstruction est nécessaire
  6. Développement du modèle de reconstruction, et reconstruction des jours manquants
  7. Estimation de la marge d’erreur du modèle

La reconstruction de données pour des analyses fiables des tendances

Dans l’exemple de la fermeture de la piste cyclable de Rachel plus haut, il existe deux autres compteurs ZELT implantés à proximité, l’un sur la rue Saint Urbain, et l’autre sur l’avenue Parc, deux compteurs que nous avons utilisés comme compteurs de référence. En regardant les données de comptage sur Eco-Visio sur Rachel, on constate que la fréquentation quotidienne moyenne est d’environ 200 passages pour le mois de décembre 2019, avec un total de 6 226 passages. Cela représente une diminution de 29% par rapport à 2018. Rien qu’avec un coup d’œil, on visualise bien le problème:

 

Après reconstruction, l’histoire est un peu différente. Les fréquentations correspondent d’avantage à la réalité. La moyenne journalière pour le mois de décembre est de 300 comptages, pour un total de 9 343 passages pour le mois, soit une augmentation de 6% par rapport à 2018. Le graphique est également plus présentable :

De temps à autre, les données de comptage peuvent manquer. Qu’il s’agisse d’une piste cyclable fermée pour travaux, d’une inondation, de PYRO-Box déplacées, ou recouvertes de neige, ou de batteries déchargées, nous savons que plusieurs types d’événements peuvent jouer sur la continuité de la collecte de données. Notre équipe d’experts en service de données ont développé cet outil pour faire face à ces problèmes et fournir un service qui vous garantit les données les plus précises possibles.

Vous voulez en savoir plus ? Vous pouvez contacter notre équipe pour plus d’information sur la reconstruction de données et pour en savoir plus sur nos services.

Il n'y a pas encore de commentaires

Laissez un commentaire

Votre e-mail ne sera pas publié
Entrez votre nom
Entrez votre email

Contactez-nous !