La Méthode Kanban IT (Partie 3) – Les Flow Metrics

Troisième partie consacrée à la Méthode Kanban IT !

Dans les parties précédentes, nous avons exploré ce qu’est la méthode Kanban IT et les différentes étapes de mise en œuvre.

Une fois votre Système Kanban en place, comment savoir s’il fonctionne bien ? Comment mesurer et améliorer en continu la performance du flux de travail ?

C’est là qu’interviennent la troisième pratique « Mesurer et gérer le flux » et les Flow Metrics.

Dans cet article, nous allons découvrir les principaux Flow Metrics utilisés dans un Système Kanban, leur utilité et comment les exploiter pour optimiser la gestion des activités et améliorer la livraison des demandes.

Qu’est ce que les Flow Metrics ?

Les Flow Metrics sont issus des principes du Lean Manufacturing et de la Théorie des Files d’Attente, adaptés au monde de l’IT et du développement logiciel grâce à la méthode Kanban.

Ils ont été créés et mises en oeuvre pour répondre au Just-in-Time et le flux tiré, issue du Toyota Production System (TPS), pour optimiser la production.

Dans les années 2000, David J. Anderson (Kanban University) a adapté ces principes au développement logiciel en intégrant des métriques de flux pour mesurer l’efficacité des équipes IT.

Les objectifs des Flow Metrics sont :

  • Optimiser le flux de travail et éviter les goulets d’étranglement.
  • Équilibrer la charge de travail pour éviter surcharge et sous-utilisation.
  • Meilleure visibilité sur la performance des équipes.
  • Décisions basées sur des données réelles et non sur des intuitions.
  • Optimisation des délais de livraison et amélioration de la satisfaction client.
  • Faciliter l’amélioration continue et l’adaptation aux contraintes réelles.
  • Facilite la planification et le forecasting grâce à des modèles probabilistes.

Les Principaux Flow Metrics

Throughput – Le suivi du débit

Source : Flow Analytics Pro (Throughput Run Chart)

Le Throughput (Débit) permet de suivre le nombre de demandes traité sur une période donnée. le Throughput permet de voir comment le débit évolue dans le temps, souvent en temps réel.

Ce type de graphique est particulièrement utile pour surveiller la performance d’un système ou d’une application sur une période donnée et pour repérer des tendances ou des fluctuations significatives.

Le Throughput Run Chart est particulièrement utile pour :

  1. Suivre les tendances dans le débit : Il permet de visualiser les changements graduels ou brusques dans le débit au fil du temps, révélant des tendances croissantes, décroissantes, ou des périodes de stabilité.
  2. Détecter les anomalies et les pics : En suivant l’évolution des débits, il devient facile de repérer des anomalies, comme des pics soudains (augmentation ou diminution rapide du débit) qui pourraient signaler des événements inattendus, des problèmes de performance ou des changements de comportement du système.
  3. Optimiser les processus : Le run chart peut aider à identifier des périodes où le système fonctionne de manière optimale ou sous-optimale, permettant ainsi de prendre des décisions pour ajuster les ressources ou améliorer l’efficacité.
  4. Mesurer l’impact des changements : Si une mise à jour ou une modification est appliquée à un système, le run chart peut être utilisé pour surveiller l’impact de ce changement sur le débit dans le temps.

Le suivi du débit, par période est souvent associé au Throughput Histogram, qui permet d’analyser la répartition des débits dans un Flux donné. En termes simples, il montre comment les valeurs de débit se distribuent sur une période de temps et permet de comprendre les performances ou le comportement du système en termes de débit.

Source : Flow Analytics Pro (Throughput Histogram)

Le Throughput Histogram est utilisé pour :

  1. Identifier la performance globale : Il montre comment les valeurs de débit sont réparties. Par exemple, si un grand nombre d’événements ou de transactions se situe dans une fourchette de débit élevée, cela indique que le système fonctionne de manière performante.
  2. Détecter des goulots d’étranglement : Un histogramme qui montre une concentration importante de faibles valeurs de débit pourrait indiquer des goulots d’étranglement ou des problèmes de performance dans certaines parties du système.
  3. Analyser la variabilité des performances : L’histogramme permet de visualiser si les débits observés sont stables ou variables. Une distribution uniforme indique une performance relativement constante, tandis qu’une distribution très étalée peut signaler une grande variabilité dans le débit.

Flow Time – Temps de traitement

Le Flow Time est souvent décomposé en 3 parties, permettant de suivre la performance du Flux :

  • Lead Time – Permet de suivre le temps moyen de passage d’une demande dans l’ensemble du Flux d’un Système Kanban.
  • Reaction Time – Permet de mesurer le temps moyen nécessaire à la prise en charge d’une demande.
  • Cycle Time – Permet de mesurer et d’analyser le temps moyen de traitement d’une demande, sur les étapes de réalisation du Flux. La particularité du Cycle Time est de permettre également de mesurer le temps passé sur chacune des étapes du Flux d’un Système Kanban et ainsi d’identifier les possibles goulets d’étranglement et être plus efficace dans les actions pour rendre le Système plus fluide.

Note : J’aime utiliser le terme Flow Time, plutôt que Cycle Time, couramment utilisé par les formateurs/praticiens Kanban ou les différents outils digitaux. A titre personnel, je trouve ce terme plus clair et permettant d’éviter la confusion entre les différentes mesures du temps de traitement (Lead Time, Reaction Time, Cycle Time) et le Cycle Time qui permet spécifiquement de mesurer les étapes de réalisation de la demande.

2 types de graphiques sont utilisés pour suivre le Flow Time.

Flow Time Scatterplot

Source : Flow Analytics Pro (Flow Time Scatterplot)

Le Flow Time Scatterplot (Temps de flux en nuage de points) est un graphique permettant de suivre les tickets traités dans un système ou un processus sur un intervalle donné. Il visualise chaque ticket en fonction du moment où il a atteint l’étape finale du Flux et du temps nécessaire pour parcourir les étapes du Flux que l’on souhaite mesurer.

Il permet de mesurer, le Lead Time, Le Reaction Time et le Cycle Time.

Le Flow Time Scatterplot est utilisé pour :

  1. Analyser les performances du processus : Il montre comment les temps de traitement des tickets varient au fil du temps. Chaque point sur le graphique représente un ticket individuel traité dans un intervalle spécifique du flux, et son temps de traitement associé.
  2. Repérer des anomalies ou des goulots d’étranglement : En identifiant des tickets dont le temps de traitement est particulièrement long ou court, il est possible de détecter des anomalies ou des goulots d’étranglement dans le processus.
  3. Suivre l’évolution des temps de traitement : Le scatterplot permet de voir si les temps de traitement augmentent, diminuent, ou restent stables dans le temps. Cela peut révéler des tendances liées à la charge de travail ou à l’efficacité du processus.

Flow Time Histogram

Source : Flow Analytics Pro (Flow Time Histogram)

Le Flow Time Histogram (Histogramme de Temps de Flux) représente la répartition des durées (ou temps de flux) des tickets traités sur un intervalle, représenté par une étape de début et une étape de fin du Flux à analyser.

L’histogramme visualise ces durées de manière agrégée afin d’aider à comprendre la performance globale et la dispersion de la distribution du temps nécessaire au traitement des demandes, sur un intervalle donné.

Le Flow Time Histogram est utilisé pour :

  1. Évaluer la latence : Il montre comment les durées de traitement se répartissent dans un système. Un histogramme avec des valeurs concentrées autour de temps faibles suggère que la plupart des transactions ou des événements sont traités rapidement, tandis qu’un histogramme étalé vers des temps élevés peut indiquer des problèmes de latence.
  2. Repérer les anomalies : En étudiant l’histogramme, il est possible de détecter des incohérences, telles que des pics inhabituels dans le temps de traitement, qui pourraient signaler des périodes de surcharge, des erreurs de configuration ou des problèmes de ressources.
  3. Optimiser les performances : Le Flow Time Histogram permet d’identifier les cas où les temps de réponse sont trop longs et d’ajuster les ressources ou les processus pour améliorer la rapidité des transactions.

Work In Progress (WIP) – Nombre d’éléments dans l’encours

Source : Flow Analytics Pro (Cumulative Flow Diagram du WIP)

Le WIP (Work In Progress) représente le nombre total de tickets présent dans l’encours du Flux.

Pourquoi mesurer le WIP ?

L’efficacité d’un Système Kanban repose sur la capacité de l’équipe à traiter les demandes, dans des délais acceptable, sans interférence ou obstacles. Pour ce faire, en autres, l’équipe doit s’assurer que le nombre de demandes en cours de traitement correspond à sa capacité à faire et ainsi éviter les goulets d’étranglement, les surcharges et le multi-tâches.

Un WIP trop important ralentit le flux et crée des goulets d’étranglement.

Un WIP trop faible peut indiquer un manque de travail disponible.

Un suivi rigoureux du WIP permet d’améliorer l’efficacité du débit et de réduire le Cycle Time au temps réel nécessaire au traitement d’un ticket. Il permet ainsi de rendre le Flux plus prédictible.

Une bonne façon de bien gérer son WIP et d’affecter des limites, basses et hautes, sur les différents étapes du flux, en tenant compte de la capacité à faire de l’équipe et de sa performance.

Source : Renaud Chevalier – Consultant en management et IA
Source : Renaud Chevalier – Consultant en management et IA

Aging – Age des tickets dans l’encours

Source : Flow Analytics Pro (Aging Chart)

Le Aging Chart (Temps de Vieillissement des tickets) permet de suivre depuis combien de temps les tickets sont présents dans les différentes étapes de l’encours du Flux (étapes généralement nommées Work In Progress).

Ce graphique aide les utilisateurs à visualiser l’ancienneté des tickets actuellement en cours de traitement à chaque étape, afin de détecter les goulots d’étranglement ou les tickets bloqués.

Chaque point sur le graphique correspond à un ou plusieurs tickets dans une étape donnée, en fonction du temps qu’ils y ont passé.

En plus de ces points, le graphique affiche quatre lignes horizontales qui représentent les performances passées en termes de Cycle Time pour les tickets terminés, à savoir :

  1. 50 % des tickets traités ont eu un Cycle Time inférieur à cette valeur.
  2. 75 % des tickets traités ont eu un Cycle Time inférieur à cette valeur.
  3. 85 % des tickets traités ont eu un Cycle Time inférieur à cette valeur.
  4. 95 % des tickets traités ont eu un Cycle Time inférieur à cette valeur.

Ces lignes servent de repères de performance pour comparer la durée de présence des tickets dans l’encours avec les performances des tickets déjà terminés.

Le Aging Chart est un outil clé pour :

  1. Suivre l’ancienneté des tickets en cours : Il montre depuis combien de temps chaque ticket est bloqué ou en traitement dans chaque étape du flux. Cela permet de détecter rapidement les tickets qui prennent plus de temps que prévu et risquent de causer des retards.
  2. Comparer avec les tickets terminés : Les lignes horizontales représentant les performances passées des tickets traités (50 %, 75 %, 85 %, 95 % des tickets traités) permettent de comparer l’âge des tickets en cours avec les temps de traitement des tickets déjà terminés, afin de voir si les tickets actuels prennent plus de temps que la moyenne passée.
  3. Identifier des tickets à risque : Les tickets dont la durée dans l’étape dépasse les lignes représentant les performances des tickets terminés peuvent être considérés comme des tickets à risque. Ils peuvent signaler des goulots d’étranglement ou nécessiter une attention immédiate pour éviter des retards supplémentaires.

Efficiency – Efficience du Flux

Source : Flow Analytics Pro (Efficiency chart)

Le Flow Efficiency (Flux d’Efficience) permet de mesurer et de visualiser le taux d’efficience des tickets traités dans le flux, c’est-à-dire le pourcentage du temps pendant lequel les tickets sont effectivement en cours de traitement (temps productif) par rapport au temps total qu’ils passent dans le flux (temps total).

Il indique dans quelle mesure le flux est efficace en évitant les temps d’attente ou de blocage.

Le Flow Efficiency est particulièrement utile pour :

  1. Mesurer l’efficacité globale du processus : Il permet de comprendre dans quelle mesure le temps de traitement des tickets est réellement productif. Un flux très efficace devrait montrer un grand nombre de tickets avec des taux d’efficience élevés.
  2. Comparer l’efficience entre types de tickets : Le graphique permet d’observer si certains types de tickets ont des taux d’efficience plus élevés ou plus faibles, ce qui peut révéler des différences dans la complexité ou la gestion de ces types de demandes.
  3. Repérer les inefficacités : Les tickets ayant des taux d’efficience faibles peuvent signaler des zones d’inefficacité, comme des goulots d’étranglement, des étapes qui prennent trop de temps, ou des temps d’attente non productifs.
  4. Identifier les goulots d’étranglement liés aux attentes (ex. : backlog, validations).
  5. Améliorer la gestion des dépendances et l’élimination des gaspillages.

Cumulative Flow Diagram (CFD) – Diagramme de Flux Cumulé

Source : Flow Analytics Pro (Cumulative Flow Diagram)

Le Cumulative Flow Diagram (Diagramme de Flux Cumulé) permet de visualiser l’évolution des tickets au fil du temps à travers les différentes étapes d’un flux de travail.

Chaque section colorée représente une étape du flux, comme « À faire », « En cours », « En revue », ou « Terminé ».

Le CFD montre combien de tickets se trouvent à chaque stade à un moment donné, ce qui permet de suivre la progression du travail et de repérer les goulots d’étranglement qui pourraient freiner le flux.

Le Cumulative Flow Diagram est essentiel pour :

  1. Suivre la progression du travail : Le CFD permet de voir en un coup d’œil comment les tickets évoluent à travers les différentes étapes du flux de travail, en visualisant la quantité de travail à chaque stade.
  2. Identifier les goulots d’étranglement : En observant les zones où les bandes colorées s’élargissent ou restent bloquées, on peut repérer des goulots d’étranglement dans certaines étapes du flux. Par exemple, si une étape « En cours » gonfle tandis que « Terminé » reste stable, cela peut indiquer qu’il y a trop de tickets en cours de traitement et que l’équipe n’arrive pas à les terminer efficacement.
  3. Évaluer la stabilité du flux : Un flux stable est représenté par des bandes qui progressent de manière fluide et équilibrée, montrant que les tickets passent de manière régulière d’une étape à l’autre. Des bandes irrégulières ou qui stagnent peuvent signaler des problèmes de gestion de la capacité ou de priorisation des tâches.

Le CFD regroupe également l’ensemble des Flow Metrics présentés dans cet article.

Source : Flow Analytics Pro (Cumulative Flow Diagram)

La Simulation de Monte-Carlo

La simulation de Monte-Carlo est un outil avancé permettant d’estimer la probabilité de différents résultats pour des scénarios tels que « How Many » (Combien de tickets ou de points peuvent être traités dans un temps donné) et « When » (Quand un certain nombre de tickets ou de points peuvent être terminés). Elle repose sur la répétition de simulations basées sur des données historiques et des distributions de probabilités, pour donner aux utilisateurs une prévision basée sur des scénarios réalistes et variés.

En Kanban, elle est utilisée pour anticiper la capacité de livraison d’une équipe sur une période donnée, en se basant sur les fluctuations passées du Throughput et du Cycle Time.

La simulation de Monte-Carlo repose sur la répétition de milliers de simulations pour modéliser des scénarios probables :

  1. Données historiques : La simulation utilise les données historiques du projet ou de l’équipe pour créer une distribution de probabilité réaliste basée sur la vélocité de l’équipe, le flux de travail, le temps de traitement des tickets, et d’autres paramètres. Ces données servent de base pour les simulations.
  2. Répétition des simulations : La simulation répète plusieurs milliers de fois des scénarios en fonction des distributions de probabilité des données d’entrée. Chaque simulation suit une répartition aléatoire des résultats possibles, basée sur les données historiques et les critères choisis.
  3. Estimation des résultats : Une fois les simulations terminées, la simulation donne des prévisions sous forme de pourcentages de probabilité pour différents résultats. Par exemple, un résultat typique serait :
    • « Avec 95 % de probabilité, l’équipe pourra terminer entre 40 et 50 tickets dans les deux prochaines semaines. »
    • « Il y a 85 % de probabilité que l’équipe termine 200 points d’effort avant la fin du mois prochain. »

Avantages clés :

  • Basé sur des données réelles – Prend en compte la variabilité naturelle du système.
  • Probabiliste et non déterministe – Fournit une fourchette de prévision réaliste, au lieu d’une estimation fixe sujette à erreurs.
  • Facilite la prise de décision – Permet aux équipes et aux managers d’ajuster leurs priorités en fonction des probabilités de succès.
  • S’adapte aux changements du système – Peut être recalculée régulièrement en fonction des nouvelles données.

Limites et précautions :

  • Nécessite un historique suffisant – Fonctionne mieux avec plusieurs semaines/mois de données.
  • Les prévisions restent des probabilités – Un événement inattendu (ex. : incident majeur, absence d’un membre clé) peut modifier les résultats.
  • Ne remplace pas une bonne gestion du flux – Doit être combiné avec un suivi des Flow Metrics classiques.

Pour aller plus loin

Voici une liste d’ouvrages et d’articles qui vous permettrons d’en apprendre plus sur les Flow Metrics et comment les mettre en oeuvre :

When Will It Be Done?: Lean-Agile Forecasting to Answer Your Customers’ Most Important Question (Daniel S. Vacanti)

Actionable Agile Metrics for Predictability: An Introduction (Daniel S. Vacanti)

Kanban pour l’IT – 2e éd. – Une nouvelle méthode pour améliorer les processus de développement (Laurent Morisseau)

Le Throughput Run Chart : Analyser la qualité de votre débit, avec Flow Analytics Pro

L’Aging Chart : Un Outil Essentiel pour Optimiser Votre Flux de Valeur

Optimiser le Flux de Valeur : Les clés pour améliorer l’éfficacité du Flux et la répartition du temps

Mesurer et Booster la Performance des Équipes Scrum avec Flow Analytics Pro

Conclusion

La gestion et l’analyse des Flow Metrics fait partie de la troisième pratique de la Méthode Kanban IT et est une composante essentielle d’un Système Kanban performant.

Contrairement aux approches basées sur des estimations (Story Points, Jours/Homme, …) ou des deadlines fixes, les Flow Metrics permettent d’optimiser le flux de travail en s’appuyant sur des données réelles et mesurables.

Grâce aux Flow Metrics, les équipes peuvent :

  • Améliorer leur prédictibilité en suivant le Flow Time (Lead Time ; Reaction Time ; Cycle Time).
  • Éviter la surcharge en surveillant l’encours (Work In Progress ; Aging).
  • Optimiser la productivité en mesurant le Throughput.
  • Fluidifier les processus en analysant le Flow Efficiency et l’Aging.
  • Prendre des décisions éclairées grâce aux prévisions par Simulation de Monte-Carlo.

En adoptant une gestion Data-Driven avec ces métriques, les équipes/organisations peuvent :

  • Gérer la performance du flux.
  • Identifier rapidement les goulets d’étranglement.
  • Ajuster leur cadence de travail en fonction des capacités réelles de l’équipe.
  • Améliorer continuellement leur performance en s’appuyant sur des données factuelles.

Note : Data-Driven = approche qui consiste à prendre des décisions stratégiques sur la base d’une analyse et d’une interprétation des données.

(« Sans données, vous êtes juste une personne avec une opinion. »)

Dans la quatrième partie, je vous présenterais comment associer les pratiques Kanban à un cadre Scrum.