Carey Price, Dustin Tokarski et le théorème de Bayes

ChatGPT et les probabilités conditionnelles

ChatGPT face à un problème de probabilités conditionnelles tiré d’un examen universitaire. Incapable de le résoudre en 2023 et 2024, il parvient à une solution correcte — mais étonnamment verbeuse — en 2025.
Auteur

Jérôme Soucy

Date de publication

6 février 2026

Introduction

Troisième volet de la série, après le problème du Tricheur et celui du dénombrement. Cette fois, c’est un problème de probabilités conditionnelles et de théorème de Bayes qui passe au banc d’essai. Avec les tournois de hockey olympique qui se profilent à l’horizon, ça m’apparaît un bon moment de le faire.

Le verdict est plutôt favorable : dès 2025, ChatGPT parvient à une solution correcte. La trajectoire est semblable à celle du problème des bouteilles de vin — et bien différente de celle du Tricheur, qui n’avait trouvé preneur qu’en 2026. Mais « correct » ne signifie pas nécessairement « élégant ».

Je n’ai malheureusement pas conservé les traces de mes interactions avec ChatGPT en 2023 et 2024, où le modèle n’avait pas été en mesure de résoudre correctement ce problème.

timeline
    title Modèles évalués
    2023 : GPT-3.5
         : Réponse incorrecte (trace non conservée)
    2024 : GPT-4 (early)
         : Réponse incorrecte (trace non conservée)
    2025 : GPT-4 (late)
         : Réponse correcte

Évolution des modèles ChatGPT testés (2023–2025)

Le problème

Carey Price (Source : Wikipédia)

Dustin Tokarski (Source : Wikipédia)

Ce problème est lui aussi tiré de l’examen 1 du cours STT-1500 : Probabilités à l’hiver 2015. En relisant l’énoncé, je me suis dit que ça faisait un bon moment que j’avais entendu parlé de Dustin Tokarski. Disons que sa carrière de gardien de but dans la LNH a été de courte durée. Il a connu ses plus grands moments en assurant la relève de Carey Price durant les séries éliminatoires de 2014, face aux Ranger de New York. Bon, je m’éloigne du sujet.

NoteQuestion

Lors d’une partie de la saison régulière de la Ligue nationale de hockey (LNH), deux équipes s’affrontent. Une équipe gagne en temps réglementaire si, après soixante minutes de jeu, elle a inscrit plus de buts que l’adversaire. En cas d’égalité, une prolongation débute. Dès qu’une équipe marque un but, elle gagne en prolongation. Si aucun but n’est marqué après cinq minutes, la partie se terminera en tirs de barrage.

Le tableau suivant indique les différentes probabilités de l’issue d’une partie des Canadiens selon le gardien de but qui débute la partie. La probabilité que le gardien partant soit Carey Price est de 80 %, tandis que dans 20 % des cas, c’est Dustin Tokarski.

Temps régl. Prolongation Tirs de barrage
V D V D V D
Price 45 % 36 % 3 % 3 % 8 % 5 %
Tokarski 40 % 39 % 4 % 6 % 6 % 5 %

(a) Sachant qu’une partie ne s’est pas conclue en temps réglementaire, quelle est la probabilité qu’une séance de tirs de barrage soit nécessaire pour déterminer l’équipe gagnante?

(b) Sachant que les Canadiens de Montréal viennent de gagner une partie en prolongation, quelle est la probabilité que le gardien partant était Carey Price?

Réponses de l’enseignant

Observation. Ce problème mobilise deux outils fondamentaux : le théorème des probabilités totales (pour conditionner sur le gardien partant) et le théorème de Bayes (pour inverser un conditionnement).

NoteRéponse (a)

Considérons les événements suivants :

  • \(A\) = la partie ne s’est pas conclue en temps réglementaire;
  • \(B\) = la partie s’est terminée en tirs de barrage;
  • \(G\) = le gardien partant était Carey Price.

Nous devons calculer \(\mathbb{P}(B \mid A)\). En observant qu’une partie qui se termine en tirs de barrage ne s’est pas terminée en temps réglementaire (\(B \subset A\)), nous avons

\[ \mathbb{P}(B \mid A) = \frac{\mathbb{P}(A \cap B)}{\mathbb{P}(A)} = \frac{\mathbb{P}(B)}{\mathbb{P}(A)}. \]

D’après le théorème des probabilités totales,

\[ \begin{aligned} \mathbb{P}(A) &= \mathbb{P}(A \mid G)\,\mathbb{P}(G) + \mathbb{P}(A \mid G^c)\,\mathbb{P}(G^c) \\ &= (3\,\% + 3\,\% + 8\,\% + 5\,\%) \times 80\,\% + (4\,\% + 6\,\% + 6\,\% + 5\,\%) \times 20\,\% \\ &= 0{,}194. \end{aligned} \]

\[ \begin{aligned} \mathbb{P}(B) &= \mathbb{P}(B \mid G)\,\mathbb{P}(G) + \mathbb{P}(B \mid G^c)\,\mathbb{P}(G^c) \\ &= (8\,\% + 5\,\%) \times 80\,\% + (6\,\% + 5\,\%) \times 20\,\% \\ &= 0{,}126. \end{aligned} \]

Ainsi, \(\mathbb{P}(B \mid A) = \dfrac{0{,}126}{0{,}194} \approx 64{,}95\,\%\).

NoteRéponse (b)

Considérons les événements suivants :

  • \(C\) = les Canadiens de Montréal ont gagné en prolongation;
  • \(G\) = le gardien partant était Carey Price.

D’après le théorème de Bayes,

\[ \mathbb{P}(G \mid C) = \frac{\mathbb{P}(C \mid G)\,\mathbb{P}(G)}{\mathbb{P}(C \mid G)\,\mathbb{P}(G) + \mathbb{P}(C \mid G^c)\,\mathbb{P}(G^c)} = \frac{3\,\% \times 80\,\%}{3\,\% \times 80\,\% + 4\,\% \times 20\,\%} = 75\,\%. \]

Observation structurante. L’inclusion \(B \subset A\) permet de simplifier \(\mathbb{P}(A \cap B)\) en \(\mathbb{P}(B)\), réduisant le problème au calcul de deux probabilités totales.

La réponse de ChatGPT en 2025

NoteRéponse de GPT-4 (late) (2025)

Étape 1 : Probabilité qu’une partie ne se termine pas en temps réglementaire

Pour chaque gardien, la probabilité que la partie ne se termine pas en temps réglementaire est la somme des probabilités des scénarios « prolongation » et « tirs de barrage ».

  • Pour Carey Price :

\[ \begin{aligned} P(\text{non régl.} \mid \text{Price}) &= P(\text{prolongation} \mid \text{Price}) \\ &\quad + P(\text{barrages} \mid \text{Price}) \end{aligned} \]

où :

\[ \begin{aligned} P(\text{prolongation} \mid \text{Price}) &= 3\,\% + 3\,\% = 6\,\% \\ P(\text{barrages} \mid \text{Price}) &= 8\,\% + 5\,\% = 13\,\% \end{aligned} \]

Donc :

\[P(\text{non régl.} \mid \text{Price}) = 6\,\% + 13\,\% = 19\,\%\]

  • Pour Dustin Tokarski :

\[ \begin{aligned} P(\text{non régl.} \mid \text{Tokarski}) &= P(\text{prolongation} \mid \text{Tokarski}) \\ &\quad + P(\text{barrages} \mid \text{Tokarski}) \end{aligned} \]

où :

\[ \begin{aligned} P(\text{prolongation} \mid \text{Tokarski}) &= 4\,\% + 6\,\% = 10\,\% \\ P(\text{barrages} \mid \text{Tokarski}) &= 6\,\% + 5\,\% = 11\,\% \end{aligned} \]

Donc :

\[P(\text{non régl.} \mid \text{Tokarski}) = 10\,\% + 11\,\% = 21\,\%\]

Étape 2 : Probabilité d’un tir de barrage, sachant une partie non réglementaire

Utilisons le théorème de la probabilité totale pour trouver \(P(\text{barrages} \mid \text{non régl.})\) :

\[ \frac{P(\text{barrages} \cap \text{non régl.})}{P(\text{non régl.})} \]

\(P(\text{barrages} \cap \text{non régl.}) = P(\text{barrages})\), car « barrages » implique « non réglementaire ».

  1. \(P(\text{barrages})\) est obtenu en pondérant les contributions de chaque gardien :

\[ \begin{aligned} P(\text{barrages}) &= P(\text{Price})\,P(\text{barrages} \mid \text{Price}) \\ &\quad + P(\text{Tokarski})\,P(\text{barrages} \mid \text{Tokarski}) \end{aligned} \]

\(P(\text{barrages} \mid \text{Price}) = 13\,\%\), \(P(\text{barrages} \mid \text{Tokarski}) = 11\,\%\), \(P(\text{Price}) = 80\,\%\) et \(P(\text{Tokarski}) = 20\,\%\).

\[ \begin{aligned} P(\text{barrages}) &= 0{,}8 \cdot 0{,}13 + 0{,}2 \cdot 0{,}11 \\ &= 0{,}104 + 0{,}022 = 0{,}126\ (12{,}6\,\%) \end{aligned} \]

  1. \(P(\text{non réglementaire})\) est également pondéré :

\[ \begin{aligned} P(\text{non régl.}) &= P(\text{Price})\,P(\text{non régl.} \mid \text{Price}) \\ &\quad + P(\text{Tokarski})\,P(\text{non régl.} \mid \text{Tokarski}) \\ &= 0{,}8 \cdot 0{,}19 + 0{,}2 \cdot 0{,}21 \\ &= 0{,}152 + 0{,}042 = 0{,}194\ (19{,}4\,\%) \end{aligned} \]

  1. Finalement :

\[P(\text{barrages} \mid \text{non régl.}) = \frac{0{,}126}{0{,}194} \approx 0{,}649\ (64{,}9\,\%)\]

Étape 3 : Probabilité conditionnelle avec le théorème de Bayes

Nous voulons \(P(\text{Price} \mid \text{vict. prol.})\), que nous calculons avec la formule de Bayes :

\[ \frac{P(\text{vict. prol.} \mid \text{Price})\,P(\text{Price})}{P(\text{vict. prol.})} \]

  1. \(P(\text{vict. prol.} \mid \text{Price})\) : D’après le tableau, \(P(\text{vict. prol.} \mid \text{Price}) = 3\,\% = 0{,}03\).

  2. \(P(\text{Price})\) : \(P(\text{Price}) = 80\,\% = 0{,}8\).

  3. \(P(\text{vict. prol.})\) :

Utilisons le théorème de la probabilité totale :

\[ \begin{aligned} P(\text{vict. prol.}) &= P(\text{Price})\,P(\text{vict. prol.} \mid \text{Price}) \\ &\quad + P(\text{Tokarski})\,P(\text{vict. prol.} \mid \text{Tokarski}) \\ &= 0{,}8 \cdot 0{,}03 + 0{,}2 \cdot 0{,}04 \\ &= 0{,}024 + 0{,}008 = 0{,}032\ (3{,}2\,\%) \end{aligned} \]

  1. Finalement :

\[ \begin{aligned} P(\text{Price} \mid \text{vict. prol.}) &= \frac{0{,}03 \cdot 0{,}8}{0{,}032} \\[4pt] &= \frac{0{,}024}{0{,}032} = 0{,}75\ (75\,\%) \end{aligned} \]

Résultats finaux

(a) La probabilité qu’une séance de tirs de barrage soit nécessaire, sachant que la partie ne s’est pas conclue en temps réglementaire, est 64,9 %.

(b) La probabilité que le gardien partant soit Carey Price, sachant que les Canadiens ont gagné en prolongation, est 75 %.

Diagnostic 2025. Solution correcte et bien structurée, mais considérablement plus verbeuse que celle de l’enseignant.

Analyse. La réponse de GPT-4 (late) est mathématiquement irréprochable. Le modèle identifie correctement les outils nécessaires — théorème des probabilités totales pour la question (a), théorème de Bayes pour la question (b) — et les applique sans erreur. Il reconnaît même que « barrages » implique « non réglementaire », ce qui lui permet de simplifier correctement \(P(\text{barrages} \cap \text{non réglementaire})\) en \(P(\text{barrages})\).

La différence avec ma solution est avant tout une question de style. Là où je définis les événements à l’aide de variables (\(A\), \(B\), \(G\)), observe l’inclusion \(B \subset A\) et déroule le calcul en quelques lignes, ChatGPT procède par étapes numérotées, explicite chaque substitution numérique et recalcule des quantités intermédiaires pour chaque gardien séparément. Le résultat est un texte environ trois fois plus long pour le même contenu mathématique.

La différence. J’utilise des symboles (\(A\), \(B\), \(G\)) pour désigner les événements. ChatGPT, lui, utilise des noms d’événements en toutes lettres (\(P(\text{barrages} \mid \text{Price})\)), ce qui rend chaque formule plus longue.

Cette verbosité n’est pas un défaut en soi : pour un étudiant qui découvre le théorème de Bayes, ces étapes détaillées peuvent constituer un support pédagogique utile. Mais elle révèle une caractéristique des modèles de langage : ils privilégient le déroulement systématique d’une procédure connue plutôt que l’identification de raccourcis conceptuels.

Conclusion

Ce problème de probabilités conditionnelles confirme une tendance observée dans les articles précédents : ChatGPT excelle lorsque le problème se réduit à l’application méthodique de théorèmes standards. Le théorème de Bayes et le théorème des probabilités totales sont parmi les résultats les plus documentés en probabilités — et la donnée sous forme de tableau impose une structure qui laisse peu de place à l’ambiguïté.