[Billet d'humeur] P(A/B) = P(B/A) x P (A) / P(B)
Publié par Evariste de Montalembert le | Mis à jour le
Dans notre petit village d'acheteurs à Montalembert, on était tous au café à se désoler que la dernière étude Pisa indique que le niveau de maths en France était en train de chuter - mais on ne se sentait pas concernés, bien sûr. Pendant que Léopold, le cafetier, servait des petits blancs, le maître d'école Watrin entamait justement un cours de maths pendant ce temps-là (toute allusion à « Uranus » de Marcel Aymé est naturellement fortuite).
Et le bon maître Watrin de parler d'intelligence artificielle à ses élèves... On a donc commencé avec lui par l'histoire, et puis tant qu'à faire, on a regardé en quoi ça nous concernait tous dans les achats, mais pas pour les raisons qu'on pourrait penser.
Le terme « intelligence artificielle » (vous savez, le sujet dont tout le monde parle) a été officialisé en 1956 au cours de la conférence de Dartmouth, une conférence auxquels plusieurs scientifiques ont participé dont John Mc Carthy et Ray Solomonoff. John : un type assez amusant, spécialiste de l'élagage alpha-bêta (pour ceux qui se demandent comment joue une machine aux échecs, ben c'est ça). Ray : un autre dingue, connu pour être à l'origine du concept de probabilité algorithmique, et très inspiré par les travaux de Bayes.
À ce stade, nos apprentis acheteurs ouvraient de grands yeux et se demandaient bien quel était le rapport entre toutes ces billevesées et leurs tâches au quotidien, d'autant plus qu'ils étaient sûrs, eux, d'être déjà des matheux rationnels de folie.
Le bon Ray, poursuivit donc Watrin, était persuadé que la pierre angulaire de l'intelligence artificielle résidait non pas dans des raisonnements hypothético-déductifs (« si... alors »), mais dans le sujet de la meilleure probabilité de tirer un raisonnement adéquat. Et il était très inspiré par le théorème du révérend Thomas Bayes (à ce moment-là, on entendit glousser dans la salle de classe : « ça y est, on est de la Bayes »).
Et donc, toujours, Watrin poursuivant opiniâtrement, indiqua ce que dit ce théorème : P (A/B) = P (B/A) xP (A)/P (B). À et B sont 2 événements. P (A) et P (B) sont les probabilités que ces événements se produisent de manière indépendante. P (A/B) est la probabilité que l'événement A se réalise si l'événement B s'est produit. P (B/A), c'est l'inverse (pour ceux qui ont suivi).
Travaux pratiques pour les achats : j'évalue mes fournisseurs suivant un référentiel (mettons pour l'exemple : un référentiel financier ou de RSE). Mettons que ce référentiel soit super fiable, et qu'il soit négatif dans 99 % des cas si le fournisseur a effectivement des problèmes, et positif dans 95 % des cas si le fournisseur n'en a pas. Mettons qu'un fournisseur sur 1000 a des problèmes (financiers ou RSE). Tout ça, c'est des maths, bien sûr. Mettons enfin qu'on veuille évaluer la probabilité qu'un fournisseur ait réellement des problèmes (événement A) en fonction d'un test négatif à tous ces beaux référentiels (événement B), alors le théorème de Bayes dit (en forme discrète, pour les matheux) :
P (A/B) = (0,99x0,001)/(0,99x0,001 + (1-0,95) x (1-0,001)) = +/- 2 %
Ce qui peut aussi se traduire par : quasiment tous les fournisseurs (99 %) qui ont un problème sont bien négatifs à ce référentiel, mais pratiquement tous les négatifs (98 %) n'en ont... pas du tout ! On n'y peut rien, c'est juste des maths (le théorème en question date d'avant la révolution française, on ne peut pas dire que ça vienne juste d'être inventé). C'est aussi ce qu'on appelle « l'oubli de la fréquence de base ». Car ce qui fait la beauté de l'équation, c'est précisément le « un millième » (La fréquence de base - On voit bien, toujours pour les matheux, que si les 0,001 étaient remplacés par 1, on aboutirait à un résultat différent).
Et donc, dans ce cas d'espèce précis, quand on déploie des trésors d'ingéniosité à trouver des solutions de doubles sources, plans d'actions divers et variés parce que le fournisseur est supposé « risqué » : dans 98 % des cas, c'est statistiquement faux, même si on a de beaux référentiels et un SRM de folie qu'on a payé une blinde.
Adieu veaux, vaches, cochons, et référentiels RSE, financiers ou autres de tout poil, où l'on en tire la conclusion « qu'en-dessous d'un certain score, on va regarder comment se passer de ces fournisseurs ». Les maths sont imparables !
Alors, au village, on s'est tous regardés, et on s'est dit : maintenant, on comprend mieux le classement Pisa !
Bonnes fêtes à tous