Quelle est votre chance de vous en sortir ? #Covid19

La crise que nous vivons concentre le défi majeur de notre espèce, celui de la coopération, autrement dit de l’opposition entre intérêt personnel et interêt collectif. À cause du caractère exponentiel de la dissémination du virus, chaque individu infecté aggrave involontairement la situation future — on le répète, qu’il présente des symptômes ou non. Par opposition, chaque confiné, en choisissant d’obéir au confinement et de minimiser ses déplacements, contribue à dresser une barrière contre le coronavirus. L’emballement médiatique autour des essais menant à l’élaboration d’un médicament [1] présuppose que le danger lié au coronavirus, c’est de tomber malade. Mais est-il dangereux d’être atteint de Covid19 ? Doit-on s’en inquiéter ? Quelle est votre chance de vous en sortir ? Réponse.

Quelle est la probabilité d’être malade ?

Le mot « probabilité » est un synonyme mathématique de chance. Comment peut-on connaître la probabilité d’être atteint de Covid19 ? Généralement, il y a deux façons d’estimer des probabilités :

  1. On dispose d’un modèle théorique qui nous semble pertinent. Par exemple pour un lancer de pile ou face, on trouve ça raisonnable d’attendre 50% de chance d’avoir pile et 50% pour face [2].
  2. Sinon, on peut utiliser des observations empiriques sur une population, en calculant sur un échantillon donné la proportion d’individus malades.

Ces deux points sont en quelque sorte une définition de deux mots souvent confondus, les probabilités et les statistiques. Les probabilités s’occupent de donner des modèles a priori, valables avant toute observation, tandis que les statistiques donnent des mesures a posteriori, résultant de l’expérimentation. En fait, elles ne sont pas mutuellement exclusives. Même les modèles théoriques ont besoin d’observations pour fonctionner, et notamment estimer certains paramètres inconnus — c’est ce qu’on appelle l’inférence statistique [3].

Pour déterminer la probabilité d’être malade, on peut procéder comme pour les sondages. Imaginons qu’on observe un certain nombre de cas suspects dans la population, représentés en couleur sur l’image ci-dessus. Ces individus constituent l’échantillon de test : on fait passer un dépistage à chacun [4].

Issue du dépistage : malades en rouge, individus sains en vert

Supposons que sur les 12 cas testés, on observe 4 malades. On a donc envie de dire que la probabilité d’être malade est de 4 sur 12, \frac{4}{12} = \frac{1}{3} = 33\%. Aurait-on raison ? Pas vraiment…

Le conditionnement a.k.a. comment arnaquer avec les probas

En fait, on n’a pas vraiment calculé la probabilité d’être malade. Mais si, regardez : on n’a testé que les individus qui présentent des symptômes suspects. On a donc calculé la probabilité d’être malade sachant que l’on présente une suspicion. C’est pas la même chose. C’est ce qu’on appelle une probabilité conditionnelle, et repérer un conditionnement est souvent nécessaire pour éviter de se faire piéger. En effet, le conditionnement représente une information extérieure dont on dispose et qu’on « cache » dans le calcul des probabilités. Je donne un autre exemple pour illustrer :

Supposons qu’on cherche à calculer la probabilité qu’un individu possède un sac Louis Vuitton. Et qu’on aille interroger des gens uniquement Avenue Victor Hugo, dans le 16ème.

Ici, on aurait conditionné par le fait d’habiter dans le 16ème ; on doit donc s’attendre à surestimer la probabilité qu’on tente de calculer. C’est la raison pour laquelle quand on fait de l’inférence statistique, il faut s’assurer de ne pas artificiellement biaiser l’échantillon de test. Il aurait donc fallu, pour nos 12 individus testés, les choisir aléatoirement dans une population homogène — ce qui est, je l’accorde, plus facile à dire qu’à faire.

brusicor 🔵₂ on Twitter: "Le théorème de Bayes, une base des ...
Sheldon Cooper s’adonnant aux probabilités conditionnelles et à la formule de Bayes

La probabilité de mourir du Covid19

Maintenant, imaginons qu’on est bien malade. Même si ce n’est pas vous, vous devez bien connaître quelqu’un pour qui c’est le cas. On suit bien à la lettre le confinement mais on se demande : est-ce grave ? Quel est le risque d’en mourir ? — oui, on peut poser des questions graves aussi crûment #grosseambiance [5]. Ici, on peut s’appuyer sur les observations faites un peu partout dans le monde et compilées par l’OMS. Il semblerait qu’en ce moment, environ 3 malades sur 100 décèdent du coronavirus.

Parmi tous les malades, peu finissent par mourir

Ce taux de 3% est appelé taux de létalité, et correspond à la proportion de décès parmi les malades. Pour mettre en lien avec le conditionnement probabiliste, cela correspond donc à la probabilité de décéder sachant qu’on est atteint de Covid19. La population considérée ici est celle des malades. Et comme vous avez suivi, vous comprenez que c’est un nombre différent de la probabilité de décéder du Covid19 tout court. Cette dernière correspond au nombre de décès ramenés à la population entière, et ça s’appelle le taux de mortalité. Sa valeur est très dure à calculer tant que l’épidémie n’est pas terminée, car elle dépendra du nombre total de contaminés. Dans une hypothèse pessimiste de 50% de la population contaminée, on s’attendrait à ce que le taux de mortalité soit de 1,5% (50% de 3% = 1,5%). Pour 70 millions d’habitants, ça représenterait quand même plus d’un million de morts. Les probabilités sont impitoyables.

Attention, ce chiffre de 3% est à prendre avec des pincettes [8]. C’est une estimation qui utilise le nombre de cas constatés actuellement, dans le monde, ce qui est nécessairement biaisé. En effet, c’est un peu comme si on conditionnait notre probabilité sur l’ensemble des gens dont on est sûr maintenant qu’ils sont malades ; or il y a des cas qu’on ignore. D’ailleurs, l’expérience malheureuse du Diamond Princess est intéressante car elle constitue un « système fermé » et donne un taux de létalité de 0,5%, ce qui pousse certains à affirmer que les 3% annoncés par l’OMS sont surestimés. En tout état de cause, supposons pour la suite que la vraie valeur est bien 3%, ce qui fixe les idées, et laisse espérer une réalité encore plus favorable.

À titre individuel en revanche, si on est malade du coronavirus, on doit s’attendre à environ 3% de chances d’en mourir (chiffre à moduler suivant l’âge et la condition physique [6], ou tout autre facteur de risque). Ce qui donne 97% de chances de s’en sortir, ce qui est quand même très prometteur — vous seriez prêts à miser combien d’argent pour jouer à un pile ou face avec 97% de chance de gagner ? Si vous doutez que 3% est faible, on peut visualiser ça sous différentes formes : une barre de progression

Voici où se situe 3%

ou même une couleur

Le carré du centre a bien une couleur à 3% intermédiaire entre le gris et le noir : arrivez-vous à voir la différence ?

Conclusion

Lorsqu’on vous montre un taux, une proportion, une statistique, demandez-vous toujours quel conditionnement, même implicite, a été effectué. En d’autres termes, ce que représente le dénominateur de la fraction. Bien souvent, une volonté politique mal placée peut utiliser une observation réelle (le numérateur) mais tromper dans la base de comparaison (le dénominateur).

Et quelle morale tirer pour Covid19 ? Principalement que si on est malade mais qu’on ne fait pas partie de la population à risque (ceux pour qui le taux de létalité est de l’ordre de 10% voire 15%), on n’a pas vraiment besoin de se faire du souci pour soi. Bien entendu, tout peut arriver, on peut même dire que ça va arriver, mais on ne sait pas pour qui. Voici la triste réalité des probabilités : une probabilité très faible, c’est une quasi-garantie que rien ne nous arrivera à titre individuel, mais que ça arrivera à d’autres [7]. D’où l’intérêt des mesures prises pour ralentir la dissémination du virus : protéger les gens à qui ça arrivera.


Pour ne pas rater les prochains articles de la série, n’oubliez pas de vous inscrire à la newsletter


Notes

[1] Dont la fameuse et controversée hydroxychloroquine défendue par le non moins controversé Pr Raoult. Ceux qui me connaissent savent mon avis sur la question — notamment sur le manque d’interprétabilité scientifique des travaux mis en avant par ce professeur.

[2] Si tant est que la pièce est équilibrée, sinon on peut donner plus d’importance à la face truquée. Ce modèle porte le nom de Loi de Bernoulli, et les mathématiciens disposent dans leur arsenal de tout un tas de modèles théoriques qui peuvent modéliser différents phénomènes aléatoires.

[3] Cette inférence est rendue possible, bien souvent, par une loi très connue mais dont beaucoup de gens écorchent le nom : la Loi des grands nombres (attention, rien à voir avec la théorie des nombres !) Énoncée simplement, elle explique que pour un grand nombre d’observations, les fréquences observées finissent par correspondre aux probabilités théoriques. La boucle entre probabilités et statistiques est bouclée.

[4] On suppose ici que nos tests de dépistage fonctionnent bien, ce qui n’est pas forcément une hypothèse correspondant à la réalité.

[5] Rappelons qu’hormis la mort, le coronavirus peut laisser des séquelles plus ou moins graves.

[6] Il est ici pertinent de conditionner suivant son âge. En effet, dans le groupe des gens âges de plus de 80 ans, ce taux de létalité est de 15%.

[7] Ce phénomène est très similaire au loto. À titre individuel, il est virtuellement impossible de gagner, tellement les chances sont infimes. Mais multipliées par le nombre de participants, il devient au contraire invraisemblable que personne ne gagne ; c’est-à-dire qu’il est presque certain que quelqu’un va gagner.

[8] Remerciements à Paul-Claude pour me l’avoir fait remarquer.

Covid19 et la croissance exponentielle

Depuis la rédaction de l’article, la croissance exponentielle continue, et la trajectoire de la France (bleue) est toujours aussi proche de celle de l’Italie (rouge) ! Voir le graphique ci-dessus.

Sources : données de l’université Johns Hopkins compilées à l’adresse https://coronavirus.politologue.com

Mise à jour du 16 mars

La pandémie liée au Covid19 gagne dangereusement le monde. Chaque pays prend ses dispositions et publie ses recommandations officielles — se laver les mains fréquemment, ne plus serrer les mains ou faire la bise, etc.

Il y a cependant un paradoxe. Les pays où le nombre de cas est encore faible semblent croire qu’il leur est inutile de prendre des mesures trop contraignantes — sous peine de se voir qualifier de mesures démesurées… Il est vrai qu’on a tendance à sous-estimer la gravité d’une épidémie, surtout lorsqu’on est jeune et en bonne santé et qu’on se dit qu’au pire, avoir l’équivalent d’une grippe pendant une semaine, y’a pas mort d’homme. Bien au contraire, il faut absolument garder en tête deux points cruciaux :

  1. Même si le coronavirus n’est pas si grave que ça pour un jeune, et même celui-ci ne développe pas de symptômes, il sera un vecteur de transmission et pourra infecter à son tour les individus à risque — parmi lesquelles les personnes de plus de 50 ans ou présentant des troubles respiratoires. N’oublions pas que les lésions pulmonaires peuvent être très graves et conduire à un Syndrome de Détresse Respiratoire Aiguë (la raison pour laquelle les services de réanimation risquent le débordement)
  2. Le nombre de contaminés suit une loi de croissance exponentielle. Ainsi, un faible nombre de diagnostiqués aujourd’hui n’est pas vraiment matière à rassurer

Il y a déjà suffisamment de ressources en ligne qui traitent du problème du point de vue sanitaire. Je vais donc m’attarder sur le deuxième point, ce qui sera l’occasion de rappeler quelques fondamentaux mathématiques qui, en ces temps de pandémie, gagneraient à être connus d’un plus grand nombre.

Maladie contagieuse = croissance exponentielle

Tout repose sur l’idée très simple suivante : un malade, en contact avec d’autres personnes, peut leur transmettre le virus. Ok, dit comme ça ce n’est rien de neuf. Mais cela signifie que sans mesure de confinement, plus il y a de malades, plus le nombre de personnes nouvellement infectées sera élevé. On peut même dire que chaque jour, le nombre de nouveaux cas est proportionnel au nombre de cas de la veille [1]. Les données relevées partout dans le monde suggèrent une valeur de proportionnalité comprise entre 1,2 et 1,3. Dit autrement : chaque jour, le nombre de malades bondit de 20% à 30%.

Ceci est caractéristique d’une croissance exponentielle. C’est une suite qui évolue en partant d’un nombre initial (qu’on peut dire égal à 1, correspondant ici au patient zéro) et qui multiplie à chaque fois par une constante (ici disons 1,3). Voici l’évolution que cela donne sur 20 jours :

Suite à croissance exponentielle (taux 1,3). Si le démarrage est lent, ça s’emballe très vite !

On voit qu’au bout d’un moment (ici à peu près 10 jours), la situation s’emballe très vite. Voyons maintenant ce qu’il se passerait si on ne regardait que sur un horizon de 10 jours, et qu’on comparait à un autre pays qui partirait d’un nombre de cas plus aigu :

La courbe rouge et la courbe bleue représentent une situation imaginaire, où deux pays démarrent avec un nombre de cas différents

Si on habite dans le pays rouge, on comprend rapidement qu’on a affaire à une crise sanitaire majeure et qu’il faut agir pour endiguer la prolifération du virus. En revanche, depuis le pays bleu, ça semble suffisamment calme. Si le gouvernement, voyant ces chiffres, imposait la quarantaine à sa population, on crierait sur les réseaux sociaux que c’est scandaleux, extrême, abusé… Et pourtant. Nous avons vu que le pays bleu finit lui aussi par subir la pandémie de plein fouet. Peut-on comparer les deux pays. Je vais vous révéler un truc : pour le pays rouge, j’ai mis comme valeur de départ celle du pays bleu au 11ème jour. Et les propriétés de l’exponentielle font que la courbe rouge correspond exactement à la fin de la courbe bleue :

Pour une croissance exponentielle, commencer avec une valeur plus élevée, c’est équivalent à commencer plus tard. Ce qui veut dire que les pays où les nombres de cas sont plus faibles ont simplement du retard sur les autres (si le taux d’évolution ne change pas, par exemple si aucune mesure n’est prise)

Cela signifie que lorsqu’on démarre d’une valeur plus élevée, c’est comme si on était dans le futur d’un autre pays — et réciproquement, si on démarre d’une valeur plus faible, c’est comme si on était dans le passé d’un autre pays [2]. Voici pourquoi on dit que la France a du retard sur l’Italie, ou que l’Europe a du retard sur la Chine. Le faible nombre de cas (enfin faible… relativement) d’il y a une semaine n’aurait pas dû être une invitation à rassurer la population (« ne vous en faites pas, la situation n’est pas si grave que ça, inutile de s’alarmer et donc de changer vos comportements »), mais à se rendre compte qu’il vaut mieux prendre des dispositions pour ralentir les contaminations (et donc faire baisser le facteur), afin de gagner le plus de temps possible.

Image
Si on trace la courbe de progression de l’Italie avec celle de la France décalée de 8 jours, on a une superposition quasi-parfaite

Finalement, la situation de cette dernière semaine en France résulte vraisemblablement du manque de mesures politiques fortes conjugué à l’insouciance de la population. Comme pour la majorité des drames modernes, la responsabilité est partagée entre tous.


Notes

[1] Tout cela est semblable au cas de la radioactivité : étant donné une certaine matière radioactive, le nombre de désintégrations (par unité de temps) est proportionnel à la quantité de matière présente. Cela conduit à la fameuse équation différentielle f’ = a.f (la dérivée est proportionnelle à la fonction) dont la solution est, par définition, une fonction exponentielle ; ici de la forme f(t) = f_0 . e^{at}. Noter que pour les désintégrations radioactives, a est négatif (la quantité de matière diminue), on a donc affaire à une décroissance exponentielle.

[2] Formellement, cela provient du fait que l’exponentielle convertit les additions en multiplications. Pour réaliser un décalage temporel d’une durée de t_0, on passe de f(t) à f(t-t_0).

Et ensuite, f_0e^{t – t_0} = f_0e^{t}e^{ – t_0} = (f_0 e^{ – t_0}) e^{t}.

Sommes–nous obsédés par l’optimisation ?

Depuis pas mal de temps, il semblerait qu’une frénésie d’optimisation ait gagné la société. Alors qu’à l’origine on s’intéressait surtout aux coûts, maintenant, tout le monde veut optimiser tout, tout le temps : la façon de travailler, les décisions qu’on prend, le choix de partenaire, etc. Je pense que le mot optimal — et ses variantes — sont souvent utilisés à tort et à travers. Les lecteurs réguliers du blog savent à quel point le sens des mots m’importe. Il ne pourrait en être différemment du mot optimisation, puisque c’est un mot très présent en maths [1].

Résultat de recherche d'images pour "optimal"

Tout d’abord un petit point de vocabulaire. Il y a souvent une confusion sur les mots optimal et optimum. Il se trouve que le premier est un adjectif, l’autre un nom (substantif). Tout comme pour minimum et maximum, d’origine latine, la règle de la terminaison est :

  • _um → nom singulier
  • _a → nom pluriel [2]
  • _al/_ale/_aux/_ales → adjectif (qui suit les règles d’accord en genre et en nombre)

Ainsi on peut parler d’un maximum ou alors de valeur maximale. Maintenant que ceci est clair, passons au vif du sujet.

Vous avez dit optimiser ?

L’optimalité est un concept mathématique. L’avantage des maths, c’est que les mots y ont un sens précis. En l’occurrence, l’optimisation concerne les fonctions [3]. Inutile de s’appesantir sur ce concept, ce qui compte — et en simplifiant — est que les fonctions prennent un nombre infini de valeurs. Et dans ce cadre, optimiser une fonction, c’est une idée très simple : trouver, dans cette infinité de valeur, la plus grande [4].

Résultat de recherche d'images pour "maximum fonction"
Exemple de fonction avec son maximum et son minimum

L’important pour parler d’optimalité est d’être sûr que la valeur est bien meilleure que n’importe quelle autre valeur possible. Que n’importe quelle autre possible. Bon, en fait, quand on parle d’optimalité, on doit préciser quel ensemble des valeurs possibles on considère. Mais dans la plupart des cas — en maths, cela est assez évident. Et si ce n’est pas évident, il faut le préciser.

Choisir entre la peste et le choléra

Or, on entend fréquemment des propos tels que : « entre ces 3 options, la première est optimale. » Deux possibilités :

  1. Il n’existe vraiment que 3 solutions possibles, et aucune autre. Ce serait surprenant, et donc tout esprit critique qui se respecte doit se demander pourquoi. Ainsi la personne qui présente ces 3 options devrait clairement expliquer pourquoi il ne peut y avoir aucune autre possibilité [je liste cette éventualité par pur désir d’exhaustivité, car en fait ce n’est que très rarement le cas]
  2. Ou bien, plus vraisemblablement, il en existe d’autre. Pourquoi les avoir occultées ? Ce choix n’est probablement pas volontaire [5], il résulte sûrement d’une volonté de cadrer le raisonnement.

Dans le cas numéro 2, la personne qui parle voulait probablement dire meilleure, et c’est le mot qu’elle aurait du utiliser. Cela m’embête pour deux raisons. La première est que j’ai l’impression que ça relève du sciencewashing — je ne sais pas si le mot existe, du coup je l’invente là, maintenant. C’est comme le greenwashing, sauf qu’au lieu de nous conférer une autorité morale (grâce à l’environnement), cela nous confère une autorité intellectuelle par l’utilisation, abusive, d’un jargon scientifique. Or on sait à quel point les gens peuvent se faire avoir par des discours jargonnants mais vides de sens.

La seconde est que dire optimal suggère qu’on était dans le cas numéro 1, qu’il n’y a aucun autre choix possible. Non seulement cela rend insensible aux potentielles failles dans le raisonnement, mais aussi laisse une impression de choix du type « peste ou choléra ? » qui enferme l’esprit et l’empêche de réfléchir à d’autres alternatives — ce qu’on appelle en anglais to think outside the box.


En conclusion, méfions-nous des utilisations abusives des mots optimal et optimiser. Prenons un dernier exemple, dans le monde de l’entreprise. Quand les chefs d’un service veulent « optimiser » son fonctionnement, ils souhaitent en fait l’améliorer selon les critères qu’ils pensent être désirables. Mais si jamais ils se trompent quant à la pertinence de leur analyse — et cela est très fréquent — rien ne garantit l’efficacité des mesures adoptées.

Notes

[1] Je ne compte pas le nombre de cours qui s’appellent « Optimisation blablabla » que j’ai eus au fil de mes études.

[2] L’orthographe rectifiée de 1990 accepte optimums (au lieu d’optima).

[3] C’est donc un sous-sujet de ce qu’on appelle l’analyse.

[4] En fait, mathématiquement, optimiser peut vouloir dire trouver la plus grande ou la plus petite valeur… Cela peut paraître surprenant qu’un mot mathématique puisse vouloir dire une chose et son contraire, mais en fait le contexte permet presque toujours de savoir si on cherche la plus grande ou la plus petite valeur. Et pour ceux qui se demandent pourquoi une telle ambiguïté, c’est tout simplement parce que trouver la plus grande ou la plus petite valeur, c’est presque exactement le même problème. En effet, la plus grande valeur d’une fonction f est la plus petite de son opposée –f.

[5] Je pense que cela relève surtout d’un manque de ce que j’appelle l’imagination logique, c’est-à-dire la faculté à s’imaginer les conséquences logiques d’une situation donnée.

Naissance

Nouvelle décennie, nouveau blog.

Comme tout nouveau-né, il a fallu lui trouver un nom. De préférence un nom qui évoque le (futur) contenu (à défaut de pouvoir trouver une combinaison de sons qui sonne bien) du blog. Sauf que s’il y a bien une chose que mes quelques mois à publier sur Medium m’ont appris, c’est qu’il est difficile de trouver un thème central concernant mes posts.

Après d’interminables tergiversations et conseils chaotiques [1] pour trouver un nom de blog, je suis à peu près certain que je finirai par regretter un jour où l’autre ce choix. Mais il faut bien se jeter à l’eau un jour ou l’autre. Et aujourd’hui est le jour idéal.

Pourquoi ? Outre le fait qu’on vient de célébrer le changement de décennie [2], aujourd’hui est un jour spécial. Nous sommes le 2 février 2020, soit le 02/02/2020, et ce que ce soit avec la notation européenne des dates qu’avec l’américaine ! Pour ceux qui ne l’auraient pas repéré, 02022020 est un palindrome, c’est-à-dire un « mot » qui se lit pareil de gauche à droite ou de droite à gauche, un peu comme kayak. Ce mot-nombre à même d’autres propriétés intéressantes :

  • il n’est composé que de 2 chiffres (0 et 2) qui sont tous les deux présents en quantités égales (4 de chaque), quantité qui est elle-même une puissance de 2 ;
  • il est composé de 8 chiffres, ce qui est égal à la somme de ses chiffres (0+2+0+2+2+0+2+0 = 8) ;
  • c’est le seul « palindrome universel » (valable pour la notation européenne et américaine) de la décennie ! Par exemple en 2021 on doit avoir 12/02 qui peut soit vouloir dire 12 février chez nous ou bien 2 décembre chez les américains… etc.

Bref, un jour particulièrement intéressant pour quelqu’un comme moi.

file

Parlons maintenant du nom du blog. Idées transverses, pourquoi ? Pour capturer deux points fondamentaux de mes posts :

  1. Mon blog insistera sur la transversalité des concepts. Je pense que les différents champs de connaissance se nourrissent entre eux. Ainsi en lisant le blog, voire un seul article, vous pourrez découvrir des notions de maths, de science, d’informatique, d’économie, voire de linguistique (et beaucoup de critiques sur la société) [3]
  2. La plupart des médias écrits (blogs ou journaux en ligne) ont des sujets motivés par l’actualité. Chez moi, c’est différent : je parle de plein de choses différentes, que je trouve passionnantes (évidemment) mais qui n’attireraient pas forcément votre attention en temps normal.

Bref, le blog est un moyen de partager ce que je trouve intéressant, et une tentative de le rendre intéressant au plus grand nombre — bon et je l’avoue, surtout un endroit où me plaindre des absurdités que j’observe.

Quant au changement de plateforme, il est motivé par les limitations (et quelques frustrations) posées par Medium. Medium est une super plateforme pour écrire des articles d’opinion, mais lorsqu’on n’écrit pas sur un sujet tendance, elle ne rapporte pas beaucoup de lecteurs. J’ai donc décidé de m’en libérer et d’héberger le blog moi-même.

Mise à jour du 12 février

Les anciens articles ont maintenant été réintégrés au site !

Notes

[1] Il est d’ailleurs souvent très désagréable de demander conseil à plusieurs personnes, car on obtient toujours des conseils contradictoires. À qui se fier ? Et que faire lorsqu’on n’a pas d’avis personnel tranché ? C’est un des mystères de la vie…

[2] Certains relèvent que techniquement, la prochaine décennie devrait commencer en 2021 (puisque le calendrier n’a pas d’an 0), mais en bon informaticien je m’insurge.

[3] Liste non exhaustive inspirée par mon activité passée sur Medium.

Le portrait de Dorian Gris

Regardez cette étrange image que j’ai créée pour vous. D’abord de près (ou en grand), puis de loin (ou en petit, ou en plissant des yeux). Vous pourriez être surpris, et même peut-être gêné… Si tout se passe bien, vous devriez distinguer le visage d’un homme qui, petit à petit, se métamorphose en femme. Comment expliquer ce sortilège ? Illusion d’optique ? Pas vraiment — en fait pas du tout, et c’est ce que nous allons voir dans cet article.

Photo à regarder d’abord de près (ou en grand), puis de loin (ou en petit, ou en plissant des yeux). Surprenant !

Pour bien comprendre le phénomène en jeu, on va devoir expliquer la décomposition spectrale des signaux. Ne partez pas ! Derrière ce nom barbare se cache une idée très simple et intuitive. Si si je vous jure ! Vous la rencontrez tous les jours sans vous en apercevoir. Faisons un petit détour par la musique pour comprendre.

Combinaison de fréquences

Au collège, on apprend qu’une note de musique n’est rien d’autre qu’une pulsation qui se répète avec une certaine fréquence. Plus la fréquence est élevée, plus la note est perçue comme aiguë, et réciproquement, une fréquence basse donne une note grave. C’est par exemple à ça que correspond le 440 Hz du diapason qui donne le La. La fréquence correspond au nombre de pulsations en une seconde, et on peut par exemple représenter le signal audio de la sorte :

De gauche à droite, les fréquences vont grandissant. Les plus malins reconnaîtront la fonction sinus [1] sur ces graphes, et ils auront raison : une fonction sinus représente ce qu’on appelle une onde pure, une note qui se déploie dans l’éternité des temps passés et futurs.

Regardons à présent ce qui se passe quand on additionne deux fréquences, l’une basse, l’autre haute.

On a comme l’impression que la fréquence haute s’enroule autour de la fréquence basse. En fait, on peut même remarquer deux propriétés intéressantes :

  • Si on dézoome, c’est-à-dire qu’on regarde de loin, le signal résultant ressemble énormément à la fréquence basse : on ne distingue plus les détails apportés par la fréquence haute
  • Au contraire, lorsqu’on regarde de près, on ne se rend plus compte de la forme globale donnée par la fréquence basse : ce qui est visible ressemble beaucoup à la fréquence haute

On a trouvé là le secret qui rend possible l’effet des visages : un signal livre ses fréquences hautes quand il est observé de près, et ses fréquences basses quand on le voit de loin. Mais vous allez sûrement vous demander : quel rapport avec les images ? Il n’y a pas de notion de fréquence à ce que je sache ? Eh bien, si !

Continuer la lecture de « Le portrait de Dorian Gris »

La table des pentagrammes

Parmi les symboles ésotériques, le pentagramme (étoile à 5 branches) est sans doute l’un des plus célèbres. Sa simplicité géométrique combinée à la symbolique du chiffre 5 en font un candidat de choix pour représenter une supposée matrice de l’univers. Il a été beaucoup utilisé dans la kabbalah (mystique juive) ou en alchimie, comme l’atteste le fascinant article Wikipédia à son sujet.

Pentagramme censé détenir les secrets de la transmutation alchimique, issu du manga Full Metal Alchemist

Comment se dessine l’étoile à 5 branches ? C’est facile, il suffit de prendre un pentagone régulier, et de relier sommet sur deux, jusqu’à ce qu’on retourne au point de départ (le sommet du haut).

Du pentagone (à gauche) au pentagramme (à droite), les sommets sont numérotés par ordre de visite

À partir de là, tout esprit matheux qui se respecte se demande ce qu’il se passerait si on procédait à la même construction mais avec d’autres valeurs. De quelles valeurs parle-t-on ? On peut remarquer que la construction du pentagramme a utilisé deux nombres :

  1. le nombre de côtés du polygone de départ, ici 5 ;
  2. le nombre de sommets à « sauter » entre chaque trait, ici 2.

Ainsi, notre pentagramme classique, provenant de ces deux valeurs, est entièrement caractérisé par celles-ci : on lui donne donc le doux nom de (5,2).

Essayons donc de refaire la même chose mais en partant d’un polygone à 6 côtés (un hexagone pour les hellénisants), et testons différentes valeurs pour l’autre paramètre. On construit donc les figures (6,1) à (6,5) :

La famille (6,1) à (6,5) au complet
  1. (6,1) correspond à l’hexagone régulier, puisqu’on relie tous les sommets dans l’ordre, sans en sauter aucun.
  2. À partir de (6,2), notre procédure n’atteint plus tous les sommets de l’hexagone ! En effet, en reliant les sommets de 2 en 2, on revient à notre point de départ en 3 tours (puisque 3 × 2 = 6).
  3. De même pour (6,3), mais on revient au point de départ dès le deuxième trait tiré, puisque 2 × 3= 6 !
  4. Ensuite, les figures restantes sont les symétriques des premières (comme si la ligne verticale en (6,3) était un miroir). On voit que (6,4) est comme (6,2) mais en tournant dans l’autre sens. Cela s’explique car sur l’hexagone, tourner de 4 sommets dans un sens, c’est tourner de 2 sommets dans l’autre. On peut faire la même remarque pour (6,5).

Cette remarque est en fait intuitive pour quiconque sait lire l’heure : tout le monde sait que 45 minutes, « moins le quart » (pour l’heure d’après). D’ailleurs, regardons ce qui se passe si on construit les mêmes pentagrammes pour un polygone à 12 sommets—un dodécagone—, chacun représentant un marquage sur l’horloge. On ne va afficher que (12,1) à (12,6) puisqu’après, tout comme on vient de le voir, les figures seront symétriques.

Continuer la lecture de « La table des pentagrammes »

Un polonais à la rescousse de Twitter

Il y a quelques semaines, un simple problème arithmétique a déchaîné les passions sur Twitter : combien font 8 ÷ 2 (2 + 2) ? Face à ce calcul d’apparence simple—qui n’est pas, malgré le titre de certains journaux, une équation— deux camps se sont divisés sur la réponse présumée : 1 ou 16.

D’aucuns croient que le désaccord entre les calculatrices est une preuve d’un complot mathématique mondial.

Villani à la rescousse

Des médias très sérieux ont même demandé au député Cédric Villani, détenteur de la médaille Fields (l’équivalent du prix Nobel des maths, comme on dit), de démêler le vrai du faux :

Une expression mathématique n’est bien écrite que s’il n’y a pas d’ambiguïté. Et ici, l’expression est ambiguë. C’est un peu comme si vous écriviez « Je suis le professeur » et que vous faisiez voter pour savoir si « suis » est le verbe être ou le verbe suivre.

De quelle ambiguïté parle-t-il ? Du fait qu’on doive multiplier par (2 + 2), c’est-à-dire 4, avant ou après avoir fait la division. En jargon matheux, on dit : la multiplication est-elle prioritaire face à la division ? On apprend assez tôt que la multiplication est prioritaire face à l’addition et la soustraction. Par exemple, 2 × 3 + 1 est égal à 6 + 1 = 7, et non pas 2 × 4 = 8. Si on veut signifier le second cas, on doit utiliser des parenthèses—c’est par exemple la solution proposée par Cédric Villani : 2 × (3 + 1), qu’on peut noter 2 (3 + 1)(le signe fois est ici implicite). Sauf que dans le cas des signes × et ÷, il n’y a pas de convention de priorité.

Un autre moyen de lever l’ambiguïté dans le problème de Twitter est de noter la division sous la forme de fraction — qui est d’ailleurs la seule forme acceptable en mathématiques à partir du collège. Du coup, la question revient à savoir si 8 ÷ 2 (2 + 2) correspond à

(1)

ou à

(2)

Un signe aussi intimidant qu’une fraction n’aurait certainement pas autant soulevé les foules…

Pourtant, il existe une autre solution peu connue : la notation polonaise.

Łukasiewicz à la rescousse

Drapeau de la Pologne (oui, il y a une barre blanche)

Au 20ème siècle, le mathématicien polonais Jan Łukasiewicz a proposé une façon différente de noter les opérations, qui a le bon goût de ne jamais produire d’ambiguïté. Cette notation, que l’on qualifie de préfixée, consiste à écrire l’opérateur avant les deux nombres concernés (et non entre les deux nombres, notation infixée). Ainsi, 3 + 4 s’écrit + 3 4. Assez étrange, n’est-ce pas ? En fait, c’est assez naturel en terme de langage : on annonce dès le début qu’on va faire une addition, et puis on donne l’un après l’autre les deux termes à additionner. Et c’est pareil pour les autres opérateurs qui prennent deux nombres.

La règle est simple : on lit de gauche à droite ; quand on voit un opérateur, on attend de lire deux nombres, puis on réalise le calcul et on écrit le résultat à la place du triplet “opérateur opérande1 opérande2”. Pour mieux appréhender ça, prenons quelques exemples.

  • – 4 3 → 4 – 3 = –1
  • + 3 7 → 3 + 7 = 10
  • × – 3 1 3 → (3 – 1) × 3 = 6

Reprenons le dernier exemple × – 3 1 3. En voyant le signe fois, on attend deux nombres à venir. Puis on voit le signe moins, on attend donc deux nombres. Viennent 3 et 1 qui font les deux opérandes du signe moins : on calcule donc 3 – 1 = 2, et on place 2 à l’endroit occupé par “– 3 1”. L’expression devient alors × 2 3, ce qui signifie avec notre notation habituelle 2 × 3, soit 6. L’évolution de l’expression est donc la suivante :

  • × – 3 1 3
  • × 2 3
  • 6

Maintenant qu’on a compris comment passer de la notation polonaise à la classique, on peut faire l’inverse : comment écrire une expression habituelle en notation polonaise ? Essayons avec (1 + 2) × (3 + 4). Voici les étapes de la réflexion :

  1. (1 + 2) s’écrit + 1 2
  2. (3 + 4) s’écrit + 3 4
  3. Si les deux termes du haut s’appelaient A et B, les multiplier s’écrirait × A B
  4. Il faut donc écrire × + 1 2 + 3 4

On peut donc revenir au problème de Twitter, 8 ÷ 2 (2 + 2). On va essayer de réécrire cette expression avec la notation polonaise—ce dont on parle depuis 5 minutes qui ont paru durer 4 heures. Il faut distinguer les deux cas écrits sous forme de fraction en début d’article.

Cas (1), (2 + 2) en numérateur.

  • D’abord, on divise 8 par 2 → ÷ 8 2
  • on calcule 2 + 2 séparément → + 2 2
  • puis on multiple les deux :

× ÷ 8 2 + 2 2

Cas (2), (2 + 2) en dénominateur.

  • D’abord on calcule 2 + 2 → + 2 2
  • on multiplie 2 par ça → × 2 + 2 2
  • puis on multiplie 8 par ça :

÷ 8 ×2 + 2 2

Et voilà, on voit que les deux possibilités s’écrivent différemment. La notation polonaise explicite la priorité des opérations puisque, en vertu de l’écriture préfixée, plus un opérateur arrive tôt, plus on l’effectue tard. (on peut reformuler ce charabia par : les opérateurs les plus à gauches sont les moins prioritaires).

Dans le cas (1), l’opérateur qu’on voit en premier est ×, ce qui veut dire qu’on fait d’abord ÷; ici la division a la priorité. À l’inverse dans le cas (2), l’opérateur qu’on voit en premier est ÷; la multiplication a ici priorité.

L’ambiguïté est bien levée. Merci la Pologne d’avoir sauvé Twitter !


Supplément pour les nerds

Ne vous inquiétez pas si vous ne comprenez pas le charabia suivant

Il existe un moyen facile d’obtenir l’écriture en notation polonaise d’une expression. On va l’illustrer avec le calcul 2 + 3 × 4. Tout d’abord, on construit l’arbre syntaxique correspondant à l’expression, comme ci-dessous :

Arbre syntaxique de l’expression 2 + 3 × 4

Ensuite, on réalise un parcours en profondeur de l’arbre en suivant les deux règles suivantes :

  1. On écrit la valeur des nœuds à la première visite.
  2. On écrit la valeur des feuilles quand on les visite.

En notant qu’un parcours en profondeur d’un arbre binaire visite chaque nœud trois fois (quand on arrive dessus, quand on prend l’embranchement après avoir visité le premier fils, puis quand on le quitte), on remarque également que ces trois possibilités correspondent respectivement aux notations préfixées, infixées et postfixées. Ainsi, écrire l’opérateur à la deuxième visite conduit à la notation classique.

Terminons sur un dernier exemple. Ecrivons le résultat du parcours en profondeur de l’arbre syntaxique ci-dessous, avec les trois types de notation :

Illustration du parcours en profondeur d’un arbre binaire

Préfixée (notation polonaise)

+ a ÷ × b 4 3

Infixée (notation classique, sans parenthèses)

a + b × 4 ÷ 3

Postfixée (notation polonaise inverse)

a b 4 × 3 ÷ +