La crise que nous vivons concentre le défi majeur de notre espèce, celui de la coopération, autrement dit de l’opposition entre intérêt personnel et interêt collectif. À cause du caractère exponentiel de la dissémination du virus, chaque individu infecté aggrave involontairement la situation future — on le répète, qu’il présente des symptômes ou non. Par opposition, chaque confiné, en choisissant d’obéir au confinement et de minimiser ses déplacements, contribue à dresser une barrière contre le coronavirus. L’emballement médiatique autour des essais menant à l’élaboration d’un médicament [1] présuppose que le danger lié au coronavirus, c’est de tomber malade. Mais est-il dangereux d’être atteint de Covid19 ? Doit-on s’en inquiéter ? Quelle est votre chance de vous en sortir ? Réponse.

Quelle est la probabilité d’être malade ?
Le mot « probabilité » est un synonyme mathématique de chance. Comment peut-on connaître la probabilité d’être atteint de Covid19 ? Généralement, il y a deux façons d’estimer des probabilités :
- On dispose d’un modèle théorique qui nous semble pertinent. Par exemple pour un lancer de pile ou face, on trouve ça raisonnable d’attendre 50% de chance d’avoir pile et 50% pour face [2].
- Sinon, on peut utiliser des observations empiriques sur une population, en calculant sur un échantillon donné la proportion d’individus malades.
Ces deux points sont en quelque sorte une définition de deux mots souvent confondus, les probabilités et les statistiques. Les probabilités s’occupent de donner des modèles a priori, valables avant toute observation, tandis que les statistiques donnent des mesures a posteriori, résultant de l’expérimentation. En fait, elles ne sont pas mutuellement exclusives. Même les modèles théoriques ont besoin d’observations pour fonctionner, et notamment estimer certains paramètres inconnus — c’est ce qu’on appelle l’inférence statistique [3].

Pour déterminer la probabilité d’être malade, on peut procéder comme pour les sondages. Imaginons qu’on observe un certain nombre de cas suspects dans la population, représentés en couleur sur l’image ci-dessus. Ces individus constituent l’échantillon de test : on fait passer un dépistage à chacun [4].

Supposons que sur les 12 cas testés, on observe 4 malades. On a donc envie de dire que la probabilité d’être malade est de 4 sur 12, \frac{4}{12} = \frac{1}{3} = 33\%. Aurait-on raison ? Pas vraiment…
Le conditionnement a.k.a. comment arnaquer avec les probas
En fait, on n’a pas vraiment calculé la probabilité d’être malade. Mais si, regardez : on n’a testé que les individus qui présentent des symptômes suspects. On a donc calculé la probabilité d’être malade sachant que l’on présente une suspicion. C’est pas la même chose. C’est ce qu’on appelle une probabilité conditionnelle, et repérer un conditionnement est souvent nécessaire pour éviter de se faire piéger. En effet, le conditionnement représente une information extérieure dont on dispose et qu’on « cache » dans le calcul des probabilités. Je donne un autre exemple pour illustrer :
Supposons qu’on cherche à calculer la probabilité qu’un individu possède un sac Louis Vuitton. Et qu’on aille interroger des gens uniquement Avenue Victor Hugo, dans le 16ème.
Ici, on aurait conditionné par le fait d’habiter dans le 16ème ; on doit donc s’attendre à surestimer la probabilité qu’on tente de calculer. C’est la raison pour laquelle quand on fait de l’inférence statistique, il faut s’assurer de ne pas artificiellement biaiser l’échantillon de test. Il aurait donc fallu, pour nos 12 individus testés, les choisir aléatoirement dans une population homogène — ce qui est, je l’accorde, plus facile à dire qu’à faire.

La probabilité de mourir du Covid19
Maintenant, imaginons qu’on est bien malade. Même si ce n’est pas vous, vous devez bien connaître quelqu’un pour qui c’est le cas. On suit bien à la lettre le confinement mais on se demande : est-ce grave ? Quel est le risque d’en mourir ? — oui, on peut poser des questions graves aussi crûment #grosseambiance [5]. Ici, on peut s’appuyer sur les observations faites un peu partout dans le monde et compilées par l’OMS. Il semblerait qu’en ce moment, environ 3 malades sur 100 décèdent du coronavirus.

Ce taux de 3% est appelé taux de létalité, et correspond à la proportion de décès parmi les malades. Pour mettre en lien avec le conditionnement probabiliste, cela correspond donc à la probabilité de décéder sachant qu’on est atteint de Covid19. La population considérée ici est celle des malades. Et comme vous avez suivi, vous comprenez que c’est un nombre différent de la probabilité de décéder du Covid19 tout court. Cette dernière correspond au nombre de décès ramenés à la population entière, et ça s’appelle le taux de mortalité. Sa valeur est très dure à calculer tant que l’épidémie n’est pas terminée, car elle dépendra du nombre total de contaminés. Dans une hypothèse pessimiste de 50% de la population contaminée, on s’attendrait à ce que le taux de mortalité soit de 1,5% (50% de 3% = 1,5%). Pour 70 millions d’habitants, ça représenterait quand même plus d’un million de morts. Les probabilités sont impitoyables.
Attention, ce chiffre de 3% est à prendre avec des pincettes [8]. C’est une estimation qui utilise le nombre de cas constatés actuellement, dans le monde, ce qui est nécessairement biaisé. En effet, c’est un peu comme si on conditionnait notre probabilité sur l’ensemble des gens dont on est sûr maintenant qu’ils sont malades ; or il y a des cas qu’on ignore. D’ailleurs, l’expérience malheureuse du Diamond Princess est intéressante car elle constitue un « système fermé » et donne un taux de létalité de 0,5%, ce qui pousse certains à affirmer que les 3% annoncés par l’OMS sont surestimés. En tout état de cause, supposons pour la suite que la vraie valeur est bien 3%, ce qui fixe les idées, et laisse espérer une réalité encore plus favorable.
À titre individuel en revanche, si on est malade du coronavirus, on doit s’attendre à environ 3% de chances d’en mourir (chiffre à moduler suivant l’âge et la condition physique [6], ou tout autre facteur de risque). Ce qui donne 97% de chances de s’en sortir, ce qui est quand même très prometteur — vous seriez prêts à miser combien d’argent pour jouer à un pile ou face avec 97% de chance de gagner ? Si vous doutez que 3% est faible, on peut visualiser ça sous différentes formes : une barre de progression

ou même une couleur

Conclusion
Lorsqu’on vous montre un taux, une proportion, une statistique, demandez-vous toujours quel conditionnement, même implicite, a été effectué. En d’autres termes, ce que représente le dénominateur de la fraction. Bien souvent, une volonté politique mal placée peut utiliser une observation réelle (le numérateur) mais tromper dans la base de comparaison (le dénominateur).
Et quelle morale tirer pour Covid19 ? Principalement que si on est malade mais qu’on ne fait pas partie de la population à risque (ceux pour qui le taux de létalité est de l’ordre de 10% voire 15%), on n’a pas vraiment besoin de se faire du souci pour soi. Bien entendu, tout peut arriver, on peut même dire que ça va arriver, mais on ne sait pas pour qui. Voici la triste réalité des probabilités : une probabilité très faible, c’est une quasi-garantie que rien ne nous arrivera à titre individuel, mais que ça arrivera à d’autres [7]. D’où l’intérêt des mesures prises pour ralentir la dissémination du virus : protéger les gens à qui ça arrivera.
Pour ne pas rater les prochains articles de la série, n’oubliez pas de vous inscrire à la newsletter
Notes
[1] Dont la fameuse et controversée hydroxychloroquine défendue par le non moins controversé Pr Raoult. Ceux qui me connaissent savent mon avis sur la question — notamment sur le manque d’interprétabilité scientifique des travaux mis en avant par ce professeur.
[2] Si tant est que la pièce est équilibrée, sinon on peut donner plus d’importance à la face truquée. Ce modèle porte le nom de Loi de Bernoulli, et les mathématiciens disposent dans leur arsenal de tout un tas de modèles théoriques qui peuvent modéliser différents phénomènes aléatoires.
[3] Cette inférence est rendue possible, bien souvent, par une loi très connue mais dont beaucoup de gens écorchent le nom : la Loi des grands nombres (attention, rien à voir avec la théorie des nombres !) Énoncée simplement, elle explique que pour un grand nombre d’observations, les fréquences observées finissent par correspondre aux probabilités théoriques. La boucle entre probabilités et statistiques est bouclée.
[4] On suppose ici que nos tests de dépistage fonctionnent bien, ce qui n’est pas forcément une hypothèse correspondant à la réalité.
[5] Rappelons qu’hormis la mort, le coronavirus peut laisser des séquelles plus ou moins graves.
[6] Il est ici pertinent de conditionner suivant son âge. En effet, dans le groupe des gens âges de plus de 80 ans, ce taux de létalité est de 15%.
[7] Ce phénomène est très similaire au loto. À titre individuel, il est virtuellement impossible de gagner, tellement les chances sont infimes. Mais multipliées par le nombre de participants, il devient au contraire invraisemblable que personne ne gagne ; c’est-à-dire qu’il est presque certain que quelqu’un va gagner.
[8] Remerciements à Paul-Claude pour me l’avoir fait remarquer.