Le portrait de Dorian Gris

Regardez cette étrange image que j’ai créée pour vous. D’abord de près (ou en grand), puis de loin (ou en petit, ou en plissant des yeux). Vous pourriez être surpris, et même peut-être gêné… Si tout se passe bien, vous devriez distinguer le visage d’un homme qui, petit à petit, se métamorphose en femme. Comment expliquer ce sortilège ? Illusion d’optique ? Pas vraiment — en fait pas du tout, et c’est ce que nous allons voir dans cet article.

Photo à regarder d’abord de près (ou en grand), puis de loin (ou en petit, ou en plissant des yeux). Surprenant !

Pour bien comprendre le phénomène en jeu, on va devoir expliquer la décomposition spectrale des signaux. Ne partez pas ! Derrière ce nom barbare se cache une idée très simple et intuitive. Si si je vous jure ! Vous la rencontrez tous les jours sans vous en apercevoir. Faisons un petit détour par la musique pour comprendre.

Combinaison de fréquences

Au collège, on apprend qu’une note de musique n’est rien d’autre qu’une pulsation qui se répète avec une certaine fréquence. Plus la fréquence est élevée, plus la note est perçue comme aiguë, et réciproquement, une fréquence basse donne une note grave. C’est par exemple à ça que correspond le 440 Hz du diapason qui donne le La. La fréquence correspond au nombre de pulsations en une seconde, et on peut par exemple représenter le signal audio de la sorte :

De gauche à droite, les fréquences vont grandissant. Les plus malins reconnaîtront la fonction sinus [1] sur ces graphes, et ils auront raison : une fonction sinus représente ce qu’on appelle une onde pure, une note qui se déploie dans l’éternité des temps passés et futurs.

Regardons à présent ce qui se passe quand on additionne deux fréquences, l’une basse, l’autre haute.

On a comme l’impression que la fréquence haute s’enroule autour de la fréquence basse. En fait, on peut même remarquer deux propriétés intéressantes :

  • Si on dézoome, c’est-à-dire qu’on regarde de loin, le signal résultant ressemble énormément à la fréquence basse : on ne distingue plus les détails apportés par la fréquence haute
  • Au contraire, lorsqu’on regarde de près, on ne se rend plus compte de la forme globale donnée par la fréquence basse : ce qui est visible ressemble beaucoup à la fréquence haute

On a trouvé là le secret qui rend possible l’effet des visages : un signal livre ses fréquences hautes quand il est observé de près, et ses fréquences basses quand on le voit de loin. Mais vous allez sûrement vous demander : quel rapport avec les images ? Il n’y a pas de notion de fréquence à ce que je sache ? Eh bien, si !

La fréquence visuelle

Revenons à la première définition de la fréquence : elle est liée à la répétition d’une certaine pulsation, et donc à la vitesse de variation du signal (plus le signal varie vite, plus la fréquence est élevée). À quoi cela pourrait-il correspondre sur une image ? Aux pixels bien sûr ! Plus précisément, à leur intensité lumineuse.

Vous êtes-vous déjà demandé comment fonctionnaient les images sur ordinateur et, de façon équivalente, les écrans ? La réponse est en fait très simple : chaque pixel contient trois blocs lumineux — les fameux Rouge, Vert, Bleu que les développeurs web connaissent bien — à intensité variable. Et c’est tout. Notre œil fusionne ces trois lumières en un seul petit point d’une certaine couleur. Lorsque les trois intensités sont identiques, on perçoit un certain niveau de gris, avec 0% correspondant au noir et 100% au blanc, ce qui donne ce qu’on appelle les images en noir et blanc [2].

Zoom sur les pixels d’un écran, on on voit qu’ils n’affichent que différentes intensités de rouge, vert et bleu ; et l’impression colorée qui en résulte (quand on regarde l’écran de suffisamment loin)

La fabrication du portrait

Maintenant que les bases sont posées, il ne reste plus qu’à savoir comment extraire les fréquences basses et hautes d’une image pour créer notre portrait étrange. Comment le faire ? Voyons d’abord pour les basses fréquences, en se souvenant de la remarque faite plus haut : un signal observé de loin révèle ses basses fréquences.

Mais oui ! Il suffit donc de regarder une image de loin pour en extraire ses basses fréquences ! Plus concrètement, cela signifie qu’on redimensionne l’image (ce qui réduit le nombre de pixels), puis on la remet à la taille d’origine (ce qui étire les pixels précédents). Plus on a compacté l’image à la première étape, plus on garde les fréquences les plus basses [3].

Ce traitement qu’on a infligé à l’image la floute, ce qui livre une leçon fondamentale : pour extraire les basses fréquences d’un signal, on le floute (dit autrement : on le lisse). Et pour les hautes fréquences ? Eh bien il suffit de prendre la différence, comme le montre ce calcul digne d’un élève de 5ème :

Si x = hf + bf
hf = x – bf

Voyons donc le résultat de la combinaison des basses fréquences d’un visage de femme avec les hautes fréquences d’un visage d’homme.

Combinaisons pour différentes proportions de hautes/basses fréquences

Certains pourraient s’imaginer que cet effet est créé par notre cerveau, tout comme de nombreuses illusions d’optique. Or ici, il n’en est rien. L’effet est un pur produit du fonctionnement de la rétine et de la théorie du traitement du signal ! Il n’y aucune illusion.

Pour finir, vous vous demandez peut-être qui sont représentés sur ces portraits. La réponse est également troublante : il ne s’agit de personne ! En l’occurrence, ce sont des visages « imaginés » par une intelligence artificielle qui a été entraînée à générer des portraits de célébrités, mais comprendre comment, c’est un autre sujet…


Notes

[1] Plus précisément, les fonctions de la forme sin(omega * x) où omega correspond à la pulsation. Si x est le temps exprimé en secondes, la fréquence f en Hertz se déduit par la formule omega = 2 * Pi * f

[2] L’appellation correcte est image en niveaux de gris

[3] Expérience de pensée : que se passe-t-il si on réduit l’image à un unique pixel ? Réfléchissez deux minutes avant de voir la réponse.
Réponse : l’unique pixel contiendra la couleur moyenne de l’image. Ceci est l’illustration d’un principe élémentaire en analyse spectrale : la fréquence de base correspond à la valeur moyenne.

Partager l'article

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *