Midjourney, plastique de l'amalgame

Accueil » Panorama » Analyse » Midjourney, plastique de l’amalgame

9 janvier 2024

Korean Spa | © Jeff Han

Midjourney, plastique de l’amalgame

Le temps des chimères

Le laboratoire de recherche Midjourney vient de sortir la sixième version de son célèbre générateur d’images par Intelligence Artificielle. Mais que nous racontent au juste les visions étranges qui en émergent depuis deux ans ?

Dans une conférence donnée le 10 octobre dernier à l’Université Paris Cité, le théoricien et historien des nouveaux médias Lev Manovich évoquait, à propos des images générées par Intelligence Artificielle, l’émergence d’une « esthétique du fragment »^[1]Lev Manovich, « Des nouveaux médias à l’esthétique artificielle : approches critiques », conférence du séminaire Matières et régimes sensibles des virtuels numériques, Université Paris Cité, 10 octobre 2023.. Selon lui, lesdites « compositions » seraient des « fragments de fragments », des « dépôts » de formes préalablement glanées sur Internet. Ces échantillons visuels, une fois amassés par des générateurs d’images tels que Midjourney, finissent digérés et recrachés sous la forme de figures dérangeantes qui évoquent le mouvement surréaliste du siècle dernier, entre les motifs liquéfiés de Dali et les corps composites de Magritte. Fondé en 2022, Midjourney est un laboratoire de recherche devenu rapidement célèbre pour son dispositif de génération d’images par IA, lancé quelques mois après DALL‑E (lire : Dali)^[2]Pour une généalogie des programmes de génération d’images par IA, voir : Antonio Somaini, « Algorithmic Images : Artificial Intelligence and Visual Culture », Grey Room n°93, 2023, pp. 74 – 115.. La particularité de ce dispositif tient à ce qu’il fonctionne sur la base de prompts, c’est-à-dire d’éléments de description textuels à partir desquels les images finissent par être déduites. Il requiert ainsi d’envoyer, à un bot dédié sur le serveur de messagerie instantanée Discord, une série de mots grâce à la commande « /imagine » ; ces derniers peuvent autant concerner un sujet (« a dog », « a bouquet of flowers », « a giant city ») qu’un style pictural (« cubist », « hyper realistic », « ghibli style ») ou une technique de représentation particulière (« photography », « painting », « cutaway diagram », « 3D model »). Cette logique d’association d’idées s’accompagne d’une tendance à l’amalgame d’éléments hétérogènes, voire radicalement opposés, dont les internautes tirent des images aux contours paradoxaux. C’est de cette manière que les visions produites par Midjourney se démarquent le plus : ce penchant pour le surréalisme et le mélange des formes s’avère davantage fertile que la sempiternelle recherche du photoréalisme, qui finira tôt ou tard par être atteint – nous y reviendrons.

Le miroir déformant

« Ces différents logiciels donnent pour la première fois une image massive de l’imaginaire anthropique. C’est un miroir noir que nous tend l’imagination artificielle, plutôt que nous qui la pilotons, révélant notre imagination, notre désir de production d’images à partir d’un cadre programmatique déterminé. »^[3]Grégory Chatonsky, « Le prompt comme image artificielle de l’imagination », juillet 2022. Dans un article publié sur son blog, où il rassemble ses créations et réflexions au sujet de ce qu’il appelle « l’imagination artificielle », l’artiste Grégory Chatonsky souligne à juste titre que, davantage que les prouesses technologiques des programmes tels que Midjourney, ce qui fascine dans ces « images d’images » tient plutôt à une « symptomatologie figurale » révélant « l’immense tableau de l’imagination de notre époque ». De fait, Midjourney ne produit rien ex nihilo et se contente de récupérer des formes et des motifs déjà composés par la main humaine en représentant indirectement l’« inconscient optique » de notre temps, pour reprendre l’expression qu’employait Walter Benjamin dans La Petite histoire de la photographie (1931) et L’œuvre d’art à l’époque de sa reproductibilité technique (1936). L’hypothèse est troublante : les images générées par IA reflèteraient, par leur propension à l’hybridité, une période de confusion esthétique où la distinction entre le vrai et le faux, l’original et la copie, mais aussi l’inquiétant et le familier, ne serait plus à l’ordre du jour. D’où la récurrence notable des figures dégoulinantes, d’anatomies semi-humaines, de traits indécis et d’artefacts de pixels disposés aléatoirement au sein du cadre, qui finissent souvent par s’apparenter à des rebuts visuels semblables à une matière en fusion non stabilisée, dysfonctionnelle et incertaine. Le nom même de « Midjourney » le suggère : il s’agit d’un trajet plastique intermédiaire et transitoire, encore inachevé, autrement dit d’un « semi-voyage ». Les productions graphiques par IA mettent ainsi à la fois en lumière un processus technique en gestation et les traits caractéristiques de la culture visuelle contemporaine – ceux du numérique, où les médiums préexistants sont mélangés pour produire des formes hétéroclites.

Il suffit pour s’en convaincre de mesurer à quel point la plupart des images les plus populaires générées avec Midjourney suivent deux horizons analogues misant chacun sur une sorte de plasticité confuse. La première de ces tendances concerne des fresques aux atours baconiens, à mi-chemin entre le figuratif et l’abstrait, dans lesquelles on reconnaît des figures et des motifs sans tout à fait pouvoir les saisir avec précision. Les formes s’y chevauchent, tandis que les couleurs, souvent très contrastées, débordent. Certains patterns visuels se répètent également à plusieurs endroits de manière plus ou moins ordonnée, par exemple dans les créations générées par le designer Jeff Han avec Midjourney.

La deuxième tendance regroupe quant à elle des représentations virales partant à l’inverse d’une silhouette très connue et familière, mais au sein desquelles transparaît un dérèglement – souvent une situation peu vraisemblable, ou une série d’incohérences graphiques qui pointent son artificialité. Ces images sont en grande partie marquées par un style pictural bien particulier, caractérisé par un léger flou cinétique et une pixellisation liée à la basse résolution, mais aussi des surfaces monochromes et exagérément lisses. Dans les deux cas, ces tableaux numériques semblent tiraillés de l’intérieur par un affrontement plastique entre le photoréalisme (par la précision et la richesse de certains détails) et son envers tantôt macabre et horrifique, tantôt absurde et grotesque. On assiste alors au retour des créatures chimériques du folklore populaire (avec l’uncaniness caractéristique des monstres numériques), qui va de pair avec la résurgence d’un esprit moyenâgeux de la caricature (avec des traits volontairement grossiers, outranciers voire blasphématoires). Dans ce véritable « théâtre anatomique »^[4]Nicole Brenez, De la figure en général et du corps en particulier : l’invention figurative au cinéma, De Boeck Supérieur, 1998, p. 20. qui a tout du freak show numérique (avec son cortège de griffons et de hiéracocéphales), les monstruosités nébuleuses et les humains à six doigts sont légion, tandis que les hommes politiques et les personnages publics se retrouvent tournés en dérision – Trump arrêté en pleine rue, Macron au milieu d’une manifestation, Elon Musk participant à un concert de dégustation de ciment, le Pape François portant une doudoune Balenciaga, etc. Pour ces figures, le principe est bien souvent le même : il s’agit d’amalgamer le probable et l’improbable afin de donner forme à des fantasmes collectifs. La grande popularité de ces productions, majoritairement générées avec Midjourney, tient autant à un appétit toujours plus marqué pour la représentation d’icônes qu’à une volonté, née notamment de la culture du mème et du détournement sur Internet, de retourner les armes du pouvoir (la propagande, les médias, etc.) contre lui-même^[5]Tous les bords politiques sont concernés par cet emploi : en témoignent les récentes caricatures de Macron signées par des militants de gauche ou des images représentant les fantasmes et les peurs de l’extrême droite contemporaine (femmes blanches et blondes apeurées cernées dans le métro par des hommes en qamis, images touristiques de Paris où se promènent intégralement des femmes voilées, etc.)..

Devenir autophage

Si elles sont aujourd’hui très populaires, l’avenir de ces images générées par IA reste incertain. À l’échelle de l’histoire des formes numériques, leur particularité réside en effet dans leur nature a priori temporaire : par l’enrichissement des outils et des programmes, il sera bientôt possible de produire des scènes fantasmatiques sans le moindre indice en mesure de trahir leur artificialité. En assemblant de plus en plus de données comme de la pâte à modeler, les programmes apprennent à maquiller leurs coutures, jusqu’à gommer les aspérités qui font précisément leur intérêt – la dernière version de Midjourney sortie le 21 décembre 2023, qui permet d’atteindre un photoréalisme inédit pour le programme, le confirme. C’est le principe même de l’Intelligence Artificielle que de vouloir dépasser sa phase primitive, puisqu’à chaque création, l’algorithme s’entraîne et s’améliore. La moindre production implique par conséquent un pas en avant technique qui éloigne potentiellement l’outil de ses origines dysfonctionnelles et surréalistes. Il est toutefois trop tôt pour tirer un trait sur la singularité dont elle peut aujourd’hui témoigner : le futur plastique des images générées par IA dépendra forcément de celui des autres images, dont elles ne resteront jamais qu’une émanation. Les programmes d’IA fonctionnent toujours de manière récursive et mimétique : il s’agit au fond d’une boucle se nourrissant de représentations déjà existantes. L’évolution de la peinture, de la photographie et du cinéma orienteront donc celle des images générées par IA – en cela, elles auront toujours intrinsèquement un train de retard. Au regard du caractère massif de leur production et de la place (matérielle, culturelle) grandissante qu’elles occupent dans l’imagerie collective, elles finiront d’ailleurs probablement par se copier elles-mêmes en générant des images d’images d’images, comme un monstre autophage. Du moins, c’est tout le mal qu’on leur souhaite : c’est de cette manière qu’elles continueront de cultiver leur part la plus singulière.

Notes[+]

Notes
↑1	Lev Manovich, « Des nouveaux médias à l’esthétique artificielle : approches critiques », conférence du séminaire Matières et régimes sensibles des virtuels numériques, Université Paris Cité, 10 octobre 2023.
↑2	Pour une généalogie des programmes de génération d’images par IA, voir : Antonio Somaini, « Algorithmic Images : Artificial Intelligence and Visual Culture », Grey Room n°93, 2023, pp. 74 – 115.
↑3	Grégory Chatonsky, « Le prompt comme image artificielle de l’imagination », juillet 2022.
↑4	Nicole Brenez, De la figure en général et du corps en particulier : l’invention figurative au cinéma, De Boeck Supérieur, 1998, p. 20.
↑5	Tous les bords politiques sont concernés par cet emploi : en témoignent les récentes caricatures de Macron signées par des militants de gauche ou des images représentant les fantasmes et les peurs de l’extrême droite contemporaine (femmes blanches et blondes apeurées cernées dans le métro par des hommes en qamis, images touristiques de Paris où se promènent intégralement des femmes voilées, etc.).

Soutenez Critikat

Critikat est une revue de cinéma associative dont les rédacteurs et rédactrices sont bénévoles.
Si elle est (et restera) entièrement gratuite, sa production a un coût : votre soutien est précieux pour garantir sa pérennité et son développement (site Internet, vidéos, podcasts...).
N'hésitez pas à nous soutenir mensuellement si vous le pouvez !

Faire un don

Corentin Lê

Réagir