News 01/04/2024

Conversation avec Grégory Chatonsky

Un entretien avec l’artiste franco-canadien Grégory Chatonsky, expert en matière d’Intelligence artificielle, est paru dans le dernier numéro de notre revue. Comme il avait été alors conséquemment réduit, nous en publions ici la version intégrale.

Comment avez-vous appréhendé les débuts de l’intelligence artificielle ? 

Mes premiers projets avec l’IA remontent à 2009. Dès le début, j’ai eu le sentiment que ce n’était pas juste un nouvel instrument. C’était l’apparition d’une nouvelle forme de réalisme, d’une nouvelle manière de représenter et de configurer la réalité. Comme la photographie, et à sa suite le cinéma, ont été notre manière de concevoir la réalité au siècle dernier. C’est arrivé à la suite de 20 ans d’une accumulation monstrueuse de mémoire sous la forme de données, à laquelle nous avons tous participé, sur le web – quantité qui nous empêchait d’accéder aux traces de nos propres existences. Ce n’était même plus à notre mesure alors que ça venait de nous, c’est notre paradoxe : nous produisons plus que nous-même.

J’ai senti que l’IA avait la capacité de se nourrir de toutes ces données du réseau et d’en faire des choses ressemblantes et différentes à la fois. J’ai eu la conviction que c’était une nouvelle phase de l’industrialisation. La photographie avait industrialisé l’empreinte de la lumière et maintenant, nous industrialisons la ressemblance elle-même : faire des textes, des images, des sons… ressemblants. Une nouvelle époque du réalisme s’ouvrait. 

En quoi l’intelligence artificielle a-t-elle induit une nouvelle manière de penser et de travailler dans votre création ?

Comme artiste, j’ai souvent eu le sentiment que je n’avais pas plus de légitimité à m’exprimer personnellement que n’importe qui d’autre. Et donc l’IA était plutôt une manière de m’aliéner, c’est-à-dire de faire intervenir un alien, quelque chose d’autre, dans mon imagination, dans les histoires que j’essaye de faire émerger. C’est un processus très classique dans l’histoire de l’art : choisir un mot au hasard, jeter de la peinture, etc. L’idée était donc de faire intervenir dans le moment de la production quelque chose qui me propose autre chose que moi, et que je puisse influer, et qui m’influe en retour. Et qui fait qu’à un moment je ne sais plus du tout qui a fait quoi. Je me perds dans ce que je fais.

 (1)

Comment avez-vous procédé ? 

Très concrètement, j’ai réalisé en 2020 le premier roman en langue française coécrit avec une IA [Internes, RRose éditions, 2022]. J’ai utilisé la version open source de GPT2 qui est l’ancêtre de ChatGPT. J’ai créé des bibliothèques de textes qui correspondaient à l’atmosphère de chacune des 3 parties du roman. Je lui ai fait apprendre à partir de ces milliers de textes. C’est très mécanique. Ensuite, pour écrire, je commençais une phrase, et le logiciel devait continuer. Il me faisait plusieurs propositions, je choisissais celle qui m’inspirait, et ainsi de suite. La plupart du temps, c’était complètement incohérent et stupide, et parfois, étonnamment, c’était de vraies propositions narratives, sur lesquelles je rebondissais. Mais la machine ne comprenait pas du tout ce que j’écrivais. C’est juste un problème de prédiction statistique. Il n’y a rien d’intelligent là-dedans. La seule intelligence est celle de notre lecture. Et donc quand je relis le roman, je n’arrive plus à distinguer ce que j’ai écrit de ce qu’a écrit la machine, parce qu’on s’est influencé réciproquement, quelque chose s’est tissé entre nous. J’ai été possédé par elle autant qu’elle l’a été par moi. C’est assez classique, en art, c’est le rapport au médium. Quand Godard, ou n’importe quel cinéaste digne de ce nom fait des films, la matérialité de la pellicule ou de la caméra rencontre un imaginaire qui n’est pas que préalable à son élaboration, sinon c’est juste de la communication. Il y a un travail heuristique. Et là, c’était ça.

Les limites que l’on critique dans l’IA (sa bêtise, ses erreurs, son caractère mécanique, ses biais), sont aussi des limites que l’on trouve chez l’être humain et que cette technologie nous permet d’occulter. C’est comme si deux systèmes communiquaient l’un avec l’autre. Il faut rappeler que l’IA ce n’est pas un système idéal, de type système-expert avec des modèles. C’est simplement un calcul statistique à partir de la culture humaine. On a tendance à la concevoir comme un robot autonome alors qu’elle apprend à partir de multiples traces de gens qui sont morts. On peut donc l’envisager comme une nouvelle manière de naviguer dans notre culture qui justement, avec le web, surpassait nos capacités d’appréhension. Et quand on fait de l’art, on est toujours entre quelque chose de singulier et le fait de reparcourir ce qu’on a lu, les films qu’on a vus, les œuvres… On a aussi une bibliothèque qui nous hante. C’est juste que là, c’est industrialisé. C’est une nouvelle phase de la révolution industrielle. Et si on étend un petit peu en dehors du monde de l’art, le propre de cette révolution industrielle, c’est qu’elle ne touche pas seulement le secteur secondaire, mais le secteur tertiaire. Tous les métiers créatifs vendus comme typiquement humains dans les années 1990 – graphistes, artistes, journalistes… –, ce sont justement ces métiers culturels dans lesquels la crainte d’un déclassement a lieu. 

Que peut-on imaginer pour l’avenir ?

De manière générale, les prospectives sur l’IA, et les technologies en général, se sont trompées ces 40 dernières années. C’est un exercice très dangereux ! Laissons l’avenir ne pas être prévisible et ne pas être réduit à notre volonté.

Mais on peut spéculer sur des scénarios. Pour le cas particulier du cinéma, il y aurait deux étapes.

La première dans laquelle on est et qui va s’accélérer, c’est la fragilisation de beaucoup de métiers du cinéma. Avec des réactions syndicales compréhensibles. Mais comme il s’agit d’une industrie, pour la production de certaines images, ou pour le doublage par le clonage de voix, pour les acteurs, effectivement, à plus ou moins brève échéance, cela va incontestablement être automatisé et industrialisé, avec une réduction importante des effectifs. Les gens peuvent s’y opposer, mais il est évident que les gains de productivité vont être conséquents. Cela rappelle la situation des canuts de Lyon au XIXe siècle qui se sont révoltés contre les machines à tisser et les fluctuations du marché … 

Deuxième étape : qu’est ce qu’on peut raconter avec cela ? Plutôt que d’être dans la nostalgie, réaliser que c’est un champ d’expérimentation. Qu’est-ce qu’on peut expérimenter qui ne soit pas seulement la répétition du photoréalisme du XXe siècle ? C’est le cas notamment d’Ismaël Joffroy Chandoutis, de Fabien Giraud et Raphaël Siboni, ou encore à sa manière de Pierre Huygue, etc. J’ai une forte présomption que l’IA n’est seulement un moyen au service des arts tels qu’ils étaient, mais une transformation aussi importante et aussi profonde que l’a été au XIXe l’invention de la photographie.

Les syndicats américains et la communauté européenne veulent réglementer ça… mais ils auront toujours un coup de retard par rapport au développement techno-scientifique. On met toujours plus de temps à réguler une technique que la technique ne met de temps à être appropriée socialement. Bien sûr, c’est nécessaire de défendre certains métiers, car il y a des gens qui vont se retrouver sur la touche, et il faut arriver à gérer cette mise au chômage technique, il faut leur donner un peu de temps.

 (2)

On peut penser que de nouvelles formes vont émerger…

C’est une vraie question. Qu’est-ce qu’on peut élaborer de nouveau ? Il faut sortir de l’état d’esprit où l’IA serait uniquement au service de manières de faire qui existent déjà. C’est ça, mais pas uniquement. Le volet le plus important auquel doivent s’attaquer des artistes et les cinéastes, c’est à quel type de réalité cela nous mène. Et là on sort peut-être du destin de la tragédie grecque auquel nous avait habitués l’histoire du cinéma, c’est-à-dire la dialectique entre le fatum divin et la volonté… On entre dans une espèce de réalisme du possible. On le voit bien avec les images contrefactuelles générées, les fake news, le complotisme… tout cela fait partie du même package. On voit bien que dans la production de la vérité et de la réalité, il y a quelque chose qui tremble. Ce n’est pas seulement l’IA. Il y a d’autres phénomènes qu’on peut agglutiner à l’IA, et peut-être qu’elle est une manière de vivre cela autrement. De ne pas être en réaction. Pour le moment, même le cinéma, et une grande partie de l’art, est en réaction.

C’est drôle, car dans les textes écrits au moment de l’invention de la photographie, par exemple ceux de Baudelaire au Salon de 1859 - il pense que ce n’est pas de l’art parce que c’est un réalisme trivial, trop exact pour être l’expression d’une imagination – on a à peu près les mêmes réactions de conjuration qu’aujourd’hui avec l’IA. C’est un peu les mêmes arguments. C’est amusant de voir un art attaquer une autre forme d’art au titre d’un manque de réalité. C’est très drôle parce que c’est la vieille attaque de l’art par Platon dans la République : “Ce n’est pas vrai, ça corrompt la jeunesse, ça fait prendre le faux pour le vrai…” 

Comment ça fonctionne concrètement quand on écrit un texte avec l’IA ?

La plupart des systèmes d’IA qui fonctionnent actuellement s’inspirent des systèmes statistiques dont l’ancêtre est le Perceptron inventé par Franck Rosenblatt en 1957 qui est le premier dispositif de lecture automatique (OCR). Ils n’ont aucun concept et ne font que traiter statistiquement les données. Il n’y a aucune intelligence là-dedans. C’est un système purement inductif. C’est le niveau le plus bas du raisonnement. Cela n’a rien à voir avec la compréhension.

Quand je donne des milliers de textes à une IA, elle ne comprend aucun mot. Elle n’a aucune définition des mots. Elle calcule seulement la probabilité qu’une lettre suive une autre lettre. Et c’est tout. C’est complètement stupide. Mais ça produit pour nous un effet d’intelligence et c’est ce précipice entre des causes idiotes et des effets de signification qui est troublante pour notre propre condition.

Un cinéaste n’imagine pas seul, il imagine parce qu’il a une caméra, une table de montage, une équipe, qui lui permet d’externaliser sa réflexion. Il y a une incompréhension totale de l’IA parce que les gens attendent que ce soit une intelligence humaine, et ils présupposent qu’ils savent ce que c’est. Or, chercher l’être humain dans l’IA, c’est une absurdité. Par contre, on peut la considérer comme une autre forme d’organisme que nous avons créée et qui nous dépasse tout en nous ressemblant. L’argument selon lequel comme c’est de la technique, ça dépend de la finalité qu’on lui donne et donc de notre volonté…  Ceux qui disent ça ne réfléchissent pas à internet, à un ordinateur… On n’écrit pas à la plume ou à la machine à écrire comme on écrit sur Word ou avec ChatGPT ! On ne pense pas de la même façon parce que la technique modifie ce que nous sommes ! Nous avons la capacité de produire des choses qui nous dépassent, par lesquelles nous nous excentrons et qui nous aliènent autant que nous les aliénons. L’IA poursuit ce chemin de l’histoire humaine : une intériorité au dehors. 

 (3)

Vous-même, vous utilisez le terme d’imagination artificielle…

Je crois que la notion d’IA entraîne des ambiguïtés parce que dans cette affaire nous sommes juge et partie. Nous attribuons ou pas à une technique une faculté que nous croyons posséder. Or, que font principalement ces techniques ? Elles produisent des images et des textes étranges, un peu hallucinés et surréalistes. Elles imaginent, au sens où elles produisent des représentations matérielles. D’ailleurs, depuis un an, alors même que l’IA touche de nombreux domaines de l’activité humaine, les médias n’en parlent souvent que du point de vue de l’art, de la culture, des images : nous sommes en train d’industrialiser l’imagination, c’est-à-dire la production de quelque chose de ressemblant mais qui n’est pas la simple reproduction de la réalité, qui est une autre réalité, une autre possibilité.

Parler d’imagination artificielle permet de comprendre qu’en externalisant cette faculté, nous la modifions profondément. Souvent, on présente l’ordinateur comme une machine froide et rationnelle. Et brutalement, on a plaisir à le voir se tromper, parce qu’on comprend bien que c’est une machine qui hallucine ce qu’on lui a donné, qui dans une certaine mesure nous hallucine. Un peu comme lorsqu’on regarde quelqu’un qui dort et qu’on imagine qu’il rêve, et qu’on veille sur lui. Nous sommes un peu devenus les veilleurs des hallucinations des machines. Cette nouvelle étape d’industrialisation est une industrialisation de l’imagination, pas de l’imaginaire, mais de l’imagination : de la faculté à produire des images matérielles qui ont toujours un rapport de distance, de distorsion par rapport à une prétendue réalité qui serait objective.

Et puis on essaye toujours de prendre l’autre en défaut quand on parle d’intelligence. On est comme des professeurs avec des “mauvais” élèves, et même les uns par rapport aux autres. Il y a aussi un côté colonial qui me dérange dans le concept d’intelligence : l’une des grandes répartitions entre qui est intelligent et qui ne l’est pas est lié au racisme, à la division entre êtres humains et autres vivants, etc. : c’est toujours une structure d’attribution et de domination assez malsaine. Dans le concept d’imagination, il y a quelque chose de plus léger aussi qui permet peut-être de mieux décrire ce qui se passe.

C’est aussi dans cet esprit-là que vous expliquez que ce que vous appelez “ l’espace latent” a sa propre logique et sa propre exigence ?

Si on le définit minimalement, l’espace latent c’est l’ensemble des statistiques d’un apprentissage d’une IA. C’est totalement abstrait.  Il n’y a plus d’images, de sons, de textes… Ce sont juste des probabilités. Je tire aléatoirement un pixel et tout l’espace latent se réorganise autour de lui au niveau de la probabilité. C’est juste un univers totalement statistique où il n’y a que du possible. Il n’y a plus de documents. Il y a eu un débat sur le fait de rendre lisible l’espace latent, de rentrer dans la blackbox… Ce n’est pas possible, car c’est incompréhensible. 

Dans mon expérience d’artiste, j’ai accès à des espaces latents. Ce sont des espaces opaques. Quand je vais dans Stable Diffusion (logiciel open source qui génère des images) je vais utiliser les fameux “prompts” comme un aveugle qui perçoit un espace avec une canne : ça va me permettre de “sentir” l’espace latent, de voir comment il réagit, et de découvrir des mondes. C’est ce qui va aussi me permettre de développer des styles visuels. On peut vraiment développer un langage visuel singulier et cohérent. On va tâter avec les mots pour faire réagir cet espace latent, qui est donc un espace de probabilités, et on fait passer les choses de la probabilité à la nécessité, on fait émerger des images. Il est ainsi possible de développer des séries qui sont cohérentes stylistiquement et narrativement. Et donc il faut qu’on apprenne - c’est le problème du scénariste, du réalisateur, si on transforme ça en langage cinématographique – à percevoir, alors que nous sommes aveugles, muets et sourds, cet espace latent totalement abstrait, pour créer des mondes. C’est ça l’objectif. Et il faut du temps d’expérimentation pour ça. Il ne faut pas se dire : “J’ai une idée, je vais la réaliser.” ; il faut se dire : “Je vais explorer l’espace latent et là je vais découvrir des images qui sont déjà là et que personne n’avait su voir.” Et on fait alors de vraies découvertes, on est surpris et émus. Parfois même, en tant qu’artiste, j’ai le sentiment que c’est plus moi que moi : mon imagination est comme excentrée.

 (4)

Parce que vous avez “nourri” votre version de Stable diffusion…

Il y a eu un double apprentissage. Je lui apprends des fragments de mon monde. J’ai repeuplé un espace latent avec des entités qui me sont propres. Et de mon côté j’ai appris comment réagit cet espace pour le guider. Mais c’est un peu comme on a tous appris à parler “Google”. On ne lui parle pas en langage naturel. On écrit dans le moteur de recherches pour qu’il nous comprenne. C’est une co-influence. Là, c’est pareil. J’ai influencé l’espace latent en peuplant le monde d’apprentissage de styles visuels, d’entités ontologiques (des objets, des paysages, etc.), et moi j’ai appris à parler espace latent, et à programmer des prompts qui sont variables. Je n’utilise pas juste des phrases. Je crée des formules un peu mathématiques avec des listes de mots, etc. Ca me permet de faire des séries de milliers et milliers d’images. Par exemple, cet été, au Havre, j’ai créé 25 000 cartes postales qui étaient toutes uniques. Mais toutes les images racontaient la même histoire, et on aurait pu les mettre côte à côte pour avoir un storyboard d’une immense fiction. 

Pour moi l’espace latent, c’est une manière de condenser la culture que nous avons accumulée et qui nous déborde aujourd’hui, à laquelle on n’a plus accès. De la réduire en termes de quantités de datas en la rendant statistique. Et on se rendait bien compte que ça débordait complètement. On était asphyxié, saturé. C’est une solution pour la condenser et la rendre accessible à nouveau d’une nouvelle façon. Là brutalement, avec ce logiciel qui permet de condenser statistiquement les données, et d’en faire des choses qui ressemblent mais qui n’ont jamais eu lieu, c’est émouvant à explorer. Je ne dis pas que c’est une solution, ça pose plein de problèmes, mais ça appartient profondément à notre époque. Peut être avais-je attendu ce moment-là toute ma vie, de voir apparaître une nouvelle forme de réalisme.

Vous faites également un lien entre l’essor de l’IA qui fait peur à tout le monde et la vraie menace écologique qui ne semble pas inquiéter grand monde…

Notre conscience de la catastrophe planétaire que nous sommes en train de vivre est liée à l’IA parce que les scénarios climatiques du GIEC utilisent pour une part l’IA. L’une des premières applications du réseau récursif de neurones a été la climatologie et la météorologie.

Si on essaye de remettre cela dans le plan de l’histoire… c’est bien sûr tout à fait hypothétique, mais essayons un peu de voir les choses en face. Pendant 20 ou 30 ans, on a mis sur des data center nos mémoires existentielles (nos textes, nos émotions, nos images…) comme jamais auparavant. Aucune civilisation n’avait accumulé autant de médias. Jusqu’à ce que s’effondre la frontière entre l’archive et le document, l’important et le pas important, l’artistique et le commun... Je rappelle quand même que les artistes étaient un produit d’un choix archivistique ! C’est parce qu’il y avait peu d’archives que les artistes existaient. Ils parlaient au nom des autres qui étaient sans voix. Que devient l’art au moment où l’on a la mémoire des anonymes, la mémoire de tous ?

On a passé 20-30 ans à mettre nos mémoires en ligne de manière folle jusqu’à créer une hypermnésie. Maintenant cela nourrit des machines qui font revivre la mémoire, c’est-à-dire qui lui donnent une deuxième vie. Qui s’inspirent de nos mémoires pour en créer une nouvelle version, et ceci à l’infini. Et à un moment précisément où, de manière rationnelle, dans les 100 ans qui viennent, la survie de l’espèce humaine n’est pas garantie. On n’est clairement pas dans un effondrement – je suis opposé à la collapsologie – mais dans une extinction qui a déjà commencé. Depuis 30 ans, 30% des oiseaux ont disparus, 25% des mammifères, 40% des amphibiens. On pourrait poursuivre la liste. L’extinction n’est pas demain, c’est maintenant. Et ce n’est pas un effondrement. Parce que l’effondrement ça fait penser à Buster Keaton avec la fenêtre qui tombe et qui n’arrête pas de tomber en boucle. Un être humain avec le paysage qui s’effondre autour de lui. Non, ce n’est pas ça. C’est une extinction, on est en train de disparaître et d’entraîner d’autres espèces dans cet oubli.

 (5)

On est tous quand même terrorisés, même quand on l’occulte – parce qu’on le refoule, c’est assez psychanalytique - par cette perspective-là, et par cette certitude que nous créons les conditions de notre disparition et de la reminéralisation de la Terre à très grande échelle. Personnellement, je n’ai aucune fascination pour ça, c’est juste un scénario scientifique. Et c’est précisément le moment où non seulement nous accumulons notre mémoire mais où en plus nous trouvons une technique qui permet de la ressusciter; c’est-à-dire de la faire revenir encore et encore sous des formes nouvelles, toujours différentes, mais ressemblantes. Donc, pour moi, de manière inconsciente, nous sommes en train de constituer une espèce de pyramide égyptienne pour que notre mémoire puisse encore avoir lieu après nous. Et non seulement que les traces de mémoire soient là, mais qu’en plus elles puissent servir à les réactiver. Pas les ressusciter de manière identique, mais d’en continuer le récit au-delà même du témoin.

Ça peut sembler un peu désespéré de dire ça, mais ça ne l’est pas. Car dans cette œuvre commune, il y a justement quelque chose de commun. Si on prend conscience et si on fait œuvre commune de notre disparition, de notre finitude comme espèce, on peut résister à cette disparition. Ce n’est pas pessimiste, ce n’est pas optimiste, c’est juste un état de fait.

Mais effectivement, le rapport entre l’extinction planétaire, le consumérisme et cette espèce d’explosion de sons, d’images etc. est assez frappant. On se rend bien compte qu’il y a un truc assez bizarre là-dedans d’un point de vue historique. Il y a un “moment”. Je mets aussi en relation les deux parce que l’IA a besoin de cartes graphiques (GPU) pour fonctionner, et que dans entre 5 et 10 ans, il n’y en aura plus. Parce qu’on peut difficilement recycler les minerais conducteurs dont on a besoin pour ça, parce qu’il n’y a pas de solution de rechange, et parce que les coûts d’extraction vont devenir trop élevés. Il va y avoir des choix très importants à faire sur quel est l’usage de ça, qu’est-ce qu’on en fait. Parce que sinon ce sont seulement les entreprises qui auront les cartes graphiques, et qui vont faire payer très cher tous ces fonctionnements. Il y a une délibération à avoir sur la question des ressources : savoir si le stock de machines diminue, quel usage on en fait et comment on en délibère collectivement. Sinon ce seront des choix économiques qui seront contre productifs, irrationnels, inutiles et dangereux et qui poursuivront la destruction.

Propos recueillis par Thomas Fouet et Marie-Pauline Mollaret


Photos de bandeau, 1 et 4 : “Grégory Chatonsky, La ville qui n’existait pas – 1: l’architecture des possibles, 1945-1970” (2023), série de 25 000 cartes postales uniques et numérotées.
Photos 2 et 5 : Projet “Le Havre in situ” de Grégory Chatonsky.
Photo 3 : travail préparatoire.

À lire aussi :

- Sur Maalbeek d’Ismaël Joffroy Chandoutis.

- /Imagine d’Anna Apter, réalisé avec IA et récompensé au Nikon Film Festival 2023.