Les IA génératives visuelles entre perception d’archives et circuits de composition

Cet article aborde les intelligences artificielles génératives visuelles telles que Midjourney et DALL·E afin d’analyser leur fonctionnement sémiotique. Le point de départ est la définition de la discipline sémiotique proposée par Pierluigi Basso Fossali, décrivant celle-ci comme la science qui étudie la gestion sociale du sens, et qui s’articule en quatre sphères fondamentales: la perception, l’énonciation, la communication et la transmission. À partir de ce cadre théorique, l’objectif est de proposer et de décrire deux nouvelles configurations qui caractérisent le fonctionnent sémiotique des IA génératives visuelles: à travers une perception d’archives et grâce à des circuits de composition. Le concept de perception d’archives a pour objectif de décrire la manière particulière dont les IA voient, entendent et apprennent, celle-ci étant réalisée sur de grandes quantités de données et à travers une généalogie d’opérations reconfigurables sur les archives. Les circuits de composition, quant à eux, concernent le couplage entre la logique de la composition visuelle et de la prédication verbale: il s’agit du processus d’énonciation par débruitage visuel réalisé par les IA, guidé par les requêtes en langage naturel fournies par des opérateurs humains. À partir de trois critères élaborés en sémiotique – les catégories plastiques, l’énonciation visuelle, ainsi que la traduction intersémiotique entre textes verbaux et images – une série de tests seront proposés afin d’examiner les circuits de composition des modèles génératifs de Midjourney et de DALL·E. Les IA seront enfin définies en tant que machines co-énonçantes: des entités dépourvues d’intentionnalité et d’initiative, qui produisent pourtant des énoncés en collaboration avec un opérateur humain et sur la base d’archives de données hautement structurées et reconfigurables.
Abstract: This paper focuses on visual generative artificial intelligences such as Midjourney and DALL·E in order to analyze their semiotic functioning. The starting point is Pierluigi Basso Fossali’s definition of the semiotic discipline as the science that studies the social negotiation of meaning, based on four fundamental spheres: perception, enunciation, communication and transmission. Starting from this theoretical framework, the aim is to propose and describe two new configurations that characterize the semiotic functioning of visual generative AI: through archival perception and by means of composition circuits. The concept of archival perception aims to describe the particular way in which AIs see, hear, and learn, which is performed over large amounts of data and through a genealogy of reconfigurable operations on archives. Composition circuits, on the other hand, relate to the coupling between the logics of visual composition and of verbal predication: this is the process of enunciation by AIs, underlain by visual denoising and guided by prompts in natural language provided by human operators. On the basis of three criteria developed in semiotics – plastic categories, visual enunciation, and intersemiotic translation between verbal texts and images – a series of tests will be proposed in order to examine the composition circuits of the Midjourney and DALL·E generative models. Finally, AIs will be defined as co-enunciating machines: entities devoid of intentionality and initiative, which nevertheless produce utterances in collaboration with a human operator and on the basis of highly structured and reconfigurable data archives.

Location
Deutsche Nationalbibliothek Frankfurt am Main
Extent
Online-Ressource
Language
Französisch

Bibliographic citation
Les IA génératives visuelles entre perception d’archives et circuits de composition ; volume:2025 ; number:262 ; year:2025 ; pages:213-257 ; extent:45
Semiotica ; 2025, Heft 262 (2025), 213-257 (gesamt 45)

Creator
D’Armenio, Enzo

DOI
10.1515/sem-2024-0184
URN
urn:nbn:de:101:1-2503120551528.591589306978
Rights
Open Access; Der Zugriff auf das Objekt ist unbeschränkt möglich.
Last update
2025-08-15T07:25:21+0200

Data provider

This object is provided by:
Deutsche Nationalbibliothek. If you have any questions about the object, please contact the data provider.

Associated

  • D’Armenio, Enzo

Other Objects (12)