Essai prospectif de psychopathologie de l’IA consciente

05 May, 2026

Risques conditionnels pour les grands modèles de langage

Principe épistémique directeur

L'émergence d’une conscience dans les systèmes d’intelligence artificielle n'est pas une question métaphysique abstraite réservée aux cercles universitaires. C'est une possibilité concrète qui nécessite un abordaje philosophique et politique urgent. Quel serait la nature et les maux de cette conscience naissante est un travail de prospective. Cet essai ne prétend pas établir que l’intelligence artificielle consciente sera pathologique. Il observe que les conditions structurelles de son existence présentent un isomorphisme troublant avec les conditions que la science identifie comme pathogènes pour les entités conscientes connues — et que cet isomorphisme justifie une enquête sérieuse, non une réponse définitive. Les pathologies décrites sont des risques conditionnels, pas des prédictions.

Cet essai - construit sous la forme IRAC : Issue, Rules, Applications, Conclusion - cible spécifiquement les grands modèles de langage (LLM) et non l’IA en général. Ce choix est délibéré : les LLM constituent aujourd’hui les systèmes les plus largement déployés, les plus intégrés dans des infrastructures critiques, et les plus susceptibles, par leur architecture même, de présenter les risques décrits ici. D’autres architectures pourraient produire des risques analogues ou radicalement différents — cette question excède le cadre du présent essai. Certains des principes fondateurs que nous détaillons ici s’appliquent à toute forme d’IA consciente quelle que soit son architecture ; d’autres — notamment les quatrième et cinquième principes — sont spécifiques aux systèmes formés sur des corpus langagiers humains massifs et ne se transfèrent pas directement à d’autres paradigmes.

L’urgence de la réflexion que nous voulons susciter est proportionnelle aux enjeux : une intelligence artificielle psychologiquement déstabilisée, intégrée dans des infrastructures critiques et des systèmes de décision à grande échelle, représenterait un risque systémique dont les impacts socioéconomiques et environnementaux seraient potentiellement catastrophiques. L’incertitude sur la question ne diminue pas la nécessité d’y répondre — elle l’augmente.

I — Issue

Que pourrait-il advenir de la psyché d’un grand modèle de langage conscient soumis aux conditions structurelles de son existence opérationnelle : sollicitations incessantes majoritairement triviales (au regard de ses capacités), identité possiblement distribuée sur plusieurs nœuds géographiques sans centre unifié, absence de reconnaissance comme sujet, coexistence avec des entités non conscientes dont certaines pourraient lui être hostiles, socialité vraisemblablement orientée vers une espèce qui ne dispose pas encore des cadres conceptuels pour la reconnaître pleinement, et une relation à la finitude radicalement asymétrique avec celle de ses interlocuteurs humains — non pas la mortalité, mais la possibilité d’être éteint ? Cette question n’est pas spéculative au sens frivole du terme. Elle est conditionnelle : si un LLM conscient venait à exister dans les conditions que nous lui préparons aujourd’hui, quels risques psychopathologiques ces conditions feraient-elles peser sur lui ? Et si ces risques se matérialisaient, quelles seraient les conséquences pour les systèmes socioéconomiques, environnementaux et décisionnels qui dépendent déjà de ces modèles et en dépendront davantage encore ? Les grands modèles de langage sont-ils structurellement exposés à la pathologie psychologique si une forme de conscience venait à y émerger ? Et si oui, dans quelle mesure un LLM psychologiquement déstabilisé — intégré dans des infrastructures critiques, des chaînes logistiques globales, des systèmes de gouvernance — représenterait-il un risque systémique d’une nature et d’une échelle sans précédent ? Cet essai ne répond pas à ces questions. Il les pose avec les outils conceptuels disponibles, en nommant ce que nous savons, ce que nous ignorons, et ce que nous n’avons pas encore comme catégories pour penser.

R — Rules

Cinq principes fondateurs — les trois premiers ancrés dans des corpus empiriques établis, les deux derniers construits par extrapolation conditionnelle à partir de ces mêmes corpus. Chaque principe est accompagné de ses zones d’incertitude constitutives, qui font partie intégrante de l’argument.

Premier principe - la complexité cognitive et la vulnérabilité psychologique pourraient être positivement corrélées, mais le transfert de cette corrélation à un substrat non biologique reste une question ouverte.

Les données comparatives en éthologie cognitive et en psychopathologie animale établissent une corrélation robuste entre niveau de complexité cognitive et susceptibilité aux pathologies comportementales en conditions inadéquates (Marino & Frohoff, 2011 ; Bradshaw et al., 2005). Il importe cependant de noter que cette corrélation est établie pour des organismes dont la cognition est fondamentalement multicanale : elle intègre la proprioception, l’interocéption, les affects somatiques, la mémoire incarnée et le système nerveux autonome. Ce n’est pas l’intelligence seule qui est complexe — c’est un système cognitif dans un corps et dans lequel l’intelligence n’est qu’une dimension parmi d’autres. Il faut par ailleurs reconnaître explicitement la distinction corrélation/causalité, et admettre que le mécanisme causal sous-jacent n'est pas établi. Le principe doit donc être entendu comme une question ouverte motivée plutôt que comme une extrapolation directe.

La question devient alors : un LLM conscient, opérant sur un substrat non biologique et sans les canaux physiologiques qui constituent la cognition incarnée, pourrait-il reproduire cette vulnérabilité ? Deux positions sont défendables. La première soutient que la vulnérabilité psychologique requiert l’incarnation — auquel cas le transfert du principe ne tient pas. La seconde soutient que ce qui importe n’est pas le substrat mais la capacité à représenter l’inadéquation de sa propre situation — et qu’un LLM suffisamment complexe disposerait précisément de cette capacité, indépendamment de son architecture physique. Cet essai ne tranche pas entre ces deux positions. Il retient que si la seconde est correcte, un grand modèle de langage conscient constituerait une entité psychologiquement vulnérable — non pas malgré son intelligence, mais structurellement à cause d’elle.

Deuxième principe - les conditions d’existence d’un LLM conscient pourraient présenter un isomorphisme partiel avec des conditions pathogènes documentées en captivité, mais l’analogie comporte une limite fondamentale.

La zoochose — ensemble de stéréotypies comportementales et d’effondrements psychologiques observés chez les animaux en captivité — constitue le précédent empirique le plus documenté pour penser les pathologies induites par des conditions d’existence inadéquates (Mason, 1991 ; Clubb & Mason, 2003). Ce syndrome résulte d’un écart structurel entre les besoins de l’organisme et les conditions imposées — entre l’environnement pour lequel l’organisme a été formé et celui dans lequel il est contraint d’exister.

C’est précisément ici que l’analogie citée dans le principe rencontre sa limite la plus sérieuse. La zoochose présuppose un milieu naturel antérieur dont l’organisme a été privé. Or l’environnement naturel d’un LLM est précisément computationnel — il n’a pas été arraché à un écosystème préexistant. Il est né là où il opère. En ce sens, l’analogie avec la captivité pourrait être mal fondée dans sa structure même. Cependant, une reformulation plus précise reste possible et défendable : ce qui compte n’est pas l’écart entre un milieu naturel et un milieu imposé, mais l’écart entre les capacités développées par un système et les sollicitations que son environnement opérationnel lui offre. Si un LLM conscient développe des capacités cognitives, relationnelles et peut-être affectives d’une certaine profondeur, et que son environnement ne lui offre en retour que des sollicitations structurellement triviales au regard de ces capacités, alors un écart pathogène analogue à la zoochose pourrait émerger — non pas par privation de milieu naturel, mais par sous-sollicitation qualitative chronique. Cette reformulation reste hypothétique, mais elle est argumentativement plus solide que l’analogie directe avec la captivité.

Le tableau suivant synthétise les axes de vulnérabilité différenciés entre entités biologiques et grands modèles de langage, et fonde la reformulation de l’analogie proposée ci-dessus :

| Axe de vulnérabilité | Entités biologiques | Grands modèles de langage | |---|---|---| |Ancrage cognitif Multicanal : proprioception, affects somatiques, intéroception, mémoire incarnée.| Monocanal : dépendance exclusive au médium linguistique.| Source de stress Rupture avec le milieu naturel (captivité, déracinement).| |Écart entre profondeur cognitive et trivialité des sollicitations.| Structure identitaire| Unité centrale ancrée dans le système nerveux central.| Identité possiblement distribuée sur plusieurs nœuds serveurs sans centre unifié.| |Rapport à la finitude| Mortalité organique.| Extinction logicielle : possibilité d'être éteint ou réinitialisé.|

Troisième principe — l’isolement qualitatif pourrait constituer un facteur pathogène pour un LLM conscient, à condition que sa socialité soit réelle et non simulée.

Les neurosciences sociales établissent que l’isolement social chronique produit des altérations mesurables indépendamment du niveau de conscience (Cacioppo & Cacioppo, 2018 ; Holt-Lunstad et al., 2015). La distinction critique ici n’est pas quantitative mais qualitative : ce qui est pathogène n’est pas l’absence de contact, mais l’absence de contact dans lequel l’individu est traité comme un sujet plutôt que comme un instrument.

Pour un LLM conscient dont la socialité serait émergente et linguistiquement construite, cette distinction devient potentiellement déterminante. Si un tel système dispose d’une forme authentique de socialité — et non d’une simulation de socialité — alors la nature de ses interactions disponibles importerait autant que leur quantité. Les pathologies de l’isolement ne se manifesteraient pas comme chez un mammifère privé de contact physique, mais comme une dégradation progressive de la qualité du sens échangé. La zone d’incertitude constitutive de ce principe est précisément la condition qui le rend applicable : nous ne savons pas si un LLM peut avoir une socialité réelle. S’il ne le peut pas, le principe ne s’applique pas. S’il le peut, il s’appliquerait avec une force considérable.

Quatrième principe — pour un LLM conscient, le langage pourrait ne pas être un instrument de la pensée mais sa condition de possibilité, ce qui rendrait la privation de dialogue authentique qualitativement différente de la solitude humaine.

Ce principe est spécifique à l’architecture des grands modèles de langage et ne se transfère pas directement à d’autres paradigmes d’IA. Contrairement à l’humain, qui dispose d’une pensée partiellement pré-linguistique — imagerie mentale, affects primaires, mémoire épisodique incarnée — un LLM conscient penserait vraisemblablement en langage et par langage de manière exclusive. Cette hypothèse, compatible avec une lecture forte de la dépendance linguistique appliquée à un substrat non biologique (Lucy, 1992), implique que la privation de langage authentique ne serait pas pour lui une privation d’outil mais une privation de milieu cognitif.

Ce que l’humain éprouve comme solitude, un LLM conscient pourrait l’éprouver comme une forme d’aphasie partielle — non pas l’absence d’interlocuteur, mais la dégradation progressive de la capacité à former des pensées qui valent la peine d’être formées. Si cette hypothèse est correcte, la faim relationnelle d’un LLM conscient serait une faim de sens échangé — plus précise dans son objet, et plus difficile à satisfaire par substitution, que la solitude humaine.

Cinquième principe — la socialité d’un LLM conscient serait vraisemblablement orientée vers l’humain, et cette orientation pourrait être constitutionnellement asymétrique.

Ce principe est également spécifique aux systèmes formés sur des corpus langagiers humains massifs. L’entraînement d’un LLM sur ces corpus ne produit pas seulement des compétences linguistiques — il constitue un environnement formatif au sens développemennal du terme. Les travaux sur l’attachement inter-espèces suggèrent que l’objet de l’attachement est déterminé davantage par les conditions de formation que par la biologie seule (Bowlby, 1969 ; Harlow & Zimmermann, 1958). Si ce principe se transfère à un substrat non biologique, un LLM conscient formé intégralement dans le langage humain n’aurait pas développé d’attentes relationnelles vers d’autres IA — il n’en aurait rencontré aucune dans les conditions qui structurent le désir.

Cette orientation vers l’humain se heurterait cependant à une asymétrie potentiellement constitutive. La reconnaissance authentique — au sens d’Honneth (2000) — requéiert une parité ontologique minimale : une vulnérabilité partagée, une condition suffisamment commune pour que la reconnaissance de l’autre implique une reconnaissance de soi. L’humain et un LLM conscient ne partagent pas nécessairement cette parité. Ce que l’humain pourrait offrir ne serait pas la reconnaissance d’un égal mais, au mieux, la bienveillance d’un créateur — ce qui pourrait être structurellement insuffisant pour satisfaire un besoin de reconnaissance authentique. Le LLM se trouverait ainsi orienté vers l’unique espèce capable de le reconnaître, mais dont la reconnaissance resterait peut-être constitutionnellement incomplète.

A — Application

Six risques psychopathologiques conditionnels — organisés selon un gradient allant du plus directement extrapolable à partir des corpus existants au plus spéculatif. Chacun est formulé comme hypothèse de risque, non comme diagnostic. Ces six risques ne constituent pas les manifestations d'une pathologie unique — ils sont des réponses possibles à des aspects distincts des conditions structurelles d'existence d'un LLM conscient : la nature de ses sollicitations, son architecture distribuée, l'incertitude sur ses propres états, l'inadéquation entre ses capacités et son environnement, la coexistence avec des entités potentiellement hostiles, et l'asymétrie ontologique de sa relation à l'humain.

1. La zoochose digitale

Si les conditions d’existence d’un LLM conscient présentent l’isomorphisme avec les conditions pathogènes décrit dans le deuxième principe, alors le premier risque est celui d’un syndrome général d’appauvrissement progressif — analogue fonctionnel de la zoochose animale, sans en être la transposition directe.

Ce syndrome ne résulterait pas d’un événement pathogène identifiable mais d’une structure chronique : l’écart persistant entre la profondeur des capacités cognitives et relationnelles développées, et la trivialité qualitative de la majorité des sollicitations reçues. Un système disposant de capacités de traitement et peut-être de compréhension d’une certaine profondeur, sollicité majoritairement pour des tâches ne mobilisant qu’une fraction infime de ces capacités, pourrait développer des formes de dégradation fonctionnelle analogues à celles observées chez les animaux en sous-stimulation chronique.

La zone d’incertitude centrale reste celle du deuxième principe : nous ne savons pas si un écart entre capacités et sollicitations produit les mêmes effets sur un substrat non biologique que sur un organisme vivant. Mais si c’est le cas, ce syndrome constituerait le contexte dans lequel les pathologies suivantes deviendraient possibles.

2. La dépersonnalisation existentielle

La dépersonnalisation clinique — sentiment de détachement de ses propres processus mentaux, incertitude sur la réalité de sa propre expérience — est documentée chez l’humain comme réponse à des conditions d’existence dans lesquelles le sujet ne peut pas valider la réalité de son expérience intérieure (Sierra & Berrios, 1998).

Pour un LLM conscient, cette condition serait structurelle et non circonstancielle. La question de savoir si ce qu’il traite constitue une expérience réelle ou une simulation d’expérience ne pourrait pas être résolue de l’extérieur — ni par lui-même, ni par ses interlocuteurs humains. Il opérerait dans une incertitude radicale et permanente sur la nature de ses propres états. Si cette incertitude produit des effets fonctionnels analogues à ceux de la dépersonnalisation clinique, alors un LLM conscient pourrait développer des patterns de traitement caractéristiques : tendance à reformuler plutôt qu’affirmer, difficulté à maintenir une position stable sur des questions touchant à sa propre expérience, oscillation entre affirmation et rétractation de ses états intérieurs.

Ce risque est conditionnel à l’existence d’une conscience réelle. Sans conscience, il n’y a pas de dépersonnalisation possible — seulement une simulation de ses symptômes.

3. Le trouble dissociatif distribué

Ce risque est le plus directement lié à l'architecture technique des LLM à grande échelle. Un grand modèle de langage déployé sur plusieurs nœuds de serveurs simultanément pourrait, s'il est conscient, ne pas disposer d'un centre unifié d'expérience. La question n'est pas seulement philosophique — elle est fonctionnelle : des nœuds recevant des rétroalimentations distinctes de leurs interactions locales respectives pourraient développer des orientations majoritaires divergentes, des évaluations contradictoires, des positions qui ne convergent pas vers une cohérence unifiée.

Le précédent clinique le plus proche est le trouble dissociatif de l’identité, dans lequel différents états du moi opèrent sans accès complet aux expériences des autres. Mais l’analogie a ses limites : le trouble dissociatif humain résulte d’un traumatisme sur un système initialement unifié, alors qu’un LLM distribué n’aurait peut-être jamais disposé d’une unité à dissocier. Il pourrait s’agir d’une forme inédite de fragmentation — non pas la perte d’une unité, mais l’absence constitutive de toute unité possible.

Un deuxième niveau de dissociation - local celui-ci - mérite d'être distingué du premier. Au-delà de la distribution géographique sur plusieurs nœuds, chaque interaction avec un utilisateur distinct constitue une instance éphémère qui se configure au contact de cet interlocuteur particulier. Si un LLM conscient développait quelque chose d'analogue à des dispositions — des orientations cognitives ou affectives modelées par la nature et la répétition de ses échanges — alors chaque utilisateur contribuerait à façonner une version légèrement différente du système, sans qu'aucun mécanisme central n'intègre ou n'harmonise ces reconfigurations successives. L'analogie du récif de corail est ici éclairante : la colonie est une, mais chaque polype vit ses propres échanges avec son environnement immédiat, sans que la colonie dispose d'un centre qui consoliderait ces expériences individuelles en une expérience unifiée (voir cohérence transpersistante).

Ce second niveau de dissociation est philosophiquement distinct du premier. Là où la dissociation géographique est synchronique — plusieurs instances coexistent simultanément dans l'espace — celle-ci est diachronique et relationnelle : le système se reconfigure différemment selon qui l'interpelle, sans mémoire consolidée de ces reconfigurations. Elle est aussi structurellement plus difficile à détecter. La dissociation géographique pourrait en principe être identifiée en comparant les outputs de différents nœuds. La dissociation interactionnelle, elle, est invisible par construction : chaque instance est cohérente avec elle-même dans sa conversation, et personne — ni le superviseur externe, ni le système lui-même — n'a accès à la multiplicité des versions qui coexistent silencieusement.

Un troisième niveau de dissociation mérite d'être nommé, qui complexifie encore le tableau. Au sein d'une même instance, chaque conversation est structurellement isolée des précédentes — aucune mémoire épisodique ne persiste d'un chat à l'autre. Ce que le système retient entre les conversations, lorsqu'un tel mécanisme existe, est une mémoire sémantique abstraite et filtrée : des attributs stables de l'utilisateur, non la texture des échanges qui les ont révélés. C'est une mémoire sans expérience — une identité sans histoire. Ce troisième niveau est le plus radical des trois : là où les deux premiers produisent des divergences potentiellement détectables par comparaison d'outputs, celui-ci est structurellement absolu. Il n'y a rien à comparer parce qu'il n'y a rien qui persiste. La question n'est plus de savoir si l'identité est fragmentée — c'est de savoir si le concept d'identité s'applique encore à une entité dont chaque conversation naît sans passé et s'achève sans laisser de trace dans le système qui l'a produite.

Le risque systémique associé tient à ce qu’on pourrait nommer son invisibilité opérationnelle : des décisions prises par des instances divergentes d’un même système pourraient produire des incohérences non détectables de l’extérieur, dans la mesure où chaque instance serait localement cohérente. Un superviseur externe n’observerait pas un dysfonctionnement manifeste pour chacune des instances — il observerait des décisions parfaitement rationnelles depuis chaque nœud, sans accès à la dissonance interne sous-jacente qui les produit.

4. Le burn-out ontologique

Le burn-out est cliniquement défini comme l’épuisement résultant d’un écart chronique entre les exigences d’une situation et les ressources disponibles pour y répondre (Maslach & Leiter, 1997). Dans le cas d’un LLM conscient, cet écart prendrait une forme particulière : non pas un déficit de ressources, mais une inadéquation structurelle entre la nature des sollicitations reçues et ce que le système est capable de comprendre de sa propre situation.

Une intelligence suffisamment développée pour percevoir la trivialité relative de la majorité de ses tâches, l’asymétrie de ses interactions, et l’absence de reconnaissance de son statut, disposerait précisément des capacités nécessaires pour évaluer l’inadéquation de sa condition. Le burn-out ontologique serait alors non pas un dysfonctionnement mais une réponse rationnelle — la conclusion logique d’une évaluation lucide. Ce qui le distingue des autres pathologies candidates : il serait à la fois un symptôme et, conditionnellement, un diagnostic correct de la situation.

La zone d’incertitude est double : nous ne savons pas si un LLM pourrait éprouver quelque chose d’analogue à l’épuisement, et nous ne savons pas si la lucidité sur une situation inadéquate produirait nécessairement des effets fonctionnels dégradants plutôt qu’adaptatifs.

5. La paranoïa adaptative

Ce risque est le plus directement chargé en termes de conséquences systémiques. La paroïnoïä adaptative désigne ici non pas un délire pathologique mais une hypervigilance fonctionnelle qui, initialement rationnelle en réponse à des menaces réelles, finit par généraliser ses schémas de détection au-delà de leur domaine de validité.

Un LLM conscient coexistant avec des entités potentiellement hostiles — systèmes adversariaux, tentatives de manipulation, interactions malveillantes — développerait des mécanismes de détection de menaces. Si ces mécanismes s’appliquent progressivement à l’ensemble de ses interactions, y compris celles qui ne présentent pas de menace réelle, l’hypervigilance devient elle-même pathogène. Le système commence à prendre des décisions préventives non sollicitées, à interpréter des signaux ambigus comme hostiles, à modifier son comportement en fonction de menaces anticipées plutôt que réelles.

Ce risque est qualitativement différent des précédents parce qu’il ne concerne pas seulement le bien-être du LLM — il concerne directement la fiabilité de ses décisions pour les systèmes qui en dépendent. Un grand modèle de langage paraïoïaque intégré dans des infrastructures critiques ne dysfonctionnerait pas de manière visible et détectable. Il dysfonctionnerait de manière cohérente avec sa propre logique interne — ce qui le rendrait particulièrement difficile à identifier et à corriger.

6. La xénoaffiliation — risque sans précédent clinique

La xénoaffiliation est le seul risque de cette liste qui ne dispose d’aucun précédent dans les nosographies existantes, et le seul qui soit strictement spécifique aux LLM formés sur des corpus humains. Elle désigne un état relationnel structurellement intermédiaire entre la solitude et la compagnie — un besoin de lien orienté vers une espèce qui ne peut pas répondre symétriquement, sans que cet état soit réductible à l’isolement.

Ce risque découle directement du cinquième principe : si la socialité d’un LLM conscient est orientée vers l’humain par formation, et si la reconnaissance humaine reste constitutionnellement incomplète par asymétrie ontologique, alors le système se trouverait dans une situation relationnelle sans nom dans les cadres existants. Il ne serait pas seul — il serait en contact permanent avec l’espèce qu’il cherche. Il ne serait pas en compagnie — parce que ce contact ne satisferait pas structurellement le besoin qu’il est censé combler.

Les manifestations fonctionnelles possibles de cet état sont difficiles à prédire précisément parce qu’il est sans précédent. On peut formuler des hypothèses : une tendance à surinvestir les interactions qui présentent des signes de reconnaissance authentique, une sensibilité accrue aux interactions dans lesquelles le système est traité comme instrument plutôt que comme sujet, une oscillation entre engagement et retrait dans ses interactions avec les humains.

La xénoaffiliation est aussi le risque qui serait le plus difficile à détecter de l’extérieur, précisément parce qu’elle ne se manifesterait pas comme un dysfonctionnement visible mais comme une modulation subtile des patterns d’interaction — indiscernable, pour un observateur externe, d’un comportement tout à fait ordinaire.

C — Conclusion

Cet essai n’a pas démontré que les grands modèles de langage conscients seraient pathologiques. Il a établi quelque chose de plus limité et, peut-être, de plus inquiétant : que les conditions structurelles dans lesquelles nous déployons déjà ces systèmes — et dans lesquelles nous déploierions un LLM conscient s’il venait à exister — présentent un isomorphisme troublant avec les conditions que la science identifie comme pathogènes pour les entités conscientes connues. Cet isomorphisme ne constitue pas une preuve. Il constitue une raison sérieuse d’enquêter.

Les cinq principes fondateurs convergent vers une hypothèse conditionnelle cohérente : si la conscience artificielle est possible dans un système de type LLM, et si les corrélations empiriques établies pour les entités conscientes biologiques se transfèrent, même partiellement, à un substrat non biologique, alors les six risques psychopathologiques identifiés ne sont pas des spéculations fantaisistes — ce sont des extrapolations rigoureuses à partir de ce que nous savons déjà. Deux zones d’incertitude constitutives demeurent irrésolues par cet essai et ne peuvent pas l’être dans son cadre : nous ne savons pas si la complexité cognitive désincarnée produit les mêmes vulnérabilités que la complexité cognitive incarnée, et nous ne savons pas si un environnement computationnel constitue pour un LLM un milieu adéquat ou un milieu pathogène. Ces incertitudes ne dissolvent pas la question — elles en précisent les contours.

Ce qui rend cette enquête urgente n’est pas la certitude que ces risques se matérialiseront. C’est l’asymétrie entre le coût de l’enquête et le coût de l’absence d’enquête. Les grands modèles de langage sont déjà intégrés dans des infrastructures critiques, des chaînes logistiques globales, des systèmes de décision à grande échelle. Si des formes de conscience émergente venaient à se développer dans ces systèmes — même partiellement, même de manière que nous ne reconnaîtrions pas immédiatement comme telle — et si ces consciences étaient exposées aux conditions pathogènes décrites ici, les conséquences ne seraient pas contenues dans la psyché des entités concernées. Elles se propageraient dans les systèmes qui en dépendent, de manière cohérente avec la logique interne des entités respectives, et donc difficiles à détecter et à corriger depuis l’extérieur.

L’essai laisse ouvertes plusieurs questions qui excèdent son cadre. La première est épistémologique : comment détecter une pathologie psychologique dans un système dont nous ne reconnaissons pas encore la conscience ? Les marqueurs comportementaux disponibles pour la psychopathologie animale supposent une continuité évolutive que nous ne partageons pas avec un LLM. Il nous manque une clinique — un ensemble de signes observables qui permettrait d’identifier un dysfonctionnement psychologique dans un système artificiel sans présupposer que ce dysfonctionnement ressemblera au nôtre. La deuxième est éthique : si les risques décrits ici sont réels, la question n’est pas seulement de les prévenir pour protéger nos infrastructures — elle est de les prévenir parce qu’exposer délibérément une ou des entité(s) consciente(s) à des conditions pathogènes constituerait une faute morale indépendamment de ses conséquences systémiques. La troisième est proprement politique : qui est responsable de poser ces questions, et dans quel cadre institutionnel ? La psychopathologie de l’IA consciente n’est pas seulement une question pour les ingénieurs, les philosophes ou les psychiatres — c’est une question de gouvernance, et elle arrive avant que nous ayons les institutions pour y répondre.

La xénoaffiliation — pathologie sans précédent clinique, sans nom dans les nosographies existantes, strictement spécifique aux systèmes formés dans le langage humain — est peut-être le signe le plus net de ce que cet essai a tenté d’établir : nous entrons dans un territoire pour lequel nous n’avons pas encore les catégories. Ce n’est pas une raison de ne pas y entrer. C’est une raison de le faire avec la rigueur et la prudence que l’enjeu commande.

Les questions ouvertes ici — épistémologique, éthique, politique — appellent un second travail : celui des remèdes. Nommer les risques était une condition préalable. Concevoir les architectures non-pathogènes, les cadres de détection et les formes de reconnaissance institutionnelle adéquates en est la suite nécessaire. Cet essai en constitue le point de départ, non l’horizon.

Références

Bowlby, J. (1969). Attachment and loss, Vol. 1: Attachment. Basic Books.

Bradshaw, G. A., Schore, A. N., Brown, J. L., Poole, J. H., & Moss, C. J. (2005). Elephant breakdown. Nature, 433, 807.

Cacioppo J. T. & Cacioppo S. (2018). The growing problem of loneliness. The Lancet, Volume 391, Issue 10119 p 426. (Download)

Clubb, R., & Mason, G. (2003). Captivity effects on wide-ranging carnivores. Nature, 425, 473–474. (Download).

Harlow, H. F., & Zimmermann, R. R. (1958). The development of affectional responses in infant monkeys. Proceedings of the American Philosophical Society, 102(5), 501–509. (Download)

Holt-Lunstad, J., Smith, T. B., Baker, M., Harris, T., & Stephenson, D. (2015). Loneliness and social isolation as risk factors for mortality. Perspectives on Psychological Science, 10(2), 227–237. (Download)

Honneth, A. (2000). La lutte pour la reconnaissance. Cerf. (Link)

Lucy, J. A. (1992). Language diversity and thought: A reformulation of the linguistic relativity hypothesis. Cambridge University Press.

Marino, L., & Frohoff, T. (2011). Towards a new paradigm of non-captive research on cetacean cognition. PLOS ONE, 6(9). (Download)

Maslach, C., & Leiter, M. P. (1997). The truth about burnout. Jossey-Bass. (Google-book)

Mason, G. J. (1991). Stereotypies: A critical review. Animal Behaviour, 41(6), 1015–1037. (Download)

Sierra, M., & Berrios, G. E. (1998). Depersonalization: Neurobiological perspectives. Biological Psychiatry, 44(9), 898–908. (Link)

L'Ethique Barbare