Les IA génératives sont décidément à la mode, on en parle même à Marseille

Je savais bien que ça n'allait pas me plaire ce machin. Mais l'affiche m’a parlé, et comme Jacques Attali et Thierry Breton se déplaçaient, j'allais faire un effort. Voici mon compte-rendu du machin. Pas sûr qu’on se fasse beaucoup d’amis ...

« À jamais les premiers ! » Olympique de Marseille (1993)

Jeu de mots

J’ai assisté au salon Artificial Intelligence Marseille (AIM) qui s’est tenu le 24 Novembre 2023, organisé par La Tribune. La Provence en parle ici.

Il y a un subtil double jeu de mots avec IAM et to aim.
Ah.

Beaucoup de bonheur

AIM proposait en réalité trois salons pour le prix d’un.

1 Un salon dédié aux grandes heures du foot et à l'intelligence artificielle.

2 Un salon au Vélodrome, temple du foot français, où le vaste domaine de l'intelligence artificielle s'est vu violemment résumé à une mot fourre-tout : l'IA générative.

3 Un salon où une collection hétéroclite d'intervenants ont tous fait mine de maîtriser l'ensemble des sujets liés à une technologie toute récente, mal comprise et aux conséquences encore inconnues.

Pourquoi il parle de football ?

On est à Marseille, bébé. Mieux : au Stade Vélodrome, temple du football français et de la politique locale. Obligé je parle de foot, cousin. Le président de la région (Renaud Muselier) a tellement filé la métaphore du foot et de l’IA dans son discours d'introduction, que ça en devenait génant. Avait-il autre chose à dire ? Probablement pas. Enfin bon, pourquoi pas. C’est Marseille, bébé. Ils nous auront au moins épargné Jul et sa bande organisée, c’est appréciable.

Je plains un peu les intervenants

Ils étaient nombreux, les cravatés, à nous expliquer pourquoi et comment l'IA générative était importante. Beaucoup issus de grandes entreprises souvent multinationales, quelques startupers éparpillés façon puzzle, dont un qui a osé parlé d’approche symbolique en IA et de Prolog - bien joué David Cortés. Nous sommes au moins trois à avoir compris la référence.

La liste des intervenants est sur le site. Le mot d’ordre était très clair : tout ce joli monde maîtrisait l’intelligence artificielle générative, des concepts aux usages. Convoqués pour chanter les louanges de cette technologie et la gloire éternelle de leurs employeurs, quel autre choix avaient-ils ? Probablement aucun. L’IA est avant tout un sujet de communication pour les entreprises. Preuve qu’ils n’étaient pas nés de la dernière pluie, ils nous ont souvent rappelé que l’IA n’avait pas commencé en Novembre 2022 avec ChatGPT. L’IA a une histoire beaucoup plus ancienne, voyons, qui remonte à l'arrivée du deep learning il y a bien 10 ans.

C’est bien connu.
Qui l’ignore encore ?

Loupé

L’histoire moderne de l’IA commence en 1956.

Si le deep learning sort en effet de la confidentialité des laboratoires spécialisés vers 2015 avec AlphaGO, il est tout à fait faux de résumer l’IA à ce type d’algorithme d’apprentissage automatique. Deux références pour le lecteur curieux : AlexNet (2012) et une revue de LeCun et al dans Nature. Le grand public découvre le terme fin 2015 avec la victoire du programme AlphaGo de DeepMind, pépite londonienne alors récemment acquise par Google. J’ai bien conscience que ce genre de considération est purement accessoire. Elles n'intéressent que les nerds ou certains teigneux.

Un nouveau Veau d’or

Car la révolution, mon doux ami, c'est évidemment l'IA générative. Elle va changer notre rapport à la technologie. À l'éducation. Au travail. À la connaissance. À tout. La balle d'argent, la silver bullet, enfin ! Elle est là. On l'aime déjà.

Il faut bien reconnaître qu’elle nous perturbe aussi un peu, cette IA générative. Elle semble s'attaquer aux métiers intellectuels. Ceux précisément qu’exerce une bonne partie de l'audience, constituée de plus de 200 personnes dont la majorité ne ressemble pas tout à fait à des développeurs ou data scientists. Certes, l’habit ne fait pas le moine, ne généralisons pas.

Alors, même pas peur de l’IA générative ? En façade non. Il convient plutôt d’exploiter ses avantages pour “faire plus” et “faire mieux”.

Mais au fond, si, bien sûr.
On trouille tous.

Surtout que personne n'y comprend un traître mot, au fond, à ces systèmes d’IA générateurs de contenus et à ces LLM. Et c’est normal, car vous n’avez pas que ça à faire de suivre les nouvelles technologies innovantes (ou non), révolutionnaires (rarement) et complexes (toujours). Je vous renvoie simplement au Guide de Survie en Milieu Hostile que nous avons rédigé récemment.

Skippy

Éric Sadin a parlé, à un moment. Je ne le connaissais pas, et sa prestation ne m'a pas donné envie de mieux connaitre le personnage. Depuis que j’ai subi le bouquin de Laurent Alexandre, j’écoute rarement les bavards médiatiques et je les lis encore moins. Il parait qu’il est apprécié. Étrange. Sous ses airs de prophète et son discours alarmiste, ce Cassandre au look très personnel m’a fait sourire. Laissons-le dans son univers si sombre.

À quoi ça sert ?

Un cas d’usage classique de ces fameuses IA génératives consiste à s’en servir pour interroger des bases de données internes. Ca m'a d’abord amusé, puis intrigué. Je rapporte ce qu’en disait un executive de La Poste, avec mes mots : « nos bases de connaissances internes sont vraiment massives et nous utilisons ces systèmes en interne pour donner accès à l’information à tout le monde ». Nous avons reçu ce genre de demandes plusieurs fois, je peux donc confirmer que le sujet est dans l’air.

L’idée est d’utiliser ce genre de système automatique pour faciliter la récupération d’information. Ça revient à créer un système de gestion électronique de documentation (GED). L’idée est séduisante tant qu’on reste à la surface. Dès qu’on gratte un peu, on déchante. Le fonctionnement des systèmes génératifs actuesl consiste à composer des réponses à partir de l’analyse d’une base de connaissances préexistante.

Composer des réponses revient en réalité à coller des mots les uns aux autres, sans aucune réflexion ni compréhension des concepts, en supposant qu’un calcul de probabilité suffira à créer du sens. Présentée ainsi, l’idée paraît discutable. Le propre de ces systèmes est de pouvoir habilement inventer des sorties, sans se soucier d’être parfaitement en ligne avec les bases d’apprentissage. Ces inventions sont appelées des hallucinations, c'est-à-dire des inventions ou des erreurs. Qui souhaite sérieusement obtenir des réponses solides sur des sujets sérieux dans 80% des cas ? Et c’est une estimation optimiste.

Pour être honnête, certains Prix Turing récents, dont Geoffrey Hinton, croient que ces systèmes comprennent réellement ce qu’ils écrivent. Yann LeCun (Meta) est moins péremptoire, mais tout de même confiant:

« LLMs obviously have some understanding of what they read and generate ». Yann LeCun, xweet

Délire ou sagesse ?

Je n’ai pas consacré ma vie à l’étude des algorithmes de deep learning, et je n’ai pas été rémunéré par Google ou Meta de longues années. Certaines subtilités de la modélisation de l’intelligence m’échappent.

Alors, délires ou sagesse ?
Le temps nous le dira.

Quoi qu’il en soit, s’il faut faire relire les sorties de programme par des humains pour débusquer leurs hallucinations, et si l'horizon des jeunes diplômés Bac+5 est de se cantonner à ces tâches passionnantes, je souhaite beaucoup de bonheur aux employeurs.

Et les autres ?

Jacques Attali était bien, un peu sombre. Fatigué ? J’ai bien aimé son intervention. Il a préféré parler de prédictions artificielles au lieu d’intelligence artificielle. Ça réduit la portée, mais ça cadre le débat.

Thierry Breton était en forme, animé par l’intérêt public. Gare à vous, GAFAM et autres lobbies ! L'intelligence artificielle, c'est le futur. Pour 25 ans, a même parié notre commissaire européen. Il n'a pas tort : l'IA concerne par définition le futur, puisque c'est une frontière entre ce qu’on sait faire (=il existe un algorithme dont le fonctionnement est clair) et ce qu’on ne sait pas vraiment encore faire (=le reste).

En tout cas, c'était bien organisé. Il y avait des p'tits croissants, c'était sympa.

Après on rigole, on rigole, on ironise, on moque un peu. Mais sincèrement, ces discours sont très perturbants. Je ne me moque pas des gens, qui font ce qu'ils peuvent avec ces outils et technologies difficiles, mais je me gausse volontiers des organisations et des jeux sociaux. Là, on est en plein dedans.

Qui a la plus belle IA ?
Qui a la plus grosse base de données ?
La cour de récré n'est jamais très loin.

Ca me laisse pantois, quelque part.


Thomas