Écrire aux machines

Partager
Écrire aux machines

Plus de dix millions. C’est le nombre d’images collectées, mi-septembre, avec le « prompt » – la commande textuelle–, qui correspond à chacune, sur le site Lexica.art depuis la mise à disposition du public, le 22 août, de Stable Diffusion. C’est dire l’engouement pour ce modèle d’intelligence artificielle open source, pouvant tourner sur un simple PC, qui génère une image à partir d’une commande constituée d’un court texte décrivant le résultat désiré. Sans surprise, Stable Diffusion est venu s’ajouter à GPT-3, Dall-E et Midjourney sur PromptBase. Créée en juin, cette place de marché commercialise un produit d’un nouveau genre : le prompt.

Si le prompt a de la valeur – quelques dollars sur PromptBase –, c’est que les images générées sont souvent bien loin du résultat escompté. Si la beauté ou le photoréalisme des images sur Lexica impressionnent, un troisième bras ou des yeux mal placés peuvent surgir facilement quand le débutant s’essaie à demander un portrait. En cause, la nature de ces modèles d’IA, reposant sur les réseaux de neurones profonds, le deep learning.

Pas question de règles préétablies ni de syntaxe explicite, c’est à partir d’un apprentissage sur de gigantesques bases de données que ces IA ont développé leurs capacités. Exploiter leur potentiel demande d’explorer à tâtons leurs arcanes. Avec parfois des découvertes surprenantes, comme celle de ces chercheurs de l’université du Texas, à Austin, qui ont constaté que Dall-E 2 générait une image d’oiseau quand le prompt était «Apoploe vesrreaitais»...

Tout un savoir-faire baptisé «prompt engineering » se développe à grande vitesse depuis à peine deux ans.

Tout un savoir-faire baptisé « prompt engineering » se développe à grande vitesse depuis à peine deux ans et l’essor du pionnier GPT-3 d’OpenAI. Aux compilations de trucs, astuces et autres guides s’ajoutent des outils de génération de prompt. Un domaine scientifique est né, avec déjà plusieurs centaines de publications sur le sujet. La création d’images –et bientôt de vidéos et de musiques– est loin d’être le seul enjeu de tous ces efforts.

GPT-3 permet toutes sortes d’actions sur du texte. Sa déclinaison pour le codage informatique, Codex, intégré par Microsoft dans GitHub Copilot, génère du code. Le tout récent Act-1, d’Adept AI, manipule pour nous les logiciels d’un PC. Ils ont tous en commun d’être commandés par des prompts. L’interface textuelle en langage naturel s’impose dans cette génération de grands modèles d’IA dont la puissance rime avec polyvalence. Mais toujours pas avec bon sens. Il faut les guider, en apprenant à leur écrire.

Sujets associés

NEWSLETTER La Quotidienne

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

LES ÉVÉNEMENTS L'USINE NOUVELLE

Tous les événements

LES PODCASTS

Le premier câble transatlantique (1/2)

Le premier câble transatlantique (1/2)

Un entremetteur talentueux et fortuné compte unir l’Europe à l’Amérique via un câble sous-marin. Pour le meilleur et pour le pire.

Écouter cet épisode

Monstre et compagnie

Monstre et compagnie

L’explosion meurtrière de la plateforme Piper Alpha révèle un industriel compatissant. Un rôle de composition pour Armand Hammer...

Écouter cet épisode

Le London Bridge, attraction touristique... en Arizona

Le London Bridge, attraction touristique... en Arizona

Du fog anglais à la chaleur de l’Arizona, il n’y a qu’un pas. Ou le pari d’un industriel américain prêt à tout pour promouvoir sa ville.

Écouter cet épisode

Einstein ou la transition énergétique avant l’heure

Einstein ou la transition énergétique avant l’heure

Einstein et Szilard, un duo de scientifiques renommés prêts à révolutionner... le quotidien des ménagères.

Écouter cet épisode

Tous les podcasts

LES SERVICES DE L'USINE NOUVELLE

Trouvez les entreprises industrielles qui recrutent des talents

ASSYSTEM

Ingénieur Mécanique expérimenté H/F

ASSYSTEM - 22/09/2023 - CDI - Flamanville

+ 550 offres d’emploi

Tout voir
Proposé par

ARTICLES LES PLUS LUS