OpenAI dévoile DALL-E 3 et permet aux artistes de ne pas participer à la formation

OpenAI dévoile DALL-E 3 et permet aux artistes de ne pas participer à la formation

OpenAI a dévoilé aujourd’hui une version améliorée de son outil de conversion de texte en image, DALL-E, qui utilise ChatGPT – le chatbot d’IA viral d’OpenAI – pour éliminer une partie de la douleur liée à l’incitation.

La plupart des outils de génération d’images à la pointe de la technologie, alimentés par l’IA, utilisent des messages-guides – des descriptions d’images – et les transforment en œuvres d’art dans un large éventail de styles, allant du photoréalisme à la fantaisie. Mais trouver le bon message peut s’avérer difficile, à tel point que l' »ingénierie des messages » est en passe de devenir une véritable profession.

Le nouvel outil d’OpenAI, DALL-E 3, utilise ChatGPT pour aider à remplir les messages. Grâce à ChatGPT, les abonnés aux offres premium d’OpenAI, ChatGPT Plus et ChatGPT Enterprise, peuvent saisir une demande d’image et l’affiner par le biais de conversations avec le chatbot – en recevant les résultats directement dans l’application de chat.

ChatGPT prend une demande aussi courte que quelques mots et la rend plus descriptive, fournissant ainsi plus de conseils au modèle DALL-E 3.

L’intégration de ChatGPT n’est pas la seule nouveauté de DALL-E 3. DALL-E 3 génère également des images de meilleure qualité qui reflètent plus précisément les messages, selon OpenAI, en particulier lorsqu’il s’agit de messages plus longs. De plus, il gère mieux les contenus qui ont toujours posé problème aux modèles de génération d’images, comme le texte et les mains humaines.

OpenAI DALL-E 3

Une image générée par DALL-E 3. Crédits image : OpenAI

En outre, DALL-E 3 dispose de nouveaux mécanismes visant à réduire les biais algorithmiques et à améliorer la sécurité – c’est du moins ce qu’affirme OpenAI. Par exemple, DALL-E 3 rejettera les requêtes demandant une image dans le style d’artistes vivants ou représentant des personnalités publiques. De plus, les artistes peuvent désormais refuser que certaines de leurs œuvres – ou toutes – soient utilisées pour former les futures générations de modèles texte-image de l’OpenAI. (OpenAI, ainsi que certains de ses rivaux, fait l’objet d’un procès pour avoir prétendument utilisé des œuvres d’artistes protégées par des droits d’auteur afin d’entraîner ses modèles d’images d’IA générative).

Le lancement de DALL-E 3 intervient alors que la course à l’IA générative s’intensifie, en particulier dans le domaine de la synthèse d’images. Des concurrents comme Midjourney et Stability AI continuent d’affiner leurs modèles de génération d’images, ce qui met la pression sur OpenAI pour qu’elle reste dans la course.

OpenAI prévoit de déployer DALL-E 3 pour les utilisateurs premium de ChatGPT en octobre, puis pour les laboratoires de recherche et les clients de son API. L’entreprise n’a pas précisé quand – ni si – elle prévoit de lancer un outil web gratuit, comme elle l’a fait avec DALL-E 2 et le modèle DALL-E original.

IA