FredVoyage

Fish on a Bicycle

SOMMAIRE

En 2022, j'ai fait comme beaucoup, je me suis essayé aux IA Générative. D'abord, avec ChatGPT, puis avec MidJourney pour créer des images.

Pour ce post, je vais me concentrer sur MidJourney et les images.

2022

On commence en 2022 avec la version 3, et quelques essaies. Au début, les essais sont peu concluants, avec une qualité d'image très approximative, et des personnages qui ne ressemblent à rien. A chaque requête, MidJourney fait 4 propositions, de forme carrée, voici ce que ça donne avec un prompt qui demande 2 adolescents qui se donnent la main en regardant la statue de la Liberté :

Voici une version que j'ai tenté d'améliorer à partir de l'image de droite :

J'ai fait d'autres essais et notamment j'ai voulu reproduire une publicité de Guinness sortie en 1996 dont la dernière scène montre un poisson qui pédale sur un vélo. Voici la publicité :

Voici l'image qui m'intéresse :

L'image n'est pas d'une qualité exceptionnelle, un screenshot du film, que j'aimerai améliorer, alors j'essaie et j'obtiens ceci sur plusieurs essais :

On arrive à mettre des poissons sur un vélo, une moto, une bière, mais rien qui ne ressemble à l'image recherchée.

2024

Il y a quelques jours, j'essaie à nouveau d'utiliser MidJourney avec l'abonnement payant. Le prix est modique : $10 pour un mois et plus de 200 clichés, résiliable à tout moment. J'essaie donc à nouveau de refaire les mêmes tests pour voir la progression du modèle.

Voici une demande simple faite en 2022 : un écureuil mange à côté d'un arbre sur un tapis de neige. Le prompt est en anglais, le voici :

snow meadow tree, a squirrel eating near the tree, realistic hyper-detailed cinematic frame

Voici le résultat :

Aucune des images ne ressemble à ce que je cherche : il y a des morceaux d'arbres, des arbres qui ressemblent à des écureuils ou l'inverse, et une prairie de neige, pour cette partie-là, généralement, ça va.

Voici le résultat de la même requête en 2024 avec le modèle 6.1 :

On peut remarquer que cela n'a rien à voir avec ce qui était proposé en 2022 avec le modèle 3.

Ca m'a donné envie de continuer et surtout de reprendre ce que j'avais tenté en 2022, pour voir ce que ça donne maintenant avec le nouveau modèle.

La surprise est grande, les images sont d'une qualité vraiment intéressante, pour preuve cet arbre, avec plein de détails :

Alors je suis retourné sur mon poisson sur son vélo, et voici quelques retours :

C'est déjà plus réaliste, car il y a bien un poisson et un vélo. Celui-ci ne pourrait pas faire grand chose, mais il est posé sur le vélo. Avec quelques essais supplémentaires, on arrive sur ce poisson rouge :

Je reprends donc l'image en noire et blanc, et là, je me heurte à un obstacle : il semble que seul un humain avec des pieds puisse pédaler :

Si j'essaie de faire pédaler une sirène, MidJourney lui ajoute des jambes et des pieds :

Avec un peu plus de liberté, il semble qu'un oiseau puisse se poser sur le vélo :

ou une grosse saucisse :

Mais pas un poisson. Le problème vient peut-être du fait qu'il faut faire des photos plus réalistes, et donc si certaines choses apparaissent, comme des mains à 6 ou 7 doigts, elles sont écartées par le modèle, d'où le problème du vélo qui ne peut être utilisé que par un humain avec des pieds.

A suivre avec les améliorations dans quelques mois, car le modèle étant récent, il sera forcément amélioré.