L'évolution de Midjourney

Mis en ligne le 12 janvier 2024
Mis à jour le 15 janvier 2024

Toujours en m'appuyant sur l'Art Déco, je voudrais montrer ici l'évolution et les progrès de l'intelligence artificielle de création d'images Midjourney depuis 2 ans. Car, en effet, sans prendre en compte les travaux préparatoires importants, la première version est sortie début 2022.

Bien sûr, à l'époque, c'était déjà quelque chose mais il a fallu attendre la version 3 avant que les médias s'en emparent (ce manque de libre arbitre m'étonnera toujours...).


Dans cet article, nous prendrons des requêtes communes à toutes les versions du programme, un animal, un type d'architecture, un véhicule ou autre, et nous regarderons ce qui est proposé dans chacune des versions pour, d'une part, voir les caractéristiques de chacun version, mais aussi pour se rendre compte de l'évolution de la technologie qui s'apprête à bousculer notre façon d'aborder l' « image ».

Elles seront présentées dans l'ordre (de gauche à droite et de haut en bas), de la version 1 à la version 6, tout en se laissant la possibilité d'évoluer à l'arrivée de nouvelles versions, à l'avenir. Vous êtes invités à cliquer sur les images pour les voir en meilleure résolution et donc plus en détail. Vous verrez à cette occasion que le grain même de l'image change.

Les animaux

Première information : Les versions 1 & 2 ne sont pas encore au point. Même si l'on peut nommer un « chat », il faut tout de même une bonne dose d'imagination pour voir un corps, une tête, quatre pattes, des moustaches... Les caractéristiques de l'objet demandé ne sont pas encore assimilées.

Sauterelle




Deuxième information. Les choses ne deviennent intéressantes qu'à partir de la version 3, qui donne une vraie consistance aux corps, aux formes. La version 1 est inutile, la version 2 donne un aperçu, commence à repérer des caractéristiques. Dans la version 3 commence à naître une vraie patte Midjourney. C'est avec cette version qu'une graphiste a peu gagner un concours, fin 2022.

Renard roux




Troisième information : À partir de la version 4, il est possible de demander un style de rendu particulier : photo, réaliste, inventif, créatif, déluré... et c'est sans fin. En l'absence de précision, le programme rendra quatre images souvent différentes, pour laisser du choix.

Architectures

Immeuble




Quatrième information : Il y a un gouffre entre la version3 et la version 4. J'été très enthousiaste à la découvrir de Midjourney 3, y voyant une grande opportunité de création nouvelle. Je trouvais assez intéressant le traitement de l'Art Déco. Par contre, j'étais conscient que très rapidement, le style Midjourney allait se reconnaître et qu'il ne lui serait pas possible de se faire passer pour un travail de créateur. Au niveau professeur, c'est vraiment à partir de la version 4 que les choses sérieuses commencent.

Ville futuriste





Cinquième information. La version 4 fait des images « mignonnes », comme peut le faire un bon jeu vidéo ou un bon dessin animé Pixar. On est à sans lieu de la version 3 en matière d'analyse de la requête et de précision du rendu mais il manque de nombreuses choses dans le traitement des couleurs et de la lumière.

Maisons de brique


Il s'agit du thème choisi pour l'image d'illustration de l'article.


Sixième information : La version 5 se dirige vers plus de réalisme, beaucoup plus même (bien qu'elle sache également faire des dessins totalement fous). On peut largement commencer à se faire avoir. D'ailleurs, avec cette version, certaines personnes malhonnêtes commencent déjà à vendre leur travail en essayant de le faire passer pour un travail original. Courant 2023, les réseaux sociaux et les sites de vente en ligne de lithographie, de T-shirt, de sets de table ou autres en sont inondés. C'était prévisible. C'est arrivé.

Ainsi, on peut trouver de nombreuses mises en garde. Attention, les IA font des erreurs. Voir ensuite la liste des erreurs courantes. Oui, ma chaque version corrige un bon nombre de ces erreurs. Alors il ne faut pas trop perdre de temps à compter le nombre de doigts, car, la technologie avançant, ce genre de choses est plus ou moins réglé.

En gros, avec la version 5, les images semblent « trop belles » pour être vraies, un peu comme un film de 2022-2023 tout fait en CGI. Quand on voit Thanos dans les Avengers, on le troupe très réussi, mais... on sait... on sait qu'il est généré par ordinateur.

Véhicules

Ambulance



Septième information : Le texte n'est pas du tout généré jusqu'à la version 6. Qu'on en fasse la demande ou non, quand un texte est affiché sur l'image, on peut être sûr que ce sera n'importe quoi. La version 6 prend en compte la demande de texte. Après de nombreux essais, je reste en demi-teinte. Ça marche... mal. Il vaut mieux en rester à quelque chose de très simple. La bonne nouvelle c'est qu'il peut créer des logos avec des sigles de manière efficace comme « GIP », « BMP », « NGX » ou autre...

Huitième information : Avant la version 5, les images avec des objets avaient presque toujours un défaut repérable. Regardez la version 4 des deux sujets précédents : Roue de secours qui rentre dans la carrosserie, coffre qui ne s'ouvre pas, non symétrie des feux arrières, éléments superflus, deux feux à gauche, problème d'essuie-glace, fenêtres absurdes, roues dépareillées. Ce genre de choses à commencer à chuter drastiquement avec la version 5. Il semble vraiment se passer quelque chose avec la version 6. Essais après essais, j'ai vraiment du mal à prendre le programme en défaut.

Neuvième information : La version gère les dégradés, les contrastes et la lumière ne façon nettement supérieure à la version précédente. Le résultat : des images vraiment plus réalistes difficiles à prendre en défaut, en tout cas, plus difficiles à prendre en défaut.

Instruments de musique

Dixième information : Pour les plus petits détails, il faudra encore attendre. Dans cet exemple, aucune version ne sait alterner les touches noires et blanches du piano de façon réaliste et pourtant les instruments sont jolis.

Accordéon



Onzième information : Malgré les progrès impressionnants, il reste des bourdes dans la version 6. Regardez cette image cubiste. À peu de chose près, on pourrait croire à un tableau d'artiste sauf que... l'instrument de gauche ne ressemble à rien, le contrebassiste de gauche possède 6 doigts (eh oui, encore...) et l'autre contrebasse est jouée par trois personnes. L'information n'est pas tant qu'il reste des soucis mais que certaines requêtes restent plus difficiles à traiter que d'autres, et notamment, on l'a dit, les plus petits détails.

Guitare


Et pour terminer, un dernier instrument de musique, en guise de conclusion.


Comme toujours, les versions 1 et 2 font un peu sourire, quand la version 3 commence réellement à dessiner les contours de l'objet. La version 4 est la première vraiment utilisable mais les images rappellent encore trop le jeu vidéo par manque de subtilité dans l'usage des couleurs. La version 5 est la première à être réellement utilisable professionnellement ; de nombreux détails sont réglés et la fiabilité augmente radicalement. La version 6 semble être celle du réalisme, où les couleurs se multiplient, la lumière et les ombres sont bien placées et où l'on ne cherche pas à faire « la plus belle » image possible.

J'ai grande hâte de découvrir ce que nous réservent les versions suivantes et je ne manquerai pas de venir vous en parler.



Hors sujet

Et pour terminer, pour ceux qui passeraient par cet article sans être particulièrement attaché à l'Art Déco, mais plus pour avoir des informations sur Midjourney, voici Un vieux Viking qui se prépare au combat, toujours dans les 6 versions de l'ia. A partir de la version 6, on voit clairement tout le potentiel qu'il peut y avoir au niveau des graphistes, du cinéma, du jeu vidéo, ne serait-ce que pour trouver l'inspiration.



Partagez cet article

Facebook Twitter Pinterest

Commentaires

Nom ou pseudo :

Adresse Email (facultatif) :

Anti-spam. Combien font



Kinan Posté le 21 mars 2024
Notre monde va se remplir d'IA, il va falloir être préparé !