Bienvenue sur notre page des news IA générative !
…une chronique tenue régulièrement, qui traite des nouveautés des outils d’intelligence artificielle dans nos métiers audiovisuels : graphisme, photographie, 3D, réalisation vidéo/film… Les outils IA génératifs évoluent très vite, et révolutionnent peu à peu nos pratiques !
Vous former à l’IA générative ?
- Formation IA générative pour la création de contenus : ChatGPT et DALL-E (3 jours)
- Formation IA et graphisme, initiation aux outils génératifs (5 jours)
- Formation IA générative, image et animation, avec Stable Diffusion (5 jours)
- Formation IA et vidéo, initiation aux outils génératifs (5 jours)
- Formation IA vidéo générative, atelier de réalisation (2 semaines)
- Formation Blender, perfectionnement et outils IA. (5 jours)
- Formation BD et IA, réaliser une bande dessinée avec l’aide de l’IA (2 semaines)
- Formation Scénariser des films et des séries avec l’IA (5 jours)
Jérémy fait son show : nouveautés IA (vidéo) et 9 IA vidéo comparées testés !
Meta présente son IA générative vidéo : Movie Gen…
Présentée, annoncée comme simple et ultra réaliste, Movie Gen n’est pour le moment pas utilisable…
Movie Gen propose les fonctionnalités « classiques » :
- texte vers vidéo
- modif de vidéo par texte
- référence d’image dans une génération vidéo
- création audio : effets, musiques…
FLUX, modèle open source : générer des images et faire un LoRA
Présentation de Flux, modèle open source & non censuré, hyper-réaliste, disponible en 3 versions : générer des images, comprendre les paramètres, fabriquer et entraîner un LoRA (petit modèle complémentaire). Un tuto réalisé par Nanda Fernandez, réalisateur, graphiste et expert IA générative.
MidJourney est désormais 100% dispo en version web !
Nanda Fernandez, un de nos formateurs experts en IA générative explique la version web de MidJourney.
Débuter avec MidJourney en version online Internet : interface et personnalisation, structure d’un prompt, styles, paramètres, options de rendu, références d’image, de prompt ou de character, dé-zooms.
Par ailleurs, MidJourney version online internet propose la fonction Editor, nouveau module disponible pour transformer des images générées en gardant le style : pan, zoom et dé-zoom, inpainting (ajout de détails ou d’éléments), infusion de style
IA vidéo générative : 5 outils comparés – Runway, Adobe, Kling, Luma, Minimax…
Jérémy Gross, directeur artistique, expert en IA vidéo générative, compare 5 outils vidéo : Adobe Firefly, Runway, Luma, Kling et Minimax…
IA vidéo générative, les news : Kling, Luma, FreePik, Midjourney, Minimax, Runway, Adobe….
Notre formateur expert en IA, Jérémy Gross, présente les news sur Kling, Luma, Google, Mistral, WebSim, Flux, Mystic, FreePik, YouTube, Midjourney, Minimax, Krea, Voice Isolator, Udio, Runway, Suno, CogVideoX, LivePortrait, Magnifier, Adobe…
Arata Fukoe, IArtiste à voir !
Arata Fukoe est un artiste japonais de l’IA qui n’essaye pas de refaire (désespérément !) le déjà vu, le déjà filmé…
Runway Gen3 testé… à améliorer !
Thomas Smith a fait de nombreux tests de prompts pour générer des vidéos avec Runway Gen3, version alpha… la version alpha est désormais dispo en public. Les premiers résultats sont décevants pour les interactions des objets ou corps entre eux, des animaux qui se décomposent au bout de 5 secondes…
Luma : générateur vidéo 2.0 dispo gratuitement et commercialement…
Disponible gratuitement et sans limites, pour le moment, Luma permet de créer un petit film de 120 images en environ 120 secondes. Les résultats sont très prometteurs… Cet outil dénommé Dream Machine offre la consistance des personnages et une assez grande précision. Luma fonctionne par prompt (commande textuelle de ce que l’on veut voir) avec ou sans une image de référence, en plus, permettant ainsi de créer rapidement une scène esthétiquement forte.
En version gratuite Luma limite à 30 vidéos par mois et en interdit l’usage commercial. Des abonnements sont proposés : Standard (23,99/USD/mois) pour 150 vidéos par mois, générés plus rapidement et à usage non restreint. Les options Pro (79,99USD/m) et Premier (399,99USD/m) font passer à 430 ou 2030 vidéos par mois…
La qualité est indéniablement arrivée dans sa version « 2 »… A tester en profondeur !
Runway présente Gen3, version alpha étonnante de progrès !
Stable Diffusion 3 Media
Version 3, encore plus puissante ! A tester !
Kling AI : un générateur de vidéos pionnier ?
Kling est un nouveau générateur vidéo, apparemment pionnier, aussi bon que ceux qu’on attend toujours (Sora,…) : il est chinois, ouvert en beta testing gratuit… à la condition d’avoir un numéro de téléphone chinois, et de télécharger l’application KWAI iOS… pas évident ! Une longue vidéo démontre (en chinois) les possibilités de Kling… Une version courte permet d’en voir un peu (commenté en anglais). A consulter ici.
Apple dévoile son IA…
Apple a dévoilé sa future offre IA : dénommée AI comme Apple Intelligence, son IA sera intégrée aux prochains OS, et fonctionnera sur les derniers Macs (et minimum un iPhone 15 Pro) de manière locale (un mini modèle ultraléger) avec aucun stockage ni partage de données personnelles. Optimisée avec des petits modules correctifs ou additifs, cette IA proposera l’option de chatGPT, lorsque ses résultats seront décevants. Quelles possibilités pour cette IA ? résumer en texte un message téléphonique, fabriquer une image, prioriser des mails ou sms… Au delà de ce micro modèle intégré, Apple proposera une IA en cloud privé, avec garantie d’aucun partage de données personnelles.
Cette offre IA arrivera en fin d’année, et pour le moment uniquement en anglais, aux USA…
Un exemple bluffant ? dessiner sur un ipad des équations, et l’ipad donne la solution…
Stable Audio, un générateur musical… limité !
Stability AI propose désormais un générateur sonore/musical, Stable Audio Open : à partir d’un prompt textuel, il produit des sons/musiques de 47 secondes maxi : idéal pour créer des petits morceaux avec ambiances, bruits, instruments, il interdit cependant tout usage commercial…
Miss AI contest : le concours de la plus belle femme « IA »…
Il fallait y penser (ou peut-être pas ??), mais voilà le premier concours mondial de la plus belle femme créée par IA… 4 juges voteront, dont 2 qui sont des IA… trois prix : 13000, 5000 et 2000 USD. Ces prix récompenseront la qualité des modèles, selon trois critères : « humains » (beauté, valeurs humaines…), techniques (agilité, qualité des prompts, détails physiques difficiles comme les mains, yeux, arrière plans…) et sociaux (audience,…) En savoir plus.
Nouveaux outils IA génératifs…
Theoretically Media donne un avant gout de différents outils IA génératifs en développement. Notamment Pandora pour rallonger des vidéos (leur ajouter des éléments…), SignLLM pour animer un personnage en langue des signes…
Parabellum : le méta site des IA…
Le site Parabellum inventorie les très nombreux outils IA disponibles, gratuits, payants, en texte, audio, vidéo, graphisme…
GPT-4o annoncé, disponible et très convaincant ?
Regardez cette vidéo, vous serez étonné.e.s de la conversation fluide, si humaine, interactive… nous l’avons testé, en vrai, en français et en anglais, et c’est très décevant : français médiocre, interaction en anglais lente et assez faible… whaou ! Heureusement ChatGPT n’est pas (encore) censé devenir notre meilleur.e ami.e… Rappelons que GPT-4o écoute, voit et parle… en plus d’écrire…
Adobe LightRoom offre la fonction Remove
Adobe vient donc d’ajouter à Lightroom la fonction Remove, pour effacer un élément d’une photographie…
AI Film Festival 2024 : les meilleurs films (co/)générés par IA…
Parmi les nombreux films récompensés, entre deux « GIF animés », deux films « tordus » et tellement artificiels… on en trouve quand même qui utilisent l’IA au bénéfice d’un point de vue, de l' »expression » d’un imaginaire normalement infilmable et d’une ouverture au monde… Voici ceux que je préfère :
- e^(i*π) + 1 = 0 de Junie Lau
- Where Do Grandmas Ho When They Get Lost ? de Léo Cannone
- LAPSE de YZA Voku
On appréciera d’écouter les invités du festival qui donnent leur avis et expérience de l’IA… le patron de Runway (organisateur du festival) et 3 artistes qui sont venus tester les IA… En résumé : au delà des polémiques publiques (remplacement des humains, droits, réalisme…) les IA sont appréciées pour les processus offerts : permettant de tester/échouer/expérimenter très rapidement, sans aucun jugement ! Le patron de Runway pense l’avenir des IA génératives comme capables prochainement de générer en temps réel, mais surtout que l’art généré par IA va se démarquer du champ cinématographique (et de ses termes, son langage) pour devenir autonome, distinct. Un animateur évoque l’accélération des processus de fabrication en citant son travail sur la série des Simpsons : les premières saisons étaient entièrement réalisées sur pellicule, image par image, et prenaient 9 mois. Les saisons actuelles, réalisées numériquement… prennent 11 à 12 mois, car les équipes prennent plus de temps pour peaufiner dialogues, rendu, détails…
Google présente sa nouvelle IA vidéo générative : Veo
Après Lumière (et ses prédécesseurs), voici Google Veo : donné comme très bon concurrent de Sora (toujours pas sorti), Veo s’appuie sur Gemini (pour analyser des films et produire des prompts) et produirait des séquences réalistes, avec une fine compréhension de termes cinéma… Les premières images ne font pas très envie, mais l’avenir le dira… Google affirme être prudent sur la fabrication d’images réalistes, dans un contexte de fake news, et chaque séquence générée serait « watermarkée ». Veo n’est pas du tout dispo mais Google a commencé à collaborer avec des artistes…
L’artiste vidéo Paul Trillo réalise le clip de Whashed Out, avec Sora
Composé de séquences en travelling « infini », Paul Trillo raconte un peu sa méthode et son expérience de Sora, l’IA générative vidéo d’OpenAI, pour le moment non publique, que quelques artistes ont pu tester… Manifestement il n’a pas souffert de la non cohérence des éléments générés, d’un plan à l’autre : il a réussi à produire des plans séquences longs, avec un couple référent dans sa « narration » : une jeune femme rousse et un jeune homme à l’épaisse tignasse brune… qui « mutent » à chaque plan séquence ! Mais cela forme malgré cela une cohérence, dans un clip de fuite en avant très rapide.
Midjourney évolue(ra) : versions 6.1 et 7, 3D, vidéo !
L’IA générative numéro 1 pour créer des images promet de nombreuses évolutions :
Personnalisation :
- Personnalisation des modèles en fonction des préférences de l’utilisateur
- Utilisation des appréciations et des classements par paires pour connaître les goûts de l’utilisateur
- Personnalisation unique par utilisateur pour commencer, possibilité de partage
- Résolution des instabilités numériques dans l’entraînement pour améliorer la cohérence
Version 6.1 :
- Amélioration qualité : images, texte, vitesse, cohérence entre les mains et le corps
- L’accent est mis sur l’élimination des artefacts et des imperfections.
- Mise à jour importante, probablement la dernière version 6.x avant de se concentrer sur la v7
- Améliorations potentielles de l’upscaler également
Version 7 :
- Modèles plus intelligents avec une meilleure compréhension des prompts
- Meilleure intégration des connaissances
- Meilleur traitement des objets multiples sans mélanges
Midjourney 3D :
- La 3D générée par l’IA devrait surpasser les graphiques informatiques conventionnels.
- Pour maintenir la qualité, il faut que les données d’entraînement en 3D soient réelles plutôt que générées par ordinateur.
- L’équipe chargée du matériel met au point un équipement de balayage 3D
- Le lancement de la 3D a été retardé d’environ 6 mois afin de recueillir des données exclusives.
IA vidéo :
- En retard par rapport à la 3D, mais en bonne voie
- Les équipes 3D et vidéo se poussent mutuellement à aller de l’avant
Sora (un peu) dévoilée…
Vous connaissez ce film ? généré officiellement par IA, avec Sora, la brillante application de génération de films, préparée par OpenAI, mais encore très mystérieuse, et toujours pas dispo…
Et bien, la société qui a créé ce film, shy kids, dévoile légèrement les conditions de conception de ce film : environ 300 plans générés pour 1 utile, énormément de postproduction ensuite pour corriger les anomalies… Sora apparemment n’est pas (pour le moment) l’outil magique. Sans compter sa censure forte : il refuserait toute esthétique connue (Star Wars, Hitchcock…).
Adobe Firefly 3 et Photoshop Beta boostent l’IA générative !
Firefly 3 (web app) et Photoshop (beta) proposent un nouveau moteur de rendu génératif ia (plus belles images), associé à des fonctionnalités plus puissantes : image de référence, stucture de référence, référence de styles, génération d’arrière plan, pinceau ia, choix de variantes…
Etude du CNC sur l’IA et nos métiers…
Adobe Firefly fête sa première année…
En un an, l’outil IA en développement, Firefly, a progressé et a diffusé ses technologies dans Photoshop, Litghtroom, Stock, Substance, Illustrator…
Premiere Pro prochainement gonflé à l’IA générative
Adobe présente un aperçu des outils IA génératifs / transformatifs prochainement intégrés dans Premiere Pro : effacement ou transformation d’un objet (identifié par l’IA), allongement de la durée d’un plan, création d’un plan par prompt… Premiere Pro proposera son IA générative (Firefly) mais également accueillera des plugs ins : Sora, Pika,… On note la présence d’artefacts ou de défauts… temporaires ?
OpenAI et le clonage vocal…
OpenAI (ChatGPT, Dall-E…) a présenté Voice Engine, un outil IA capable de reproduire une voix, à partir d’un texte et d’un échantillon audio de 15 secondes… Voice Engine n’est pour le moment pas disponible… probablement par précaution « politique » (élections américaines). A déguster prochainement…
Adobe Music genAI : création musicale…
Adobe prépare donc un outil IA de création musicale par prompt (commandes de textes)… assez miraculeux…
Midjourney : des nouveautés de taille !
Le style ref : garder des styles persistants avec la commande –sref… Une nouveauté très attendue et importante. Plus d‘infos ici.
La personnalisation des modèles : très attendue par la communauté. Plus d’infos ici.
Character weight : pour garder plus ou moins les caractéristiques d’un personnage
Portrait Pro : une version 24 dopée à l’IA
La version 24 du célèbre outil de travail de photographies de portraits, PortraitPro améliore ses fonctions d’optimisation et correction avec IA : inpainting de bouche, remplacement de dents, retrait de reflets de lunettes, amélioration de la peau… Tarifs toujours assez bas : 55 à 175 USD.
Lancement de la formation IA vidéo générative, atelier de réalisation !
Cette formation de 2 semaines est un atelier exploratoire des outils d’intelligence artificielle et du pipeline pour réaliser des films : fiction, pub, corporate, expérimentations… aussi bien pour tester les possibilités et limites techniques / créatives des outils IA actuels (et en devenir), mais aussi créer tout ou partie d’un film, de manière professionnelle et aboutie. La formation est animée par Jérémy Gross, directeur artistique, réalisateur, spécialiste des outils IA.
Sora : premières impressions d’artistes…
OpenAI présente des vidéos réalisées par des artistes ayant eu accès à Sora (encore en développement). C’est impressionnant… Les sceptiques se demandent ce qui est censuré, car encore non fonctionnel. Les apocalyptiques ressentent la fin des tournages… Les euphoriques sont dithyrambiques… 😉
Un des films est celui-ci :
Stable Diffusion 3 arrive !
Tout en présentant Stable Cascade (un générateur texte > image plus efficace, assez fin en réglages), Stability AI a surtout annoncé Stable Diffusion 3… Stable Diffusion 3 n’est disponible qu’en preview (et encore sur liste d’attente) et promet des grandes améliorations sur les requêtes multi-sujets, la qualité du rendu… SD 3 utiliserait une architecture de transformateur de diffusion et un appariement de flux… les modèles disponibles iront de 800M à 8B de paramètres
Lancement (très attendu) de notre formation IA générative, image et animation, avec Stable Diffusion.
Cette formation de 5 jours est une initiation avancée et intensive à Stable Diffusion, outil IA génératif et correctif d’images et animations. Elle s’adresse à des personnes très à l’aise avec les outils informatiques, et ayant déjà des bases en IA (Midjourney par exemple). Elle est animée par Lionel Vicidomini, motion designer, graphiste 3D, enseignant et formateur, créateur bien connu de nombreux tutos de référence (sur Blender, Cinema 4D, Stable Diffusion…)
Google présente son outil IA vidéo : LUMIERE…
Après 2 précédents outils vidéo, Google présente son nouvel outil IA pour la vidéo : LUMIERE… Nous ne disposons que des vidéos fabriquées (et sélectionnées) par Google et leurs affirmations pour juger, sans pouvoir tester pour le moment. LUMIERE propose de la vidéo générée par texte, de l’image transformée en vidéo, de la stylisation, l’animation de portions d’images, et le remplacement localisé dans une vidéo d’une partie des éléments : par exemple changer la robe d’une actrice… La grande nouveauté apportée par Google LUMIERE serait la consistance temporelle des vidéos générées, grande lacune des générateurs proposés jusqu’à maintenant.
Magnific AI : outil de « détail » de très haut niveau…
Magnific AI ne permet pas seulement d’agrandir la résolution / le détail d’une photo, mais d’en accroître et inventer des détails… avec de nombreux réglages pour doser les variations inventives.
Le seul hic est son coût : à partir de 39 USD par mois… à partir ! 🙁
VEA : amélioration audio automatique par IA…
Lancement de notre première formation IA et graphisme, initiation aux outils génératifs.
Créée et animée par Mihai Grecu, Nanda Fernandez et James Verhille, cette formation de 5 jours est une initiation aux outils de création de l’image assistée par l’IA (intelligence artificielle) : génération d’images pour le graphisme, storyboards, moodboards, design, avec Midjourney, Photoshop et de nombreuses applications IA en ligne spécifiques.
Vous êtes arrivé.e.s à la fin de ce dossier IA, c’est-à-dire au début (chronologiquement) de notre chronique !
Si vous n’avez pas tout compris, essayez nos deux articles explicatifs sur les IA génératives :
- IA et graphisme, quelles évolutions ? Midjourney, Stable Diffusion, Dall-E, Adobe…
- IA et vidéo : quelles (r)évolutions ? Sora, Lumiere, Pika, Runway Gen-2…