AI News

Un moment charnière pour l'IA au cinéma : « Dear Upstairs Neighbors » de DeepMind fait ses débuts au Sundance

L'intersection entre l'intelligence artificielle et la réalisation cinématographique haut de gamme a atteint un jalon décisif cette semaine au Festival du film de Sundance 2026. Au milieu des montagnes enneigées de Park City, Google DeepMind a dévoilé Dear Upstairs Neighbors, un court métrage d'animation qui fait plus que raconter une histoire — il réécrit les règles sur la manière dont l'IA générative (Generative AI) peut être intégrée aux pipelines d'animation professionnels.

Présenté au "Story Forum" de la Sundance Institute, le film constitue un départ significatif par rapport aux démonstrations "text-to-video" qui ont dominé les gros titres tech ces deux dernières années. Plutôt que de s'appuyer sur des invites aléatoires, le projet a utilisé un flux de travail sophistiqué "video-to-video" propulsé par le modèle Veo de Google, permettant à une équipe d'animateurs chevronnés de conserver un contrôle de direction précis tout en tirant parti de l'IA pour le gros du travail de rendu et de stylisation.

Réalisé par la vétérane de Pixar Connie He (Inside Out 2, Watermelon: A Cautionary Tale) avec la conception de production de Yingzong Xin (Turning Red, Soul), le film sert de preuve de concept pour une approche centrée sur l'artiste. Il démontre que l'avenir des médias génératifs n'est pas de remplacer la créativité humaine, mais de construire des outils capables d'interpréter et d'amplifier les nuances de la performance humaine.

Redéfinir le pipeline d'animation

Pendant des décennies, l'industrie de l'animation s'est appuyée sur un pipeline intensif en main-d'œuvre où chaque image nécessite un rendu, un éclairage et un compositing manuels. Dear Upstairs Neighbors remet en question ce statu quo en introduisant un flux de travail hybride qui combine l'art narratif traditionnel avec les capacités génératives de Veo.

Le film suit Ada, une jeune femme privée de sommeil dont les voisins bruyants à l'étage la poussent dans une bataille surréaliste et hallucinée pour sa santé mentale. Pour donner vie à ce monde chaotique et pictural, l'équipe n'a pas simplement tapé des invites comme "fille en colère contre le plafond." Au lieu de cela, ils ont développé un nouveau flux de travail où les animateurs jouaient des scènes ou créaient de grosses animations approximatives dans des logiciels 3D standard. Ces "vidéos de référence" ont servi d'ossature structurelle pour l'IA.

Les chercheurs de DeepMind ont travaillé aux côtés de l'équipe créative pour affiner les modèles Veo et Imagen sur un jeu de données soigneusement sélectionné composé d'art conceptuel spécifique au film. Cela a permis de s'assurer que lorsque l'IA traitait l'animation brute, elle ne se contentait pas de deviner le style — elle appliquait les coups de pinceau exacts, les palettes de couleurs et la logique d'éclairage définis par le Production Designer Yingzong Xin.

Le résultat est un flux de travail qui comble le fossé entre la vitesse de génération et la précision de l'animation manuelle.

Comparaison : Flux de travail traditionnel vs. flux de travail hybride assisté par Veo

Workflow Stage Traditional 3D Animation Veo-Assisted Hybrid Workflow
Concept & Storyboard Manual sketching and iteration Manual sketching + AI style exploration
Blocking & Layout Rough 3D posing and camera work Rough 3D posing / Live-action reference
Rendering & Texturing Complex lighting/shader setup per frame AI Style Transfer via Fine-Tuned Veo
Iteration Speed Hours/Days per second of footage Minutes per iteration (near real-time)
Final Polish Compositing layers and VFX 4K Upscaling & Consistency refinement

La technologie derrière la magie : affinage pour la cohérence

Une des critiques les plus persistantes de la génération vidéo par IA a été l'"instabilité temporelle" — la tendance des personnages à scintiller, se déformer ou voir leur apparence changer d'une image à l'autre. Dear Upstairs Neighbors aborde ce problème de front grâce à un affinage rigoureux des modèles.

L'équipe de DeepMind a personnalisé le modèle Veo pour comprendre la géométrie spécifique et l'esthétique du personnage Ada. En entraînant le modèle sur un petit ensemble de haute qualité composé de "feuilles d'expressions" et d'art clés, l'IA a appris à traiter le personnage comme une entité 3D cohérente plutôt que comme une série d'images sans lien. Cela a permis aux animateurs de pousser les expressions du personnage vers des limites extrêmes et stylisées sans briser l'illusion de continuité.

De plus, l'équipe a utilisé un système de "dailies" similaire à la production traditionnelle. Si une prise générée par Veo n'était pas tout à fait correcte, il ne s'agissait pas de relancer une graine aléatoire. L'équipe a utilisé des outils de raffinement localisé, leur permettant de masquer des zones spécifiques de la vidéo — comme un geste de la main ou une expression faciale — et de demander des ajustements tout en gardant le reste de l'image verrouillé. Ce niveau de granularité sépare une démo technologique d'un outil prêt pour la production.

La sortie finale a ensuite été montée en 4K grâce aux capacités d'amélioration de Veo, garantissant que le film atteigne les normes visuelles élevées requises pour une première en salle au Sundance.

Renforcer l'artiste, pas le remplacer

La narration autour de l'IA à Hollywood a souvent été empreinte de peur — peur de la perte d'emplois et de l'érosion de l'artisanat humain. Toutefois, la production de Dear Upstairs Neighbors suggère une voie différente. Le film n'a pas été "réalisé par l'IA" dans le vide ; il a été réalisé par une équipe d'artistes humains qui ont utilisé l'IA pour exécuter leur vision plus efficacement.

« Nous aspirions à permettre aux artistes de l'animation de tirer parti du potentiel créatif de IA générative sans sacrifier le contrôle artistique face à son imprévisibilité inhérente, » a noté l'équipe de Google DeepMind dans un communiqué accompagnant la première.

En déplaçant le mécanisme d'entrée du texte (qui est abstrait et imprécis) vers la vidéo (qui capture le timing, l'espacement et le jeu), la technologie devient un traducteur plutôt qu'un auteur. L'animateur reste l'acteur derrière le masque numérique. Ce flux de travail permet à de plus petites équipes d'atteindre une qualité visuelle "blockbuster" qui exigerait autrement des centaines d'artistes de rendu et une ferme de calcul massive.

Les analystes de l'industrie présents au festival ont noté que ce changement pourrait démocratiser l'animation haut de gamme. Les créateurs indépendants, qui possèdent souvent les compétences narratives mais manquent du budget pour un rendu haute fidélité, pourraient utiliser des flux de travail similaires pour produire du contenu de qualité long-métrage.

L'avenir des outils créatifs

La technologie présentée dans Dear Upstairs Neighbors ne restera pas confinée. Google a annoncé que la montée en résolution 4K et les capacités video-to-video démontrées dans le film seront intégrées à Google AI Studio et Vertex AI plus tard ce mois-ci. Ce mouvement place des outils génératifs de qualité professionnelle directement entre les mains des studios et des développeurs.

À mesure que les lignes entre production et post-production s'estompent, le rôle de l'animateur évolue. Ils deviennent des "chefs d'orchestre" des systèmes génératifs, guidant l'IA pour accomplir le travail fastidieux de texturation et d'éclairage pendant qu'ils se concentrent sur l'âme de la performance — le timing, l'émotion et l'histoire.

Sundance a toujours été un festival qui défend les voix indépendantes et la narration expérimentale. Avec la première de Dear Upstairs Neighbors, il est aussi devenu la rampe de lancement d'une nouvelle ère du cinéma, où silicium et âme travaillent de concert pour créer des "peintures vivantes" qui bougent avec la grâce de l'intention humaine.

Vedettes