Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

La synthèse de contenu visuel qui répond aux besoins des utilisateurs nécessite souvent une contrôlabilité flexible et précise de la pose, de la forme, de l'expression et de la disposition des objets générés. Les approches existantes acquièrent la contrôlabilité des réseaux antagonistes génératifs (GAN) via des données d'entraînement annotées manuellement ou un modèle 3D préalable, qui manquent souvent de flexibilité, de précision et de généralité. Dans ce travail, nous étudions une manière puissante mais beaucoup moins explorée de contrôler les GAN, à savoir

Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

Introduction

Qu'est-ce que DragGAN?

DragGAN est un outil puissant pour la manipulation interactive basée sur les points sur le manège d'images génératives. Il permet aux utilisateurs de "tirer" n'importe quel point de l'image pour atteindre précisément des points cibles de manière interactive.

Comment fonctionne DragGAN?

DragGAN se compose de deux composants principaux : 1) une supervision du mouvement basée sur les caractéristiques qui guide le point de manipulation vers la position cible, et 2) une nouvelle approche de suivi des points qui exploite les caractéristiques du GAN discriminatif pour localiser en continu la position des points de manipulation.

Caractéristiques de DragGAN

  • Contrôle précis sur la destination des pixels, permettant de manipuler la pose, la forme, l'expression et la disposition de diverses catégories telles que les animaux, les voitures, les humains, les paysages, etc.
  • Capacité à déformer une image avec des sorties réalistes même pour des scénarios difficiles tels que la création de contenu occulté et la déformation de formes suivant de manière cohérente la rigidité de l'objet.
  • Peut être utilisé pour la manipulation d'images et le suivi de points.

Prix

L'article et le code sont disponibles gratuitement, et les images, textes et fichiers vidéo sur le site sont mis à disposition gratuitement pour une utilisation non commerciale sous la licence Creative Commons CC BY-NC 4.0.

Faites - Alternative

Pixyer AI Photo de Produit

Pixyer AI Photo de Produit - Générateur d'images de produits AI en ligne gratuit pour des solutions d'e-commerce.

4.7 K
Animer des vieilles photos

Animer des vieilles photos - Outil en ligne gratuit pour transformer vos photos anciennes en vidéos captivantes.

15.7 K
Analyse de la beauté faciale

Analyse de la beauté faciale - Améliorez votre beauté grâce à l'évaluation de l'attractivité faciale et aux outils d'évaluation.

1.3 K
Flux Image IA

Flux Image AI - Générateur d'images gratuit d'intelligence artificielle pour la création et la génération de visuels époustouflants.

3.9 K
Plus de Catégories