Arraste o seu GAN: Manipulação interativa baseada em pontos na manobra de imagens generativas

Sintetizar conteúdo visual que atenda às necessidades dos usuários frequentemente requer controle flexível e preciso da pose, forma, expressão e layout dos objetos gerados. Abordagens existentes ganham controle das redes adversariais generativas (GANs) por meio de dados de treinamento manualmente anotados ou de um modelo 3D prévio, que frequentemente carecem de flexibilidade, precisão e generalidade. Neste trabalho, estudamos uma maneira poderosa, porém muito menos explorada, de controlar GANs, ou seja,

Arraste o seu GAN: Manipulação interativa baseada em pontos na manobra de imagens generativas

紹介

O que é DragGAN?

DragGAN é uma ferramenta poderosa para manipulação interativa baseada em pontos na manopla de imagem generativa. Permite aos usuários "arrastar" quaisquer pontos da imagem para alcançar precisamente os pontos-alvo de maneira interativa.

Como o DragGAN funciona?

DragGAN consiste em dois componentes principais: 1) uma supervisão de movimento baseada em características que faz com que o ponto de controle se mova em direção à posição-alvo, e 2) uma nova abordagem de rastreamento de pontos que aproveita as características discriminativas do GAN para continuar localizando a posição dos pontos de controle.

Recursos do DragGAN

  • Controle preciso sobre para onde os pixels vão, manipulando assim a pose, forma, expressão e layout de diversas categorias, como animais, carros, humanos, paisagens, etc.
  • Capacidade de deformar uma imagem com saídas realistas mesmo em cenários desafiadores, como alucinar conteúdo oculto e deformar formas que seguem consistentemente a rigidez do objeto.
  • Pode ser usado para tarefas de manipulação de imagem e rastreamento de pontos.

Preço

O artigo e o código estão disponíveis gratuitamente, e as imagens, textos e arquivos de vídeo no site são disponibilizados gratuitamente para uso não comercial sob a licença Creative Commons CC BY-NC 4.0.

Arraste - 代替

Suite de Vídeo AI Premium para Negócios | AKOOL

AKOOL é uma plataforma revolucionária de IA Generativa para marketing visual personalizado e publicidade. Com o AKOOL, criadores e inovadores de marketing podem construir experiências personalizadas e envolventes que atraem as pessoas para dentro da marca de uma forma que as converte em clientes leais.

1.1 M
Pixelcut | Editor de Fotos AI Gratuito

Pixelcut é uma ferramenta de design online gratuita que facilita a criação de fotos de produtos, anúncios e muito mais para a sua loja online. Remova facilmente o fundo ou objetos das imagens.

11.8 M
NovelAI - O Contador de Histórias de AI

Contador de histórias alimentado por IA. Impulsionado pela IA, construa histórias únicas, contos emocionantes, romances sedutores ou apenas brinque. Tudo é válido!

3.2 M
Krea AI - Liberte Seu Potencial Criativo com o Gerador de Imagens em Tempo Real de Inteligência Artificial

Krea.ai: Liberte seu potencial criativo com a Krea, uma plataforma AI de design em tempo real que oferece um gerador de imagens gratuito de inteligência artificial para gerar e aprimorar facilmente imagens e vídeos.

6.2 M
もっとカテゴリー