Detonei o RTX 4090 por 8 horas direto treinando Stable Diffusion para pintar igual meu tio Hermann

0
24


Uma de nossas peças favoritas deste ano, publicada originalmente em 27 de outubro de 2022.

Eu tenho brincado muito com a ferramenta de arte AI, Stable Diffusion, desde o Automatic1111 versão da interface do usuário da web (abre em nova aba) lançado pela primeira vez. Eu não sou muito de linha de comando tipo de cara, então ter uma interface mouseable simples é muito mais na minha rua. E é um brinquedo divertido para um homem sem um osso artístico visual em seu corpo. Imaginei o guia do mochileiro da galáxia, uma pintura de Monet de Boris Johnson sentado no vaso sanitário no meio de um lago e Donald Trump lendo meu amado PC Format.

Mas nada me afetou tanto quanto martelar o Nvidia RTX 4090 (abre em nova aba) por oito horas e meia seguidas, treinando-o para pintar como meu tio-avô Hermann.

Você não saberá o nome Hermann Kahn. Eu também ficaria incrivelmente surpreso se você o reconhecesse pelo nome pelo qual ele era realmente mais conhecido, Aharon Kahana (abre em nova aba). Honestamente, eu também não o conhecia; infelizmente ele morreu bem antes de eu nascer.

Mas ouvi tantas histórias, tanta conversa sobre o tio Hermann tanto de minha mãe quanto de minha falecida avó quando cresci, que sinto que o conheço. Pelo menos parte dele de qualquer maneira.

O estilo de arte de Kahana é distinto e uma característica distinta da minha infância.

O vínculo familiar é forte, ainda mais desde que viajei para Tel Aviv pouco antes do nascimento de meu filho de três anos. Foi para onde minha avó, Inge, e minha bisavó, Rosa Kahn, fugiram de uma Alemanha pré-Kristallnacht em meados dos anos 30. E o lugar onde Hermann Khan se estabeleceu depois de conhecer sua esposa enquanto estudava arte em Berlim.

Caminhei pelas ruas que eles percorreram, passei pelo apartamento em que minha avó cresceu, percorri a estrada para Haifa que Rosa tomava todas as manhãs para trabalhar e visitei a casa de Hermann em Ramat Gan.

A casa que ele dividia com sua esposa, Mideh, tornou-se um museu para sua arte e, embora estivesse fechada quando a visitei, e claramente já estava há algum tempo, aparentemente reabriu e está hospedando exposições novamente.

O estilo de arte de Kahana é distinto e uma característica distinta da minha infância. Eu estava cercado por suas cerâmicas e pinturas de estilo antigo e tardio nas casas de meus pais e avós. Mesmo quando criança, eu era atraído por eles. Há um vaso em particular que eu nunca poderia não veja como a nave estelar Enterprise, graças à sua seção de disco tipo Trek.

Uma imagem geométrica totalmente abstrata do que sempre presumi ser um casal apaixonado adornava nossa chaminé, uma imagem dos telhados parisienses e uma cena de praia tempestuosa em tinta a óleo espessa subia nossas escadas.

Mas, inevitavelmente, esse pintor e ceramista alemão-israelense do início do século 20 não foi incluído como um dos artistas listados pela Stable Diffusion. E embora eu tenha experimentado instruções detalhadas, mexido com gráficos X/Y para tentar encontrar alavancas para puxar para obter uma aproximação das pinturas abstratas que ele produziu, nunca cheguei lá.

O arquivo de ponto de verificação Stable Diffusion simplesmente não tem os pontos de referência necessários. Mas existem maneiras de incentivar a IA a entender imagens diferentes e relacionadas e criar a partir delas especificamente. Eles são chamados de incorporações e as pessoas os usam para treinar a ferramenta para reconhecer seus próprios rostos. Dessa forma, você pode se incluir em todas as fantasias selvagens e peludas pintadas por IA que você poderia desejar.

Mas eu queria treiná-lo para reconhecer e entender – da melhor maneira possível uma IA relativamente simples – a arte de Aharon Kahana. É uma ferramenta surpreendentemente poderosa, especialmente considerando as ressalvas na explicação das incorporações de que “o recurso é muito bruto, use por sua conta e risco”. Graças à versão mais recente do aplicativo de interface do usuário da web no Github, no entanto, tudo pode ser feito por meio de um navegador.

Você precisará do Stable Diffusion e, portanto, do Python, já instalado e em execução em sua máquina, mas você pode reunir uma pasta de imagens com um nome específico e ele destruirá sua GPU para 100% de carga e 50% de sua CPU, por horas para criar pontos de referência que o Stable Diffusion pode usar quando solicitado com o nome exato da incorporação.

Eu queria treiná-lo para reconhecer e entender – da melhor maneira possível uma IA relativamente simples – a arte de Aharon Kahana.

Parece relativamente simples, mas certamente exigiu algumas tentativas e erros da minha parte. Não menos depois de perceber que uma vez que baixei cerca de 70 imagens do trabalho do meu tio-avô, de vários sites de leilões ao redor do mundo, eu realmente tive que rotulá-las com algo vagamente detalhado para que o treinamento tivesse algum impacto.

Isso levou muito tempo para descobrir a mídia e os assuntos de cada uma das peças que baixei e, em seguida, renomear cada arquivo manualmente. E quando você está trabalhando com imagens às vezes seriamente abstratas, isso nem sempre é tão fácil.

Em seguida, apontei o RTX 4090 e meu Core i9 10900K para a pasta relevante, criei o invólucro de incorporação e o deixei trabalhando por mais de oito horas e meia para chegar a um acordo com o que eu o alimentei. Todos os 16.432 núcleos e uma boa parte dos 24 GB de memória da nova placa Nvidia, bem como metade do meu Core i9 de 10ª geração, foram empregados nessa tarefa.

Não vou fingir ser inteligente o suficiente para realmente entender o que eu havia feito com a GPU de consumo mais poderosa do mundo, mas quando verifiquei com ela durante a noite, pude ver que ela estava pegando as imagens de entrada e fazendo suas próprias aproximações.

Era como um ensinamento do além-túmulo, como se meu PC tivesse passado a noite aprendendo com Hermann, rabiscando em alguma homenagem ao seu estilo para tentar descobrir como fazê-lo sem a ajuda do artista.

Pela manhã, a incorporação foi concluída e eu poderia inicializar a interface do usuário da web novamente – agora listada com uma incorporação de inversão textual – e afixar o texto ‘by aharon_kahana’ ao final de qualquer prompt e ver o que a IA havia aprendido durante a noite.

E foi notável. Meu computador criava homenagem após homenagem ao meu tio-avô, mais fascinante ainda quando fazia imagens de coisas que Kahana nunca acertaria. Sou um novato absoluto quando se trata da arte mística do prompt, mas mesmo meus pedidos básicos entregaram imagens que evocaram a memória do artista.

Onde faltava a alma pura e a compreensão do que estava realmente fazendo, compensava com uma estranha criatividade digital e esforço apoiado por GPU. Certamente, tudo estava reconhecível e inextricavelmente ligado ao seu estilo de arte.

Eu sei que muitos artistas modernos estão protestando contra o desenvolvimento da arte da IA, frustrados com o excesso de fotos de mulheres fantasiosas criadas por pessoas sem talento artístico – junto com as ditas fantasias peludas – e não pretendo saber exatamente como Aharon Kahana teria sentido, mas não posso deixar de sentir que ele teria abraçado esta nova ferramenta.

E é isso que é, uma ferramenta. Por mais que eu tenha ficado impressionado com o quão perto o Stable Diffusion chegou de recriar seu estilo de arte, isso é tudo o que ele realmente pode fazer: recriar. Não vai realmente evoluir o estilo por conta própria; ainda será necessário um artista humano para levar a arte adiante. E ainda precisa de informações humanas detalhadas para fornecer um assunto suficiente para construir.

Em vez de algo que substituirá os artistas, é apenas outra ferramenta – como as SLRs de alta resolução e o Photoshop se tornaram para os pintores de paisagens – que se encaixará no arsenal de artistas interessados ​​em levar a tecnologia a lugares novos e interessantes.

A arte da IA, em seu nível atual, parece um ponto de partida, e não algo capaz de realmente criar o produto acabado. Mas isso provavelmente não vai me impedir de encher meu PC com um milhão de imagens coloridas e infinitamente abstratas. Tudo inspirado por parte da minha família que nunca conheci, mas ainda espero abraçar.



Fonte deste Artigo

DEIXE UMA RESPOSTA

Please enter your comment!
Please enter your name here