NFT e artes criadas por Inteligência Artificial

Se você é um entusiasta de ativos digitais, investe em criptomoedas ou acompanha notícias de tecnologia, provavelmente já se deparou com um termo que está em alta: NFT, sigla em inglês para token não fungível (Non-Fungible Token).

Se antes esse era um assunto quase que exclusivo de comunidades de investimentos — e distante do público geral, portanto —, após vários famosos virarem notícia por terem investido milhões em artes digitais (como “imagens de macacos”), as pessoas começaram a querer entender mais sobre essa possível oportunidade no mercado.

NFT — Arte digital criada por mim usando apenas Inteligência Artificial (modelos de redes neurais VQGAN + CLIP). Na figura acima, cada quadrado representa uma etapa da iteração.

Pela sua natureza não fungível, cada NFT é um objeto único, tornando-o um objeto escasso, exclusivo e desejado por colecionadores. Assim como só há uma Mona Lisa no mundo, que está exposta no Museu do Louvre, só há um bem virtual exclusivo associado a cada NFT.

Ou seja, mesmo que alguém faça uma cópia digital de determinada arte online, apenas a original possuirá valor comercial (ou seja, pessoas querendo pagar por ela).

Neymar e NFTs — Neymar investiu um total de R$ 6 milhões em NFTs como essa — *Imagem: BAYC/Reuters.*

É indiscutível e amplamente conhecido que o mercado de NFTs é uma grande oportunidade para investidores e artistas. No entanto, existe uma outra categoria de profissionais que começou a se beneficiar do momento, com vários profissionais obtendo ganhos consideráveis: os cientistas de dados.

Então, diga-me o que você acha dessa oportunidade de usar suas habilidades em Data Science para gerar suas próprias AI Arts ou virar um AI Artist e vendê-las como NFT?

R$ 5 milhões em 5 semanas com artes digitais

No final de 2021, o mundo da Arte foi surpreendido com a trajetória relâmpago de um artista desconhecido. Em apenas 5 semanas, ele saiu do completo anonimato e atingiu a expressiva quantia de R$ 5 milhões em artes digitais vendidas.

Autointitulado “artista autônomo descentralizado” e inspirado pelas técnicas do pintor renascentista Leonardo da Vinci, Botto também possui um ritmo impressionante de produção. Com 350 novas obras por semana, o seu estilo artístico se mantém em constante evolução.

Com uma comunidade crescente de fãs, as aspirações de Botto são ambiciosas. Espera-se que, em um futuro não muito distante, ele também seja capaz de escrever livros e compor músicas. E, se isso está soando como humanamente impossível para você, eu quero lhe dizer que o seu julgamento não foi tão equivocado.

Botto não é um humano, mas um modelo de Deep Learning treinado por um cientista de dados.

Um algoritmo de IA capaz de criar artes completamente originais, com um ritmo de produção impressionante e que já vendeu mais de R$ 5 milhões em marketplaces de NFT.

Vamos dar uma olhada na arquitetura que permitiu essa oportunidade fantástica para os entusiastas, artistas e investidores do mercado de criptomoedas.

VQGAN + CLIP e GPT-3

O modelo utilizado por Botto para gerar artes é baseado nas combinações VQGAN, CLIP, GPT-3, entre outras técnicas customizadas para data augmentation. Esses modelos, aliás, estão entre as maiores redes neurais profundas disponibilizadas publicamente, com milhões de obras de artes analisadas.

Arquitetura baseada em VQGAN + CLIP para geração de artes.

Como esses modelos também foram treinados para reconhecer faces, animais, objetos, imagens, movimentos artísticos, poemas, ensaios, prosas, entre outros, eles fornecem um enorme espaço latente para que o cientista de dados trabalhe. Ou seja, a variação permite que não se fique restrito a uma única área de pesquisa.

O processo de criação de artes pelo artista digital Botto envolve, primeiramente, a criação de um prompt de escrita (por meio de um algoritmo) contendo sentenças completas ou palavras aleatórias.

Esse prompt é enviado para a arquitetura neural VQGAN (Vector Quantized Generative Adversarial Network), que combina redes neurais convolucionais com Transformadores, visando a uma imagem final em alta resolução.

Como é da natureza das Redes Adversárias Generativas (Generative Adversarial Networks – GAN), a VQGAN irá gerar muitas imagens semelhantes. Por esse motivo, é de bom grado inserir uma outra arquitetura para avaliar o quão adequado um prompt (ou legenda) está em relação a determinada arte gerada.

Avaliação e otimização baseada no algoritmo Gradiente Descent. Fonte: (FRANS, 2021)

É aí que a rede neural CLIP (Contrastive Language–Image Pre-training) entra no processo, dando notas para cada arte gerada pela VQGAN, em um processo baseado no algoritmo Gradient Descent a fim de otimizar a nota atribuída a cada iteração. Como está escrito no site da OpenAI, o objetivo da CLIP é conectar textos e imagens.

Ah, vale ressaltar também que as descrições usadas na criação são geradas pelo famoso GPT-3. De acordo com a documentação pública, são a única parte do processo em que há uma curadoria humana.

Por fim, o output gerado pelo modelo será redimensionado para 2048×2048 pixels por meio de uma técnica conhecida como neural upscaling. Ainda de acordo com a documentação do Botto, essa é a dimensão máxima que a combinação utilizada pode fornecer por meio de uma GPU e sem perder algumas características desejáveis.

Crie sua própria Arte NFT baseada em VQGAN + CLIP

Há algumas semanas comecei uma sequência de aulas para os alunos da Escola de Data Science (EDS) voltadas à geração de artes e mercado de NFT. Essa jornada (que está sendo uma das melhores que já fiz) irá possibilitar que meus alunos aprendam a usar uma arquitetura baseada em VQGAN + CLIP (a mesma do artista robô Botto).

Arte gerada usando VQGAN + CLIP — Arte que gerei usando VQGAN + CLIP e o *prompt* **“cientistas de dados programando em um mundo distópico”**.

A figura acima foi uma arte que eu gerei com essa combinação VQGAN + CLIP. Para você ter noção do poder dessas, após configuradas e treinadas, bastou informar o seguinte prompt de texto como argumento e executar o script.

“cientistas de dados programando em um mundo distópico”
Texto usado para gerar a minha AI Art

Apenas com recursos gratuitos de GPU (Google Colab), em 20 minutos é possível obter uma arte completamente original e em vários estilos possíveis. De traços pós-modernistas, como os de Van Gogh, a pixelarts, que o remeterão à nostalgia dos jogos do Nintendo (8 bits).

Aprenda AI Arts na Escola de Data Science

Abrangendo tanto a parte teórica (amparado pelas publicações científicas mais recentes) quanto a prática (Jupyter Notebooks disponibilizados no Google Colab), as aulas permitirão que os alunos não sejam meros executores de código, mas capazes de entender todas as etapas e as customizar de acordo com a sua necessidade.

Todos que me conhecem sabem que eu não consigo aceitar a ideia de ensinar apenas códigos e exemplos prontos. Como todo aluno que ainda carrega o ITA no sangue, eu gosto de trazer conceitos bem definidos, papers acadêmicos de journals relevantes e exemplos práticos do mundo real.

Assim, logo na primeira aula, eu compartilhei o mapa mental que construí durante minha pesquisa e as referências bibliográficas que deram origem aos modelos mais usados na indústria.

As etapas da Art Generation foram realizadas dentro do Google Colab — Todas as etapas da *Art Generation* foram realizadas dentro do Google Colab.

Obviamente, para se chegar no fantástico mundo novo das GAN, desenvolvi uma trilha completa a fim de fornecer o embasamento teórico e conceitos que as sustentam. Dentre os assuntos abordados ao se tornar aluno EDS, você irá ter acesso a mais de 150 horas de conteúdo, incluindo:

Aulas teóricas e projetos práticos de Deep Leaning e TensorFlow (disponível)
Curso completo de Visão Computacional com 6 projetos com OpenCV (disponível)
Curso de Estatística Descritiva para Iniciantes (disponível)
Autoencoders (disponível)
Neural Style Transfer (disponível)
Generative Adversarial Networks (disponível a partir de 19/JUNHO)

Assine a Escola de Data Science

Clique no link acima e aprenda técnicas para criar suas artes para o mercado de NFT.