Às vezes, Lizzie Wilson apresenta-se numa rave com o seu companheiro de IA.
Numa noite de semana, em fevereiro passado, ela ligou o seu portátil a um projetor que lançou a imagem do ecrã na parede de um loft com tecto baixo no leste de Londres. Uma pequena plateia acomodou-se sob a luz ténue e rosada. Wilson sentou-se e começou a programar.
Cliques e zumbidos de techno ecoavam pelas colunas do local. A audiência assistia, a abanar a cabeça, enquanto Wilson digitava códigos linha a linha no ecrã projetado, ajustando sons, repetindo batidas, fazendo caretas a cada erro.
Wilson é uma “live coder”. Em vez de usar software específico como a maioria dos produtores de música eletrónica, cria música escrevendo um código para a gerar ao vivo. É uma arte performativa improvisada conhecida como algorave.
“É meio aborrecido quando vais ver um concerto e alguém está só sentado no portátil”, diz ela. “Podes aproveitar a música, mas falta um aspeto performativo. Com a codificação ao vivo, toda a gente pode ver o que estou a escrever. E quando o meu portátil trava, as pessoas realmente gostam disso. Começam a aplaudir.”
Assumir riscos faz parte da vibe. Por isso, Wilson gosta de intensificar as suas atuações mais um nível, improvisando com o que ela chama de “agente de codificação ao vivo”, um modelo de IA generativa que cria os seus próprios beats e loops para adicionar à mistura. Muitas vezes, o modelo sugere combinações sonoras que Wilson não tinha pensado. “Tens esses elementos de surpresa,” diz ela. “Só precisas de ir com tudo.”
É uma visão que vai além da promessa das ferramentas gerativas existentes, criadas por empresas como a OpenAI e a Google DeepMind. Estas podem automatizar uma impressionante variedade de tarefas criativas e oferecer gratificação quase instantânea, mas a que custo? Alguns artistas e investigadores receiam que esta tecnologia possa transformar-nos em consumidores passivos de mais uma “sopa” de IA.
Por isso, estão à procura de maneiras de reinserir a criatividade humana no processo. O objetivo é desenvolver ferramentas de IA que potenciem a nossa criatividade em vez de a retirar, incentivando-nos a melhorar na composição musical, no desenvolvimento de jogos, no design de brinquedos, entre outros, e preparando o terreno para um futuro no qual humanos e máquinas criem coisas juntos.
No fundo, os modelos gerativos poderiam oferecer aos artistas e designers um meio totalmente novo, impulsionando-os a criar coisas que antes não poderiam ser feitas e concedendo superpoderes criativos a todos.
Explosão de criatividade
Não existe uma única forma de ser criativo, mas todos nós o fazemos. Criamos de tudo, desde memes até obras-primas, rabiscos e designs industriais. Há uma crença errada, geralmente entre adultos, de que a criatividade é algo que se perde com o tempo. Mas ser criativo, seja a cozinhar, a cantar no duche ou a criar TikToks super estranhos, é algo que a maioria de nós faz apenas por diversão. Não precisa de ser uma arte de alto nível ou uma ideia que mude o mundo (e, ainda assim, pode ser). Criatividade é um comportamento humano básico; deve ser celebrada e incentivada.
Quando modelos gerativos de texto para imagem como o Midjourney, o DALL·E da OpenAI e o popular Stable Diffusion de código aberto chegaram, causaram uma explosão do que parecia ser muito criativo. Milhões de pessoas passaram a ser capazes de criar imagens impressionantes de praticamente qualquer coisa, em qualquer estilo, com um clique. Modelos de texto para vídeo surgiram em seguida. Agora, startups como a Udio estão a desenvolver ferramentas semelhantes para música. Nunca antes os frutos da criação estiveram ao alcance de tantas pessoas.
Wilson, investigadora no Creative Computing Institute da University of the Arts London, é apenas uma das muitas pessoas que trabalham no que é conhecido como cocriatividade ou criatividade além do humano. A ideia é que a IA possa ser usada para inspirar ou criticar projectos criativos, ajudando as pessoas a fazer coisas que, sozinhas, não teriam feito. Ela e os seus colegas criaram o agente de codificação ao vivo para explorar como a inteligência artificial pode ser usada para apoiar os esforços artísticos humanos — no caso de Wilson, a improvisação musical.
Mas para vários investigadores e artistas, o entusiasmo em torno destas ferramentas distorceu a ideia do que é realmente a criatividade. “Se eu pedir à IA para criar algo por mim, isso não é ser criativo”, diz Jeba Rezwana, que trabalha com cocriatividade na Towson University, em Maryland. “É uma interacção única: clicas, ela gera algo e pronto. Não podes dizer ‘gosto desta parte, mas talvez mudasse algo aqui’. Não há um diálogo contínuo.”
Rezwana refere-se à forma como a maioria dos modelos generativos está configurada. Pode-se dar feedback às ferramentas e pedir que tentem novamente. Mas cada novo resultado é gerado do zero, o que pode dificultar a obtenção exacta do que se pretende. Como disse o cineasta Walter Woodman no ano passado, depois de o seu colectivo artístico Shy Kids ter feito uma curta-metragem com o modelo de texto-para-vídeo da OpenAI pela primeira vez: “o Sora é como uma máquina de jogos: nunca sabes o que vais receber de volta.”
Além disso, as versões mais recentes de algumas destas ferramentas gerativas nem sequer utilizam o prompt enviado tal como está para produzir uma imagem ou vídeo (pelo menos não nas configurações padrão). Antes de um prompt ser enviado para o modelo, o software edita-o, frequentemente adicionando dezenas de palavras ocultas, para tornar mais provável que a imagem gerada pareça mais bem-acabada.
“São adicionadas coisas extra para melhorar o resultado”, diz Mike Cook, investigador de criatividade computacional no King’s College London. “Tenta pedir ao Midjourney para te dar um desenho mal feito de algo. Ele não consegue fazer isso.” Estas ferramentas não te dão o que queres; dão-te o que os seus criadores acham que tu queres.
Tudo isso está bem se só precisares de uma imagem rápida e não te importares muito com os detalhes, diz Nick Bryan-Kinns, também do Creative Computing Institute: “Talvez queiras fazer um cartão de Natal para a tua família ou um folheto para venda de bolos na tua comunidade. Essas ferramentas são ótimas para isso.”
Em resumo, os modelos gerativos existentes facilitaram a criação, mas não tornaram fácil ser criativo. E há uma grande diferença entre as duas coisas. Para Cook, confiar nessas ferramentas pode, de facto, prejudicar o desenvolvimento criativo das pessoas a longo prazo. “Embora muitos destes sistemas de IA criativa sejam promovidos como formas de tornar a criatividade mais acessível,” escreveu num artigo publicado no ano passado, “podem, na verdade, ter ‘efeitos adversos nos seus utilizadores, no que diz respeito a restringir a sua capacidade de inovar, idealizar e criar’.” Dado o quanto os modelos gerativos foram defendidos por colocarem habilidades criativas ao alcance de todos, a sugestão de que podem, de facto, fazer o oposto é devastadora.
Ele está longe de ser o único investigador preocupado com o impacto cognitivo destas tecnologias. Em fevereiro, uma equipa da Microsoft Research Cambridge publicou um relatório concluindo que as ferramentas de IA generativa “podem inibir o envolvimento crítico com o trabalho e potencialmente levar a uma dependência excessiva da ferramenta a longo prazo, diminuindo a capacidade para resolução independente de problemas.” Os investigadores descobriram que, com o uso de ferramentas gerativas, o esforço das pessoas “muda da execução de tarefas para a gestão de tarefas.”
Cook está preocupado porque as ferramentas gerativas não permitem que falhes, uma parte crucial da aprendizagem de novas competências. Temos o hábito de dizer que os artistas são talentosos, diz Cook. Mas a verdade é que os artistas trabalham a sua arte, desenvolvendo competências ao longo de meses e anos.
“Se realmente falares com artistas, eles dirão: ‘bem, melhorei a fazer isto repetidas vezes’,” diz ele. “Mas falhar é mau. E estamos sempre à procura de maneiras de evitar isso.”
Modelos gerativos permitem-nos evitar a frustração de fazer um trabalho menos conseguido.
“Infelizmente, estamos a remover a única coisa que precisas de fazer para desenvolveres competências criativas por ti próprio, que é falhar,” diz Cook. “Mas absolutamente ninguém quer ouvir isso.”
Surpreende-me
E, ainda assim, nem tudo é uma má notícia. Artistas e investigadores estão entusiasmados com as formas como as ferramentas gerativas podem capacitar os criadores, apontando-os para direções novas e surpreendentes e afastando-os de becos sem saída. Cook acredita que a verdadeira promessa da IA será ajudar-nos a melhorar no que queremos fazer, em vez de fazer isso por nós. Para isso, diz ele, precisaremos de criar novas ferramentas, diferentes das que temos agora. “Usar o Midjourney não faz nada por mim, não muda nada em mim,” afirma. “E acho que isso é uma oportunidade perdida.”
Pede a vários investigadores que estudam a criatividade para nomear uma parte fundamental do processo criativo e muitos dirão: reflexão. É difícil de definir com precisão, mas a reflexão é um tipo de pensamento focado e deliberado. É o que acontece quando surge uma nova ideia. Ou quando uma suposição que tinhas se revela errada e precisas repensar a tua abordagem. É o oposto de uma interação única.
Procurar formas de como a IA pode apoiar ou incentivar a reflexão, pedindo-lhe para lançar novas ideias ou desafiar ideias que já tens, é um fio condutor na investigação sobre cocriação. Se ferramentas gerativas como o DALL·E tornam o ato de criar algo sem esforço, a proposta aqui é justamente reinserir o desafio no processo. “Como podemos fazer arte sem resistência?”, pergunta Elisa Giaccardi, investigadora de design na Universidade Politécnica de Milão, em Itália. “Como nos envolver verdadeiramente num processo criativo sem que o material nos imponha alguma reação?”
Veja-se o caso do agente de live coding de Wilson. Ela afirma que a ferramenta impulsiona a sua improvisação musical em direções que talvez não seguiria sozinha. Treinado com trechos de código públicos, partilhados pela comunidade de live coding, o modelo sugere comandos mais próximos do estilo de outras pessoas do que do dela. Isso aumenta a hipótese de surgirem resultados inesperados. “Não porque não conseguirias criar aquilo por tua conta,” explica. “Mas, pelo modo como o cérebro humano funciona, temos a tendência de recorrer sempre às mesmas ideias.”
No ano passado, Wilson participou num estudo conduzido por Bryan-Kinns e seus colegas, no qual investigaram seis músicos experientes enquanto usavam uma variedade de modelos gerativos para os ajudar a compor um musical. Os investigadores queriam ter uma ideia de que tipos de interações com a tecnologia eram úteis e quais não eram.
Os participantes disseram que gostaram quando os modelos faziam sugestões surpreendentes, mesmo quando estas eram resultado de falhas ou erros. Às vezes, os resultados eram melhores. Às vezes, o processo parecia novo e empolgante. Mas algumas pessoas tiveram dificuldade em abdicar do controlo. Era difícil direcionar os modelos para produzir resultados específicos ou repetir aqueles de que os músicos gostavam. “De certa forma, é o mesmo que estar numa banda,” diz Bryan-Kinns. “Precisas de ter esse sentido de risco e surpresa, mas não queres que seja totalmente aleatório.”
Designs alternativos
Cook aborda o inesperado por outra perspetiva: extrai ideias surpreendentes de ferramentas de IA que desenvolveu para cocriar videojogos. Uma delas, chamada Puck, lançada pela primeira vez em 2022, gera propostas de design para jogos simples de combinar formas, como Candy Crush ou Bejeweled. Muitas das criações do Puck são experimentais e desajeitadas. Não esperes que ele produza algo que realmente queiras jogar. Mas essa não é a intenção: Cook usa o Puck e uma ferramenta mais recente chamada Pixie para explorar que tipo de interação as pessoas podem desejar ter com uma ferramenta de cocriação.
O Pixie é capaz de ler o código de um jogo e modificar linhas específicas para gerar designs alternativos. Não faz muito tempo, Cook estava a trabalhar numa cópia de um jogo popular chamado Disc Room, em que os jogadores precisam de atravessar uma sala cheia de lâminas giratórias.
Ele pediu ao Pixie para o ajudar a criar um design de nível que fosse igualmente difícil tanto para jogadores habilidosos como para iniciantes. O Pixie projetou uma sala onde nenhum dos discos realmente se movia. Cook ri: não era o que ele esperava. “Basicamente, transformou a sala num campo minado,” diz ele. “Mas achei realmente interessante. Eu não tinha pensado nisso antes.”
Questionar suposições ou ser desafiado faz parte do processo criativo, afirma Anne Arzberger, investigadora da Universidade de Tecnologia de Delft, na Holanda. “Quando penso nas pessoas com quem tive as melhores colaborações, não foram aquelas que apenas diziam ‘sim, ótimo’ a cada ideia que eu propunha,” diz ela. “Foram pessoas realmente críticas, com ideias opostas às minhas.”
Ela quer construir uma tecnologia que forneça uma base de apoio semelhante. Como parte de um projeto chamado Creating Monsters, Arzberger desenvolveu duas ferramentas experimentais de IA que ajudam designers a encontrar preconceitos ocultos nos seus projetos. “Eu estava interessada em maneiras de usar essa tecnologia para aceder a informações que, de outra forma, seriam difíceis de obter,” diz ela.
Para o projeto, ela e os seus colegas analisaram o problema de projetar figuras de brinquedos que fossem neutras em relação ao género. Ela e os seus colegas (incluindo Giaccardi) usaram o Teachable Machine, uma aplicação web criada pelos investigadores do Google em 2017, que facilita o treino do teu próprio modelo de aprendizagem automática para classificar diferentes entradas, como imagens. Treinaram esse modelo com algumas dezenas de imagens que Arzberger havia rotulado como masculinas, femininas ou neutras em termos de género.
Arzberger pediu depois ao modelo que identificasse os géneros de novos designs de brinquedos. Descobriu que vários deles eram classificados como femininos, mesmo quando tinha tentado torná-los neutros em relação ao género. Sentiu que as suas visões de mundo, e os seus próprios preconceitos inconscientes, estavam a ser expostos. Mas a ferramenta muitas vezes estava certa: desafiava as suas suposições e ajudava a equipa a aprimorar os projetos. Segundo Arzberger, essa mesma abordagem pode ser usada para avaliar todo o tipo de característica de design.
Arzberger usou então um segundo modelo, uma versão de uma ferramenta criada pela startup de imagens e vídeos gerativos Runway, para criar os seus próprios designs de brinquedos neutros em relação ao género. Primeiro, os investigadores treinaram o modelo para gerar e classificar designs de brinquedos com aparência masculina e feminina. Depois, puderam pedir à ferramenta para encontrar um design que estivesse exatamente no meio dos designs masculino e feminino que o modelo tinha aprendido.
Os modelos gerativos podem fornecer feedback sobre designs que os designers humanos poderiam não perceber sozinhos, diz ela: “Nós realmente podemos aprender algo.”
Tomar o controle
A história da tecnologia está cheia de avanços que mudaram a forma como a arte é feita, desde receitas para novas cores vibrantes de tinta até à fotografia e sintetizadores. Na década de 1960, o investigador da Stanford John Chowning passou anos a trabalhar num algoritmo esotérico que podia manipular as frequências dos sons gerados por computador. Stanford licenciou a tecnologia à Yamaha, que a incorporou nos seus sintetizadores — incluindo o DX7, o som novo e estiloso por detrás dos êxitos dos anos 1980 como “The Best”, de Tina Turner, “Take On Me”, do A-ha, e “When Doves Cry”, de Prince.
Bryan-Kinns interessa-se profundamente por como artistas e designers encontram maneiras de usar novas tecnologias. “Se conversares com artistas, a maioria deles nem fala destes modelos generativos de IA como uma ferramenta, falam como se fosse um material artístico, como tinta ou algo do género”, afirma. “É uma forma diferente de pensar sobre o que a IA está a fazer.” Ele destaca como algumas pessoas estão a forçar a tecnologia a realizar coisas estranhas, para as quais ela não foi originalmente projetada. Segundo ele, artistas costumam apropriar-se ou até fazer usos não convencionais dessas ferramentas.
Bryan-Kinns aponta o trabalho de Terence Broad, outro colega seu no Creative Computing Institute, como um exemplo favorito. Broad usa técnicas como o “network bending”, que envolve a inserção de novas camadas numa rede neural para produzir efeitos visuais glitch em imagens geradas, e a geração de imagens com um modelo treinado sem dados, o que resulta em manchas abstratas de cor, quase como pinturas de Rothko.
Mas Broad é um caso extremo. Bryan-Kinns resume a questão da seguinte forma:
“O problema é que existe um abismo entre, de um lado, as ferramentas generativas muito comerciais, que produzem resultados de altíssima qualidade, mas sobre as quais tens pouquíssimo controlo, e do outro, ferramentas que oferecem controlo total sobre o que estão a fazer, mas cujo uso é bem mais complexo, porque é preciso ser alguém confortável em lidar com a parte técnica do computador.”
“Isso é um número pequeno de pessoas,” diz ele. “É um número muito pequeno de artistas.”
Arzberger admite que trabalhar com os seus modelos não foi simples. Executá-los levou várias horas, e ela não tem a certeza se a ferramenta Runway que usou ainda está disponível. Bryan-Kinns, Arzberger, Cook e outros querem pegar nos tipos de interações criativas que estão a descobrir e incorporá-las em ferramentas que possam ser usadas por pessoas que não são programadores avançados.
Encontrar o equilíbrio certo entre surpresa e controlo será difícil. O Midjourney pode surpreender, mas oferece poucas alavancas para controlar o que produz além do teu prompt. Alguns afirmam que escrever prompts é, em si, um ato criativo. “Mas ninguém luta com um pincel da forma como luta com um prompt,” diz Cook.
Perante essa luta, Cook às vezes observa os seus alunos aceitarem os primeiros resultados que uma ferramenta generativa lhes dá. “Estou realmente interessado nesta ideia de que estamos a preparar-nos para aceitar que o que sai de um modelo é exatamente o que pediste,” diz ele. Está a projetar um experimento que vai variar palavras e frases em prompts semelhantes para testar quanta desconexão as pessoas percebem entre o que esperam e o que recebem.
Mas ainda estamos no início. Entretanto, as empresas que desenvolvem modelos generativos normalmente enfatizam os resultados em vez do processo. “Há um progresso algorítmico impressionante, mas muitas vezes o design da interação é negligenciado,” diz Rezwana.
Para Wilson, a escolha crucial em qualquer relação cocriativa é o que fazes com o que recebes. “Estás a ter esta relação com o computador que estás a tentar mediar,” ela diz. “Às vezes corre mal, e isso faz parte do processo criativo.”
Quando a IA te dá limões, faz arte. “Não seria divertido ter algo completamente antagonista numa performance, como algo que está ativamente contra ti e tu meio que tens uma discussão?” questiona ela. “Seria, no mínimo, interessante de assistir.”