Sistemas de Inteligência Artificial como DALL-E ou Midjourney podem realizar tarefas criativas?
Estamos testemunhando uma grande mudança no processo de geração de imagens.
O recente influxo e crescimento do aprendizado automático e da inteligência artificial levanta questões sobre a maneira como os processos criativos evoluem e se desenvolvem por meio da tecnologia.
Sistemas como DALL-E, DALL-E 2 e Midjourney são programas de IA (inteligência artificial) treinados para gerar imagens a partir de descrições de texto usando um conjunto de dados de texto-imagem.
O conjunto diversificado de recursos inclui a criação de versões antropomorfizadas de animais e objetos, combinando conceitos não relacionados de maneiras plausíveis e transformando imagens existentes.
DALL-E e sistemas similares são capazes de criar imagens plausíveis para uma grande variedade de frases que exploram a estrutura composicional da linguagem.
O DALL-E tem alguns recursos semelhantes aos usados no processo de renderização 3D, mas a diferença está na natureza dos comandos iniciais.
Para a renderização 3D, o comando inicial deve ser especificado em detalhes completos, enquanto DALL-E geralmente é capaz de “preencher os espaços em branco”.
Ele também pode controlar independentemente os atributos de um pequeno número de objetos.

Um dos recursos mais interessantes é a capacidade de combinar conceitos não relacionados e isso pode ter implicações para os campos da arquitetura e do design.
Os modelos generativos de IA incentivam os arquitetos e designers a explorar um maior número de possibilidades a partir de uma nova perspectiva, pois diminuem o tempo entre a intenção e a execução.
Eles oferecem uma maneira acessível de brincar com dados e gerar variações criativas para as soluções dos problemas.
Alguns pesquisadores estão chamando isso de “serendipidade artificial”, sistemas que maximizam a oportunidade de serendipidade, abrindo o leque das capacidades criativas para além dos métodos clássicos.
Os arquitetos já estão experimentando essas ferramentas para explorar questões complexas como o planejamento urbano e as possibilidades dos espaços existentes.
Outros estão combinando palavras-chave arquitetônicas com clichês de design contemporâneo, referências à cultura pop e vários estilos de arte para projetar edifícios ou simplesmente explorar a natureza das tendências de design e tecnologia.

Embora esses modelos tenham limitações, o campo está evoluindo em um ritmo sem precedentes.
Recentemente, a Apple lançou Gaudi, um “arquiteto neural” que leva esse processo um passo adiante, criando cenas 3D a partir de comandos de texto como “suba as escadas” ou “passe pelo corredor”.
É difícil prever onde essas tecnologias nos levarão, mas seu impacto já pode ser sentido.
Nos campos da arquitetura e do design, elas podem ser entendidas como ferramentas poderosas para explorar, otimizar e testar ideias criativas muito rapidamente.

expresso.arq sobre artigo de Maria-Cristina Florian | Traduzido porCamilla Ghisleni


