DEV Community

Karina Kato
Karina Kato

Posted on

Imagens Geradas por Inteligência Artificial

É impressionante o poder que a tecnologia atingiu!

Essas imagens a seguir são geradas por inteligência artificial. Dado um texto com a descrição, ela gera automaticamente a imagem. 🤖

Imagem gerada por IA - Midjourney

O entendimento do texto não é uma tarefa fácil. Já pensou que quando você descreve algo pode ser difícil entender como as palavras se relacionam e o que elas significam? 📖

A parte de geração de imagens é outra tarefa extremamente complexa. Nós mesmos podemos ter dificuldades de pensar em como uma descrição se tornaria uma imagem. 🤔

Há algumas redes neurais generativas de imagem que estão fazendo bastante sucesso hoje e talvez seja interessante você conhecê-las para entender a que nível a tecnologia já evoluiu. Dentre as mais famosas estão Dall.e 2 criada pela Open AI e o Midjourney. Ambas tiveram resultados surpreendentes! 😱

Gerei as imagens a seguir usando o Midjourney. Um ponto interessante é que é possível passar parâmetros para configurar a imagem resultante gerada. Você não precisa entender de inteligência artificial para usar o produto.

Na primeira imagem gerei um robô fofo com óculos segurando o ícone do LinkedIn e fundo roxo. Perceba como foi uma descrição específica. Também tentei passar textos mais abstratos como “perseguindo sonhos” ou “o inverno está chegando”. Por fim, testei coisas um pouquinho mais difíceis de serem imaginadas como “um diamante arco-íris em formato de estrela” ou “um vitral de unicórnio “. 🦄

𝐂𝐨𝐦𝐩𝐚𝐫𝐚𝐭𝐢𝐯𝐨 𝐝𝐞 𝐢𝐦𝐚𝐠𝐞𝐧𝐬 𝐠𝐞𝐫𝐚𝐝𝐚𝐬 𝐩𝐨𝐫 𝐢𝐧𝐭𝐞𝐥𝐢𝐠ê𝐧𝐜𝐢𝐚 𝐚𝐫𝐭𝐢𝐟𝐢𝐜𝐢𝐚𝐥

Também trouxe um comparativo das imagens geradas pelo 𝐌𝐢𝐝𝐣𝐨𝐮𝐫𝐧𝐞𝐲 e 𝐃𝐀𝐋𝐋.𝐄 2. É interessante ver como os resultados gerados são diferentes e dependentes dos dados que foram alimentados durante o treino da rede.

Black and white shih tzu

Cutest fire pokemon

Stained glass unicorn

Cute robot

Rainbow diamond star shaped

Chasing dreams

Particularmente gostei muito das imagens criadas pelo Midjourney para temas mais abstratos com arte digital e paisagens. Também adorei o robô fofo de óculos segurando o ícone do LinkedIn com um fundo roxo.

Já no DALL.E 2, achei incrível o nível de detalhes que a rede neural consegue pegar a partir do texto. É possível passar frases bem complexas. O Shih Tzu branco e preto sorrindo com um chapéu vermelho em estilo de pintura a óleo é sensacional! Também amei o Pokémon de fogo mais fofo gerado. Senti que a rede capturou muito a essência do que é um Pokémon, pois parece uma mistura de um Plusle com a cauda de um Cyndaquil.

Quais resultados você gostou mais? 😉

┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄

Me acompanhe no LinkedIn se quiser receber mais posts sobre inteligência artificial, aprendizado de máquina, ciência de dados e carreira. https://www.linkedin.com/in/karinakato

Top comments (0)