Início Ciência e tecnologia Esta nova ferramenta de IA do Google permite gerar facilmente imagens de...

Esta nova ferramenta de IA do Google permite gerar facilmente imagens de outras fotos – sem necessidade de aviso

71
0

Google/ZDNET

Compor o prompt e a descrição corretos para criar uma imagem gerada por IA pode ser um desafio. Freqüentemente, a imagem resultante erra o alvo, forçando você a ajustar seu prompt repetidamente até obter o resultado correto. Agora, uma nova ferramenta do Google pretende simplificar o processo ao permitir criar uma imagem baseada em outras imagens.

Também: Os melhores geradores de imagens de IA

Inicialmente disponível nos EUA, o Whisk é o experimento mais recente do Google Labs, acessível gratuitamente a qualquer pessoa com uma conta do Google. É desenvolvido com Gemini AI do Google e oferece várias maneiras de criar uma imagem a partir de outras imagens.

Como usar o Whisk para criar imagens

Para começar, faça login em a página inicial do Whisk com sua conta do Google. Escolha um dos três modelos para gerar sua imagem. Você pode selecionar um adesivo, que cria uma imagem plana semelhante às encontradas em aplicativos de mensagens. Um alfinete esmaltado adiciona um pouco mais de profundidade à imagem, enquanto uma pelúcia resulta em uma imagem tridimensional.

Por padrão, o Whisk seleciona automaticamente uma imagem para o estilo com base no modelo que você escolher. Em seguida, escolha a imagem que deseja usar para o assunto. Você pode selecionar uma das imagens fornecidas na página ou fazer upload da sua própria. Gêmeos analisa as imagens quanto ao estilo e tema e depois as combina para gerar uma nova imagem. Se não gostar do resultado, você pode alterar a imagem do assunto e gerar um resultado diferente.

Além disso: testei 9 detectores de conteúdo de IA – e esses 2 identificaram corretamente o texto de IA todas as vezes

Embora esse processo pareça simples, você pode ser ainda mais criativo. Para ter mais controle, selecione a opção de começar do zero. Aqui, você pode escolher imagens para o assunto, cena e estilo, enviando suas próprias imagens ou escrevendo uma solicitação tradicional. Se não souber por onde começar, peça inspiração ao Whisk e ele gerará uma série de imagens para você.

Quando estiver pronto, diga ao Whisk para gerar uma nova imagem com base nas seleções combinadas. Em resposta, o Whisk exibe várias imagens com base na mixagem. Você pode refinar os resultados adicionando ou removendo imagens de origem ou editando o prompt.

Todas as imagens que você gera são salvas automaticamente em sua biblioteca Whisk. A partir daí, você pode excluir quaisquer imagens indesejadas e baixar as que desejar. Os downloads são salvos como arquivos JPG, permitindo que você os use com outros aplicativos e serviços.

A ferramenta Whisk AI do Google gera imagens baseadas em outras imagens
Captura de tela de Lance Whitney/ZDNET

Como o Google realiza esse tipo de geração de imagens?

Em vez de duplicar suas imagens de origem para criar novas, o Whisk extrai alguns elementos-chave.

“Nos bastidores, o modelo Gemini escreve automaticamente uma legenda detalhada de suas imagens. Em seguida, ele alimenta essas descrições no mais recente modelo de geração de imagens do Google, Imagen 3”, escreveu Thomas Iljic, diretor de gerenciamento de produtos do Google, em um comunicado. postagem no blog publicada segunda-feira. “Esse processo captura a essência do seu tema, não uma réplica exata. Dessa forma, você pode remixar facilmente seus temas, cenas e estilos de maneiras inovadoras.”

Além disso: 7 maneiras de escrever prompts ChatGPT melhores – e obter os resultados desejados com mais rapidez

Como resultado, as imagens geradas de uma pessoa podem ter altura, peso, penteado ou tom de pele diferentes do original. O Google também permite que você edite o prompt subjacente se quiser orientar os resultados em uma direção específica.

“Em nossos primeiros testes com artistas e criativos, as pessoas descreveram o Whisk como um novo tipo de ferramenta criativa – não um editor de imagens tradicional”, acrescentou Iljic. “Nós o construímos para uma exploração visual rápida, e não para edições perfeitas. Trata-se de explorar ideias de maneiras novas e criativas, permitindo que você trabalhe com dezenas de opções e baixe aquelas que você adora.”



Fonte