O Whisk, novo gerador de imagens com inteligência artificial (IA) do Google, agora pode ser acessado por usuários brasileiros. A ferramenta utiliza IA generativa para criar imagens a partir da mistura de imagens já existentes, sem a necessidade de prompts de texto. A plataforma foi lançada em dezembro do ano passado (2024), mas estava disponível somente nos Estados Unidos. Recentemente, dois meses após a primeira apresentação ao público, o Whisk foi liberado em mais 100 países e chega ao Brasil.

O que é o Whisk?

O Whisk é uma ferramenta para geração de imagens com IA generativa que permite adicionar imagens de referência para criar uma totalmente nova. O diferencial do serviço em comparação aos geradores de imagens já lançados está justamente nesse processo inicial para a criação de imagens. De acordo com a apresentação da plataforma feita pelo Google, o objetivo é proporcionar um processo criativo mais dinâmico, ao invés de “gerar imagens com prompts de texto longos e detalhados”.

A tecnologia possibilita que o usuário insira até três imagens para inspirar a sua nova criação, sendo cada uma delas uma forma de referência: uma para o assunto ou o personagem principal, uma para o ambiente que será o cenário e uma para determinar o estilo artístico que o conteúdo deve ter. Então, a inteligência artificial do Google combina essas imagens para formar uma ilustração exclusiva, porém ainda dentro do conceito proposto.

Como funciona o Whisk?

O Whisk funciona por meio das capacidades multimodais do modelo Gemini e do Imagen 3. Segundo o Google, ao inserir as imagens, o Gemini automaticamente analisa os arquivos e produz descrições em texto detalhadas deles. Essas informações alimentam os prompts que serão usados no Imagen 3, o modelo de geração de imagens mais recente da empresa. Para refinar os resultados, o usuário pode adicionar prompts em texto para descrever com mais detalhes como deseja a imagem.

Como utilizar o Whisk?

O Whisk é uma ferramenta experimental do Google Labs, o setor de experimentação de produtos com inteligência artificial do Google. Portanto, para utilizar a novidade, é necessário acessar o site oficial e fazer um login no Google Labs com uma conta Google. Vale lembrar que além do Whisk, o Google Labs também disponibiliza outras ferramentas com modelos de inteligências artificial, como o NotebookLM.

Na tela inicial do Whisk, a própria plataforma disponibiliza uma demonstração para testar a inteligência artificial. Para fazer uma criação nova, clique em “Começar do zero”. Nesta etapa, é possível adicionar as imagens em “Assunto”, “Ambiente” e “Estilo”, arrastando o arquivo ou fazendo upload. Entretanto, não é obrigatório preencher todos esses tópicos. Apesar do foco em imagens, a ferramenta oferece um espaço para descrições em texto.

O Whisk também permite inserir mais de uma imagem em cada uma das seções (“Assunto”, “Ambiente” e “Estilo”); utilizar imagens sugeridas pela IA para produzir as montagens e adicionar mais detalhes em texto sobre como quer que seja a imagem. Depois, basta clicar na seta para gerar a ilustração. O programa fornece pelo menos duas opções diferentes que ainda podem ser refinadas ou baixadas diretamente através do botão de download.

Fonte: Google