- Combina os recursos avançados do Nano Banana Pro com a velocidade do Gemini Flash, possibilitando geração de imagens em alta velocidade e iterações de edição
- Oferece recursos de nível profissional em alta velocidade, como renderização baseada em conhecimento de mundo, representação e tradução precisas de texto, manutenção da consistência do tema e suporte a resolução 4K
- Aplicado em todo o ecossistema de apps do Google: app Gemini, Busca, AI Studio e Gemini API, Flow, Google Ads etc.
- Combina SynthID e credenciais de conteúdo C2PA para reforçar os recursos de identificação e verificação da origem de conteúdo gerado por IA
- O Google está evoluindo, com o Nano Banana 2, na direção de elevar ao mesmo tempo a confiabilidade e a utilidade da mídia generativa
Visão geral do Nano Banana 2
- O Nano Banana 2 (Gemini 3.1 Flash Image), anunciado pelo Google DeepMind, é um modelo que combina os recursos avançados do Nano Banana Pro com a velocidade do Gemini Flash
- O modelo anterior, Nano Banana, ganhou atenção por redefinir a forma de geração e edição de imagens, enquanto o Nano Banana Pro ofereceu controles de nível de estúdio
- Esta versão integra as vantagens dos dois modelos para entregar ao mesmo tempo geração de imagens de alta qualidade e alta velocidade de processamento
- O Nano Banana 2 se destaca por conhecimento de mundo avançado, renderização precisa de texto, consistência de tema e suporte a especificações de produção
Inteligência e qualidade visual na velocidade do Flash
- O Nano Banana 2 aplica a inteligência de alta velocidade do Gemini Flash à geração visual para dar suporte a edições rápidas e trabalho iterativo
- Conhecimento de mundo avançado: usa informações em tempo real do Gemini e dados baseados em imagens da web para representar temas específicos com mais precisão
- Com isso, é possível gerar infográficos, diagramas e visualizações de dados
- Com o recurso de renderização e tradução precisas de texto, é possível gerar texto nítido em mockups de marketing ou criação de cartões, além de traduzir e localizar texto dentro de imagens
Recursos aprimorados de controle criativo
- O Nano Banana 2 reduz a diferença entre velocidade e fidelidade visual para gerar rapidamente imagens realistas e de alta qualidade
- Consistência de tema: mantém até 5 personagens e 14 objetos de forma consistente dentro do mesmo fluxo de trabalho
- Execução precisa de instruções: reflete com fidelidade nuances detalhadas de solicitações complexas
- Especificações para produção: oferece suporte de 512 px a 4K e a várias proporções, atendendo de posts sociais a fundos widescreen
- Upgrade de fidelidade visual: entrega texturas, iluminação e detalhamento mais ricos
Integração com produtos e acessibilidade
- O Nano Banana 2 está sendo implementado gradualmente em todo o Google
- App Gemini: o Nano Banana 2 vem embarcado por padrão nos modelos Fast, Thinking e Pro, e assinantes Pro e Ultra também podem manter o modelo Pro
- Busca (Search): disponível em dispositivos móveis e desktop via modo IA e Lens, com suporte adicional em 141 países e 8 idiomas
- AI Studio e Gemini API: oferecido em versão preview, também disponível no Vertex AI
- Flow: definido como o modelo base de geração de imagens oferecido gratuitamente a todos os usuários
- Google Ads: aplicado ao recurso de sugestão de imagens na criação de campanhas publicitárias
Reforço de verificação de origem e confiabilidade
- Para aumentar a confiabilidade da mídia generativa, o Google combina SynthID e C2PA Content Credentials
- Essa combinação fornece não só se a IA foi usada, mas também informações de contexto sobre como ela foi usada
- O recurso de verificação do SynthID já foi usado mais de 20 milhões de vezes desde o lançamento, sendo aplicado à identificação de imagens, vídeos e áudios gerados por IA
- Em breve, o app Gemini também deve receber recurso de verificação C2PA
Resumo
- O Nano Banana 2 é o mais recente modelo de geração de imagens do Google, reunindo velocidade, precisão e qualidade
- Integrado a todo o ecossistema Gemini, oferece uso imediato para desenvolvedores, designers e profissionais de marketing
- É um exemplo da evolução estratégica do Google ao buscar ao mesmo tempo transparência em conteúdo de IA e maior produtividade criativa
1 comentários
Comentários do Hacker News
Fiz algumas previsões sobre o impacto que as ferramentas de geração de imagens por IA terão na arte
À medida que a tecnologia evoluir, até o próprio “gosto” pode acabar sendo resolvido tecnicamente. Hoje dizem que IA “não é cool”, mas isso pode ser apenas uma questão do estágio atual de desenvolvimento
Como no caso da SpaceX, usar metas ainda não alcançadas para desmerecer o todo é uma crítica equivocada
Em vez disso, acho que “design emergente (emergent design)” será a próxima tendência. Por exemplo, a Czinger mostra uma abordagem que encontra formas por meio de otimização probabilística
Por exemplo, mesmo que a Sora faça um vídeo de futebol perfeito, os fãs ainda vão assistir a uma partida de verdade. A razão de apreciarmos arte é a conexão emocional de saber que foi feita por humanos
Por isso, eu gostaria de perguntar a quem diz que “arte por IA é legal” — “então, para que serve a arte?”
Já vi muitos trabalhos incríveis feitos por artistas reais com IA, e estou curioso para ver que tipo de experimentos criativos vão surgir com essa ferramenta
Estou construindo uma casa agora, e o modelo de imagem do Nano Banana mudou completamente o jogo no processo de projeto
Fiz centenas de renderizações até encontrar um design de que gostei, e incorporei isso ao projeto da designer de interiores
É difícil expressar curvas ou elementos decorativos no CAD, mas o Nano Banana cria muito bem designs orgânicos
No fim, a casa está ficando muito mais bonita
Dá para ver exemplos neste blog
Tirando algumas ideias originais propostas pelo designer, o Gemini foi melhor na maior parte
Ainda me impressiona poder trocar cores, móveis e disposição em questão de segundos
Hoje em dia as imagens de IA estão tão realistas que muita gente comum as confunde com fotos reais
Por exemplo, fotos de comida no Facebook ou imagens de modelos falsos.
A expressividade melhorou, mas ao mesmo tempo isso também traz um lado perturbador
Em alguns casos é óbvio, mas na maioria é impossível distinguir
Agora qualquer um pode criar imagens falsas, e as pessoas acabam aprendendo naturalmente a verificar fontes e julgar confiabilidade
No longo prazo, as imagens vão se tornar commodities e perder valor emocional
Antes, uma foto era algo precioso; agora é só uma entre milhares.
Com a arte por IA acontece o mesmo: quando há demais, o impacto emocional diminui
Eu fotografo casamentos, e nos últimos 2 anos os pedidos por fotografia em filme aumentaram muito.
A popularidade de discos de vinil ou de câmeras digitais antigas vai na mesma linha
A expressão de “cubismo” em um dos exemplos do novo modelo foi um tanto decepcionante
O núcleo do cubismo era reunir vários pontos de vista, tempos e estilos em uma única imagem,
mas a IA só está imitando uma divisão geométrica. Ainda passa a sensação de que ela copia apenas a “forma”, e não o “significado”
Antes ela criava prédios aleatórios, mas agora busca e usa materiais reais como referência
Dá para ver mais detalhes na página do DeepMind Gemini Image Flash
Se existisse uma IA assim no passado, talvez obras como a Mona Lisa ou o teto da Capela Sistina nem existissem
Daria para produzi-las mais barato por prompt
A IA é uma ferramenta que elevará ainda mais esses limites
Quanto mais a tecnologia avança, mais a “escassez” desaparece, e o valor real vai se concentrar em sistemas de controle
Os mestres do passado são lembrados graças aos seus patronos, mas os criadores de hoje estão sendo soterrados pela necessidade de sobreviver
Como disse Terence McKenna, o futuro vai seguir em uma direção cada vez mais estranha e contraditória
Veja este link
Por exemplo, ela consegue fazer “uma imagem de Jesus fincando uma bandeira na Lua”, mas “uma imagem de jacquesm fincando uma bandeira na Lua” sai toda errada
Testei os resultados do
gemini-3.1-flash-image-preview(NB 2) no GenAI ShowdownA melhoria de NB → NB Pro foi grande, mas de NB Pro → NB 2 não houve grande avanço
Em especial, a qualidade da edição localizada (localization) piorou
Veja a comparação detalhada neste link
Usei o NB Pro 2 rapidamente, e ele parece mais uma melhoria incremental do que um salto funcional
Mesmo assim, foi impressionante ele ter passado no “King Louie jump rope test”
Os resultados do teste podem ser vistos nesta página
Para edição de fotos pessoais, a restrição de detecção de celebridades ainda é forte demais
Quase qualquer pessoa é reconhecida como “parecida com celebridade”, o que impede a edição
Do ponto de vista de engenharia, é uma tecnologia impressionante, mas fico em dúvida se existe uma justificativa de uso legítima do ponto de vista de negócios
Parece que, na maioria dos casos, usam isso porque “não querem pagar artistas”
Quando grandes empresas distribuírem conteúdo em larga escala, o impacto pode até ser negativo
Esse tipo de eficiência pode perfeitamente ser aplicado a pequenos negócios