A OpenAI apresentou o ChatGPT Images 2.0, uma evolução significativa de sua ferramenta integrada de geração de imagens. Enquanto versões anteriores apostavam sobretudo na novidade da síntese visual, esta atualização mira precisão técnica e lógica estrutural. A empresa descreve a mudança como um "salto qualitativo", voltado especificamente para resolver o atrito histórico entre as instruções do usuário e o resultado visual produzido. Ao integrar capacidades de raciocínio — que permitem ao sistema pesquisar na web e verificar o próprio trabalho —, a OpenAI tenta transformar o gerador de imagens de brinquedo criativo em instrumento profissional confiável.
Um dos focos centrais da atualização é a destreza linguística do modelo. Historicamente, geradores de imagens por IA têm dificuldade com as nuances estruturais de texto, produzindo caracteres distorcidos ou scripts ilegíveis. O Images 2.0 apresenta melhora expressiva na renderização de textos densos e, principalmente, de alfabetos não latinos. A OpenAI afirma ter obtido avanços significativos no tratamento de japonês, coreano, chinês, hindi e bengali — o que sugere um movimento em direção a uma ferramenta de design mais globalizada, capaz de respeitar a sintaxe visual específica de diferentes culturas.
Além da tipografia, o modelo oferece maior consciência espacial e flexibilidade técnica. Agora suporta proporções extremas de 3:1 a 1:3 e produz resoluções de até 2K. Para designers e desenvolvedores, o valor está na consistência: o modelo é supostamente mais eficaz em posicionar objetos em uma cena e manter suas relações espaciais. Esses refinamentos tornam a ferramenta cada vez mais viável para fluxos de trabalho técnicos como storyboarding e prototipagem de jogos, nos quais lógica visual e coesão são tão essenciais quanto a imagem em si.
Com reportagem de Engadget.
Source · Engadget



