Federação Nacional dos Trabalhadores em Tecnologia da Informação

Google lança IA capaz de transformar imagens em jogos

Google lança IA capaz de transformar imagens em jogos

Modelo cria jogos 2D a partir de imagens e textos, com cenário editável em tempo real. Tecnologia segue restrita ao uso interno, sem data para liberação ao público

Jogos – O Google DeepMind apresentou nesta terça-feira (5/8) a terceira versão do Genie, uma inteligência artificial voltada para a criação de jogos. O sistema é capaz de transformar uma imagem ou um simples trecho de texto em um jogo 2D interativo.

Desenvolvido com foco em criadores de conteúdo digital, o Genie 3 permite gerar ambientes virtuais de forma dinâmica e intuitiva, mesmo sem conhecimentos técnicos profundos.

LEIA: Decreto atualiza estratégia nacional de cibersegurança com novas prioridades

Apesar disso, o DeepMind ainda considera a IA uma ferramenta de pesquisa, aproveitando os jogos como uma plataforma para testar os limites da tecnologia. O modelo, por enquanto, permanece indisponível para o público.

O que o novo modelo oferece?

O Genie 3 representa um avanço em relação à versão anterior, lançada sete meses atrás. Em comparação com o Genie 2, o novo sistema traz gráficos mais refinados, interações contínuas e uma memória visual aprimorada.

Enquanto a versão anterior esquecia elementos que saíam de cena após dez segundos, o Genie 3 consegue manter a coerência visual por vários minutos — embora o DeepMind não tenha divulgado a duração exata desse período.

A simulação gerada roda em resolução de 720p, a 24 quadros por segundo, e pode ser explorada com comandos de teclado. A tecnologia também permite a realização de “eventos programáveis”, como modificar o cenário em tempo real, inserir novos objetos, alterar o clima ou incluir personagens adicionais.

Outro destaque é a utilidade do sistema no treinamento de agentes de IA em ambientes virtuais, ajudando a contornar a limitação de dados do mundo real — um desafio cada vez mais relevante com a evolução dos modelos de linguagem.

Pesquisa em IA é o foco principal

Segundo o Google DeepMind, o principal objetivo do Genie 3 é auxiliar na pesquisa em inteligência artificial, especialmente no desenvolvimento de “agentes incorporados” que podem ser testados em ambientes digitais.

A ferramenta também pode beneficiar artistas e designers, que ganham uma nova forma de visualizar aspectos como a movimentação dos personagens e a ambientação do jogo antes da produção final.

Apesar do potencial, parte da indústria de games ainda observa com desconfiança o uso de IA nesse contexto. Conforme apontado pela Ars Technica, especialistas da área questionam a viabilidade da aplicação prática da ferramenta no desenvolvimento profissional de jogos.

Por gerar cenários quadro a quadro, o Genie 3 funciona como um laboratório para ajustar o comportamento e a capacidade de resposta desses agentes diante de diferentes situações — uma etapa considerada essencial na corrida pela inteligência artificial geral (IAG).

Obstáculos técnicos ainda estão presentes

Embora traga melhorias significativas, o Genie 3 ainda enfrenta desafios técnicos. A resolução de 720p e a taxa de 24 FPS são modestas diante dos padrões atuais de qualidade gráfica. A nova capacidade de manter memória visual por mais tempo é um avanço, mas os pesquisadores reconhecem que experiências mais complexas exigiriam estabilidade por horas, não apenas minutos.

O modelo também apresenta limitações comuns em IAs generativas, como “alucinações” e distorções visuais. Entre os problemas identificados estão movimentos incorretos, como personagens andando ao contrário, e textos confusos exibidos nos cenários — a menos que sejam programados previamente.

Em termos de interação, os agentes de IA atualmente apenas se deslocam nos ambientes gerados, sem capacidade de alterar o cenário de forma autônoma. Além disso, a interação entre múltiplos agentes ainda está em fase de testes, segundo o DeepMind.

Por ora, o acesso ao Genie 3 continua restrito a pesquisadores internos, sem previsão de lançamento público, embora haja expectativa de ampliação futura.

(Com informações de TecnoBlog)
(Foto: Reprodução/Freepik/user20395405)

Compartilhe:

Outras publicações