O Google acaba de lançar uma inteligência artificial (IA) capaz de gerar qualquer imagem a partir de um texto. O sistema pode misturar diversos estilos, seja pinturas a óleo, fotografias e renderizações CGI.
O novo serviço da gigante da internet, chamado Imagen, é pioneiro no campo de criação por conta da qualidade em que o produto é exibido. Até o lançamento da novidade, quem liderava este mercado era o DALL-E, um programa do laboratório OpenAI.
Contudo, é necessário ressaltar que o serviço não foi disponibilizado para o público e que as imagens criadas a partir da inteligência artificial não saem sempre perfeitas. Imagens geradas por alguns modelos de texto podem aparecer inacabadas ou borradas, problemas habituais da tecnologia que também foram encontrados no concorrente DALL-E.
Limitação do produto
Além de gerar figuras imperfeitas, o produto de imagens a partir de IA também não foi lançado ao público devido os problemas legais que ele pode gerar. Embora a maior parte das pessoas utilize a criatividade para o bem, é possível que alguns apliquem o sistema na criação de notícias falsas, por exemplo. O próprio Google aponta que a ferramenta pode codificar preconceitos sociais, isso porque ele analisa grandes quantidades de dados e eles se baseiam em padrões para aprender e replicar.
O programa “codifica vários preconceitos e estereótipos sociais, incluindo um viés geral para gerar imagens de pessoas com tons de pele mais claros e uma tendência para imagens retratando diferentes profissões para se alinhar com os estereótipos de gênero ocidentais”.
Este problema também pode ser encontrado no DALL-E, por exemplo, um dos motivos que não permitiu que a ferramenta fosse disponibilizada ao público. Mas ambas empresas apontam a utilização de filtros que tentam impedir a criação de imagens racistas, violentas e pornográficas.
IA no celular
Com a mescla de realidade virtual em diversas ferramentas – como no app Art & Culture que exibe animais em 3D – o Google trouxe, no ano passado, uma configuração para adicionar direcionamentos no mapa, em tempo real, enquanto o usuário consulta o celular.
O recurso foi atualizado para incluir imagens imersivas, de dentro de restaurantes e hotéis, por exemplo, e de apoio ao usuário na hora de fazer as visitas. A ideia é quase como ter um guia particular, podendo consultar visualmente ambientes abertos e fechados na hora de decidir para onde viajar.