La edición de fotos a través de la app de Gemini ha experimentado un avance significativo con la introducción de un nuevo modelo nativo. A partir de ahora, Google permite transformar imágenes, ya sean propias o de personas cercanas, adaptándolas a nuevos escenarios y posibilidades de manera rápida y con resultados sorprendentes.
El modelo, denominado Gemini 2.5 Flash Image, está disponible desde hoy en diversas plataformas. La manera más accesible de utilizarlo es a través de la app de Gemini, aunque también puede ser utilizado mediante herramientas para desarrolladores como Vertex, Google AI Studio y la API de Gemini.
Una de las características más destacadas del nuevo editor de fotos de Gemini es su capacidad para transformar a los usuarios en lo que siempre han querido ser, respetando su apariencia sin grandes distorsiones. Esto implica que se puede tomar una selfie y solicitar a través de un prompt de texto que se ubique en un escenario diferente, que se imagine realizando otra actividad, o incluso que se aplique un look de otra época, manteniendo los rasgos faciales intactos.
Para probar la herramienta, se tomó una foto de frente y se pidió a Gemini que me transformara en un futbolista, logrando un resultado satisfactorio. Resulta impresionante cómo la inteligencia artificial ajusta la orientación del rostro para integrarlo en la nueva imagen, incluso respetando el formato de mis gafas, lo cual es un detalle relevante.
Gemini Flash 2.5 Image: la nueva IA para editar fotos
El nuevo editor de fotos de Gemini no se limita a convertir a los usuarios en futbolistas, toreros o estrellas de sitcoms de los noventa. El modelo desarrollado por Google DeepMind también tiene la capacidad de combinar dos fotos diferentes para crear una nueva imagen que respete la apariencia de sus protagonistas.
En uno de los ejemplos compartidos por la compañía, se muestra cómo la IA puede unir a una joven y su mascota en una nueva escena sin distorsionar su apariencia. Además, la tecnología permite realizar ediciones en múltiples pasos, lo que significa que se pueden seguir aplicando modificaciones sobre la misma imagen sin necesidad de crearla de nuevo desde cero.
Es importante señalar que las capacidades de Gemini Flash 2.5 Image no se limitan a la edición de fotos de personas reales. También es posible realizar otros tipos de ediciones, como cambiar el color de las paredes de una habitación vacía o añadir muebles y otros elementos para componer el entorno. Asimismo, se pueden mezclar diferentes diseños existentes para crear imágenes realistas, como adaptar el patrón estético de las alas de una mariposa en un vestido.
La nueva IA de Google se ha convertido en el modelo de edición de imágenes mejor calificado del mundo, superando a flux-1, GPT-Image y Qwen, entre otros modelos.
Sin embargo, la nueva funcionalidad de Gemini ha generado algunas preocupaciones, ya que permite editar fotos de personas reales, lo que podría facilitar la creación de deepfakes. Desde Google, han asegurado a TechCrunch que se han implementado salvaguardias para prevenir abusos. En el anuncio oficial, la empresa enfatiza que la modificación de fotos debe ser de usuarios o de individuos que “conozcan bien”. Se espera ver cómo se desarrollará esta situación en el futuro.
Fuente original: ver aquí