Google lanza Imagen 3, el modelo de texto a imagen de alta calidad para usuarios de Gemini

2024/10/12

A principios de este año, Google presentó Imagen 3, su modelo de generación de texto a imagen más avanzado hasta la fecha. Esta versión actualizada aporta numerosas mejoras en la calidad y precisión de la imagen. Según Google, Imagen 3 logra un nivel de detalle excepcional, creando imágenes fotorrealistas que presentan artefactos mínimos que distraigan en comparación con su predecesor, Imagen 2.

Recientemente, Google puso el modelo Imagen 3 a disposición de todos los usuarios de Gemini en todo el mundo. Con este lanzamiento, tanto los usuarios estándar de Gemini como los de Gemini Advanced pueden describir las imágenes que desean generar y Gemini producirá la imagen correspondiente a través de IA. Sin embargo, tenga en cuenta que solo aquellos con acceso a Gemini Advanced pueden generar imágenes que representen figuras humanas.

Si la imagen generada no cumple con sus expectativas, puede refinarla proporcionando detalles adicionales en su solicitud. Cuanto más precisa sea con las especificaciones de la imagen, más precisos serán los resultados que Gemini le entregará. El modelo Imagen 3 mejorado muestra una mayor comprensión del lenguaje natural y la intención subyacente detrás de las indicaciones, incluso capturando detalles matizados de descripciones extensas.

Otro aspecto en el que Imagen 3 destaca es en la representación de texto, un aspecto que ha planteado desafíos para muchos modelos de generación de imágenes contemporáneos. Esta función permite a los usuarios producir felicitaciones de cumpleaños personalizadas, marcar lugares con carteles y otras solicitudes personalizadas.

Explora las capacidades del modelo Imagen 3 en Gemini aquí .

Fuente

Deja una respuesta Cancelar la respuesta