Dall-e y el sistema de imágenes de OpenAI mejora radicalmente en ChatGPT 4o

Sin duda, grandes noticias que saltan a la vista una vez que comienzas a generar imágenes y experimentar…

|

Lectura:

2–3 minutos

Todo el mundo estaba de acuerdo en que OpenAI había avanzado mucho en muchos aspectos, pero que el desarrollo de generación de imágenes se había quedado estancado. Esto era cierto hasta hoy, que por fin se ha anunciado que el nuevo modelo de creación de imágenes está ya disponible para el modelo ChatGPT 4o.

Sin duda, grandes noticias que saltan a la vista una vez que comienzas a generar imágenes y experimentar con el nuevo sistema. La mejora es evidente. “La generación de imágenes GPT‑4o destaca por la precisión en la representación de texto, el seguimiento preciso de indicaciones y el aprovechamiento de la base de conocimientos y el contexto del chat de 4o, lo que incluye la transformación de imágenes cargadas o su uso como inspiración visual”, asegura OpenAI en su comunicado.

La generación de texto en las imágenes puede suponer un antes y un después para algunos trabajos creativos. Además, el nuevo sistema, al estar integrado en ChatGPT 4o, admite refinamiento de las imágenes mediante lenguaje natural.

Más mejoras, según el comunicado de OpenAI: “La generación de imágenes de GPT‑4o sigue instrucciones detalladas con atención al detalle. Mientras que otros sistemas tienen dificultades con entre 5 y 8 objetos, GPT‑4o puede gestionar hasta 10-20 objetos diferentes”.

El sistema también cuenta con limitaciones y en el capítulo de seguridad, todas las imágenes generadas incluyen metadatos C2PA⁠, que identifican la imagen como proveniente de GPT‑4o para mayor transparencia. Y en cuanto a contenido se ha trabajado en no posibilitar la creación de deepfakes sexuales y violencia.

La nueva generación de imágenes de ChatGPT en GPT‑4o se implementa a partir de hoy para los usuarios de Plus, Pro, Team y Free como generador de imágenes predeterminado. Próximamente, estará disponible para Enterprise y Edu. Para quienes aprecian DALL·E, aún pueden acceder a él a través de un GPT dedicado a DALL·E”, concluye el comunicado de openAI.

Crear y personalizar imágenes es tan sencillo como chatear con GPT‑4o: simplemente describe lo que necesitas, incluyendo detalles como la relación de aspecto, los colores exactos mediante códigos hexadecimales o un fondo transparente. Dado que este modelo crea imágenes más detalladas, las imágenes tardan más en renderizarse, a menudo hasta un minuto”, asegura.

Probamos el nuevo sistema de imágenes de ChatGPT 4º

Comprobar la mejora es muy sencillo, salta a la vista la mejora incluso con los prompts más sencillos. Usando este sencillo prompt obtenemos una imagen muy adecuada y realista: “foto muy realista de una mujer mirando el reflejo de su cara en un río de aguas cristalinas”.

Por otro lado, hemos podido comprobar cómo se puede refinar una imagen fácilmente incorporando texto y subiendo otra como inspiración.

La creatividad también fluye con prompts sencillos como “foto ultrarrealista de un coche cuyas ruedas son naranjas (fruta)” que se puede ver como foto de apertura de esta noticia. E incluso puedes saber cómo hubiera sido un Espartano de la antigua Grecia si hubiera vivido en el lejano oeste.

ENCUESTA CMS MAG: ¿Estás contento con tu actual gestor de contenidos web (CMS)?

🔥Lo más popular ahora:

Últimas noticias

Jorge Mediavilla en AInnovación 2025