DALL-E 3 podría llevar la generación de imágenes de IA al siguiente nivel | ENBLE
DALL-E 3 impulsa la generación de imágenes de IA | ENBLE

OpenAI podría estar preparando la próxima versión de su generador de texto a imagen de inteligencia artificial DALL-E con una serie de pruebas alfa que ahora se han filtrado al público, según el Decoder.
Un filtrador anónimo en Discord compartió detalles sobre su experiencia, al tener acceso al próximo modelo de imagen de OpenAI que se conoce como DALL-E 3. Apareció por primera vez en mayo, contando en el canal de Discord basado en intereses que formaba parte de una prueba alfa para OpenAI, probando un nuevo modelo de imagen de IA. Compartió las imágenes que generó en ese momento.
La versión de prueba alfa de mayo tenía la capacidad de generar imágenes de múltiples relaciones de aspecto dentro del modelo de imagen. El YouTuber MattVidPro AI luego mostró varias de las imágenes generadas en una relación de aspecto de 16:9. Esta versión también mostró la destreza del modelo para la producción de texto de alta calidad, lo cual sigue siendo un punto problemático para modelos rivales, incluso para generadores principales como Stable Diffusion y Midjourney.
Algunos ejemplos mostraron imágenes como texto fusionado en una pared de ladrillos, un letrero de neón con palabras, un letrero de cartel en una ciudad, una decoración de pastel y un nombre grabado en una montaña. El modelo sostiene que DALL-E es bueno para generar personas. Una de esas imágenes mostraba a una mujer comiendo espaguetis en una fiesta desde un punto de vista de ojo de pez.
El filtrador regresó al canal de Discord a mediados de julio con más detalles y nuevas imágenes. Afirmó ser parte de una versión de prueba “alfa cerrada” que incluía aproximadamente 400 temas. Agregó que fue invitado a la prueba por correo electrónico y también participó en las pruebas de los originales DALL-E y DALL-E 2. Esto llevó a la conclusión de que la prueba alfa podría ser para DALL-E 3, aunque no se ha confirmado.
- Facebook ahora bloquea noticias en Canadá y Google puede seguir qué...
- Para entender los costos de SaaS, debes saber qué implica
- Oferta de regreso a clases Mac Mini con M2 se ha estrellado por men...
El modelo ha sido actualizado considerablemente entre mayo y julio. El filtrador ha demostrado esto compartiendo imágenes generadas basadas en el mismo estímulo, mostrando lo poderoso que se ha vuelto DALL-E 3 con el tiempo. El estímulo dice que es una pintura de un bufón rosa chocando las manos con un panda mientras compiten en una carrera de ciclismo. Las bicicletas están hechas de queso y el suelo está muy embarrado. Conducen en un bosque neblinoso. El panda está enfadado.
La versión alfa de mayo muestra la escena general que aborda la mayoría de los puntos del estímulo. Hay una ligera distorsión en las manos que se conectan y las ruedas de las bicicletas son amarillas en lugar de estar hechas de queso. Sin embargo, la versión alfa de julio es mucho más detallada, con el bufón rosa y el panda chocando las manos claramente y las ruedas de las bicicletas hechas de queso en varias generaciones.
Mientras tanto, en Midjourney, falta el bufón en la escena y los pandas están en motocicletas en lugar de bicicletas. Hay carreteras en lugar de barro. Los pandas están felices en lugar de enfadados.
Hay una serie de ejemplos de imágenes de la versión alfa de DALL-E 3 en julio que muestran el potencial del modelo. Sin embargo, con la prueba alfa sin censura, el filtrador señaló que también tiene el potencial de generar escenas de “violencia y desnudez o material con derechos de autor como logotipos de empresas”.
Algunos ejemplos incluyen una chica de anime sangrienta, un personaje de Juego de Tronos, una portada de Grand Theft Auto V, un Jesús zombi comiendo un sándwich de Subway, también sugiriendo sangre leve, y Shrek siendo desenterrado de una excavación arqueológica, entre otros.
MattVidPro AI señaló que el modelo de imagen genera imágenes como si estuvieran destinadas a un estilo específico.
DALL-E 2 se lanzó en abril de 2022, pero tuvo una fuerte regulación con una lista de espera debido a su popularidad y preocupaciones éticas y de seguridad. El generador de imágenes de IA se hizo accesible al público en septiembre de 2022.