Cargando...

Inteligencia artificial

Así ha evolucionado la IA de texto a imagen Midjourney en solo un año

Midjourney Inc. lanzó la beta de la primera versión en marzo de 2022, doce meses después se encuentra en la quinta

Así ha evolucionado la IA de texto a imagen Midjourney en solo un año. Phil Desforges.Midjourney.

Cuando se habla de la carrera por la IA no se trata solamente de la velocidad con la que las compañías están adoptando la tecnología y llevándola a los usuarios, sino también de lo rápidamente que estas herramientas evolucionan y mejoran sus capacidades. Las imágenes que generaba la primera versión de DALL-E a partir de una descripción de texto, con rostros a menudo irreconocibles, parecen de un pasado lejano cuando se compara con lo que ofrece actualmente, pero era solamente en enero de 2021.

Desde entonces, la competencia entre los modelos de lenguaje texto a imagen ha aumentado y los que más destacan, junto al de OpenAI, son Stable Diffusion y Midjourney. Este último, que ha alcanzado este mes su quinta versión transcurridos solo doce meses desde su lanzamiento, es el mejor ejemplo de la rápida evolución de las capacidades de estos sistemas de inteligencia artificial.

Al igual que los ejemplos anteriores, Midjourney es una inteligencia artificial generativa que ha sido entrenada con enormes bases de datos con todo tipo de imágenes. Con esta información y ayudada por la precisión que el usuario aporte en su prompt genera grupos de imágenes a partir de la descripción introducida. A continuación, el usuario elige la que más le gusta para obtener una versión a mayor resolución.

Las continúas actualizaciones que está realizando Midjourney Inc. sobre su inteligencia artificial generativa la han hecho evolucionar a un ritmo vertiginoso, como algunos de sus usuarios han documentado en medios sociales.

La herramienta permaneció en beta cerrada desde marzo de 2022 hasta julio, fecha en la que con su versión 3 pasó a una beta abierta a la que cualquier usuario puede acceder. El pasado noviembre llegó la versión 4 y este marzo la 5 que permite generar imágenes con una resolución que duplica a la de la v4, con detalles más precisos, una representación más realista de objetos cotidianos y permite prompts más complejos por parte del usuario.

Midjourney V1 vs V5.Midjourney.

Visto el camino recorrido en solo un año, es difícil imaginar donde estaremos en otros doce meses con esta y otras herramientas generativas. Lo único seguro es que, en un mundo que se guía por la imagen, el impacto va a hacerse notar.