¿Conoces la nueva IA de Google?, si la respuesta es no continúa leyendo. Debido a que la tecnología está avanzando con pasos agigantados, la inteligencia artificial se ha convertido en uno de los programas más utilizados del mundo.
Si hace un par de años nos hubieran preguntado qué pensamos de la IA hubiésemos respondido que era un sueño casi imposible. No obstante, para el día de hoy ya contamos con robots médicos inteligentes, ayudantes de bancas y finanzas y un montón de programas irreales.
Ahora, para este 2022 Google nos ha traído lo mejor de lo último de esta tecnología: IMAGEN, la inteligencia artificial que permite crear imágenes irreales a partir de un texto.
- La historia de Google Chrome: El inicio de uno de los mejores navegadores del mundo
- La historia de Google: cómo nació la gigante de la tecnología
- Una breve historia de Google Play Store
Imagen: la IA de Google que debes conocer
Desde el primer momento en que se ingresa a la página oficial de la IA de Google, IMAGEN, el usuario no dejará de sorprenderse. A pesar de que se trata de una página un tanto oscura, debido a su fondo negro, una vez te encuentres bajando todo va cambiando.
Lo primero que se puede ver es una breve descripción de lo que es el proyecto en sí. Sin embargo, mientras continúas indagando puedes encontrar algunos ejemplos de sus creaciones, hermosas, increíbles, irreales y muy coloridas.
¿Qué es este programa?
IMAGEN es una inteligencia artificial capaz de crear una imagen a partir de un texto. Es decir, mientras se utilizan los logaritmos necesarios, puedes incluir un perro, gato e incluso persona en el lugar que desees.
Además, también puedes colocar prendas de vestir y otros objetos que en la vida real no tienen. Según sus creadores, IMAGEN es una aplicación capaz de mostrar “fotorrealismo sin precedentes por nivel profundo de comprensión del lenguaje”.
¿Cómo funciona?
A través de un gran codificador congelado T5-XXL el cual permite, como indica su nombre, codificar el texto de entrada en incrustaciones. En pocas palabras, IMAGEN ofrece un modelo de difusión condicional que mapea el texto incrustado en una imagen de tamaño 64×64.
Además, la IA utiliza diversos modelos de difusión de súper resolución condicional de texto para aumentar la muestra de la imagen 64 × 64 → 256 × 256 y 256 × 256 → 1024 × 1024.
Una inteligencia artificial más eficiente que otras
Ciertamente, IMAGEN se ha venido promocionando como la principal competencia de DALL-E 2, la IA reconocida por ser obra de Elon Musk. Aunque la aplicación también se basa en crear imágenes a partir de un texto, existen algunas diferencias que convierten a IMAGEN en una mejor opción. Por ejemplo:
- El nivel de detalles de las imágenes
- La eficiencia al crear la imagen
En su comunicado, Google ha asegurado que es su IA la que tiene mayor eficiencia entre todas las aplicaciones de esta índole. Además, para corroborar, los desarrolladores han creado un punto de referencia el cual lleva por nombre “DrawBench”.
El objetivo de este DrawBench es comparar la tecnología de la inteligencia artificial de Google con otros similares. Por ejemplo: VQ-GAN+CLIP, DALL-E 2 (antes mencionado) e incluso, Latent Diffusion Models.
En cuanto a los resultados, personas de diversos lugares del mundo pusieron su atención en imágenes de Imagen en comparación con el resto de los programas. Con la metodología de lado a lado, IMAGEN obtuvo una mayor puntuación en cuanto al realismo de la pintura. Además, los participantes también mencionaron que tiene:
- Una mejor calidad
- Una mejor alineación imagen-texto
En pocas palabras, se trata de una aplicación inteligente capaz de entender y detallar hasta la más mínima de las explicaciones. Rápida y eficiente, la IA de Google es la mejor.
Imagen: aún queda mucho por venir
A pesar de que IMAGEN ha demostrado ser una IA sumamente eficiente en su trabajo, los desarrolladores de Google han confirmado que aún le faltan mejoras. Por ejemplo, una de los principales miedos que tienen sus creadores es, que el público lo utilice para generar imágenes indebidas. Por esta razón:
- Es de código cerrado
- No está disponible a nivel global
Sin embargo, han predicho que en un futuro no tan lejano, IMAGEN será una de las inteligencias artificiales más utilizadas por todo el mundo. Por los momentos se encuentran trabajando en los algoritmos y pensando en una manera en que su uso no pueda afectar a la comunidad en general.
Todo esto se debe a que dentro de la recopilación de las primeras pruebas, LAION-400M, quien es el conjunto de datos utilizado para recolectarlas, poseía:
- Contenido pornográfico
- Insultos racistas
- Estereotipos sociales dañinos
Asimismo, tanto IMAGEN como DALL-E son aplicaciones que ahora mismo están en el ojo público. Aunque no hayan sido creadas precisamente para competir, una de las dos debe quedar como reina de las apps de IA productoras de imágenes por texto.
Lo más destacado de la investigación
Ciertamente, toda la documentación con respecto a IMAGEN es increíble. Aun así, sus desarrolladores han tomado algunos de los puntos para clasificarlos como “lo más destacado de la investigación”. Entre estos putos se encuentran:
- Mostrar que los grandes codificadores de texto congelado preentrenados son muy efectivos para la tarea de conversión de texto a imagen.
- Mostrar que escalar el tamaño del codificador de texto preentrenado es más importante que escalar el tamaño del modelo de difusión.
- Presentar un nuevo muestreador de difusión de umbral, que permite el uso de pesos de guía sin clasificadores muy grandes.
- Presentar una nueva arquitectura Efficient U-Net, que es más eficiente en computación, más eficiente en memoria y converge más rápido.
- Crear un nuevo COCO FID de última generación de 7.27
Asimismo, demostrar a los evaluadores humanos que las muestras de IMAGEN están a la par con las imágenes de referencia en términos de alineación de imagen y texto.
La tecnología es el futuro del mundo
La IA no solo se está utilizando para aplicaciones de distracción humana, sino que, es una herramienta que puede ayudar al mundo y sus habitantes. Desde ayudantes médicos hasta cualquier otra función que permita a los seres humanos realizar tareas que antes no podían.
Además, en lo que compete a compañías y otras organizaciones, la automatización de servicios es una de las herramientas que mejor provecho ha dado a sus usuarios.
Asimismo, la toma de decisiones y ahorro de tiempo son otras de las ventajas de la inteligencia artificial. En pocas palabras, el mundo se está digitalizando y Google lo sabe.