El nuevo ChatGPT todavía tiene problemas para ver e interpretar imágenes

Se suponía que el nuevo ChatGPT analizaría imágenes y, en realidad, no lo vimos venir. Todavía en prueba, MiniGPT-4 revela las hazañas esperadas de esta función. Y eso aún no es todo…

El 14 de marzo de 2023, algunos de los suscriptores de ChatGPT recibieron un correo electrónico invitándolos a seguir el anuncio de la nueva fórmula, basada en el modelo GPT-4. Greg Brockman, uno de los fundadores de OpenAI, luego presentó en detalle las ventajas de esta nueva versión.

Una de las funciones planteadas fue la siguiente: gracias a GPT-4, la nueva fórmula ChatGPT será “multimodal”. Claramente, ya no solo aceptará texto como entrada, sino también imágenes. Y por poner un ejemplo llamativo: a ChatGPT se le muestra la imagen de una nevera abierta y es capaz de sugerir una receta de cocina en base a lo analizado.

Una versión paga de ChatGPT

Para acceder a las capacidades de este nuevo ChatGPT, era imprescindible contratar una suscripción de pago -la fórmula ChatGPT Plus- y en todo el mundo, muchos fans de esta herramienta se han lanzado. Sin embargo, cuando intentamos analizar las imágenes, salimos con las manos vacías: apareció un mensaje que nos decía que GPT-4 aún no podía hacerlo.

GPT-4 promete en el análisis de imágenes

Y luego, OpenAI finalmente presentó una demostración de esta tan esperada función de análisis de imágenes. Es accesible en esta dirección: https://minigpt-4.github.io/

La herramienta a la que tenemos acceso se llama MiniGPT-4. En el video de presentación, OpenAI destaca muchas capacidades:

analiza una fotografía de una hoja y luego explica cómo cuidarla; puede describir una fotografía con un cactus en un lago helado; sugiere eslóganes relacionados con una fotografía de tazas; se le muestra una fotografía de langostas a la parrilla y él da la receta correspondiente, etc.

Una demo ultralenta e imperfecta

Queríamos probar esta herramienta y te lo advertimos: requiere una gran dosis de paciencia. Dado que tantos usuarios están probando esta herramienta, cada solicitud se coloca en una cola. Cuente varios minutos para cargar una fotografía, cinco buenos minutos para tener la respuesta a cada solicitud. Y por mucho que decir, esta función de análisis de imágenes aún es muy perfectible y está lejos de alcanzar la destreza que promociona OpenAI. El hecho es que, si no tiene demasiada prisa, puede enviar imágenes a esta herramienta y hacerle preguntas sobre ellas. Por lo tanto, tenemos una idea de lo que ChatGPT debería ofrecer una vez que se haya desarrollado esta nueva fórmula.

Deja un comentario