El mundo lleva explorando las posibilidades de la inteligencia artificial (IA) desde la década de 1950, periodo de tiempo en el que el matemático Alan Turing sentó las bases de esta disciplina con su artículo ‘Computing Machinery and Intelligence’.
Sin embargo, en siete décadas de desarrollo, la sensación generalizada de que la IA está avanzando a pasos agigantados nunca había estado tan presente. Uno de los responsables de esta realidad ha sido el chatbot conversacional de OpenAI, ChatGPT.
El corazón de esta poderosa herramienta es GPT-3.5, uno de los modelos de lenguaje autorregresivo más avanzados que existen. Y sus capacidades están a la vista: mantiene conversaciones en lenguaje natural, entendiendo el contexto, y genera textos de todo tipo.
Si GPT-3.5 nos ha sorprendido, haciéndonos sentir aquella sensación de cuando usamos internet por primera vez, GPT-4, la siguiente evolución de este lenguaje, promete dar un salto dramático en sus capacidades. Y esta evolución está en camino.
¿Qué es GPT-4?
GPT-4 es el presunto nombre del próximo modelo de lenguaje preentrenado de OpenAI, una compañía de investigación de inteligencia artificial que anteriormente ha presentado versiones anteriores del modelo. GPT (2018), GPT-2 (2019), GPT-3 (2020) y GPT-3.5 (2022).
Las capacidades de GPT-4 estarán directamente relacionadas al lenguaje. Se espera que sea capaz de realizar con asombrosa precisión tareas como generación de texto, resúmenes, traducción automática, respuestas a preguntas complejas y mucho más.
El salto más notable de la próxima versión de GPT llegará de la mano de su capacidad para responder como si fuera un humano. Sus respuestas e interacciones serán más precisas y coherentes, por lo que sumará puntos a la hora de enfrentarse al test de Turing.
¿Cómo funcionará GPT-4?
GPT-4, al igual que los modelos anteriores, por sí mismo es un lenguaje con potencial para ser explotando en diferentes sistemas. GPT-3, por ejemplo, ha sido implementado en aplicaciones comerciales como los procesadores de texto Jasper Ai y Canva Docs.
GPT-3.5, la versión más avanzada hasta el momento, nos ha sorprendido con ChatGPT. GPT-4, podría ir más allá de los asistentes de redacción, la traducción automática y chatbots, llegando a asistentes de voz e incluso buscadores (Microsoft Bing es candidato).
A nivel interno, GPT-4 será entrenado con datasets con grandes cantidades de datos que le servirán para aprender y generar lenguaje similar al que manejamos los humanos. Detrás del modelo se encuentra una técnica de procesamiento conocida como “Transformer”.
El objetivo de esta arquitectura, presentada por Google en 2017, es innovar en la implementación de capas que permiten adaptar el modelo para que sea eficaz y eficiente en diferentes tareas. OpenAI, en sus modelos GPT, la ha utilizado para implementar varias capas.
La arquitectura Transformer, a través de sus capas, convierte cada palabra en un vector numérico que permite al modelo procesar el texto de manera matemática, se encarga de procesarlo a través de una red neuronal y “presta atención” para comprenderlo.
Con GPT-3.5 tengo la misma sensación de cuando usé Internet por primera vez siendo niño
Pero no solo se trata de capas. En los modelos GPT también intervienen una gran cantidad de parámetros. Estos se conforman durante el proceso de aprendizaje automático y, en teoría, están directamente relacionados con el rendimiento y la precisión del modelo.
¿En qué se diferencia de GPT-3?
De acuerdo a la documentación de OpenAI, GPT-3 tiene 12 capas y 175.000 millones de parámetros. La principal diferencia entre el último modelo de OpenAI y su evolución, según recoge Wired, estará en los parámetros. GPT-4 tendrá 100 billones de parámetros, casi 600 veces más que sus predecesor.
Cabe señalar que OpenAI se ha mantenido en silencio hasta el momento. No obstante, también señalan que la evolución del modelo no necesariamente podría conseguirse aumentando la cantidad de parámetros. Una gran limitación sería que la capacidad de cálculo necesaria crecer en este aspecto cuesta millones de dólares por hora.
¿Cuándo se lanzará GPT-4?
OpenAI puso en marcha silenciosamente GPT-3.5 en noviembre de 2022 con el lanzamiento de ChatGPT. No hay una hoja de ruta oficial sobre la llegada de GPT-4, o como OpenAI decida llamar la evolución del modelo, pero TechCrunch señala que podría llegar en algún momento de 2023.