OpenAI lanza una versión más pequeña y barata de su modelo de inteligencia artificial
Durante los últimos dos años los avances en herramientas y modelos de inteligencia artificial han sido exponenciales. También el nivel de recursos necesarios para hacerlos funcionar. Los modelos de lenguaje que hacen posible aplicaciones como ChatGPT o Copilot necesitan una enorme potencia de cálculo que requiere una compleja y costosa infraestructura de servidores y centros de datos.
El último anuncio de OpenAI, la empresa detrás de ChatGPT, va sin embargo en la dirección opuesta. La compañía ha lanzado un nuevo modelo, GPT-4o Mini, que es mucho más barato y consume menos recursos que GPT-4o, su modelo más popular.
Es un lanzamiento que confirma una tendencia por parte de las grandes empresas de IA, desde la propia OpenAI hasta Google, pasando por Anthropic o Apple, hacia soluciones que pueden ejecutarse localmente en dispositivos pequeños, como un teléfono, o en servidores remotos pero con un consumo muy inferior.
Parte del problema que ha obligado a cambiar la estrategia es que el sistema original podía resultar un problema para empresas tratando de construir un negocio sobre estos modelos de lenguaje (que es como se conoce a estos motores de predicción capaces de comprender el lenguaje natural y responder de forma parecida a como lo haría un ser humano).
Los costes al usar los modelos de OpenAI eran difíciles de predecir y podían llegar a ser elevados. Los desarrolladores, a menudo, recurrían a motores de empresas alternativas como Google (Gemini 1.5 Flash) o Anthropic (Claude 3 Haiku). GPT-4o Mini es una alternativa a estos dos, con un coste de 15 centavos de dólar por millón de tokens de entrada y 60 centavos por millón de tokens de salida, un 60% menos de la que hasta ahora era la opción más económica de OpenAI (GPT-3.5 Turbo). Un token es la unidad mínima que manejan los modelos de lenguaje en sus cálculos y a grandes rasgos equivale a una palabra.
El modelo sustituirá también a GPT-3.5 en la versión gratuita de la popular aplicación ChatGPT, que hasta ahora no daba acceso a la tecnología más avanzada de la compañía si el usuario no se registraba.
Tiene sentido porque GPT-4o Mini es más avanzado que GPT-3.5 en muchas de las pruebas de evaluación que se suelen utilizar para comparar el rendimiento de estos motores. Es más moderno y tiende a producir mejores respuestas, incluso siendo más limitado que GOT--4o, anunciado en abril. OpenAI también lo hará multimodal, es decir, capaz de aceptar instrucciones en forma de texto sino también como imágenes o vídeo, aunque es una función que llegará más adelante.
Es también más eficiente, lo que quiere decir que permitirá a la empresa ahorrar en los costes en los que incurre al mantener la versión gratuita de ChatGPT.