La nueva era de la IA está impulsada por modelos más pequeños
La burbuja en torno al auge de la IA está empezando a desinflarse, dando lugar a un análisis más realista. La adopción de los grandes modelos lingüísticos no está siendo nada fácil para el mundo corporativo y las empresas empiezan a preguntarse si realmente están preparadas para alojar, entrenar y actualizar la IA por sí mismas. Esto no quiere decir que sea el fin de la IA. La integración de modelos más pequeños puede marcar el rumbo hacia un futuro prometedor para la IA.
Es una historia que se repite constantemente. Cuando aparecen nuevas tecnologías, los grandes actores dominan el mercado desde una posición privilegiada. A continuación, suele producirse automáticamente una reacción desde abajo. Los pequeños fabricantes que se quedan fuera empiezan a hacerse un hueco. Finalmente, el mercado encuentra el equilibrio en un punto intermedio. Ejemplos de ello son aplicaciones sencillas como las búsquedas, los chatbots o el resumen de contenidos, para las que los modelos más pequeños son adecuados y también los más rentables.
Esta tendencia se debe a las propias limitaciones de la IA en su versión a gran escala y de los grandes modelos lingüísticos. Se trata de modelos que están diseñados para ser universales y tener conocimientos básicos, pero que no pueden profundizar en ningún tema, por lo tanto, no puede proporcionar respuestas específicas para cada tema. A ello se suma, las alucinaciones, que de momento se presentan como un problema difícil de controlar.
La eficiencia y la precisión se imponen al tamaño
Una alternativa a los LLM es el enfoque de la IA de Enjambre, que se basa en el uso de muchos modelos pequeños para llevar a cabo tareas específicas. Puede tratarse de modelos de desarrollo propio o de modelos disponibles en el mercado que se utilizan de forma combinada. En pocas palabras, se conectan a un meta-nivel, que funciona como una unidad de consulta común. Cuando se formula una pregunta, el meta-nivel decide qué modelo o modelos proporcionan la respuesta.
El uso de modelos más pequeños tiene muchas ventajas sobre los LLM. Permiten la adaptación dinámica y la integración continua de nuevos datos. Como resultado, el entrenamiento puede realizarse mucho más rápido. Los modelos pequeños también contribuyen a un importante ahorro de costes. Al fin y al cabo, los LLM con miles de millones de parámetros requieren una inversión considerable.
Además, el uso de modelos pequeños con datos específicos, también conocido en inglés como domain-specific, reduce la dependencia que tienen las empresas de los grandes proveedores de LLM, cuyas soluciones suelen ser una caja negra en cuanto a algoritmos, datos de entrenamiento o modelos.
Por otro lado, los modelos pequeños son sinónimo de transparencia, trazabilidad y fiabilidad. Europa, en particular, suele establecer estándares en este ámbito en materia de regulación, que cada vez se respetan cada vez más a nivel mundial. El RGPD es un buen ejemplo del pasado, y la Ley de IA de la UE bien podría sentar un precedente en el futuro.
La IA de Enjambre también puede ser una respuesta a la escasez de talento en IA en la industria y a la complejidad de la puesta en marcha de los grandes modelos lingüísticos. Los modelos pequeños son más fáciles de entrenar, optimizar y desplegar, lo que permite ciclos de desarrollo y experimentación más rápidos.
La euforia inicial por la IA generativa se ha moderado, dando paso a una visión más realista de su potencial. Este cambio no significa el fin de la IA, sino más bien nos invita a una necesaria reformulación. El futuro está en la IA de Enjambre: un enfoque basado en pequeños modelos domain-specific que promete revolucionar su aplicación. La IA de Enjambre es una oportunidad que los proveedores europeos no pueden dejar pasar, especialmente en un momento en que esta tecnología es fundamental.
Artículo redactado por Jan Wildeboer, evangelista del código abierto en Red Hat EMEA.
Firma Invitada
Últimas entradas de Firma Invitada (ver todo)
- La nueva era de la IA está impulsada por modelos más pequeños - 26 septiembre, 2024
- Qué implicaciones puede tener plagiar contenido de una IA - 13 junio, 2024
- Llevo 20 años creando e-commerce para las principales marcas del país, y esto es lo que he aprendido - 6 octubre, 2023