LLM vs. SLM: Los múltiples lenguajes de la IA Gen en el futuro de los negocios
Seguí algunos buenos debates y tuve conversaciones interesantes al respecto durante Febraban Tech 2024, el mayor evento de tecnología bancaria de América Latina, celebrado a fines del mes pasado en São Paulo (SP), Brasil. El uso de la IA generativa ha guiado gran parte de las discusiones entre ejecutivos y expertos en tecnología, y todavía hay mucho en el aire en torno a la elección de los mejores modelos funcionales.
Cuando hablamos de LLM, tenemos que recordar que, hace dos años, era más un tema teórico que práctico, bastante diferente al escenario actual de ebullición. El lanzamiento de ChatGPT en noviembre de 2022, considerado el gran hito en esta carrera de mil millones de dólares en torno a las plataformas de IA generativa, trató de reforzar el impacto que pueden tener en múltiples sectores, como las redes sociales y el periodismo profesional. En la misma línea, lo esencial que es formar esos motores con la mayor cantidad de datos posibles.
En el entorno bancario, existe una demanda latente de departamentos de TI que destaquen por su flexibilidad y permitan cambios en función de las estrategias del momento. No es que la eficiencia y el costo hayan perdido importancia: de hecho, estos dos elementos siguen siendo clave para una mejor entrega de ofertas y soluciones a los clientes, en un entorno desafiante para los desarrolladores.
Un buen marco de un entorno de LLM, abrazado por la IA generativa, permite multitud de tareas, desde la generación de contenidos en diversos formatos (texto, foto, video) y oportunidades de clasificación de grandes bases de datos, hasta la atención al cliente a través de chatbots que se acercan cada vez más a la interacción humana.
Es una red neuronal artificial, entrenada en conjuntos de datos masivos de texto y código, patrones de aprendizaje y reglas del lenguaje humano.
No es casualidad que hayamos visto que el mundo corporativo ya está mirando la posibilidad de no utilizar una sola plataforma LLM, sino múltiples LLM que interactúen entre sí, buscando así extraer lo mejor de cada uno. Hay una demanda de resultados cada vez más precisos y robustos, con procesos de validación cruzada, de mejora constante de la asertividad. En un entorno crítico como el financiero, estos aspectos son esenciales.
Sin embargo, al igual que con cualquier nueva tecnología que aún se está desarrollando, hay que reconocer que hay mucho trabajo por hacer. Los LLM siguen teniendo respuestas incorrectas o incoherentes, y pueden utilizarse con fines no positivos (los prejuicios, la desinformación y la falta de interpretabilidad son algunos de los factores que hay que ajustar). También están los aspectos de gasto y consumo, algo que da cabida a alternativas.
A diferencia de los LLM, los modelos pequeños de lenguaje (SLM, por su acrónimo en inglés) son menos complejos.
También tienen miles o millones de parámetros, pero se entrenan en conjuntos de datos más pequeños, lo que los hace más rápidos y eficientes. Al centrarse en tareas más específicas, se vuelven más baratas, aunque más limitadas. Sin embargo, los usos sectorizados también pueden tener una ganancia significativa con los SLM.
Más allá de los bancos, el hecho concreto que tenemos es que la elección entre un LLM y un SLM depende de las necesidades específicas de aplicación de cada empresa o industria. Y la decisión sobre qué modelo seguir debe tener en cuenta factores como el tamaño del modelo, la capacidad deseada, el costo, la interpretabilidad y la generalización. Como consultor experimentado, veo que los LLM seguirán desempeñando un papel de liderazgo. ¿Hasta cuándo? No sabemos.
Lo que no cambia es la búsqueda de soluciones estratégicas y eficientes que se componen de proyectos sostenibles, inversiones tangibles y medición de la información de extremo a extremo. En este sentido, los debates en Febraban Tech 2024 indican que ya soplan buenos vientos para todos los actores involucrados, sin importar cuál sea su idioma preferido.
Este artículo fue publicado por ComputerWeekly.es