Hace un año, América Latina y el Caribe unieron sus fuerzas para crear su propio Modelo de Lenguaje de Gran Tamaño (LLM, por sus siglas en inglés) y lo llamó LatamGPT. Se trata de un proyecto que busca romper la dependencia de modelos desarrollados en el Norte Global y sus sesgos culturales, para crear una inteligencia artificial (IA) que refleje la realidad y las particularidades latinoamericanas.
Al frente de esta iniciativa está el Centro Nacional de Inteligencia Artificial (CENIA) que, desde Chile, articuló todos los esfuerzos y que, por estas horas, ofreció novedades al anunciar su lanzamiento y progresión de actualizaciones inmediatas. Por eso, TeleSemana.com conversó con Rodrigo Durán, gerente de CENIA, sobre las novedades, los desafíos y las perspectivas, pero también sobre las dificultades de la apuesta y sus alcances posibles gracias al aporte de unas 60 instituciones públicas y privadas de la región.
¿Eran 60 Rodrigo?
Sí, más de 60 y seguimos sumando. Y creo que ha sido la parte más linda del proyecto, justamente, la articulación de ese ecosistema local.
Hace un año se presentó la iniciativa y hace muy poquitos días se anunció su disponibilización. ¿Cómo fue ese recorrido y qué involucró esta presentación?
Lo que presentamos el 10 de febrero fue el ecosistema de LatamGPT, este proyecto global que busca ser inteligencia artificial desde y para América Latina de una manera distinta, que es más colaborativa y que a veces parece ser más folclórica, pero que sin duda se ancla en los principios que compartimos muchas personas en América Latina; y también en las condiciones materiales que tenemos.
LatamGPT es un proyecto cuyo buque insignia, lo más visible, es el modelo de 70.000 millones de parámetros que vamos a liberar la próxima semana, pero que aparte de eso tiene el corpus de texto en español y portugués curado más grande que se ha publicado en Internet; y tiene también un benchmark para evaluar el desempeño de los modelos de lenguaje en la región de América Latina y el Caribe.
Además, seis reportes técnicos que permiten entender, replicar y escalar lo que se hizo con la LatamGPT y un ecosistema detrás, una articulación de actores que estamos generando el dataset, que vamos a seguir entrenando el modelo y que estamos generando conocimiento para el fortalecimiento del ecosistema de IA en América Latina y en el Caribe basándonos en un bien público.
Este recorrido fue sumamente novedoso, creo. Desde mi punto de vista, la gran virtud de LatamGPT es que logramos proponer una forma de hacer algo que en el papel se hace con mucha plata. Para entrenar un modelo de estas características usando las técnicas que nosotros usamos, no dispones de menos de 50 millones de dólares en ninguna otra parte. Ese es como el ticket de entrada. ¿Por qué? Porque necesitas cómputo, datos e ingenieros que paguen eso. Nosotros logramos hacer lo mismo con muy buenos resultados con un presupuesto menor a los cuatro millones de dólares. Y eso no lo logramos porque el CENIA sea genial, lo logramos porque América Latina se unió en torno a un proyecto.
Y no estoy hablando de los países de la región, estoy hablando de las instituciones de la región: de la Universidad de los Andes de Bogotá, del Tecnológico Monterrey, de la Universidad de Sao Paulo, de la Universidad Nacional de Córdoba, donde actores y actrices del ecosistema académico y general de toda la región dijeron que “esto tiene sentido”. Pero no solamente desde la perspectiva de este moonshot o de este viaje a la luna ingenieril porque entrenar un modelo usando continuous pre-training no se trató de hacer un fine-tuning para cambiar la superficie del modelo, ni tampoco entrenamos algo scratch a partir de cero. Nosotros tomamos una arquitectura base Llama 3.1, de 70.000 millones de parámetros, y a eso le cambiamos los pesos y los parámetros, y le integramos nuevo conocimiento.
Esa integración de nuevo conocimiento y esa lógica de tener un modelo que entendiera, valga la redundancia, el modelo del mundo de América Latina y del Caribe, la manera en la que se interpreta la realidad desde acá -o al menos aspira a eso- es algo que también convenció a las instituciones que convencionalmente no están asociadas a la inteligencia artificial, como gremios de artistas, canales de televisión, editoriales o bibliotecas, que vieron aquí una oportunidad de resguardar y de promover el patrimonio cultural y el acervo idiosincrático de los países de la región.
LatamGPT tiene esta virtud de ser la articulación de un ecosistema que es más grande que la inteligencia artificial sola, como la concebimos regularmente; y que propone una forma diferente de desarrollar la IA desde América Latina. Y, además, que articula actores que van más allá de la frontera de lo que es la ciencia de computación y la inteligencia artificial, como tradicionalmente la conocemos, porque entendemos que es una tecnología transformadora que tenemos que, de alguna manera, lograr… no sé si dominar, pero sí comprender en mayor profundidad desde distintos puntos de vista.
Contame un poquito más sobre aquello que están preparando para lanzar…
No es que vayamos a hacer otro lanzamiento, sino que vamos a liberar el modelo de 70.000 millones de parámetros de LatamGPT 1.0. Es decir, si ahora entras a los recursos disponibles, está nuestro chat de alineamiento que se llama Copuchat, donde tienes liberaciones parciales del dataset. Ésta será la primera liberación de un modelo a modelo, que puede tomar cualquier persona que sepa de programación y descargarlo en su ambiente o ponerlo en su nube para construir soluciones basadas en LatamGPT. Será el 28 de febrero y, luego, vamos a liberar una segunda versión, LatamGPT 1.1 que ofrecerá un mayor alineamiento.
Algo que nos pasó en los últimos dos meses es que nos empezó a llegar gran cantidad de información a propósito del desarrollo y de la integración de la solución; particularmente, preguntas y respuestas para el alineamiento, participación de personas en los procesos de post-entrenamiento, y no logramos meterlo todo en el modelo que vamos a liberar ahora. Por eso, a ese modelo que vamos a liberar ahora lo vamos a re-entrenar con esta nueva información. Se inicia un ciclo permanente de re-entrenamiento. Ahora lanzaremos el modelo 1.0 y en marzo, el modelo 1.1 re-entrenado.
Entre los desafíos de los que hablaban en la presentación estaba el tema del procesamiento de cómputo específico para IA. Inclusive, en Chile hay una estrategia vinculada a data centers, en la región están desembarcando muchas infraestructuras de nube y hasta AWS anunció un nuevo proyecto de nube en Chile en el marco de la presentación de CENIA. Por eso te consulto, sobre el desafío del desarrollo de cómputo pero también sobre la cuestión de la soberanía vinculada a los datos. ¿Cómo ves que se esté abordando el tema en la región y cómo lo van a abordar ustedes?
Creo que, al igual que con la legislación del Acta de la Unión Europea sobre Inteligencia Artificial, las condiciones materiales que existen en Europa te permiten ese tipo de posiciones. Salvo Brasil, no tienes ningún otro país en América Latina y el Caribe que pueda decir, “sabes que necesito entrenar modelos localmente”, porque no tienes cómputo para entrenar modelos localmente. Y recuerda que el cómputo para entrenamiento de IA es distinto a los data centers tradicionales que ya están instalados, porque es basado en GPU y tiene otra infraestructura.
Obviamente, desde el Cenia hemos empujado con fuerza la idea de que América Latina y el Caribe, particularmente Chile, tiene una oportunidad grande de transformarse en un generador de cómputo verde para el entrenamiento de modelos y la inferencia a lo largo del mundo, dadas las condiciones naturales que tiene: exceso de energía (literalmente estamos volcando energía en el desierto, del norte y del sur), también tenemos hidrógeno verde, que es lo mismo. Pero hay otros desafíos.
Vinculado a la soberanía, estoy absolutamente de acuerdo contigo porque creo que hay un desafío que puede ser resuelto, parcialmente, en el mediano plazo con políticas más estrictas de transparencia en relación al tratamiento que tienen los datos cuando están fuera del territorio nacional.
Es decir, pedir o al menos plantear la opción de que puedan existir auditorías sobre procesos de entrenamiento de manera que puedas garantizar un uso más responsable de los datos y, en el largo plazo, idealmente, desarrollar una capacidad de cómputo local que te permita el entrenamiento en territorio donde tienes jurisdicción respecto a tus propios datos.
Porque es un caso muy de borde, pero no es descabellado: nosotros, por ejemplo, entrenamos todo LatamGPT en servidores de AWS que están en Virginia, y esos datos, mientras estuvieron alojados ahí, estuvieron expuestos a que, por ejemplo, pueden ser vistos usando el Patriot Act, lo cual no tengo antecedentes que alguna vez haya pasado, no había nada interesante que mirar ahí, pero es una opción que eventualmente podría transgredir ciertos principios de soberanía… pero no tienes otra alternativa.
De hecho, para el futuro, en línea con eso y con la necesidad de desarrollo de capacidades locales: el cómputo no es solamente útil porque te permite entrenar modelos, es útil porque te permite generar un ecosistema de desarrollo en torno a él. Hoy, lo que está moviendo la aguja de dónde se va el talento globalmente no son los dólares que le pagas a un ingeniero, no son si tiene playa o no playa… es si tiene acceso o no a GPU y cuánto. ¿Por qué? Porque es como para un astrónomo un telescopio. Si tú tienes acceso a un buen telescopio, vas a ir donde el telescopio. En inteligencia artificial pasa un poco lo mismo.
Y a esa apuesta, nosotros, la tomamos hace dos años, cuando hicimos esta alianza con la Universidad de Tarapacá donde vamos a construir este supercomputador, en Arica, que va a ser 100 por ciento abastecido por energías renovables. Y estamos también en un segundo proyecto junto con el Laboratorio Nacional de Supercomputación. Estamos empezando a participar en este proyecto que tiene la Unión Europea junto con el Banco Interamericano de Desarrollo (BID) y algunos países de la región, para articular una red de supercomputadores. Desde nuestra perspectiva, articular a la comunidad de inteligencia artificial en América Latina y el Caribe es muchísimo más sencillo de lo que era hace un año atrás, porque ya hay un armado que es horizontal y hay confianza.
En ningún caso, el Cenia fue el líder de este proyecto y el resto nos siguió, sino que se articularon comunidades de trabajo que hicieron parte ética, que hicieron pre-entrenamiento, que hicieron post-entrenamiento y así sucesivamente. Entonces, creo que pensar en que podemos articular capacidades de cómputo, o al menos proyectar esa articulación a partir de lo que se construyó con LatamGPT, es algo sumamente razonable.
¿Cómo se inscribe este anuncio y esta potencialidad en este escenario de región y de rearmado de las estructuras internacionales?
Es una excelente pregunta. Voy a partir desde lo más básico para mí.
Lo más básico para mí es entender que estamos frente a una revolución que no es solamente tecnológica, que también es política, es social, es cultural y es laboral; que va a transformar de manera muy, muy profunda probablemente el contrato social en su conjunto, porque estoy pensando en mediano o largo plazo. Y cuando ves las cosas desde ese punto de vista, estamos hablando de algo que se parece mucho más a la crisis climática, que se parece mucho más a cambio que a la irrupción del Internet, es más profundo que eso. Y, por lo tanto, los esfuerzos y la urgencia para hacerse cargo de un desafío de esas características son distintos y son de mayor intensidad.
Y creo que ahí es donde estamos un poco limitados en América Latina, no solamente a nivel de gobierno, sino también a nivel de empresas privadas, de academias, etcétera. Todavía no hay una conciencia real a propósito de qué es lo que estamos enfrentando. Y, por lo tanto, ese primer desafío para mí es fundamental, el generar mayor conciencia de la envergadura y la magnitud de lo que estamos atravesando.
Con esto, debería desencadenarse solo un proceso de mayor inversión y creo que aquí, nosotros demostramos que con lo que tenemos podemos hacer algo, podemos participar, nos podemos sentar a esa mesa. Si nos articulamos y nos unimos podemos hacer algo que es folclórico.
LatamGPT fue un proyecto que tomó al menos 18 meses en parar un modelo de 70.000 millones de parámetros, que es algo que una empresa tecnológica en Estados Unidos o en China hace todas las semanas, por deporte.
ChatGPT 5.2 tiene 30 veces los parámetros que tenemos nosotros, y un proceso de entrenamiento que es 50 veces más sofisticado porque tiene los recursos. Hay que tener recursos, aquí no hay mucho más. Por lo tanto, pensar que los gobiernos de América Latina y el Caribe van a poder invertir para, no te digo competir ni ponerse a la altura, pero sí avanzar.
La sola idea de que esto tiene que venir desde el gobierno a mí me parece que es descabellada. Los gobiernos de América Latina enfrentan una cantidad de desafíos sociales, urgentes y apremiantes que hacen, desde mi punto de vista, políticamente inviable el poder convencer al electorado o a los tomadores de decisiones públicas que no van a construir más hospitales porque hay que hacer supercomputadores. Eso no tiene asidero desde mi punto de vista.
Pero lo que sí tiene asidero es que el sector privado se dé cuenta, uno, de la oportunidad que hay, y dos, del riesgo.
Hay un tema que se ha ignorado, desde mi punto de vista, y es que, sobre todo con las economías agénticas ahora, que muchos sectores productivos locales pueden desaparecer en la competencia, desaparecer radicalmente, cuando lleguen gigantes tecnológicos o empresas basadas en inteligencia artificial, porque las diferencias en productividad son brutales. Está pasando con Shein o con Temu hoy y es un ejemplo, multiplicalo en todos los sectores económicos y te das cuenta de que el sector servicios a nivel de banco, de seguros o sectores que son intensivos en personas que pueden ser reemplazadas por agentes de una empresa que opera desde China, u Holanda o Estados Unidos, desde donde tú quieras… te saca del mapa.
¿Entonces?
Nosotros podemos ser líderes en adoptar la inteligencia artificial desde las empresas, sin requerir de grandes cantidades de cómputo ingeniero, y ser quienes propongan esas soluciones a escala latinoamericana, para después expandirlas hacia afuera. Pero la tendencia va hacia allá. Ceo que aquí hay una oportunidad y un riesgo del sector privado que no se está tomando en consideración, que son quienes en el resto del mundo lideran esto.
Si vas a Europa, está bien, es medio híbrido, pero quienes empujan el carro son los privados; en Estados Unidos, para qué te digo. En China es distinto, porque China es China. Acá pienso que está bien lo que hacen los gobiernos porque avanzan de forma responsable en el marco de lo que es viable. Podrían ser más agresivos y más entusiastas, sin duda, pero aunque fueran todos lo más entusiastas del mundo, sería insuficiente si el sector privado no se pliega y lidera.
Ahí el rol del gobierno tiene que ver con que ese liderazgo que tenga el sector privado esté en el marco de ciertos principios comunes de ética y de responsabilidad. Más que ser quien promueve y desarrolla la tecnología, ser quien establece los bordes para ese desarrollo. Y creo que no estamos ahí todavía, pero es lo que viene.
¿Qué ecos observaron a partir del lanzamiento de la semana pasada?
Es muy temprano aún. Sin duda hay entusiasmo, sin duda hay mayor confianza. Más allá del ecosistema, más allá del modelo y de los productos técnicos que nosotros generamos, la importancia de demostrar que existe una forma distinta viable, lenta, difícil de coordinar, pero viable, para desarrollar estos artefactos tecnológicos desde la región. Es algo que, no te voy a decir que es inspirador, pero al menos sí permite decir, “ah, podemos estar en esta conversación”. Y por lo tanto, eventualmente, esto habilita una reacción por parte de otros actores.
En el anuncio estuvo presente un hipersescalador pero ¿qué rol ocupan las telcos en este proceso?
El rol de las telcos es fundamental, porque al final del día, todo esto sucede habilitado por la infraestructura que las telcos sostienen: no tienes inteligencia artificial sin Internet, asi de sencillo.
El consumo de datos cada vez más se va a ir moviendo hacia esas interacciones y vas a tener, cada vez más demanda en ese sentido de acceso a información. Además, el rol de las telcos es el de habilitante porque más allá de construir se trata de cómo garantizas el acceso (a conectividad de) poblaciones que hoy día no lo tienen.
Por ejemplo, Colombia es un país que su principal déficit hoy es el acceso (a Internet) en lugares rurales o que estuvieron aislados el marco de los conflictos armados; por eso lo veo más como un tema de madurez y de políticas públicas que geográfico. Chile es un país que no solamente tiene una red de fibra óptica sumamente rápida, sino que además tiene una profundidad muy grande. En Chile tú tienes más gente sin acceso a agua potable que sin acceso a Internet… esa es como la magnitud porque se contruyeron buenas políticas para eso. Estuve de vacaciones en el sur de Chile en un bosque bien profundo, y no tenía señal de teléfono, pero sí tenía Internet. No sé si eso es bueno, en mi caso, porque no me permitía desconectarme, pero refleja que puedes enfrentar desafíos de conectividad con buenas políticas públicas e incentivos puestos correctamente. Ahí el caso de Chile es sumamente valioso y podría ser replicado en otros países de la región. Y el rol de las telco es clave porque es el habilitante del acceso. Sin telco no hay nada más.
Bueno, pero con las soluciones satelitales LEO esa ecuación también cambia. En lo personal, cuando vi al hiperescalador pensé que ese podría haber sido el lugar para una telco… siento que, en algún punto, se desdibuja su rol…
Si. Si tú trabajas en un mundo donde ya existe la telco, donde ya tiene una infraestructura, donde ya hay contratos… es un poco lo que me dicen cuando me acerco a una compañía o a un gobierno: les digo “mira todas las oportunidades de productividad que hay aquí”… y aunque las identifican, me responden que ellos ya tienen sus formas o procesos.
El proceso de adopción y transformación es sumamente importante y sumamente costoso. Entonces, creo que ahí hay una oportunidad para la telco de entender y de ser un early adopter de cómo están funcionando las tecnologías afuera; de ver a los hiperescaladores, de ver cómo están funcionando los satélites y de aprovechar la ventaja que tienen al estar operando en el país para no quedar fuera.
¿Cómo es el horizonte para Cenia y LatamGPT en adelante, cómo sigue?
Durante el primer semestre vamos a hacer varias salidas, no solamente del modelo. Esperamos también liberar el dataset, que es la parte, creo yo, más habilitante porque se usa como petróleo para otros modelos. Vamos a liberar el benchmark, que va a permitir comparar el desempeño de distintos modelos en América Latina y el Caribe. Y estos reportes técnicos, que vamos a ir abriendo de forma periódica, que transparentan y enseñan cuáles fueron las decisiones y los desafíos que nosotros tuvimos de manera que sea replicable y escalable el proyecto.
Nuestra idea es continuar con LatamGPT; estamos articulando al equipo para esta nueva etapa. Ahora partimos esta segunda etapa con un equipo que tiene capacidades distintas y vamos a reforzarlo; estamos gestionando los recursos para seguir avanzando en esa dirección. Y esa gestión de recursos tiene una parte que es de multilateralismo, de seguir buscando organismos e instituciones que vean la relevancia de contar con este bien público. En segundo lugar, la filantropía. También creemos que es un espacio relevante para conseguir apoyo.
Y, en tercer lugar, es el desarrollo de casos de uso. La única forma de la sostenibilidad en el mediano y largo plazo, para gestionar los propios recursos y se reinviertan, además de la monetización de ciertas soluciones que creemos que tienen ese potencial.