
En un movimiento histórico para la independencia tecnológica del Sur Global, Chile ha lanzado oficialmente Latam-GPT, el primer modelo de lenguaje de gran tamaño (Large Language Model, LLM) de código abierto diseñado específicamente para dominar las complejidades lingüísticas y el contexto cultural de América Latina. La presentación tuvo lugar este martes en los estudios de Televisión Nacional de Chile (TVN) en Santiago, con la asistencia del presidente Gabriel Boric y figuras clave de la comunidad científica.
Desarrollado por el Centro Nacional de Inteligencia Artificial (CENIA) en colaboración con el Banco de Desarrollo de América Latina (CAF) y Amazon Web Services (AWS), Latam-GPT representa un giro estratégico del consumo pasivo de tecnología centrada en EE. UU. hacia la creación activa. Con 50 mil millones de parámetros y entrenamiento en más de 8 terabytes de datos regionales, el modelo tiene como objetivo corregir los sesgos históricos inherentes a gigantes globales como GPT-4 y Gemini, ofreciendo una herramienta que realmente comprende el "voseo" del Cono Sur, las raíces indígenas de los Andes y la realidad sociopolítica de la región.
Durante años, investigadores y empresas en América Latina han lidiado con las limitaciones de los modelos de IA convencionales. Aunque sistemas como ChatGPT dominan el español, su lógica subyacente y base de conocimientos culturales se derivan abrumadoramente de datos en inglés y de la cosmovisión del Norte Global.
Los investigadores de CENIA destacaron que, al ser consultados sobre literatura local, historia o incluso festividades, los modelos globales suelen alucinar o proporcionar respuestas genéricas y estereotipadas. Por ejemplo, los modelos estándar a menudo no reconocen el peso cultural de fechas como el "18 de septiembre" en Chile (celebraciones de las Fiestas Patrias) o generan imágenes de latinoamericanos que recurren a caricaturas —como hombres con ponchos ante paisajes montañosos— ignorando la modernidad urbana de la región.
"Estamos en la mesa, no en el menú", afirmó el presidente Boric durante el lanzamiento, enfatizando que Latam-GPT es una cuestión de soberanía. "Si no desarrollamos nuestros propios modelos, corremos el riesgo de perder nuestra identidad cultural en la era digital y seguir dependiendo de herramientas que no entienden quiénes somos".
Latam-GPT se distingue no por competir en tamaño bruto contra modelos de billones de parámetros, sino por la calidad y especificidad de sus datos. El modelo funciona como un sistema denso y culturalmente rico diseñado para la eficiencia y la relevancia local.
El entrenamiento inicial se llevó a cabo utilizando la infraestructura en la nube de AWS con una subvención de 2 millones de dólares en créditos. Sin embargo, la hoja de ruta para Latam-GPT incluye una mejora significativa de hardware. Las futuras iteraciones se entrenarán en un nuevo clúster de supercomputación en la Universidad de Tarapacá, equipado con GPUs NVIDIA H200 de última generación. Esta inversión de 10 millones de dólares marca un salto significativo en la capacidad computacional de la región, asegurando que el mantenimiento y la evolución del modelo permanezcan dentro de las fronteras latinoamericanas.
La siguiente comparación ilustra cómo se posiciona Latam-GPT frente a los modelos de código cerrado dominantes que lideran el mercado actualmente.
| Característica | LLM comerciales globales (p. ej., GPT-4, Gemini) | Latam-GPT |
|---|---|---|
| Enfoque principal | Propósito general, centrado en el Norte Global | Cultura, historia y dialectos latinoamericanos |
| Tipo de licencia | Cerrada / Propietaria | Código abierto (Open Source) (Accesible para modificación) |
| Matiz cultural | Alta tasa de alucinación en temas locales | Alta fidelidad al contexto local y modismos |
| Soberanía de datos | Los datos residen en centros de datos de EE. UU./UE | La gobernanza de datos prioriza la soberanía regional |
| Coste de despliegue | Altos costes de API para startups | Pesos gratuitos disponibles para alojamiento local |
| Alcance lingüístico | Español/Portugués estándar | Dialectos regionales + Lenguas indígenas (Hoja de ruta) |
Uno de los principales impulsores de Latam-GPT es su aplicación en el sector público. A diferencia de los modelos comerciales que funcionan como "cajas negras", la naturaleza abierta de Latam-GPT permite a los gobiernos desplegarlo de forma segura dentro de su propia infraestructura para manejar datos sensibles de los ciudadanos.
El Ministerio de Ciencia, Tecnología, Conocimiento e Innovación prevé que el modelo se utilice para:
"No se trata solo de un chatbot", explicó el director de CENIA, Álvaro Soto. "Es una infraestructura fundamental. Al liberar los pesos del modelo, estamos permitiendo que una startup en Colombia, una universidad en Argentina o una agencia gubernamental en Perú construyan aplicaciones especializadas sin pagar un 'peaje' a los gigantes tecnológicos extranjeros".
La decisión de hacer que Latam-GPT sea de código abierto es un diferenciador crítico. Aborda el fenómeno del "Desierto de Datos", donde las empresas internacionales recolectan datos locales para entrenar modelos propietarios que luego se venden de vuelta a la región.
Al democratizar el acceso al modelo base, CENIA espera impulsar un ecosistema de innovación. Las startups ahora pueden ajustar (fine-tune) Latam-GPT para verticales específicos —como las regulaciones mineras chilenas o el agritech brasileño— a una fracción del coste de ajustar un modelo como Llama 3 o GPT-4, y con un rendimiento base superior en el idioma objetivo.
Aunque la versión actual destaca en español y portugués, el proyecto tiene una ambiciosa hoja de ruta para la inclusividad. El equipo de desarrollo está trabajando activamente en la incorporación de conjuntos de datos para lenguas indígenas, incluyendo el mapuche (mapudungun), quechua, guaraní y aimara.
Esta iniciativa es técnicamente desafiante debido a la escasez de texto digitalizado en estos idiomas (lenguas de bajos recursos). Sin embargo, al asociarse con antropólogos y comunidades indígenas, CENIA pretende preservar estos idiomas digitalmente, evitando la "extinción digital" que amenaza a las culturas excluidas de la revolución de la IA (Artificial Intelligence).
El lanzamiento de Latam-GPT sitúa a Chile y a América Latina firmemente en el mapa global de la IA. Es una declaración de que la región se niega a ser un espectador en la revolución tecnológica. Aunque todavía no posea el poder de razonamiento bruto de los modelos más grandes del mundo, Latam-GPT demuestra que la precisión cultural y la soberanía de los datos son tan valiosas como el recuento de parámetros. A medida que el modelo madure en la supercomputadora de la Universidad de Tarapacá, promete convertirse en la columna vertebral digital para una nueva generación de innovadores latinoamericanos.