Chile lanza Latam-GPT, el primer modelo de lenguaje de IA de código abierto de América Latina

Chile rompe la barrera del idioma en IA con el lanzamiento de Latam-GPT

En un movimiento histórico para la independencia tecnológica del Sur Global, Chile ha lanzado oficialmente Latam-GPT, el primer modelo de lenguaje de gran tamaño (Large Language Model, LLM) de código abierto diseñado específicamente para dominar las complejidades lingüísticas y el contexto cultural de América Latina. La presentación tuvo lugar este martes en los estudios de Televisión Nacional de Chile (TVN) en Santiago, con la asistencia del presidente Gabriel Boric y figuras clave de la comunidad científica.

Desarrollado por el Centro Nacional de Inteligencia Artificial (CENIA) en colaboración con el Banco de Desarrollo de América Latina (CAF) y Amazon Web Services (AWS), Latam-GPT representa un giro estratégico del consumo pasivo de tecnología centrada en EE. UU. hacia la creación activa. Con 50 mil millones de parámetros y entrenamiento en más de 8 terabytes de datos regionales, el modelo tiene como objetivo corregir los sesgos históricos inherentes a gigantes globales como GPT-4 y Gemini, ofreciendo una herramienta que realmente comprende el "voseo" del Cono Sur, las raíces indígenas de los Andes y la realidad sociopolítica de la región.

El problema: IA con sesgo del norte

Durante años, investigadores y empresas en América Latina han lidiado con las limitaciones de los modelos de IA convencionales. Aunque sistemas como ChatGPT dominan el español, su lógica subyacente y base de conocimientos culturales se derivan abrumadoramente de datos en inglés y de la cosmovisión del Norte Global.

Los investigadores de CENIA destacaron que, al ser consultados sobre literatura local, historia o incluso festividades, los modelos globales suelen alucinar o proporcionar respuestas genéricas y estereotipadas. Por ejemplo, los modelos estándar a menudo no reconocen el peso cultural de fechas como el "18 de septiembre" en Chile (celebraciones de las Fiestas Patrias) o generan imágenes de latinoamericanos que recurren a caricaturas —como hombres con ponchos ante paisajes montañosos— ignorando la modernidad urbana de la región.

"Estamos en la mesa, no en el menú", afirmó el presidente Boric durante el lanzamiento, enfatizando que Latam-GPT es una cuestión de soberanía. "Si no desarrollamos nuestros propios modelos, corremos el riesgo de perder nuestra identidad cultural en la era digital y seguir dependiendo de herramientas que no entienden quiénes somos".

Bajo el capó: Arquitectura técnica y entrenamiento

Latam-GPT se distingue no por competir en tamaño bruto contra modelos de billones de parámetros, sino por la calidad y especificidad de sus datos. El modelo funciona como un sistema denso y culturalmente rico diseñado para la eficiencia y la relevancia local.

Recuento de parámetros: 50 mil millones.
Corpus de entrenamiento: 8 terabytes de datos de texto, equivalente a millones de libros.
Fuentes de datos: Una mezcla seleccionada de 2,6 millones de documentos que incluyen archivos gubernamentales, artículos académicos, literatura local y datos web de 20 países latinoamericanos y España.
Principales contribuyentes: Brasil aportó el conjunto de datos más grande (685.000 documentos), seguido de México (385.000) y España (325.000).

El entrenamiento inicial se llevó a cabo utilizando la infraestructura en la nube de AWS con una subvención de 2 millones de dólares en créditos. Sin embargo, la hoja de ruta para Latam-GPT incluye una mejora significativa de hardware. Las futuras iteraciones se entrenarán en un nuevo clúster de supercomputación en la Universidad de Tarapacá, equipado con GPUs NVIDIA H200 de última generación. Esta inversión de 10 millones de dólares marca un salto significativo en la capacidad computacional de la región, asegurando que el mantenimiento y la evolución del modelo permanezcan dentro de las fronteras latinoamericanas.

Análisis comparativo: Latam-GPT vs. Gigantes globales

La siguiente comparación ilustra cómo se posiciona Latam-GPT frente a los modelos de código cerrado dominantes que lideran el mercado actualmente.

Característica	LLM comerciales globales (p. ej., GPT-4, Gemini)	Latam-GPT
Enfoque principal	Propósito general, centrado en el Norte Global	Cultura, historia y dialectos latinoamericanos
Tipo de licencia	Cerrada / Propietaria	Código abierto (Open Source) (Accesible para modificación)
Matiz cultural	Alta tasa de alucinación en temas locales	Alta fidelidad al contexto local y modismos
Soberanía de datos	Los datos residen en centros de datos de EE. UU./UE	La gobernanza de datos prioriza la soberanía regional
Coste de despliegue	Altos costes de API para startups	Pesos gratuitos disponibles para alojamiento local
Alcance lingüístico	Español/Portugués estándar	Dialectos regionales + Lenguas indígenas (Hoja de ruta)

Una herramienta para las políticas públicas y la educación

Uno de los principales impulsores de Latam-GPT es su aplicación en el sector público. A diferencia de los modelos comerciales que funcionan como "cajas negras", la naturaleza abierta de Latam-GPT permite a los gobiernos desplegarlo de forma segura dentro de su propia infraestructura para manejar datos sensibles de los ciudadanos.

El Ministerio de Ciencia, Tecnología, Conocimiento e Innovación prevé que el modelo se utilice para:

Optimizar currículos educativos: Creando sistemas de tutoría que hagan referencia precisa a la historia y literatura local.
Tecnología legal (Legal Tech): Asistiendo a abogados y jueces con jurisprudencia específica del derecho civil latinoamericano, en lugar del common law estadounidense que a menudo se filtra en las respuestas genéricas de la IA.
Salud: Gestionando la asignación de recursos en hospitales públicos mediante el procesamiento de datos locales no estructurados.

"No se trata solo de un chatbot", explicó el director de CENIA, Álvaro Soto. "Es una infraestructura fundamental. Al liberar los pesos del modelo, estamos permitiendo que una startup en Colombia, una universidad en Argentina o una agencia gubernamental en Perú construyan aplicaciones especializadas sin pagar un 'peaje' a los gigantes tecnológicos extranjeros".

Soberanía digital y la filosofía del código abierto

La decisión de hacer que Latam-GPT sea de código abierto es un diferenciador crítico. Aborda el fenómeno del "Desierto de Datos", donde las empresas internacionales recolectan datos locales para entrenar modelos propietarios que luego se venden de vuelta a la región.

Al democratizar el acceso al modelo base, CENIA espera impulsar un ecosistema de innovación. Las startups ahora pueden ajustar (fine-tune) Latam-GPT para verticales específicos —como las regulaciones mineras chilenas o el agritech brasileño— a una fracción del coste de ajustar un modelo como Llama 3 o GPT-4, y con un rendimiento base superior en el idioma objetivo.

Hoja de ruta futura: Integración de lenguas indígenas

Aunque la versión actual destaca en español y portugués, el proyecto tiene una ambiciosa hoja de ruta para la inclusividad. El equipo de desarrollo está trabajando activamente en la incorporación de conjuntos de datos para lenguas indígenas, incluyendo el mapuche (mapudungun), quechua, guaraní y aimara.

Esta iniciativa es técnicamente desafiante debido a la escasez de texto digitalizado en estos idiomas (lenguas de bajos recursos). Sin embargo, al asociarse con antropólogos y comunidades indígenas, CENIA pretende preservar estos idiomas digitalmente, evitando la "extinción digital" que amenaza a las culturas excluidas de la revolución de la IA (Artificial Intelligence).

Conclusión

El lanzamiento de Latam-GPT sitúa a Chile y a América Latina firmemente en el mapa global de la IA. Es una declaración de que la región se niega a ser un espectador en la revolución tecnológica. Aunque todavía no posea el poder de razonamiento bruto de los modelos más grandes del mundo, Latam-GPT demuestra que la precisión cultural y la soberanía de los datos son tan valiosas como el recuento de parámetros. A medida que el modelo madure en la supercomputadora de la Universidad de Tarapacá, promete convertirse en la columna vertebral digital para una nueva generación de innovadores latinoamericanos.