
Dans une démarche historique pour l'indépendance technologique du Sud Global (Global South), le Chili a officiellement lancé Latam-GPT, le premier grand modèle de langage (Large Language Model - LLM) open-source spécifiquement conçu pour maîtriser les subtilités linguistiques et le contexte culturel de l'Amérique latine. L'inauguration a eu lieu ce mardi dans les studios de la Televisión Nacional de Chile (TVN) à Santiago, en présence du président Gabriel Boric et de figures clés de la communauté scientifique.
Développé par le Centre National d'Intelligence Artificielle (CENIA) en collaboration avec la Banque de Développement de l'Amérique latine (CAF) et Amazon Web Services (AWS), Latam-GPT représente un pivot stratégique passant de la consommation passive de technologies centrées sur les États-Unis à la création active. Avec 50 milliards de paramètres et un entraînement sur plus de 8 téraoctets de données régionales, le modèle vise à corriger les biais historiques inhérents aux géants mondiaux comme GPT-4 et Gemini, offrant un outil qui comprend véritablement le « voseo » du Cône Sud, les racines autochtones des Andes et la réalité sociopolitique de la région.
Pendant des années, les chercheurs et les entreprises d'Amérique latine ont été confrontés aux limites des modèles d'IA grand public. Bien que des systèmes comme ChatGPT parlent couramment l'espagnol, leur logique sous-jacente et leur base de connaissances culturelles sont massivement dérivées de données en langue anglaise et de la vision du monde du Nord Global.
Les chercheurs du CENIA ont souligné que lorsqu'ils sont interrogés sur la littérature locale, l'histoire ou même les jours fériés, les modèles mondiaux hallucinent fréquemment ou fournissent des réponses génériques et stéréotypées. Par exemple, les modèles standards ne reconnaissent souvent pas le poids culturel de dates comme le « 18 septembre » au Chili (célébrations de la fête de l'Indépendance) ou génèrent des images de Latino-Américains basées sur des caricatures — comme des hommes en ponchos devant des paysages montagneux — ignorant la modernité urbaine de la région.
« Nous sommes à table, pas au menu », a déclaré le président Boric lors du lancement, soulignant que Latam-GPT est une question de souveraineté. « Si nous ne développons pas nos propres modèles, nous risquons de perdre notre identité culturelle à l'ère numérique et de rester dépendants d'outils qui ne comprennent pas qui nous sommes. »
Latam-GPT se distingue non pas en rivalisant par sa taille brute contre des modèles aux billions de paramètres, mais par la qualité et la spécificité des données. Le modèle fonctionne comme un système dense et culturellement riche, conçu pour l'efficacité et la pertinence locale.
L'entraînement initial a été réalisé à l'aide de l'infrastructure cloud d'AWS grâce à une subvention de 2 millions de dollars en crédits. Cependant, la feuille de route de Latam-GPT prévoit une mise à niveau matérielle significative. Les futures itérations seront entraînées sur un nouveau cluster de calcul intensif à l'Université de Tarapacá, équipé de GPU NVIDIA H200 de pointe. Cet investissement de 10 millions de dollars marque un saut significatif dans la capacité de calcul de la région, garantissant que la maintenance et l'évolution du modèle restent à l'intérieur des frontières de l'Amérique latine.
La comparaison suivante illustre comment Latam-GPT se positionne par rapport aux modèles propriétaires dominants qui dirigent actuellement le marché.
| Fonctionnalité | LLM commerciaux mondiaux (ex. GPT-4, Gemini) | Latam-GPT |
|---|---|---|
| Objectif principal | Usage général, centré sur le Nord Global | Culture, histoire et dialectes d'Amérique latine |
| Type de licence | Fermée / Propriétaire | Open Source (Accessible pour modification) |
| Nuance culturelle | Taux d'hallucination élevé sur les sujets locaux | Haute fidélité au contexte local et à l'argot |
| Souveraineté des données | Les données résident dans des centres de données US/UE | La gouvernance des données donne la priorité à la souveraineté régionale |
| Coût de déploiement | Coûts d'API élevés pour les startups | Poids (weights) gratuits disponibles pour l'hébergement local |
| Portée linguistique | Espagnol/Portugais standard | Dialectes régionaux + Langues autochtones (Feuille de route) |
L'un des principaux moteurs de Latam-GPT est son application dans le secteur public. Contrairement aux modèles commerciaux qui fonctionnent comme des « boîtes noires », la nature ouverte de Latam-GPT permet aux gouvernements de le déployer en toute sécurité au sein de leur propre infrastructure pour traiter les données sensibles des citoyens.
Le ministère de la Science, de la Technologie, de la Connaissance et de l'Innovation prévoit que le modèle soit utilisé pour :
« Il ne s'agit pas seulement d'un chatbot », a expliqué le directeur du CENIA, Álvaro Soto. « C'est une infrastructure fondamentale. En publiant les poids du modèle, nous permettons à une startup en Colombie, une université en Argentine ou une agence gouvernementale au Pérou de créer des applications spécialisées sans payer de "péage" aux géants technologiques étrangers. »
La décision de rendre Latam-GPT open-source est un différenciateur critique. Elle s'attaque au phénomène du « Désert de données », où les données locales sont récoltées par des entreprises internationales pour entraîner des modèles propriétaires qui sont ensuite revendus à la région.
En démocratisant l'accès au modèle de base, le CENIA espère susciter un écosystème d'innovation. Les startups peuvent désormais affiner Latam-GPT pour des secteurs spécifiques — tels que les réglementations minières chiliennes ou l'agritech brésilienne — à une fraction du coût d'affinage d'un modèle comme Llama 3 ou GPT-4, et avec une performance de base supérieure dans la langue cible.
Alors que la version actuelle excelle en espagnol et en portugais, le projet dispose d'une feuille de route ambitieuse en matière d'inclusivité. L'équipe de développement travaille activement à l'incorporation d'ensembles de données pour les langues autochtones, notamment le Mapuche (Mapudungun), le Quechua, le Guaraní et l'Aymara.
Cette initiative est techniquement complexe en raison de la rareté des textes numérisés dans ces langues (langues à faibles ressources). Cependant, en s'associant à des anthropologues et à des communautés autochtones, le CENIA vise à préserver ces langues numériquement, empêchant ainsi « l'extinction numérique » qui menace les cultures exclues de la révolution de l'IA.
Le lancement de Latam-GPT place fermement le Chili et l'Amérique latine sur la carte mondiale de l'IA. C'est une déclaration selon laquelle la région refuse d'être un simple spectateur de la révolution technologique. Bien qu'il ne possède peut-être pas encore la puissance de raisonnement brute des plus grands modèles mondiaux, Latam-GPT prouve que la précision culturelle et la souveraineté des données sont tout aussi précieuses que le nombre de paramètres. À mesure que le modèle mûrit sur le supercalculateur de l'Université de Tarapacá, il promet de devenir la colonne vertébrale numérique d'une nouvelle génération d'innovateurs latino-américains.