Agustín Gómez[1] Son muchos temas que se han abarcado y muchas aristas. Voy a tratar de resumir mis comentarios en tal vez cuatro o cinco puntos que considero importantes. Par" />
loader image

Foto: Freepik

Retos de datos, sesgos y alfabetización digital

17 septiembre, 2025

Agustín Gómez[1]

Son muchos temas que se han abarcado y muchas aristas. Voy a tratar de resumir mis comentarios en tal vez cuatro o cinco puntos que considero importantes.

Para los que nos están escuchando en esta transmisión, dentro de 33 minutos en hora costarricense, que serán las 11 de la mañana, ChatGPT va a lanzar su modelo OpenAI 5. ¿Qué implicaciones tiene eso? Vamos a ver dentro de un rato, pero el principal tema es que cada día, cada hora, cada minuto, tenemos nuevos modelos, formas nuevas de interactuar con herramientas, algoritmos, tecnología y posiciones filosóficas, con diferentes esquemas que abordan un componente complejo: la inteligencia artificial y los grandes modelos de lenguaje. Para quienes estén interesados, interesadas, sintonicen ese evento dentro de unos 40‑50 minutos y nos daremos cuenta del impacto.

Sin duda, uno de los ejes que se han estado conversando en este espacio es que, en un mar de datos, parece haber una laguna muy chiquitita de información sobre territorios o sobre los pueblos indígenas como tales, que ayude a nutrir un gran modelo de lenguaje.

Muchos especialistas que me antecedieron pusieron eso como un centro de debate, ya que eventualmente los modelos se entrenan con la información existente. Si no hay datos, si no hay investigación, si no evidenciamos el trabajo de cada uno de nuestros territorios y países, no podremos contar con los recursos suficientes para entrenar un gran modelo de lenguaje.

Eso también parte del hecho de cuáles son los esfuerzos; ese es el segundo punto que se están haciendo en la región. Desde Chile se está coordinando una iniciativa llamada ChatGPT Latinoamericano, que trata de apoyar y sistematizar la forma en la cual podemos entrenar un gran modelo de lenguaje con textos latinoamericanos, con información y posiciones latinoamericanas, para tratar de cerrar la brecha de sesgos mencionada previamente.

Creo que el principal tema que tenemos que evidenciar hoy es que necesitamos producir, sistematizar y ordenar. En un mar de datos parece que no hemos sido lo suficientemente eficientes en sistematizar los esfuerzos que cada uno de nuestros países puede aportar a instancias globales y mundiales que están liderando este proceso.

La inteligencia artificial no es una tecnología más;
es un esquema que debe usarse para cerrar brechas y crear espacios.

Lo otro que debemos entender es la forma en la cual vamos a tratar de sistematizar estas buenas experiencias. Uno de los panelistas nos explicó cómo han desarrollado un agente con inteligencia artificial. Creo que en cada país tenemos muy buenos ejemplos.

En el caso de Costa Rica, les puedo comentar que se desarrolló un diccionario del idioma Ngäbere construido con los mismos habitantes de los cinco territorios indígenas y está a disposición un glosario en el cual por primera vez se están identificando nuevos términos, atribuyendo nuevas palabras o estructuras gramaticales, aspectos que tal vez no eran tan claros. Y qué va a pasar de ahí en adelante, cómo podemos incluirlo en el acervo de conocimiento mundial.

Sin duda también hay ejemplos como atlases de territorios indígenas que han tratado sistematizar información de registros administrativos a partir de los censos de población y vivienda; pero cada uno de nuestros países en la región tiene una privacidad y cobertura distintas que imposibilita, en algunos momentos, contar con datos que sirvan para alimentar estos grandes modelos.

Hay una cantidad increíble de mejoras u oportunidades al trabajar con modelos de inteligencia artificial para reestructurar, completar información y contextualizar las diferentes convivencias que pueden tener los territorios indígenas o las poblaciones en general.

Pero lo que debemos empezar a visualizar es: ¿cuáles son esos planes de acción que tenemos que hacer? ¿Qué va a pasar con la sistematización o con la pérdida eventualmente de lenguas indígenas que se esté dando en el mundo? ¿Cómo podemos cerrar esa brecha que aludían las personas que me antecedieron respecto al desarrollo tecnológico y a la brecha digital?

Hoy y en los próximos años, la carrera no será necesariamente por el mejor modelo de lenguaje, sino por aquel que vaya a correr en dispositivos móviles, anteojos o relojes. Entonces, también tenemos que empezar a preparar la forma en la cual las diferentes poblaciones accederán a estos recursos. Hoy hablamos siempre de la necesidad de alfabetizar, pero también debemos pensar en cómo vamos a alfabetizar digitalmente y en inteligencia artificial a toda la población para encontrar un valor agregado.

La inteligencia artificial no es una tecnología más, ni un esquema neutral; es un esquema que debe usarse para cerrar brechas y crear espacios. No solo tenemos que ver su lado negativo, sino también las posibilidades; pero sin inversión, datos y conocimiento, de nada sirve tener los mejores modelos de lenguaje si no podemos socializarlos.

[1] Especialista en Estadística y Sistemas de Información, Líder del equipo de IA de la Universidad Estatal a Distancia , UNED, Investigador de proyectos del Centro de Investigación Observatorio del Desarrollo de la Universidad de Costa Rica UCR

.