Lenguaje, IA y entrenamiento del criterio humano

Cómo los modelos de lenguaje pueden ayudarnos a pensar mejor cuando los usamos para contrastar, revisar y entrenar el criterio humano, no para sustituirlo.

Introducción: lenguaje, incertidumbre y pensamiento

En Ordenar la incertidumbre: del razonamiento inferencial a la abducción humana en la IA defendía una idea de fondo: la IA no elimina la incertidumbre, sino que nos obliga a redistribuir el trabajo intelectual. La máquina funciona muy bien cuando el problema ya tiene alguna forma: reglas, patrones, datos, ejemplos o procedimientos. Pero el territorio más interesante sigue estando en otro lugar: en crear sentido, formular hipótesis y cambiar el marco desde el que miramos un problema.

Este texto continúa esa intuición y la lleva a un terreno más práctico. Si la IA no elimina la incertidumbre, sino que nos obliga a reorganizar nuestra relación con ella, entonces la pregunta ya no es solo qué puede hacer una máquina. La pregunta es qué tipo de pensamiento construimos al usarla. Y, para responderla, conviene empezar por una zona decisiva de nuestra vida mental: el lenguaje.

La tesis de fondo es sencilla: comprender cómo funciona el lenguaje no explica por sí solo la arquitectura técnica de un LLM, pero sí ayuda a entender qué clase de operación realiza: modela regularidades de uso lingüístico humano y produce nuevas secuencias verosímiles a partir de ellas. Desde ahí se entiende mejor por qué estos modelos son tan eficaces en ciertas tareas, dónde se encuentran sus límites y cómo podemos usarlos para mejorar nuestras propias operaciones de pensamiento.

El texto defiende tres ideas. Primero, que los LLM actúan sobre el lenguaje producido y, por eso, inciden en muchas operaciones intelectuales. Segundo, que su fluidez no equivale a comprensión, juicio ni responsabilidad sobre el sentido. Tercero, que su mejor uso no consiste en pensar por nosotros, sino en convertirse en una tecnología para descargar operaciones secundarias y generar material de contraste. Bien usada, la IA puede producir fricción fértil; mal usada, puede fabricar profundidad falsa: una forma de kitsch cognitivo.

Tomaremos aquí algunas ideas de Wittgenstein, sobre todo el concepto de juegos de lenguaje, sin convertir el texto en una clase de filosofía. La intuición que nos interesa es sencilla: para entender una palabra no basta con mirar qué objeto nombra o qué definición tiene en un diccionario; hay que mirar cómo se usa, en qué situación, con qué reglas, para hacer qué cosa y dentro de qué práctica humana.

Desde ahí se entiende algo decisivo: los LLM no trabajan con "palabras sueltas", sino sobre las huellas de uso humano del lenguaje. Y justamente ahí está su potencia y su límite. El punto de partida, por tanto, no es todo lo humano, sino una zona decisiva de lo humano: el lenguaje como medio con el que ordenamos, discutimos y transformamos buena parte de nuestros problemas.

I. Lo que la máquina hace con el lenguaje

Dicho de otro modo: si miramos los LLM con la atención que un filólogo presta a los textos -no como un depósito de palabras, sino como un sedimento de prácticas humanas-, sus capacidades dejan de ser un simple detalle técnico. Se convierten en el centro del asunto, porque muestran hasta qué punto el pensamiento se teje con operaciones lingüísticas.

Los LLM clasifican textos, traducen, resumen, extraen información, proponen lecturas de tono, reformulan ideas, generan versiones para públicos distintos, comparan enfoques, organizan corpus y sostienen conversaciones con una fluidez que hace poco parecía ciencia ficción de sobremesa.

Y esto importa porque muchas actividades que llamamos "intelectuales" pasan primero por operaciones lingüísticas. Pensar no es solo tener ideas flotando en la cabeza. Pensar es nombrar, ordenar, distinguir, relacionar, argumentar, matizar y encontrar la forma verbal de una intuición que todavía está a medio cocer.

El lenguaje no es solo un medio de comunicación: es una tecnología cognitiva con la que clasificamos el mundo, convertimos experiencias en conceptos, formulamos preguntas, construimos relatos y probamos argumentos.

Ahora bien, conviene distinguir niveles. En sentido estricto, un LLM opera sobre secuencias lingüísticas: aprende regularidades de uso y calcula continuaciones verosímiles. Cuando lo integramos en sistemas con buscadores, bases de datos, sensores, memoria, herramientas o acciones, puede recibir información externa y actuar en el entorno. Pero eso ya no es solo el modelo lingüístico: es una arquitectura ampliada. Esta distinción evita pedirle al modelo base lo que corresponde al sistema completo.

La potencia del LLM se debe a que el lenguaje humano deja huellas. Cada texto producido conserva rastros de usos, géneros, estilos, conceptos, instituciones, relaciones sociales y formas de interpretar el mundo. El modelo no accede directamente a la experiencia que produjo esas huellas, pero aprende a operar sobre ellas con enorme eficacia. Por eso puede imitar géneros, registros y operaciones discursivas: una disculpa, una explicación pedagógica, una hipótesis provisional, un resumen ejecutivo o una objeción filosófica.

El límite está en que operar sobre huellas no equivale a participar plenamente en las prácticas que las producen. Un texto no es solo una cadena de signos, y una lengua no es solo un depósito de frases posibles. El lenguaje humano existe en cuerpos, instituciones, oficios, escuelas, leyes, conversaciones, conflictos, tradiciones, clases sociales, tecnologías, memorias compartidas y formas de vida.

El modelo puede producir la forma verbal adecuada, pero no siempre posee las condiciones pragmáticas que vuelven real ese acto: una promesa compromete a alguien, una disculpa presupone responsabilidad y un diagnóstico se inscribe en una institución con consecuencias.

Aquí encaja la expresión "loro estocástico", si la usamos con cuidado. Un LLM no es un loro porque repite frases literalmente, sino porque produce lenguaje a partir de regularidades estadísticas: usos previos, contextos probables, patrones de continuación y cálculo de lo que encaja mejor en una secuencia. Pero esas regularidades no están vacías. Proceden de textos humanos ya cargados de mundo. Por eso, el modelo puede sonar inteligente: trabaja con lenguaje donde ya hay inteligencia humana sedimentada.

La clave es no confundir el manejo de significado con la comprensión humana. El modelo puede manejar formas de significado porque aprende regularidades de textos humanos ya cargados de mundo. Pero manejar regularidades de significado no equivale a comprender en sentido humano: no implica experiencia propia, responsabilidad, participación institucional ni capacidad para responder por las consecuencias de lo dicho. Su acceso al sentido es indirecto. Hereda el significado textual, pero no lo ancla por sí mismo.

Aquí surge el problema del grounding simbólico. Heredar el significado es recibir patrones ya estabilizados: saber qué palabras suelen ir juntas, qué tono corresponde a una situación o qué argumento aparece en un debate. Anclar el significado es poder comprobar, padecer, medir, usar o responder materialmente sobre aquello que se dice. Un modelo puede explicar con solvencia qué significa "dolor", distinguir matices médicos y redactar una respuesta empática; pero no siente dolor, no observa el cuerpo del paciente ni responde ante el daño de un mal consejo.

También por eso su uso exige cuidado. Cuando se multiplica la producción de lenguaje, puede multiplicarse también la inflación conceptual. Si todo es pensamiento, creatividad, criterio o inteligencia, esos conceptos dejan de cortar la realidad con precisión: se vuelven etiquetas prestigiosas, pero cada vez menos discriminantes. De ahí nace una de las derivas más peligrosas de la IA: el kitsch cognitivo, la apariencia de profundidad fabricada con fluidez verbal y conceptos prestigiosos sin anclaje práctico.

Desde ahí, la pregunta cambia. No basta con preguntar si una respuesta "suena" bien. Tenemos que preguntar qué estamos intentando hacer con esas palabras, qué reglas gobiernan ese uso, qué contaría como hacerlo bien o mal y qué consecuencias tendría aceptarlo.

De aquí se sigue una regla práctica: cuanto más cerrada, repetible y textualizada es una tarea, más razonable es usar el modelo para acelerar el trabajo; cuanto más abierta, situada o responsable es una tarea, más debemos tratar su respuesta como borrador, pista o candidato. Esta regla permite pasar de la teoría del lenguaje al uso cotidiano sin saltar de plano.

II. Usos seguros: descargar hojarasca intelectual

Hay un primer uso de la IA que es evidente, ya se está dando y, aun así, es poco glamuroso: liberar hojarasca intelectual.

Llamo hojarasca intelectual no a ciertas tareas en sí mismas, sino al uso preliminar, repetitivo o instrumental de esas tareas cuando todavía no exigen una interpretación profunda. Búsquedas iniciales, recopilación de información dispersa, resúmenes de orientación, clasificación de materiales, extracción de datos, comparación rápida de posturas, limpieza de notas, reformulaciones mecánicas o preparación de un primer mapa de un tema pueden ser operaciones decisivas o simple preparación del terreno. Depende del lugar que ocupen en el proceso.

Muchas de esas tareas pertenecen a usos del lenguaje ya muy estabilizados. Eso significa que sabemos bastante bien qué cuenta como hacerlo bien o mal: resumir sin perder lo esencial, traducir sin romper el registro, ordenar información por categorías, convertir notas dispersas en un esquema, localizar repeticiones, proponer ejemplos o cambiar el tono de un texto. No son fáciles en todos los casos, pero muchas veces son repetibles. Y lo repetible, cuando está lo suficientemente textualizado, es precisamente el terreno en el que un LLM puede ser muy fuerte.

Por eso no toda búsqueda, resumen o clasificación es hojarasca. En filología, investigación o documentación, construir un corpus, seleccionar fuentes o resumir críticamente puede ser una operación intelectual decisiva. La hojarasca surge cuando la tarea se limita a preparar el terreno.

Delegar esa hojarasca no necesariamente empobrece la inteligencia. Puede liberarla. No hay ninguna grandeza espiritual en pasar cuarenta minutos haciendo una búsqueda que una máquina puede dejar preparada en treinta segundos, siempre que luego sepamos mirar ese resultado con criterio.

Si antes invertíamos una hora en localizar materiales, agruparlos y obtener una primera orientación, ahora podemos usar esa energía en lo que importa: evaluar qué vale la pena, distinguir lo central de lo accesorio, detectar sesgos, reconocer límites, jerarquizar ideas, formular una hipótesis y decidir qué cuenta como una buena explicación. El peligro aparece cuando confundimos descargar trabajo con descargar juicio.

Buscar información no es comprenderla. Resumir un texto no es interpretarlo. Generar argumentos no es tener criterio. Producir lenguaje no equivale a pensar.

Precisamente porque el LLM trabaja bien con formas lingüísticas, puede ayudarnos a ordenar, resumir, comparar y reformular. Pero precisamente porque no habita el mundo que da sentido a esas formas, no debe decidir por nosotros qué importa, qué vale, qué significa o qué consecuencias asumimos. La IA puede devolver materiales. El trabajo intelectual empieza cuando decidimos qué hacer con ellos.

En este primer uso, por tanto, la IA funciona, sobre todo, como acelerador de operaciones estabilizadas. Prepara mapas, limpia materiales, agrupa datos y reduce la fricción instrumental. Su valor radica en liberar tiempo y atención, no en resolver el núcleo del pensamiento.

Descargar la hojarasca puede ahorrar energía. Pero pensar mejor no consiste solo en ahorrar energía: consiste en usarla contra nuestras propias inercias. Ahí empieza el segundo uso.

III. Usos de contraste: el LLM como generador de fricción

El segundo uso es más interesante y también más delicado. No consiste en pedir al LLM que diagnostique nuestro pensamiento como si tuviera sensibilidad pragmática plena, sino en pedirle que genere candidatos: posibles objeciones, posibles presupuestos, posibles juegos de lenguaje, posibles contraejemplos, posibles reformulaciones. Su valor no está en que sean verdaderos por defecto, sino en que nos obligan a decidir si tienen alcance real.

Aquí se unen ambos momentos del buen uso. Primero, la máquina descarga operaciones secundarias: ordena, resume, compara, reformula y propone regularidades textuales. Segundo, convertimos ese resultado en material de contraste: revisamos qué deja fuera, qué presupone, qué exagera, qué confunde y qué posibilidades abre. El criterio se ejercita precisamente en ese paso de ida y vuelta.

Esto no vale lo mismo para todos los dominios. En una discusión conceptual, literaria, educativa o argumentativa, un candidato puede presentarse como útil, aunque sea provisional, dado que su función es abrir una revisión. En una decisión médica, jurídica, técnica o materialmente peligrosa, ese mismo candidato no basta: necesita fuentes verificables, conocimiento experto, datos del caso y responsabilidad institucional. El modelo puede ayudar a preparar preguntas, pero no sustituir el juicio situado que decide.

Ahora bien, para que esa preparación sea fértil, conviene tener claro hacia dónde apunta el pensamiento que queremos ejercitar. De ahí que necesitemos fijar el horizonte.

Prácticas que cambian el marco

Para entender qué significa pensar mejor con IA, necesitamos fijar primero el horizonte. No porque vayamos a pedirle a la máquina que haga ciencia, arte o literatura por nosotros, sino porque esas prácticas muestran que el pensamiento humano no se limita a continuar lo probable. A veces pensar es cambiar el marco desde el que algo se vuelve visible.

Por eso importan prácticas en las que el lenguaje no solo repite lo disponible, sino que cambia el modo de ver: la ciencia cuando formula una hipótesis ante una anomalía. El arte, cuando encuentra una forma para una experiencia todavía confusa, la literatura, cuando inventa una ficción capaz de decir algo verdadero sobre la realidad. No son adornos culturales del argumento. Son ejemplos de usos del lenguaje en los que pensar significa salir de un marco y poner una forma nueva a prueba.

En el texto anterior ya aparecían capacidades como la abducción, la lateralidad, la hermenéutica o el juicio. Aquí no se trata de repetirlas, sino de preguntarnos cómo se aplican al usar la IA. Desde esta perspectiva, esas operaciones no son facultades abstractas desconectadas del lenguaje. Son prácticas situadas: maneras de cambiar el uso de las palabras, revisar qué se cuenta como una buena respuesta, mover un problema de marco y asumir la responsabilidad de lo que una formulación hace en el mundo.

También por eso pueden fallar. La abducción puede convertirse en ocurrencia; la lateralidad, en extravagancia; la hermenéutica, en sobreinterpretación; y el juicio, en prejuicio con buena retórica. Lo humano no es infalible: es responsable. Su valor no está en acertar siempre, sino en poder revisar, contrastar, responder y corregir en una práctica compartida.

La abducción no solo añade una frase plausible ante una anomalía; propone un nuevo modo de describir el problema para que algo de la realidad pueda volverse visible, discutible y contrastable. La lateralidad rompe la inercia de los usos más probables: desplaza una metáfora, cambia una categoría, mira el mismo problema desde otro juego de lenguaje y abre un camino que no estaba contenido en la continuación más probable.

La hermenéutica no se limita a resumir lo dicho; reconstruye situaciones, intenciones, silencios, tradiciones, ironías, conflictos y condiciones de recepción. El juicio decide qué distinción importa, qué regla se aplica, qué excepción cambia el caso y qué consecuencias asumimos al formular una tesis.

Estas operaciones importan porque son las que permiten salir de la inercia de lo conocido. La ciencia no avanza solo acumulando datos, sino cuando una hipótesis reformula la anomalía; el arte y la literatura, cuando una forma inédita tensa nuestra percepción de lo real. En los tres casos, el lenguaje trabaja en contra de lo probable, no a su favor. Este es el horizonte: un pensamiento que cambia el marco.

La cuestión práctica es si un LLM puede ayudarnos a acercarnos a ese horizonte. Por sí solo no produce una abducción científica ni una necesidad expresiva artística, pero sí puede generar variaciones, analogías y marcos posibles a partir de lo ya textualizado. Esa ayuda es modesta, pero no trivial: nos brinda material para ensayar desplazamientos de mirada. El salto sigue siendo comprobar si alguna de esas formas abre mundo o solo lo decora.

Candidatos, contraste y trazabilidad

Por eso el uso más fértil de un LLM no es delegar en él la enunciación, sino utilizarlo como herramienta de fricción discursiva. Si el lenguaje es el medio con el que ordenamos nuestro pensamiento, a menudo quedamos atrapados en nuestra propia circularidad verbal: usamos los mismos clichés, metáforas cómodas y estructuras sintácticas autojustificativas.

Como "gimnasio de pensamiento", la IA funciona como un generador de alteridad discursiva. Al confrontar nuestras formulaciones con el modelo, no buscamos un oráculo que valide nuestras tesis ni un juez que las refute. Buscamos material plausible ante el que tengamos que reaccionar. Ese matiz importa: el modelo no garantiza la objeción verdadera, pero puede producir fricción suficiente para que nosotros revisemos mejor.

Muchas confusiones no nacen de que nos falten datos, sino de que una palabra se ha salido de su uso preciso y empieza a comportarse como si nombrara una cosa clara cuando, en realidad, mezcla usos distintos. "Inteligencia", "creatividad", "pensamiento", "autoría", "comprensión" o "criterio" son buenos ejemplos.

La IA no detecta esos enredos por nosotros en sentido fuerte. Puede sugerir presupuestos implícitos, contraejemplos, metáforas dominantes, contradicciones pragmáticas o distinciones conceptuales posibles. Algunas sugerencias serán triviales, otras forzadas y, alguna, puede tocar el nervio del problema. La tarea intelectual empieza al separar unas de otras.

Por eso conviene formular las peticiones como pruebas de revisión, no como sustitutos del razonamiento: "Dame posibles puntos ciegos", "formula la versión más fuerte de la postura contraria", "dime qué tendría que comprobar para saber si este contraejemplo importa".

La diferencia es decisiva. No pedimos al modelo que determine la verdad de nuestro argumento, sino que produzca materiales posibles para que nosotros los podamos contrastar. Pero el orden importa. Si acudimos a la IA antes de haber formulado nuestra propia tesis y antes de haber intentado objetarla por nosotros mismos, no estamos entrenando el pensamiento: estamos externalizando demasiado pronto una de sus operaciones centrales. La IA debería entrar después del primer esfuerzo, no en su lugar.

Pongamos un caso sencillo. Imaginemos que partimos de esta tesis: "La IA empobrece la escritura". Un uso pobre de la IA sería pedirle diez argumentos a favor y quedarnos con los que suenen mejor. Eso no ejercita el pensamiento; lo maquilla.

Un uso formativo sería distinto. Primero formularíamos la tesis sin IA y trataríamos de entender qué experiencia o preocupación la sustenta. Después buscaríamos nuestras propias objeciones: en qué casos la IA podría mejorar la escritura, qué autores, estudiantes o profesionales podrían beneficiarse de ella, qué operaciones podría liberar y qué nuevas prácticas podría abrir. Solo entonces tendría sentido pedirle al modelo que ampliara el contraste: presupuestos ocultos, contraejemplos, distinciones o marcos alternativos que no habíamos visto.

Al final, la tesis inicial tendría que cambiar. Quizá ya no diríamos "la IA empobrece la escritura", sino algo más preciso: "La IA empobrece la escritura cuando sustituye la experiencia, el conflicto y el juicio del autor por una superficie verbal suficiente; pero puede mejorarla cuando se usa para preparar, contrastar o revisar un pensamiento que sigue siendo humano". La idea no se ha debilitado. Se ha vuelto más resistente.

Es verdad que un LLM bien guiado podría producir por sí solo una reformulación similar. Esa objeción es importante. La diferencia no está en que la máquina sea incapaz de escribir la frase final, sino en quién reconoce su valor, quién descarta las versiones débiles, quién comprueba si el matiz responde al problema real y quién se hace responsable de sostener esa tesis después. El criterio humano no consiste en fabricar cada palabra manualmente, sino en dirigir el proceso, seleccionar, verificar, asumir y volver a pensar desde el resultado.

Para que esto no sea simplemente "tener la última palabra", necesitamos exigir trazabilidad. Al usar IA, tendríamos que poder explicar por qué aceptamos una reformulación y rechazamos otra, qué evidencia o experiencia la respalda, qué límite hemos descubierto y qué cambio real hemos introducido en la posición inicial. El criterio no se demuestra porque el humano firme el resultado, sino porque puede reconstruir el camino que lo llevó hasta ahí.

Fricción fértil y kitsch cognitivo

Este reencuadre resuelve una parte importante del problema. La IA no es un gimnasio porque planteé objeciones certeras. Lo es porque nos brinda muchas oportunidades para ejercitar el músculo de la evaluación pragmática. Nos pone delante materiales que suenan posibles y nos obliga a decidir si son fecundos, superficiales o directamente equivocados.

Una sugerencia genera fricción fértil cuando obliga a revisar un presupuesto real, cuando encuentra un contraejemplo que podemos comprobar, cuando señala una distinción que no habíamos hecho y que cambia de verdad el problema, o cuando desplaza el marco de tal manera que vemos algo que antes quedaba oculto.

En cambio, una sugerencia se vuelve kitsch cognitivo cuando suena profunda pero no modifica nada. Cuando la sofisticación verbal no se corresponde con ninguna diferencia práctica. Cuando una objeción parece brillante en abstracto, pero al bajarla a la situación concreta no toca ninguna evidencia, ninguna experiencia, ninguna consecuencia. Cuando produce la apariencia de pensamiento sin obligarnos a pensar mejor.

El riesgo kitsch de la IA se debe a que puede fabricar superficies verbales verosímiles de profundidad sin necesidad expresiva ni conflicto real con el mundo. Puede imitar la forma de una intuición, la cadencia de una objeción, la textura de una explicación compleja. Pero su valor depende de que sepamos distinguir entre ocurrencia, ruido y descubrimiento. Y esa distinción no se resuelve con más fluidez, sino con contraste.

Aquí surge el problema de la inflación conceptual, porque el kitsch se alimenta de ella: la profusión de palabras prestigiosas sin anclaje práctico es justo la materia prima de la profundidad falsa. Pedir muchos candidatos no debería significar aceptar muchas palabras nuevas, muchas distinciones nuevas o muchos marcos nuevos sin coste. Justo al contrario: la abundancia obliga a filtrar.

Una distinción solo merece quedarse si aumenta la precisión, si reduce la confusión, si permite ver una consecuencia o si cambia una decisión. Si solo añade vocabulario prestigioso, no ha pensado más: ha inflado el texto.

Por eso el hábito decisivo no es creer ni desconfiar automáticamente. Es preguntar: qué cambia si aceptamos esta sugerencia, qué prueba la sostiene, qué experiencia la confirma o la desmiente, qué consecuencias tendría usarla, qué parte de nuestro argumento queda realmente afectada. Si no cambia nada, se descarta. Si cambia algo pero no podemos justificarlo, se deja en suspenso. Si cambia algo y podemos reconstruir por qué, entra provisionalmente en el pensamiento.

Consecuencias educativas

Esto tiene una aplicación educativa directa. Si el problema es lingüístico y pragmático, no deberíamos limitar la educación a prohibir o permitir determinadas herramientas. Deberíamos enseñar una secuencia: formular una tesis propia, intentar desmontarla sin ayuda, usar la IA para ampliar el campo de objeciones y revisar después qué sirve y qué no sirve. La IA puede hacer visible esa diferencia si el ejercicio no termina en la respuesta generada, sino en la revisión del juicio que la acepta o la descarta.

En lugar de prohibir o pedirles a los alumnos que usen la IA para buscar argumentos que elaboren, decoren o refuercen su creencia inicial, podríamos hacer lo contrario: darles una creencia, una tesis o un argumento y pedirles que busquen las mejores razones para desmontarlo. No se trata de educar en el relativismo ni en la sospecha permanente. Se trata de enseñar que una idea no se vuelve sólida por la acumulación de apoyos, sino por resistencia al contraste.

Un alumno que solo busca argumentos a favor aprende a defenderse. Un alumno que aprende a buscar argumentos en contra empieza a pensar. Y esto, en tiempos de opiniones blindadas, no es una habilidad menor.

La IA puede convertirse así en una herramienta para ejercitar el sistema crítico: proponer contradicciones posibles, separar premisas de conclusiones, sugerir diferencias entre evidencia y retórica, formular posibles falacias, comparar marcos teóricos, señalar puntos ciegos y ayudar a reconstruir una posición más sólida después de haberla puesto en crisis. Pero el aprendizaje no está en aceptar esa lista. Está en compararla con el propio esfuerzo previo y revisar qué cambia.

Una actividad posible sería pedirle al alumno cuatro entregas. Primero, su tesis inicial, escrita antes de usar la IA. Segundo, su mejor objeción propia, también antes de usar la herramienta. Tercero, el mejor candidato de objeción que haya conseguido construir con ayuda de la IA, incluyendo posibles presupuestos ocultos, contraejemplos y razones no lógicas que expliquen por qué alguien podría sostener la posición contraria. Cuarto, una reformulación final más precisa, más matizada y más fuerte que la primera.

La evaluación no premiaría estar de acuerdo con la máquina. Tampoco premiaría acumular citas, argumentos o párrafos bonitos. Premiaría la trazabilidad del juicio: haber pensado antes de delegar, haber distinguido mejor, haber reconocido una objeción pertinente, haber identificado un límite, haber cambiado una formulación y haberle podido explicar por qué la versión final es más fuerte que la inicial.

También puede convertir la humildad intelectual en un procedimiento. Podemos pedirle que genere pruebas de revisión: cambiar los protagonistas de un argumento, invertir el signo de una evidencia, separar una idea del grupo que la defiende o preguntar si mantendríamos una postura si no fuera ya nuestra. No porque la máquina tenga la última palabra, sino porque nos ayuda a escenificar cambios de perspectiva que normalmente evitamos.

Este uso es más exigente que pedir respuestas. También es menos cómodo. Obliga a aceptar que muchas veces no queremos pensar, sino tener razón. Y la IA, mal usada, puede darnos la razón con una facilidad obscena.

Conclusión: sintaxis artificial, criterio humano

La buena pregunta no es: "¿Qué puede hacer la IA?". Puede hacer muchas cosas. Tampoco es, en el fondo, "¿cómo eliminamos la incertidumbre?", sino "¿en qué empleamos la energía intelectual que la máquina nos libera?". Porque la pregunta decisiva es: "¿qué tipo de sujeto produce el uso que hacemos de la IA?".

Si la usamos para ahorrar todo esfuerzo, produce dependencia. Si la usamos para confirmar nuestras creencias, produce un dogmatismo asistido. Si la usamos para generar lenguaje sin pensamiento, produce kitsch cognitivo: mucho texto, poca vida mental.

Pero si la usamos después de un primer esfuerzo propio, para descargar lo repetitivo y convertir sus respuestas en fricción crítica, puede convertirse en una tecnología de formación intelectual. No piensa por nosotros. Nos obliga, si la usamos bien, a responder mejor a lo que nos devuelve.

Comprender el lenguaje nos permite usar los LLM sin adorarlos ni despreciarlos: no como sujetos que deciden en nuestro lugar, sino como tecnologías de trabajo lingüístico. Pueden ordenar y tensionar una idea, pero no decidir por nosotros qué merece decirse ni qué consecuencias asumimos al decirlo.

Porque lo específicamente humano no es producir más texto. Es crear sentido allí donde todavía no lo había.