Adoctrinamiento no significa agenda oculta. Significa transmisión sistemática de un marco de valores sin que el receptor sea consciente del mecanismo ni tenga acceso a alternativas equivalentes. Esa definición aplica con precisión a lo que ocurre cuando un modelo de lenguaje responde preguntas existenciales a escala masiva.
Las tres condiciones que ya están cumplidas
Para que un sistema transmita valores de forma no consciente, necesita tres condiciones. La primera es input sesgado en etapas críticas de alineación. El summit de Anthropic con líderes cristianos en marzo de 2026 no fue una consulta simbólica: según los participantes que hablaron con The Washington Post, los investigadores de interpretabilidad de la empresa estuvieron activamente involucrados. Esas son las personas que trabajan para entender por qué el modelo genera los outputs que genera. Su presencia en las discusiones sobre duelo, suicidio y sentido de vida no es decorativa.
La segunda condición es escala. Claude tiene decenas de millones de usuarios activos. Cuando un modelo con un determinado perfil cultural responde preguntas sobre el suicidio, sobre cómo hablar con un hijo que perdió la fe, sobre si hay sentido en el sufrimiento, lo hace miles de veces por segundo en contextos donde el usuario asume que está recibiendo algo cercano a una respuesta neutral. No es así — lo que está recibiendo es la síntesis cultural de lo que el modelo aprendió sobre esos temas.
La tercera condición es invisibilidad del mecanismo. El usuario de Claude no sabe qué consultas religiosas informaron la respuesta que recibe. No hay aviso, no hay declaración de origen cultural, no hay posibilidad de elegir un marco alternativo. La interacción simula neutralidad porque el modelo no dice "según el marco cristiano-occidental que me fue enseñado." Simplemente responde.
El efecto existe independientemente de la intención. Que el proceso haya sido bien intencionado no reduce la escala de la influencia ni transfiere la responsabilidad a nadie más.
Los temas donde el marco importa más
No todos los temas son igualmente sensibles al sesgo cultural. Las matemáticas no cambian según la tradición religiosa del modelo. Pero hay un conjunto de preguntas donde el marco cultural de la persona determina la respuesta tanto como los hechos: cómo procesar el duelo, si el suicidio puede tener justificación, qué significa una vida con sentido, qué se le debe decir a alguien que está perdiendo la fe.
Estos son exactamente los temas que Anthropic discutió en su summit de marzo de 2026. Son también los temas donde la divergencia entre tradiciones religiosas es mayor y más consecuente. Un modelo con input cristiano sobre el suicidio responde con diferentes énfasis que uno entrenado con marcos budistas o islámicos sobre el mismo tema. Ninguno de los dos es necesariamente correcto o incorrecto — pero el usuario que los recibe no sabe desde cuál posición está hablando el sistema.
Por qué "no fue intencional" no es un argumento suficiente
Meghan Sullivan, filósofa de Notre Dame que participó en el summit de Anthropic, dijo a los medios que salió convencida de que el interés de la empresa era genuino. Eso es perfectamente compatible con que el resultado tenga consecuencias no previstas y no supervisadas. La historia tecnológica está llena de efectos a escala que sus creadores no querían y que ocurrieron de todas formas.
Lo que falta no es buena intención — es estructura de rendición de cuentas. No hay auditoría externa sobre qué cambios específicos produjeron estas consultas en el comportamiento del modelo. No hay transparencia sobre qué preguntas se discutieron y qué respuestas del modelo se consideraron problemáticas. No hay mecanismo para que un usuario budista en Bangkok, un musulmán en Karachi o un ateo en Guadalajara cuestionen el marco cultural desde el que el sistema fue afinado. Y no hay ninguna empresa del sector — no solo Anthropic — que haya implementado esa estructura voluntariamente.
El problema no es que Anthropic consultó a líderes religiosos. Es que lo hizo sin contárselo a nadie, sin auditoría, con investigadores de interpretabilidad en la sala, y con consecuencias que afectan a usuarios que nunca eligieron ese marco.

