La IA que no necesita internet: soberanía en tu bolsillo

IA que no necesita internet: mujer usando smartphone sin conexión en entorno urbano


Toda la IA que usas hoy envía tus datos a servidores que no controlas, procesa tu información en hardware que no es tuyo y puede desaparecer mañana si la empresa decide cambiar sus precios o cerrar el servicio. Hay una arquitectura alternativa en construcción que invierte esa lógica. Su nombre no importa tanto como lo que implica: la inteligencia artificial que corre directamente en tu dispositivo, sin conexión, sin nube, sin intermediarios. Y va a cambiar quién tiene el control.

Qué es realmente la IA en dispositivo

La on-device AI es inteligencia artificial que se ejecuta en el chip de tu teléfono, tableta o computadora. Todo el procesamiento ocurre localmente: el texto que escribes, las imágenes que analizas, las tareas que automatizas. Ningún dato sale del dispositivo. No hay latencia de red. No hay empresa que vea lo que preguntas.

La distinción técnica que hace posible esto es la unidad de procesamiento neuronal —el NPU—, un chip diseñado específicamente para ejecutar operaciones de IA de forma eficiente en hardware móvil. Los teléfonos de gama alta de 2024 y 2025 ya los tienen integrados. Los modelos que corren sobre esos chips son versiones comprimidas de los grandes modelos de lenguaje: más pequeños, más rápidos, más limitados en alcance, pero funcionales para las tareas que la mayoría de las personas realizan cotidianamente.

Dónde está hoy: el presente desigual

Google tiene desplegado Gemini Nano —entre 1,800 y 3,250 millones de parámetros, aproximadamente 1 gigabyte de peso— en teléfonos Pixel 8 y 9, Samsung Galaxy S24 y S25, y otros modelos de Xiaomi y Motorola. Opera sin conexión, responde en menos de 100 milisegundos y entiende tanto texto como imágenes. Apple tiene Apple Intelligence funcionando en iPhone 15 Pro, iPhone 16 y chips de la serie M, con un modelo base que corre íntegramente en el dispositivo para tareas como resúmenes y correcciones.

El movimiento estructural más relevante de 2026 en este frente es el acuerdo entre Apple y Google anunciado el 12 de enero, que establece que la próxima generación de modelos de Apple Intelligence se construirá sobre tecnología Gemini. El acuerdo incluye que Apple puede destilar ese modelo —de escala masiva— en versiones compactas diseñadas para correr completamente en dispositivo. Es la primera vez que dos de las tres empresas con mayor control sobre hardware personal del mundo alinean su estrategia de IA alrededor de la inferencia local.

La limitación real hoy es de acceso: los chips que soportan IA en dispositivo están en teléfonos de gama alta. En México y América Latina, ese segmento representa una fracción minoritaria del mercado total. La promesa tecnológica está disponible para quienes ya pueden pagarse el hardware más caro.

Qué cambia y cuándo: el horizonte de democratización

IA que no necesita internet: smartphone sobre mesa con cables desconectados sin conexión

La trayectoria de costos de los chips de IA apunta en una dirección consistente. Qualcomm, MediaTek y Samsung tienen hojas de ruta activas para llevar capacidades de NPU a segmentos de precio medio para 2027 y 2028. Si esa trayectoria se sostiene —y los precedentes históricos de otros chips especializados sugieren que sí—, la IA en dispositivo dejará de ser privilegio de gama alta y se volverá estándar de mercado antes de 2030.

Cuando eso ocurra, las consecuencias serán más profundas que la conveniencia técnica. La soberanía de datos, que hoy es un concepto abstracto en la mayoría de las conversaciones sobre privacidad, se volverá una característica de producto que los fabricantes competirán por ofrecer. Los gobiernos de América Latina que hoy debaten leyes de datos tendrán que legislar sobre un ecosistema donde una porción creciente del procesamiento de IA nunca saldrá del dispositivo del usuario. Las regulaciones que asumen que los datos viajan a servidores centralizados quedarán desactualizadas antes de que terminen de redactarse.

Para las empresas, el impacto llegará por el lado de los costos. Según datos de mercado para aplicaciones móviles, procesar localmente puede reducir hasta un 90% los costos de inferencia en la nube. Cuando esa reducción esté disponible en hardware de precio accesible, la economía de las aplicaciones de IA cambia radicalmente: los modelos de negocio basados en cobrar por llamadas a API enfrentarán competencia de aplicaciones que simplemente no necesitan esa infraestructura.

Por qué importa en México y LATAM: el problema de la conectividad

En la región hay un problema de infraestructura que la IA en dispositivo resuelve directamente: la conectividad irregular. En zonas urbanas con cobertura deficiente, en municipios rurales, en edificios con señal inestable, la IA que depende de la nube simplemente no funciona. La IA en dispositivo funciona sin señal. Eso no es un detalle técnico menor; es una diferencia de acceso real para millones de personas.

El Foro Latinoamericano de Datos, en sus sesiones más recientes, ha posicionado la soberanía de datos como un valor central del desarrollo tecnológico de la región. Pero la soberanía de datos a nivel nacional —leyes, servidores locales, restricciones a transferencias transfronterizas— es mucho más difícil de implementar que la soberanía de datos a nivel individual que ofrece la IA en dispositivo. Un teléfono que no envía datos a ningún servidor externo es, en la práctica, la forma más directa de soberanía de datos disponible hoy.

La paradoja de la descentralización

Hay un problema estructural que el entusiasmo por la IA en dispositivo oscurece: los modelos que correrán localmente en tu teléfono serán, en su mayoría, destilaciones de los mismos tres o cuatro modelos gigantes que hoy dominan el mercado global. Gemini de Google ahora alimenta la IA en iOS, Android y Samsung. Los modelos de OpenAI sustentan el ecosistema de Microsoft. Los de Anthropic impulsan Amazon. La ejecución se descentraliza; la dependencia de los modelos fundacionales no desaparece.

El riesgo de largo plazo es que la IA en dispositivo produzca la ilusión de independencia mientras consolida una dependencia estructural más profunda: si el modelo que corre en tu teléfono es una destilación de Gemini, y Gemini cambia sus valores o sus restricciones en la próxima actualización, tu teléfono cambiará con él. La arquitectura distribuida no resuelve el problema del control centralizado sobre los modelos. Solo lo hace menos visible.

Lo que nadie te cuenta sobre la IA. Sin ads, sin spam. Cancela cuando quieras, sin drama.
Suscríbete

Cookies

Usamos cookies para mejorar tu experiencia. Política de privacidad.