Estudio del MIT: la IA pasa el mínimo laboral, no más

evaluación IA MIT: mujer revisa hoja de resultados frente a línea automatizada de producción


El MIT probó 41 modelos de lenguaje en más de 11,000 tareas reales del mercado laboral. La IA aprobó. Pero apenas. Y eso desmonta tanto el relato del apocalipsis como el del reemplazo total.

Qué midió el estudio y cómo

El equipo del MIT usó 41 modelos de lenguaje distintos —incluyendo versiones de Claude, Gemini y ChatGPT— para evaluar tareas de texto en múltiples categorías laborales definidas por el Departamento de Trabajo de Estados Unidos. Los resultados no fueron calificados por algoritmos: los evaluaron profesionales con experiencia real en cada puesto. La escala iba de 1 a 9. El umbral de lo aceptable: 7.

El número que lo resume todo

Al corte de finales de 2025, los modelos alcanzaron esa calificación mínima en aproximadamente el 65% de las tareas. Suena bien hasta que se lee la otra cara: en tareas complejas —de múltiples pasos, creativas o de alta precisión—, la probabilidad de obtener una calificación "superior" nunca superó el 50%. La IA llega al piso. Rara vez sube al techo.

La IA como becario desmotivado: entrega lo suficiente para no ser despedida, pero no lo suficiente para sorprender a nadie.

Fortune también señala que la IA tiene una tasa de éxito menor en roles técnicos especializados como los del área legal y tecnología, mientras que se desempeña mejor en las tareas de texto asociadas a sectores como construcción y mantenimiento. No son números de sustitución masiva. Son números de asistente con rendimiento irregular que depende del tipo de trabajo.

Cuando la automatización falla en público

El mismo medio documenta varios casos recientes que ilustran exactamente ese límite. El año pasado, Deloitte entregó dos reportes a clientes gubernamentales en Australia y Canadá que resultaron repletos de fabricaciones. Medios como CNET y Sports Illustrated fueron sorprendidos publicando artículos generados por IA bajo firmas inventadas. Y un despacho de abogados se disculpó públicamente ante un tribunal de quiebras después de que se descubrieran citas falsas generadas por IA en uno de sus expedientes. No son excepciones aisladas: son el costo real de empujar la automatización más allá de lo que los modelos actuales pueden sostener.

Lo que el estudio no resuelve

El 65% de tareas aprobadas con calificación mínima no es un techo: es una fotografía de finales de 2025. Según Fortune, los investigadores del MIT estiman que la tasa de éxito aumenta hasta 11 puntos porcentuales por año conforme los modelos mejoran. Para 2029, los autores proyectan que la mayoría de los modelos alcanzará entre el 80% y el 95% de las tareas con calificación mínima. Lo que hoy es rendimiento mediocre puede ser rendimiento sólido en tres años. El estudio no cierra el debate sobre el futuro del trabajo; establece dónde estamos hoy, con una metodología que usó evaluadores humanos reales en lugar de benchmarks automáticos.

Como escribieron los propios investigadores: la automatización masiva en sectores con baja tolerancia al error todavía está lejos. Esa distancia no es para siempre.

Lo que nadie te cuenta sobre la IA. Sin ads, sin spam. Cancela cuando quieras, sin drama.
Suscríbete

Cookies

Usamos cookies para mejorar tu experiencia. Política de privacidad.