La irrupción de ChatGPT a finales de 2022 marcó un punto de inflexión en la percepción y uso de la inteligencia artificial (IA). En solo un mes, la plataforma atrajo a más de 100 millones de usuarios, evidenciando su potencial para transformar la sociedad en áreas tan diversas como la comunicación, el empleo y, especialmente, la educación. Sin embargo, mientras las herramientas de IA se incorporan cada vez más en la enseñanza superior, emergen tanto oportunidades como retos significativos para la evaluación y el aprendizaje.
Un estudio reciente realizado por investigadores de la Escuela de Ciencias de la Computación y Comunicación (IC) de la École Polytechnique Fédérale de Lausanne (EPFL) se posiciona como un análisis pionero en esta área. Publicado en la prestigiosa revista Proceedings of the National Academy of Sciences (PNAS), este trabajo examina cómo los modelos de lenguaje grande (LLMs, por sus siglas en inglés) como GPT-3.5 y GPT-4 pueden desempeñarse en evaluaciones académicas de educación superior, planteando preguntas críticas sobre su impacto en la enseñanza y las metodologías de evaluación.
Evaluando la IA en la Educación Superior
El equipo de EPFL analizó el desempeño de los LLMs en 50 cursos que abarcan nueve programas de licenciatura, maestría y educación en línea en disciplinas STEM como ciencias computacionales, matemáticas, biología, química, física y ciencias de los materiales. “Gracias a la colaboración de un gran consorcio de profesores, docentes y asistentes de enseñanza, logramos recopilar el conjunto de datos más amplio hasta la fecha de materiales de curso, evaluaciones y exámenes”, explicó Antoine Bosselut, profesor asistente y líder del Laboratorio de Procesamiento de Lenguaje Natural en EPFL.
Los investigadores utilizaron ocho estrategias de generación de respuestas para evaluar el rendimiento de GPT-3.5 y GPT-4. Los resultados fueron sorprendentes: GPT-4 respondió correctamente al 65.8% de las preguntas en promedio, y alcanzó una precisión del 85.1% en al menos una estrategia de formulación. Esto, incluso utilizando los enfoques más básicos, destacó el potencial de estas herramientas para responder con precisión a una amplia gama de desafíos académicos.
“Nos sorprendieron los resultados; nadie esperaba que los asistentes de IA lograran porcentajes tan altos de respuestas correctas en tantos cursos”, señaló Anna Sotnikova, científica del laboratorio y coautora del estudio.
Los desafíos de la evaluación y el aprendizaje
El impacto de la IA en la educación plantea dos tipos principales de vulnerabilidades, según los investigadores. Por un lado, la vulnerabilidad en la evaluación, que implica que los métodos tradicionales de evaluación pueden ser manipulados por estas herramientas. Por otro lado, la vulnerabilidad educativa, que sugiere que el uso excesivo de la IA podría interrumpir los procesos cognitivos que los estudiantes necesitan para desarrollar habilidades fundamentales.
“La preocupación radica en que si estos modelos son tan capaces como indicamos, los estudiantes podrían evitar los pasos necesarios para aprender nuevos conceptos”, afirmó Bosselut. Esto podría generar una base más débil de conocimientos, dificultando la comprensión de temas más complejos en etapas posteriores.
Además, los modelos de IA como GPT-4 están en constante evolución, lo que plantea un desafío aún mayor. “El modelo que utilizamos tenía dificultades con preguntas matemáticas. Hoy en día, ya existen modelos especializados para matemáticas, por lo que si repitiéramos el estudio, los resultados probablemente serían más altos”, añadió Sotnikova.
Adaptación del sistema educativo
Ante estos desafíos, los investigadores de EPFL proponen cambios sustanciales en la forma en que se diseñan las evaluaciones académicas. “A corto plazo, deberíamos impulsar evaluaciones más complejas, no necesariamente en dificultad, sino en la integración de múltiples habilidades y conceptos aprendidos a lo largo del curso”, sugirió Bosselut.
Este enfoque, que promueve el aprendizaje basado en proyectos, no solo ayuda a mitigar las limitaciones de la IA, sino que también beneficia a los estudiantes al fomentar habilidades prácticas y colaborativas.
A largo plazo, los sistemas educativos deben adaptarse para aprovechar las fortalezas de la IA sin comprometer el desarrollo de competencias esenciales. Pierre Dillenbourg, vicepresidente de Asuntos Académicos en EPFL, destacó la necesidad de abordar cuestiones clave: “¿Qué nuevas habilidades requerirán los graduados del futuro? ¿Qué habilidades se están volviendo obsoletas? ¿Cómo proporcionamos retroalimentación a gran escala y medimos el conocimiento?”
Un futuro educativo con IA
La introducción de modelos de lenguaje en la educación recuerda el impacto que tuvo la llegada de las calculadoras. Beatriz Borges, estudiante de doctorado en EPFL y coautora del estudio, lo explica así: “Cuando las calculadoras fueron introducidas, hubo preocupaciones similares de que los estudiantes no aprenderían matemáticas. Hoy en día, las calculadoras no se permiten en niveles básicos, pero se esperan en niveles más avanzados para concentrarse en habilidades más complejas.”
Del mismo modo, se prevé una adaptación gradual en el uso de los modelos de IA. La clave estará en equilibrar las herramientas tecnológicas con los métodos de enseñanza tradicionales, asegurando que los estudiantes adquieran tanto habilidades fundamentales como competencias avanzadas.
El estudio de EPFL concluye con recomendaciones prácticas para reducir riesgos y maximizar beneficios:
- Desarrollo de evaluaciones integradoras: Diseñar tareas que combinen habilidades múltiples y fomenten el pensamiento crítico.
- Formación docente: Equipar a los educadores con las herramientas necesarias para integrar la IA en sus metodologías.
- Enseñanza de competencias digitales: Preparar a los estudiantes para trabajar con y sin herramientas de IA, enfatizando cuándo y cómo usarlas.
La revolución de la inteligencia artificial ya está transformando la educación superior, y su impacto no hará más que crecer. Como lo destacó Borges, esta transición representa solo el comienzo de una era educativa en la que humanos y máquinas colaborarán para potenciar el aprendizaje. Sin embargo, para maximizar los beneficios y minimizar las vulnerabilidades, será crucial que instituciones, educadores y estudiantes trabajen juntos en la creación de un sistema educativo adaptado a las necesidades del siglo XXI.