Перейти к содержимому
IT и стартапы

ИИ накачивает студенческие оценки, но не знания: данные восьми семестров

Исследование 319 курсов в американском университете показало: рост GPA после запуска ChatGPT объясняется аутсорсингом домашних заданий, а не реальным прогрессом студентов.

Казакевич Алексей
6 мин
ИИ накачивает студенческие оценки, но не знания: данные восьми семестров

После появления ChatGPT в ноябре 2022 года доля студентов с оценкой «A» в американских университетах выросла на 13 процентных пунктов — примерно на 30% выше базового уровня 2022 года. Средний GPA поднялся на 0,12 пункта, а разброс оценок сузился: «A-минус» и «B-плюс» массово превращаются в чистые «A». При этом экзаменационные баллы практически не изменились.

Такие данные приводит исследователь Игорь Чириков, проанализировавший 319 курсов в 84 кафедрах за восемь осенних семестров — с 2018 по 2025 год. Уровень «ИИ-экспозиции» каждого курса определялся по структуре заданий из силлабусов осени 2022 года — до того, как ChatGPT вышел в публичный доступ. Ключевой параметр — доля письменных и программистских задач: именно в этих областях языковые модели работают лучше всего.

Домашние задания растут, экзамены — нет

Центральный вопрос исследования: отражают ли более высокие оценки реальный прогресс в обучении или просто факт того, что ИИ выполняет работу вместо студента? Чириков проверил это через структуру итоговой оценки: если ИИ действительно улучшает понимание материала, рост должен быть равномерным — и в курсах с упором на домашние задания, и в тех, где вес имеют контрольные экзамены.

Но картина оказалась иной. В курсах, где домашние задания составляют более медианной доли итоговой оценки, количество «A» выросло на дополнительные 16 процентных пунктов по сравнению с курсами ниже медианы при той же ИИ-экспозиции. В курсах с низкой долей домашних заданий эффект минимален и статистически незначим.

Дополнительным тестом послужили оценки за устные презентации — формат, где ИИ практически бесполезен. Там никакого роста не зафиксировано. Чириков называет совокупность результатов «трудно объяснимой одними лишь общими учебными успехами или эффектами сортировки».

Оценки теряют смысл как сигнал

Грейд-инфляция в американских университетах — не новость. В Гарварде доля «A» выросла с 24% в 2005 году до 60,2% в 2025-м. Прежде это объясняли мягкостью преподавателей, конкуренцией между вузами и институциональной политикой. Но ИИ работает иначе.

Все предыдущие факторы инфляции действовали на этапе выставления оценок — после того как студент сдал работу. ИИ вмешивается раньше: он меняет сам процесс создания работы, ещё до того как преподаватель её увидит. Это принципиально новый механизм.

Последствия выходят за рамки академической среды. Если оценки по письму и программированию всё больше отражают качество работы языковой модели, а не реальные навыки студента, работодатели и приёмные комиссии магистратур начнут принимать худшие кадровые решения. Для белорусских IT-компаний, активно нанимающих выпускников — в том числе иностранных вузов, — это означает, что академический бэкграунд кандидата становится менее надёжным индикатором компетентности.

Чириков также указывает на потенциальный замкнутый круг: если ИИ берёт на себя задачи, которые должны формировать навыки, выпускники окажутся слабее именно в тех областях, где автоматизация наиболее активна. Это ускорит вытеснение людей из профессий и расширит разрыв в квалификации на рынке труда.

Что делать: не просто больше экзаменов

Автор исследования предлагает не сводить решение к переводу всего на очные контрольные работы — это и недостаточно, и технически сложно. Более продуктивный путь — переосмыслить сами форматы заданий: либо ограничить применение ИИ структурно, либо намеренно встроить его в процесс с обязательной документацией хода работы и последующими вопросами, доказывающими понимание материала.

Гендиректор OpenAI Сэм Альтман в недавнем интервью признал, что за три с половиной года после запуска ChatGPT образовательная система практически не адаптировалась. Он ожидал год хаоса с читингом, а затем системной перестройки — но не может указать ни на одно значимое системное изменение. По его словам, без такой перестройки критическое мышление рискует «существенно атрофироваться».

««Я — человек, который думает через письмо. Я пишу много вещей, которые никому не показываю, но это важно для меня, чтобы разобраться в чём-то. Поэтому я рад, что научился писать. Люди говорят то же самое о программировании», — сказал Альтман.»

На государственном уровне первой жёсткие меры приняла Норвегия: страна фактически запретила ИИ-инструменты в начальной школе и ограничила их использование в средней. Премьер-министр Йонас Гар Стёре объяснил решение тем, что бесконтрольное применение ИИ подталкивает учеников пропускать важные этапы обучения.

Для белорусского контекста вопрос особенно актуален: резиденты Парка высоких технологий и IT-компании, работающие на экспорт, традиционно делают ставку на сильную техническую базу специалистов. Если академические оценки перестают быть надёжным фильтром, индустрии придётся инвестировать в собственные системы верификации навыков — технические интервью, тестовые задания и внутренние программы обучения становятся не опцией, а необходимостью.

— По материалам The Decoder: оригинальная статья. Перевод и адаптация — редакция Digital Business.

ПоделитьсяVK

Свежие новости

Все новости
ИИ и оценки студентов: GPA вырос на 0,12 пункта · Digital Business