УДК 004.89
DOI: 10.36871/26189976.2026.04-4.007
Авторы
Шамиль Ильдарович Губайдуллин,
Казанский государственный энергетический университет, Казань, Россия
Анастасия Андреевна Шишкина,
Казанский государственный энергетический университет, Казань, Россия
Аннотация
В статье представлено исследование методов автоматической генерации тестовых заданий с управляемым уровнем сложности на основе нейросетевых моделей. Целью работы является сравнительный анализ эффективности различных архитектурных подходов к генерации вопросов множественного выбора и оценке их сложности с использованием таксономии Блума. На основе экспериментальной базы, включающей публичные датасеты, демонстрируется потенциал современных нейросетевых подходов для автоматизации разработки контрольно-измерительных материалов в образовании. Результаты вычислительных экспериментов показывают, что двухэтапная архитектура «Генератор – Критик» с использованием fine-tuned T5 и классификатора на основе RuBERT достигает наилучших показателей качества (BLEU- 4 = 34,2, ROUGE-L = 61,5 %, точность классификации сложности = 92,8 %), однако требует значительных вычислительных ресурсов. Гибридная архитектура CNN‑BiLSTM для классификации уровня сложности демонстрирует оптимальный баланс между качеством (F1‑мера = 88,4 %) и скоростью (≈ 0,04 с на образец), что делает её предпочтительной для интеграции в системы массового тестирования. Особое научное значение имеет анализ «эффекта семантического дрейфа»: при генерации вопросов на основе малознакомых модели предметных областей качество падает на 12-18 %, что указывает на необходимость применения методов domain adaptation. Разработаны практические рекомендации по интеграции систем генерации тестов в учебный процесс, включая использование экспертной валидации сгенерированных вопросов и методов объяснимого ИИ для повышения доверия к автоматически сформированным тестовым материалам. Практическая значимость исследования заключается в разработке методологии выбора оптимальной архитектуры в зависимости от доступных вычислительных ресурсов и требований к качеству генерируемых тестовых заданий. Кроме того, в статье обоснована необходимость регулярной адаптации моделей к новым предметным областям для снижения семантического дрейфа, а также предложен подход к экспертному пост-валидированию сгенерированных заданий. Полученные результаты создают основу для разработки адаптивных систем генерации тестов, интегрируемых в цифровые образовательные платформы.
Ключевые слова
глубокое обучение
генерация вопросов
тестовые задания
таксономия Блума
нейросетевые языковые модели
автоматизация оценивания
Список литературы
[1] Гафурова Л. Р., Канева О. Н. Разработка системы автогенерации вопросов из текстов учебных материалов // Информационный бюллетень Омского научно-образовательного центра ОмГТУ и ИМ СО РАН в области математики и информатики: Материалы IX Международной молодежной научно-практической конференции с элементами научной школы «Прикладная математика и фундаментальная информатика. Том 3. № 1. – Омск: Омский государственный технический университет, 2019. – С. 103-107.
[2] Катасёв А. С., Катасёва Д. В., Смирнов Ю. Н., Васильев В. Л. Нейронечеткий классификатор оценки уровня знаний обучающихся // Вестник Технологического университета. – 2024. – Т. 27, № 9. – С. 115-119.
[3] Макарова И. Г., Денильханова Р. Х., Янова О. Ю. Эффективные стратегии обучения компьютерным информационным технологиям и их влияние на цифровую экономику // Экономика и управление: проблемы, решения. – 2025. – Т. 3, № 6(159). – С. 205-210.
[4] Нуриев Т. Р., Сибаева Г. Р. Методы и средства сопровождения больших данных в образовательных цифровых платформах // Цифровая трансформация: тенденции и перспективы: Сборник трудов IV Международной научно-практической конференции, Москва, 18 декабря 2025 года. – Москва: Общество с ограниченной ответственностью «Издательство «Мир науки», 2025. – С. 415-418.
[5] Овсеенко Г. А., Базабова С. А., Абдуллаев Д. А. Роль инновационных технологий в современном образовании // Экономика и управление: проблемы, решения. – 2025. – Т. 5, № 4(157). – С. 196-200.
[6] Павлов Е. М., Рыжов А. В., Петров С. А. Автоматическое составление тестовых заданий для контроля знаний по методам оценки надежности программного обеспечения // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. – 2022. – № 3. – С. 179-184.
[7] Пырнова О. А., Ахметшин Д. А., Никоноров Д. П. Геймификация образовательного процесса с использованием мобильного приложения // Научно-технический вестник Поволжья. – 2023. – № 12. – С. 514-517.
[8] Пырнова О. А., Зарипова Р. С. Технологии искусственного интеллекта в образовании // Преподавание информационных технологий в российской Федерации: Материалы Семнадцатой открытой Всероссийской конференции, Новосибирск, 16–17 мая 2019 года / Ответственный редактор А. В. Альминдеров. – Новосибирск: Новосибирский национальный исследовательский государственный университет, 2019. – С. 335-337.
[9] Пырнова О. А., Катасёв А. С. Построение и оценка эффективности модели дерева решений для прогнозирования успеваемости обучающихся // Инженерный вестник Дона. – 2024. – № 4(112). – С. 578-584.
[10] Рочева О. А., Зарипова Р. С., Бекетов С. И. Информационные технологии как основы парадигмы в образовании с целью развития общества // Russian Journal of Education and Psychology. – 2023. – Т. 14, № 2-2. – С. 85-89.
[11] Халидов А. А., Теплая Н. А., Ноздреватых Д. О. Роль чат-ботов в образовательном процессе // Экономика и управление: проблемы, решения. – 2024. – Т. 6, № 11(152). – С. 89-93.

