Алгоритмы научились обыгрывать людей на гуманитарном поле. Что дальше?

Нейросеть YandexGPT 2 набрала на ЕГЭ балл, необходимый для поступления в вуз. Это первый случай в России, когда генеративная нейросеть сдала Единый госэкзамен, выполнив все его задания, включая творческое. Эксперты полагают, что активное участие искусственного интеллекта в сфере образования и шире - в гуманитарной сфере - неизбежно и потребует изменения подходов. Те же, кто проигнорирует наступление искусственного интеллекта и не сделает его своим союзником, в конечном счете проиграют.

Алгоритмы научились обыгрывать людей на гуманитарном поле. Что дальше?
© Российская Газета

Наступление нейросетей в самых разных сферах стало общепризнанным явлением в 2023 году. Но если с техническими областями все оказалось более-менее понятно, то наступление нейросетей в гуманитарных сферах... К такому жизнь нас не готовила. Всегда считалось, что именно там, где речь идет о творчестве, о создании чего-то нового - преимущество живого человека и человеческого разума над машиной будет безусловным.

Их применение захватывает сегодня всю гуманитарную сферу, становясь во многих случаях серьезным конкурентным преимуществом для тех, кто не овладевает этим навыком, полагает преподаватель кафедры "Киберспорта", проектный менеджер факультета "Игровой индустрии и киберспорта" университета "Синергия" Егор Скоков.

"Они очень сильно ускоряют и упрощают работу. С изучением ИИ у молодых специалистов появляется возможность сместить более возрастных коллег, которые решили бойкотировать нейросети и отказываются работать с ними. С таким развитием данной технологии робот в ближайшем обозримом будущем может вытеснить некоторые профессии, например, обычных программистов или даже художников", - уверен эксперт. По его словам, нейросеть уже превзошла человека в гуманитарной сфере. Примеров тому очень много. "Например, ИИ-дизайнер Студии Артемия Лебедева Николай Иронов в очень короткие сроки выдает до тысячи разных дизайнов", - говорит Скоков.

Лень, как известно, один из двигателей прогресса, так что нет ничего удивительного в том, что драйверами внедрения и продвижения нейросетей стали студенты и школьники, а учебные испытания - одним из самых ярких вызовов для алгоритмов. Главной непокоренной вершиной для ИИ в системе образования долгое время оставалась сдача Единого госэкзамена полностью, включая и творческую часть. Преодолеть ее удалось разработчикам Яндекса. Так, нейросеть YandexGPT 2 набрала на ЕГЭ по литературе балл, необходимый для поступления в вуз.

Нейросети научились делать обобщения и понимать контекст

"Нейросеть решала задания практически так же, как это делал бы любой школьник: генерировала ответы на открытые вопросы и выбирала один или несколько вариантов из предложенных, если они были. "После этого решения языковой модели внесли в бланки и отправили на проверку официальным экспертам ЕГЭ по литературе", - поясняют в Яндексе.

Пройти ЕГЭ по литературе - сложная задача для алгоритмов. Экзамен проверяет знания сразу с нескольких сторон: там есть задания для оценки эрудиции, стиля письма и творческих способностей. В первой части нейросеть анализировала произведение и отвечала на вопросы о нем, во второй - писала сочинение на заданную тему. В результате нейросеть приблизилась к среднему баллу по этому предмету среди российских школьников (63 по итогам 2022 года), которые выбирают литературу и специально готовятся к экзамену. Она также преодолела минимальный порог, необходимый для поступления в вуз, - 40 баллов. Ее усредненная оценка составила 55 баллов.

"Стандартным тестом для оценки эрудиции языковых моделей в мире считается MMLU: он включает вопросы разной степени сложности из 57 областей знания. Так можно объективно сравнить несколько нейросетей, но нельзя оценить качество их ответов на открытые или творческие вопросы. Именно поэтому мы предложили YandexGPT 2 сдать ЕГЭ по литературе. Его задания тесно связаны с текстом, языком и пониманием культурного контекста", - говорит Алексей Гусаков, технический директор Поиска Яндекса.

ЕГЭ для YandexGPT 2 - это своего рода выпускной экзамен для российской нейросети, говорит Алина Кочетова, промпт-инженер "Михайлов и Партнеры", автор Telegram-канала "Это не я, это нейросеть!". "Такие задачи на порядок сложнее классических промпт-запросов: задания в ЕГЭ составлены так, чтобы проверить уровень реальных знаний и владения материалом. Так что полученный высокий балл говорит о качестве модели Яндекса: им удалось быстро обучить нейросеть, правильно интерпретировать задания и дать верные ответы. Вообще очень полезно проводить подобные тестирования и испытания ИИ, ведь они мотивируют разработчиков брать новую и новую планку и наглядно показывают скорость развития технологий", - отмечает Кочетова.

Основная сложность в ЕГЭ по литературе для нейросети YaGPT 2.0 заключается в том, что от искусственного интеллекта требуется навык понимания и интерпретации не только самих текстов литературных произведений, но и широкого литературного контекста, рассказывает кандидат педагогических наук, председатель управляющего совета ГБОУ "КиберШкола", член совета директоров BRICSCESS Елена Скаржинская.

"Творческий характер заданий ЕГЭ по литературе часто предполагает умение понимать литературный стиль, метафоры, аллюзии, аллегории и иные виды глубоко заложенного авторского смысла. Что, в свою очередь, требует развитой способности к критическому мышлению и анализу. Более того, при анализе литературных произведений всегда возможна субъективная и даже эмоциональная оценка произведения. Для выполнения такого рода работ модель должна быть обучена делать обобщения и выводы на основании очень большого объема прочитанных текстов. И не только понимать, но и правильно интерпретировать прочитанное. Поэтому в основе YaGPT 2.0 лежат довольно сложные алгоритмы и процедуры, требующие для решения такого рода задач много времени и больших вычислительных ресурсов", - отмечает Скаржинская.

Возникает и другая проблема - этического свойства. "Искусственный интеллект стремительно входит во все сферы жизни человека. В том числе в область культуры. А этические ограничения являются сутью культуры. Не думаю, что возможно ограничить искусственный интеллект, но для сохранности человека как вида важно обозначить границы взаимодействия человека и ИИ", - говорит Елена Скаржинская.

"В целом же прогресс не остановить, и человек сам тоже должен совершенствоваться", - уверена она.

Ключевой вопрос

Нужно ли корректировать подходы к оценке знаний?

В Рособрнадзоре - ведомстве, ответственном за проведение Единого госэкзамена в стране, не считают сдачу экзамена нейросетью чем-то опасным.

"Тренировать искусственный интеллект разработчики могут на любых задачах, в том числе заданиях Единого госэкзамена, - сообщили "РГ" в пресс-службе ведомства. - Но сам экзамен не ориентирован на тестирование возможностей нейросетей. Для системы ЕГЭ развитие нейросетей угрозы не несет, так как использование гаджетов во время экзаменов запрещено порядком проведения ЕГЭ, и участники реальных экзаменов никак не смогут воспользоваться помощью искусственного интеллекта", - полагают в ведомстве.