
Команда российских ученых, в том числе из НИУ ВШЭ, применила технологии искусственного интеллекта для анализа 4,5 тыс. подписок студентов на сообщества ВКонтакте. Эксперты выяснили, что алгоритмы могут с высокой точностью предсказать успеваемость на основе этих данных. Работу специалистов опубликовали в журнале IEEE Access.
Сотрудники НИУ ВШЭ, Сколтеха и Томского государственного университета собрали данные о подписках 4445 студентов с открытыми профилями. После этого они воспользовались NLP-анализаторами, методами анализа естественного языка, чтобы классифицировать тематику сообществ. Также эксперты таким же образом оценили сложность текстов и эмоциональную тональность контента.
Затем ученые составили цифровой профиль о предпочтениях и интересах для каждого студента. После этого они применили машинное обучение, чтобы найти связь с успехами в учебе. Оказалось, что студенты, получающие высокие оценки, скорее всего, подписаны на сообщества о науке и образовании, где публикуют аналитические статьи и обсуждают новые технологии. «Отличники читают более сложные тексты и проявляют больший интерес к дискуссиям и глубокому анализу информации», — отметили авторы работы.

Молодые люди с низкой успеваемостью обычно следят за развлекательными сообществами. В них публикуют юмор, мемы, музыку и видеоигры. «В контенте этих сообществ больше проявлялись негативные эмоции, а также он оказался менее информативен, чем у студентов с лучшей успеваемостью», — подчеркнули ученые.
Некоторые результаты работы удивили экспертов, заявил аспирант департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ Сергей Горшков. «Например, что студенты, увлекающиеся искусством или путешествиями, показывают отличную успеваемость. Эти увлечения не мешают учебе. Наоборот, они, похоже, помогают учиться лучше. А активное взаимодействие с сообществами, связанными с подработками, — маркер невысокой успеваемости, что вполне объяснимо», — заявил ученый.

Авторы работы считают, что такой подход образовательные организации смогут использовать для выявления талантливых абитуриентов. Помимо этого, анализ подписок может помочь работодателям при поиске кандидатов с высоким предполагаемым уровнем аналитических способностей.
«Это исследование еще раз напоминает о необходимости цифровой гигиены. Например, в договорах об открытии счета в банке и у оператора сотовой связи можно увидеть, что вы даете разрешение на использование некоторой информации из аккаунта социальной сети, привязанной к вашему номеру телефона. Это может в дальнейшем использоваться для составления цифрового профиля. Хотите ли вы этого, решать вам», — отметил Дмитрий Игнатов, заведующий Научно-учебной лабораторией моделей и методов вычислительной прагматики факультета компьютерных наук НИУ ВШЭ.