ChatGPT ставит науку под угрозу: что придумали ученые

Многие ученые прибегают к помощи нашумевшего бота ChatGPT и других языковых моделей. Какие риски это несет, и как использование «умных» технологий сказывается на качестве исследований? Научный журнал Nature предложил 5 способов контроля ChatGPT. Мы приводим главные тезисы из статьи.
1. Не забывайте о проверке человеком
2. Разработать правила контроля
3. Инвестируйте в по-настоящему открытые языковые модели
4. Воспользуйтесь преимуществами искусственного интеллекта
5. Необходимо обсуждать
1. Не забывайте о проверке человеком
2. Разработать правила контроля
3. Инвестируйте в по-настоящему открытые языковые модели
4. Воспользуйтесь преимуществами искусственного интеллекта
5. Необходимо обсуждать
Ещё

С тех пор, как в конце прошлого года появился чат-бот под названием ChatGPT, стало очевидно, что такой тип искусственного интеллекта сильно повлияет на работу ученых и исследователей.

ChatGPT — это большая языковая модель (LLM), система машинного обучения, которая автономно извлекает информацию из предоставленных данных и может создавать сложные и достаточно осмысленные тексты после обучения на большом объеме текстовых данных. Это последний из множества подобных ИИ, разработанных OpenAI — компанией, располагающейся в Сан-Франциско, штат Калифорния.

ChatGPT вызвала ажиотаж и многочисленные дискуссии, потому что это одна из первых языковых моделей, которая может убедительно общаться с пользователем не только на английском, но и других языках. Более того, она бесплатна, проста в использовании и продолжает улучшаться.

На русском бот общается хуже, текст похож на работу автопереводчика
На русском бот общается хуже, текст похож на работу автопереводчика

Технология окажет сильное влияние на науку и общество. Уже сейчас многие исследователи используют ChatGPT и другие известные языковые модели для написания эссе и текстов публичных выступлений, подбора литературы, составления проектов, улучшения существующих статей, а также выявления пробелов в исследованиях и для написания компьютерного кода, включая статистический анализ.

Вскоре эта технология эволюционирует до такой степени, что с ее помощью можно будет проводить эксперименты, писать и дополнять рукописи, проводить экспертную оценку и помогать редакторам в выборе — принять авторский текст или отказаться от него.

Разговорный ИИ, вероятно, произведет революцию не только в исследовательской деятельности, но и в издательской практике. С одной стороны, он предоставит новые возможности, с другой — создаст ряд проблем. Тем не менее, его внедрение могло бы ускорить развитие инноваций, сократить время до публикации и помочь людям свободно заниматься исследованиями, сделав науку более справедливой и разнообразив количество точек зрения.

В то же время, подобные ИИ могут ухудшить качество и прозрачность исследований и негативно отразиться на независимости людей как ученых. ChatGPT и другие LLM создают убедительный текст, но зачастую неверный. Их использование может исказить научные факты и распространить дезинформацию.

Мы (журнал Nature — прим. ред.) выделили пять важных предложений.

1. Не забывайте о проверке человеком

Многие языковые модели разрабатывались годами. Но постоянное повышение качества данных, а также сложные методы калибровки ИИ сделали их гораздо более качественными, чем раньше. LLM приведет к появлению нового поколения поисковых систем, которые способны выдавать подробные и информативные ответы на сложные вопросы пользователей. Но использование разговорного ИИ для специализированных исследований, скорее всего, приведет к неточностям, предвзятости и плагиату.

Мы задали ChatGPT несколько вопросов, которые требовали глубокого понимания специфики, и обнаружили, что она часто генерирует ложный и вводящий в заблуждение текст.

Например, когда мы спросили: «У скольких пациентов с депрессией наблюдается рецидив после лечения?», был получен чрезмерно общий текст, утверждающий, что эффекты лечения, как правило, долговременны. Однако многочисленные высококачественные исследования показывают, что эффект лечения ослабевает, и что риск рецидива колеблется от 29% до 51% в течение первого года после завершения лечения. Повторение того же запроса дало более подробный и точный ответ.

Такие ошибки могут быть вызваны отсутствием соответствующих статей в обучающем наборе ChatGPT, неумением выделить соответствующую информацию или неспособностью отличить заслуживающие доверия источники от менее заслуживающих доверия.

Невнимательных рецензентов можно обмануть, заставив принять статью, написанную искусственным интеллектом, с помощью красивой подачи, авторитетности ученого, а также склонности к чрезмерному обобщению на основе нескольких положительных впечатлений от работы.

И поскольку эта технология обычно воспроизводит текст без достоверных ссылок на первоисточники или авторов, исследователи, использующие ее, рискуют неверно сослаться на другие работы и невольно заняться переписыванием несуществующих текстов, выдавая их за собственные идеи.

Предполагая, что некоторые исследователи используют LLM в своей работе, другие ученые должны сохранять бдительность. Процессы проверки фактов и верификации информации, осуществляемые экспертами, всегда будут незаменимыми. Даже когда LLM способны ускорить подведение итогов, выставление оценок и написание обзоров, авторитетные научные журналы могут решить включить этап проверки человеком или даже запретить определенные приложения, использующие эту технологию.

2. Разработать правила контроля

Уже доступны инструменты для прогнозирования вероятности того, кем написан текст: машинами или людьми. Они могли бы быть полезны для обнаружения использования LLM в производстве псевдо-научными журналами. Но, вероятно, такие методы обнаружения получится обойти более развитыми технологиями искусственного интеллекта и другими уловками.

Вместо того, чтобы участвовать в бесполезной «гонке вооружений» между чат-ботами с ИИ и детекторами чат-ботов с искусственным интеллектом (ИИ), мы считаем, что исследовательское сообщество и издатели должны разработать свод правил по использованию LLM честно и прозрачно.

В исследовательских работах необходимо четко и конкретно указывать, использовали ли авторы технологии искусственного интеллекта, такие, как ChatGPT, при подготовке своей научной работы, анализа. И в какой степени. Это предупредит редакторов и рецензентов о необходимости более тщательного изучения рукописей на предмет потенциальных неточностей и ненадлежащих указаний источников.

Исследовательские институты, издатели и спонсоры должны согласовать четкую политику, повышающую осведомленность и требующую прозрачности в отношении использования разговорного ИИ при подготовке всех материалов, которые могут войти в публикацию. Издатели могут запросить у автора подтверждение того, что такая политика соблюдалась.

На данный момент LLM не должны быть авторами научных работ, поскольку они не несут ответственность за написанное. Но исследователям может быть достаточно трудно точно определить роль LLM в работах.

Кстати, база данных на разных языках сильно отличается
Кстати, база данных на разных языках сильно отличается

Мы находимся в той точке, когда технологии вроде ChatGPT могут генерировать значительные фрагменты текста по запросу автора. Но в то же время есть ученые, которые прошли через множество циклов доработок и улучшений своей работы, используя искусственный интеллект в качестве средства проверки грамматики или орфографии, но не использовали его для создания текста.

В будущем LLM, вероятно, будут включены в инструменты обработки и редактирования текста, поисковые системы и инструменты программирования. Политику придется адаптировать, но ключом всегда будет полная прозрачность.

Изобретения, придуманные ИИ, уже становятся причиной фундаментального переосмысления патентного права. Были поданы судебные иски по поводу авторских прав на код и изображения, которые используются для обучения ИИ, а также на те, которые генерируются ИИ. В случае материалов, написанных с помощью искусственного интеллекта, исследовательскому и юридическому сообществу также необходимо будет выяснить, кому принадлежат права на тексты.

3. Инвестируйте в по-настоящему открытые языковые модели

Сейчас почти все разговорные ИИ являются собственностью небольшого числа крупных технологических компаний, у которых есть ресурсы для разработки подобных технологий. Например, OpenAI финансируется в основном Microsoft. Другие крупные технологические корпорации спешат выпустить аналогичные инструменты.

Одной из наиболее насущных проблем для исследовательского сообщества является отсутствие прозрачности. Базовые учебные наборы и LLM для ChatGPT и его предшественников не доступны всем, и технологические компании могут скрывать внутреннюю работу своих ИИ.

Например, мы попросили ChatGPT объяснить работу нескольких исследователей. В некоторых случаях в нем приводились подробные отчеты об ученых, которых можно было считать менее влиятельными на основе их Индекса Хирша (мера индивидуальной продуктивности и влияния исследователя. — Прим. ред.).

Мы выступаем за то, чтобы финансирующие науку организации, университеты, неправительственные организации (НПО), правительственные исследовательские учреждения и такие организации, как ООН, а также технологические гиганты инвестировали в независимые некоммерческие проекты. Это поможет разработать передовые технологии искусственного интеллекта с открытым исходным кодом, прозрачные и контролируемые.

Вот один из удачных примеров: BigScience разработала языковую модель с открытым исходным кодом под названием BLOOM. Технологические компании могли бы извлечь выгоду из такой программы, открыв источники своих языковых моделей в надежде на более активное вовлечение сообщества.

4. Воспользуйтесь преимуществами искусственного интеллекта

По мере увеличения рабочей нагрузки и конкуренции в академических кругах возрастает и необходимость использования разговорного искусственного интеллекта. Чат-боты предоставляют возможности для быстрого выполнения задач аспирантам, стремящимся завершить свою диссертацию, исследователям, нуждающимся в быстром обзоре литературы для своего проекта, а также рецензентам, которым не хватает времени для анализа.

Если чат-боты с искусственным интеллектом помогут в решении этих задач, результаты могут быть опубликованы быстрее, что позволит ученым сосредоточиться на новых экспериментальных разработках.

ChatGPT помогает найти ошибки в коде / Источник: springboard.com
ChatGPT помогает найти ошибки в коде / Источник: springboard.com

Кто-то утверждает, что, поскольку чат-боты просто изучают статистические ассоциации между словами в своем обучающем наборе, а не понимают их значения, LLM смогут вспоминать и синтезировать только то, что люди уже сделали. Они не демонстрируют человеческие аспекты научного процесса, такие, как творческое и концептуальное мышление.

В 1991 году исследователи писали, что «партнерские отношения» между людьми и ИИ могут превзойти интеллектуальные способности только лишь людей. Они могут ускорить развитие инноваций до ранее немыслимых уровней. Вопрос в том, как далеко может и должна зайти автоматизация?

Различные ИИ могут сбалансировать набор академических навыков у разных ученых. С одной стороны, ИИ мог бы оптимизировать академическую подготовку — например, предоставляя обратную связь для улучшения навыков письма и рассуждений учащихся. С другой стороны, это может снизить потребность в определенных навыках, таких, как умение выполнять поиск литературы. Но это не всегда плохо.

Если мы заботимся только о скорости проведения исследований, вклад людей может стать более ограниченным и неясным по мере развития технологий искусственного интеллекта. В будущем чат-боты с ИИ смогут генерировать гипотезы, разрабатывать методологию, проводить эксперименты, анализировать и интерпретировать данные и писать научные работы. Вместо редакторов и рецензентов-людей ИИ также мог бы оценивать статьи.

ChatGPT ставит науку под угрозу: что придумали ученые

Поэтому крайне важно, чтобы ученые, в том числе специалисты по этике, обсуждали компромисс между использованием искусственного интеллекта, который ускоряет получение новых знаний, и потерей человеческого потенциала вкупе с увеличением автономии исследовательского процесса.

Креативность и оригинальность людей, образование, профессиональная подготовка и продуктивное взаимодействие с другими людьми, вероятно, останутся необходимыми для проведения актуальных и инновационных исследований.

5. Необходимо обсуждать

Во-первых, мы рекомендуем каждой исследовательской группе немедленно провести собрание, чтобы обсудить и опробовать ChatGPT на себе (если они еще этого не сделали). Преподаватели должны говорить о его использовании и этике со студентами старших курсов. Всем участникам исследования следует напомнить, что они будут нести ответственность за свою работу, независимо от того, была ли она создана с помощью ChatGPT или нет.

Во-вторых, мы призываем к немедленному проведению международного форума по разработке и ответственному использованию LLM для научных исследований.

LLM остается палкой о двух концах. Модели могли бы помочь ученым из разных стран, например, устранив языковые барьеры и позволив большему количеству людей писать работы высокого качества. Но существует вероятность того, что, как и в случае с большинством инноваций, страны с высоким уровнем дохода и привилегированные исследователи быстро найдут способы использовать LLM таким образом, чтобы ускорить свои собственные исследования и усилить существующее неравенство.

Наука, как и многие другие сферы общества, сейчас сталкивается с тем, что ИИ посягает на ее ценности и стандарты. Основное внимание должно быть уделено использованию возможностей и управлению рисками.

Источник: Nature