Human-in-the-loop или как (не) полезть в петлю
В апреле этого года вспыхнул громкий скандал: Amazon закрыла свои магазины формата Just Walk Out, где покупатели брали нужные им товары и уходили, а умные камеры отслеживали стоимость взятого и автоматически списывали соответствиующие суммы со счетов клиентов. Все бы ничего, но только вскрылось, что за посетителями наблюдали тысяча индийцев — в ситуациях, когда система сомневалась, подключались люди и проводили разметку данных или корректировали выставляемые счета.
Новость привлекла много внимания, и Интернет заполонили статьи о грандиозном ИИ-обмане Amazon. Но если так разобраться, то корпорация Джеффа Безоса не единственная совмещает, а порой и прямо выдает работу искусственного интеллекта за труд людей. Например, стартап Presto Automation Inc. поставляет голосового ИИ-ассистента Presto Voice, который может принимать заказы у посетителей заведений общественного питания. Как выяснили журналисты, компания нанимала рабочих из Филиппин, которые участвовали в обработке запросов клиентов (около 70% от общего числа) и следили, чтобы система выдавала корректные результаты.
Такой подход называется human-in-the-loop (HITL) — «человек в цикле». Хотя стоит напомнить, что «loop» переводится ещё как «петля». Смысл его заключается в плотном взаимодействии ИИ-модели и человека. Последний участвуют в обучении системы, следит за тем, как она выполняет свою работу, и при случае исправляет ее просчеты. Приверженцы HITL указывают на то, что искусственный интеллект в нынешнем состоянии несовершенен, и задействование людей позволяет как минимизировать риск ошибок, так и постоянно повышать точность модели. Впрочем, как бы здраво подобные аргументы ни звучали, остается вопрос, можно ли программный продукт считать подлинно AI, если большая часть работы выполняется человеком. Более того, условия, в которых работники дистанционно «страхуют» работу ИИ, таковы, что HITL можно сравнить с современным вариантом крепостного права. Но обо всем по порядку.
Краудсорсингом сыт не будешь
В помощь IT-стартапам, которые задействуют human-in-the-loop, приходят краудсорсинговые платформы, где операторы регулярно выполняют различные задания. Например, присылаются картинки с аэрозолями и консервными банками, и человеку нужно ответить «Да»/ «Нет» на вопросы, есть ли на этикетках текст, он на русском языке и так далее. Если брать обработку документов, то в ситуациях, когда алгоритмы не уверены в результатах распознавания, изображения паспортов или, например, водительских прав пересылаются краудсорсерам, и те также нажимают на кнопки «Да» и «Нет». А порой сами набирают текст со сканов или фотографий документов, подчас включающий данные прописки, серию и номер паспорта, СНИЛС и тому подобное. За каждое задание оператор получает гонорар — соответственно, чем больше он сделает, тем больше заработает. И тут всплывает один нюанс: вознаграждение за выполнение таких поручений в среднем составляет 1−4 цента. Более сложные будут стоить 20−40 центов, а за некоторые можно даже выручить от 0,7 до 1 доллара, но, как правило, подобные задания встречаются не очень часто (и для их открытия нужно выполнять специальные условия, но об этом ниже), так что надеяться на постоянный прирост дохода за счет их выполнения не приходится.
Если говорить о ситуации в России, то раньше среди фрилансеров крайне популярной была платформа «Яндекс Толока», однако в 2023 «Толока» вышла на международный рынок и стала называться Toloka AI, и на замену ей пришли «Яндекс Задания». В Toloka AI минимальный гонорар за задание составляет 1 цент, но российские IT-компании, «переехав» на новую платформу, сократили и без того маленькое вознаграждение до 1 копейки. Впоследствии минимальная цена выросла до 5 копеек за задачи, где надо нажимать кнопки «Да»/ «Нет», и 30 копеек за набор вопросов, но едва ли это как-то серьезно решает проблему низкого заработка краудсорсеров. В их обсуждениях в комментариях в социальных сетях регулярно всплывают шутки про «аттракционы невиданной щедрости» и «до начальства, может, к новому году дойдет, как изменить цену в заданиях».
Некоторые платформы хвалятся, что опытные операторы могут получать от 150 рублей в час — главное выполнять задания быстро и без ошибок и перепечатывать более важные типы данных (например, номера телефонов). Правда, если посмотреть отзывы краудсорсеров, то там указывается, что при работе 10−14 часов каждый день их средний заработок составляет чуть больше 20 тысяч рублей в месяц.
К слову сказать, в подобных сервисах существует система рейтинга, который растет при качественном и систематическом выполнении заданий. Если этот показатель высок, то пользователю становятся доступны задачи с более высокой оплатой. Если оператор начинает допускать ошибки или просто не делает работу в течение пары дней, то рейтинг тут же начинает падать. Другими словами, система зиждется на том, что человек должен как белка в колесе регулярно выполнять многочисленные задания, а если он захочет взять выходной, то и без того низкие гонорары становились еще меньше.
На пути к цифровому ГУЛАГу?
Кто же может стать оператором? Практически любой желающий — надо только быть совершеннолетним, гражданином РФ (если сервис отечественный) и зарегистрироваться на платформе, а дальше можно мерить виртуальную кепку сотрудника и «выходить» на работу. Конечно, нет детальной статистики, где указывалось, кем является среднестатистический краудсорсер, но можно сложить общую картину в голове, если почитать те же отзывы. Например, платформы HomeOperator. Из них становится понятно, что операторами становятся в основном мамы, находящиеся в декрете, безработные, или просто желающие совместить основную деятельность с дополнительным заработком — то есть те, кто будет рад фактически любым гонорарам и не станет лишний раз возмущаться по поводу условий труда. Не забываем про индийцев в Amazon или филиппинцев в Presto Automation Inc. — страны Юго-Восточной Азии традиционно «славятся» своей дешевой рабочей силой.
Что же это получается? Многочисленные эксперты обещают нам, что искусственный интеллект поможет оптимизировать многие рабочие процессы. Например, Билл Гейтс прогнозирует переход на трехдневную рабочую неделю вследствие развития ИИ. Однако в действительности не машина работает на благо человека, а люди тратят свои усилия и время в лучшем случае на поддержание, а то и на имитацию искусственного разума, получая при этом мизерные суммы. Конечно, можно сказать, что операторов на платформах никто не держит, а сидение перед монитором в течение ряда часов едва ли можно сравнить с работой на рудниках. Однако тут важны долгоиграющие последствия от практики HITL.
Так, IT-компании, пользуясь услугами краудсорсинговых платформ, могут значительно экономить на зарплатах работников. Учитывая, что такая модель экономически крайне выгодна, стоит ожидать, что систему с привлечением «людей в цикле» будут развивать и укреплять — тем более искусственный интеллект сейчас у всех на слуху, и чуть ли не каждая вторая компания пытается заделаться ИИ-разработчиком. Соответственно, потребность в новых операторах будет расти, и стоит опасаться, что в скором времени появятся механизмы принуждения, направленные на то, чтобы загнать как можно больше народа в страту краудсорсеров и заставить их день и ночь выполнять однотипные задания.
Самое обидно, что под ударом оказываются и те IT-компании, которые занимаются разработками реального искусственного интеллекта, направленного на улучшение жизни человека. К сожалению, их технологиям для развертывания нужен не один год, а в это время квазиразработчики, практикующие HITL-модель, с помощью тысяч операторов «искусственно» повышают эффективность своих решений и тем самым привлекают инвесторов, охочих до сиюминутной выгоды. Чем-то это противостояние напоминает войну Севера и Юга в США — тогда одна из сторон выступала за сохранение рабства, а другая настаивала на его отмене. Посмотрим, чем завершится нынешнее противоборство.
Обоюдоострый меч
Тем не менее от сложившейся ситуации могут пострадать и сами AI-компании, обращающиеся к услугам краудсорсинговых платформ. И дело не в исках от недовольных работников. Операторам подчас присылаются задания, где фигурируют номера телефонов, развороты паспортов или иные «чувствительные» данные. Краудсорсеры, которым, чтобы получить хотя бы один доллар или рубль, нужно изрядно постараться, вполне могут соблазниться возможностью продать информацию с присылаемых изображений на условный черный рынок — низкие гонорары и незащищенность работников формируют криминогенную среду. Тем более на стороне краудсорсеров анонимность — зачастую руководство платформы не осведомлено, кто именно работает у них оператором, и нанятый в Интернете фрилансер может без проблем избежать ответственности, при этом подставив IT-стартап и его клиентов.
Таким образом, уместно говорить не только о новой форме рабства XXI века, криминализации краудсорсинга или превращении массовых утечек данных в повседневное явление, но и о массовом закрепощении. ИИ все больше проникает в нашу жизнь, и в его распоряжении находятся как информация содержимом вашей продуктовой корзины, так и данные паспортов и иных важных документов. Все это чревато тем, что в скором времени искусственный интеллект будет использоваться для заманивания новых клиентов и навязывания им ненужных товаров и услуг — ведь он прекрасно осведомлен, что мы смотрим в Интернете, что лайкаем, что покупаем, что говорим и тому подобное. В свою очередь полная потеря частной жизни и суверенитета превращает нас в фактических рабов ИИ.
Можно ли что-то противопоставить столь дистопичному будущему? На самом деле, многое. Во-первых, необходимо принять меры по усилению защиты персональных данных пользователей — в частности, способствовать появлению законов, строже регулирующих эту сферу. Во-вторых, следует ограничить или даже запретить практику использования человеческого труда для выполнения работы алгоритмов ИИ. В-третьих, стимулировать разработку «искусственного интеллекта мечты», который сделает нашу жизнь лучше и комфортнее. Третьим направлением занимаются ученые и, конечно, наша компания Smart Engines, а первыми двумя должно озаботиться государство.