Битва машин: кто кого обманет в борьбе за рейтинги товаров на маркетплейсах

Фальшивые отзывы на маркетплейсах мешают покупателям составить реальное представление о товаре, зато повышают продажи. Нейросети распознают не только отзывы от ботов, но и проплаченные комментарии от живых людей.

Один человек решил купить своему коту аквариум с окошком. В зоомагазинах найти такой трудно, поэтому он решил заказать его в интернете. И вот он заходит на маркетплейс и читает отзывы. Какие-то комментарии оказались чистой вкусовщиной, вроде такого: «Мой кот не оценил», какие-то полезными, например такой: «Крепкое стекло. Кота выдерживает», а какие-то подозрительными: «Беру третий раз! У меня три кота, взяла каждому!». Знакомо, правда? В отзывах часто что-то смущает, но непонятно, что конкретно. Хорошо, что есть нейросети!

Бот выдает себя за человека

Автором фальшивого отзыва может быть и человек, и машина. Само собой, машина хочет быть похожей на человека, чтобы поднять рейтинг товара и захватить рынок. В 1950 году британский математик Алан Тьюринг придумал способ отличить текст, созданный человеком, от машинного. А в 2014-м машинный алгоритм сумел убедить человека в том, что он тоже человек.

В роли испытателя в тесте Тьюринга был человек, а в роли испытуемого — машина. Но бывает и наоборот. Например, тест CAPTCHA, который мы все проходили при регистрации на сайтах. Здесь уже машина определяет, человек вы или робот. Это один из вариантов нейросетей, которые помогают распознавать и блокировать фальшивые отзывы.

Тест CAPTCHA
Тест CAPTCHAИсточник: Account.Habr

Сам себя не похвалишь…

Искусственный интеллект может писать комментарии практически на любой площадке. Не верите — попробуйте сделать пост в соцсети для бизнес-знакомств TenChat. Под ним мгновенно появляется милый, дружелюбный комментарий.

Если преимущество машины в том, что она справляется с большими объемами фальшивых отзывов, то человек превосходит бота по правдоподобности текста. Существуют даже «фермы отзывов», где набирают людей, которые за плату создают много аккаунтов и пишут с них отзывы.

ChatGPT оставил комментарий под постом в TenChat Mail.ru
ChatGPT оставил комментарий под постом в TenChat Mail.ruИсточник: Hi-Tech Mail

Как распознать бота в отзывах

Если бы вместо бота машинный текст распознавал человек, ему бы пришлось круглосуточно следить за количеством запросов и вручную блокировать подозрительные записи. И даже в этом случае нет гарантии, что машина его не обманет. Сама же машина запросто обнаружит себе подобную среди миллионов отзывов по заранее заданным критериям. Как у нее это получается?

Дело в том, что нейронные сети — это не что-то абстрактное. Они представляют собой плагин или другой компонент, основанный на заложенном в него справочнике с данными и алгоритме по их выдаче, построенном на наборе критериев. Этот плагин можно вписать в систему управления сайтом, почтовую программу или приложение на смартфоне. В справочнике находятся данные для обучения. Эти данные попадают в «фильтр», который делит их на «правильные» и «неправильные». Таких «фильтров» может быть до миллиона, и даже больше. В зависимости от цели нейросети, алгоритм будет совершать с «правильными данными» одни действия, а с «неправильными» — другие.

Получается, чтобы обнаружить текст, созданный ботом, нужно знать, чем его поведение отличается от человека. Один из явных признаков бота — его неимоверная работоспособность и однообразие.

«ИИ, установленный в маркетплейсе, может определять поддельные отзывы. Например, 10 отзывов с одного IP-адреса, от разных имен пользователей, но с одинаковым текстом — явно работа примитивного бота. Или одинаковый текст от разных пользователей, которые разнесены географически, но отзывы появились в течение одного промежутка времени», — объясняет главный специалист отдела комплексных систем защиты информации компании «Газинформсервис» Дмитрий Овчинников.

Так, с помощью нейросетей с фальшивыми учетными записями и манипулированием рейтингами борется маркетплейс Amazon. «С помощью ИИ все отзывы на платформе, прежде чем будут опубликованы, анализируются алгоритмами. При наличии оснований полагать, что отзыв поддельный, его удаляют, в том числе предпринимают действия по борьбе с такими операциями, включая блокировку учетной записи, с которой этот отзыв был оставлен. Таким образом компании удалось обнаружить и заблокировать более 200 млн подозрительных отзывов», — продолжает эксперт.

Отзыв на Amazon
Отзыв на AmazonИсточник: Amazon

А вот в Google даже есть своя команда инженеров и аналитиков, которые отслеживают подозрительную активность и отсеивает фальшивые отзывы. Эта система сочетает человеческий интеллект с машинным обучением.

Как распознать ложь человека в отзывах

У человека есть индивидуальный стиль речи. Он пишет на своем уровне грамотности, в своей тональности. Но есть и общие для всех особенности. Например, если человек торопится, он промахивается мимо клавиш на клавиатуре и ставит соседнюю букву вместо нужной. У человека, который регулярно пишет отзывы, тоже есть свои особенности. Он может использовать определенные фразы, писать по одной и той же структуре или обращать внимание на одни и те же характеристики товара. Собрав большое количество отзывов от разных людей, нейросеть по этим признакам может как минимум предположить, какие отзывы написаны одним и тем же человеком. Более продвинутый вариант — отсеять подделку.

«Нейросеть с помощью математической программы отличает правду от лжи. Анализируя полученный текст, алгоритм учитывает лексику, логику, стилистику и другие критерии», — комментирует руководитель проекта «Стилсофт» Валерий Бабенко.

Например, Яндекс интегрировал в свои сервисы систему распознавания и блокировки подставных отзывов на основе собственных данных о том, как ведут себя посетители их маркетплейса. А разработчики из Napoleon IT предлагают купить доступ к своей системе и применять ее на своих платформах.

А что если бот научится генерировать текст из картинки или узнавать определенный тип картинок для теста CAPTCHA? До какого уровня совершенства в обмане могут дойти «враждующие» нейросети, если будут обучаться друг на друге? Время покажет.