Романтический алгоритм
Data Science и любовь - вещи, на первый взгляд, малосовместимые. Однако на практике алгоритмы машинного обучения уже достаточно давно и активно используются в сфере онлайн-знакомств для оптимизации процесса подбора пары, или мэтчинга.
Первые dating-решения появились в начале 2000-х годов в виде веб-сайтов с достаточно простым и прямолинейным интерфейсом. При регистрации от пользователей требовалось заполнить анкету с личной информацией и загрузить фотографию, после чего нужно было вручную искать партнера, пролистывая профили.
Популярные соцсети, такие как Facebook, "ВKонтакте" и другие, также добавили некоторые опции по поиску пары, например возможность отметить понравившуюся фотографию, указать сведения о семейном положении, показать потенциальных друзей и фильтровать пользователей.
Настоящий бум онлайн-знакомств начался в 2010-х годах после появления Tinder и Bumble. Ветераны рынка, Mamba, Badoo и OkCupid, также запустили более продвинутые мобильные версии.
На данный момент Tinder остается безусловным лидером рынка с 75 млн активных пользователей ежемесячно и годовой выручкой в 1,4 млрд долларов. По словам представителей сервиса, каждую неделю 1,5 млн людей из зарегистрированных в приложении договариваются о встрече с понравившимся собеседником. За Tinder следуют Badoo с 60 млн юзеров и Bumble с 42 млн.
Практически все современные дейтинговые платформы имеют встроенные рекомендательные системы, аналогичные тем, что есть у интернет-магазинов и онлайн-кинотеатров, благодаря чему пользователь не обязан вручную просматривать каждый профиль. Сервисы сами выполняют первичный отбор кандидатов, формируя список потенциальных партнеров на основе широкого ряда параметров. Для этого используются как простые фильтры (пол, возраст или геолокация собеседника), так и сложные цифровые следы (покупки, прослушанная музыка, поведение в соцсетях и т. д.).
"Машина не выбирает за человека, а рекомендует ему на основании предпочтений, поведения, стилистики общения и других анализируемых факторов", - пояснил Илья Душин, исполнительный директор ComBox Technology, ответственной за внедрение технологий искусственного интеллекта в сервис знакомств RuLove.
Так, большинство дейтинговых приложений анализируют фото пользователей, предлагая людей с типом внешности, которую пользователь считает наиболее привлекательной. Некоторые сервисы определяют изображения интимного характера и оповещают об этом заранее.
Такого как Дональд?
Алгоритмы Tinder обучаются в том числе на основе информации о поведении пользователя в Facebook и Instagram - списках друзей, истории постов, лайках и фотографиях.
Сервис RuLove помимо стандартных параметров поиска вроде возраста, города или семейного положения предлагает еще более 70 критериев оценки внешности, включая рост, вес, телосложение, цвет глаз и волос, и более 200 черт характера, по которым система будет подбирать анкеты.
"Для обучения алгоритмов используются неперсонализированные данные пользователей приложений iOS, Android и посетителей веб-ресурса. Параллельно работают три алгоритма: лайки/дизлайки, анализ интересов, указанных в анкетах, и анализ совместимости по фото", - рассказал Илья Душин.
Некоторые разработчики пошли по более оригинальному пути. В 2017 году сервис Badoo внедрил нейросети, работающие по алгоритмам глубокого обучения и позволяющие подбирать партнеров с определенной внешностью по загруженной фотографии. Многие начали использовать данную функцию для поиска двойников любимых звезд. По данным сервиса, на момент запуска на платформе нашлось 1405 "копий" певца Эда Ширана, 975 - Джейка Джилленхола, 751 - Идриса Эльбы и 342 - Кайли Дженнер. Самыми популярными запросами в Великобритании были Кара Делевинь и Роберт Паттинсон, а в мировой топ-10 вошли Ким Кардашьян, Селена Гомес и Дональд Трамп.
Ну что, поехали?
Российский сервис по подбору туров Lowtrip создал приложение "ЖД Сваха", который помогает одиноким путешественникам найти попутчика для поездки на поезде или для более долгого путешествия. Нейросеть анализирует количество проданных билетов по каждому маршруту, обрабатывает запросы пользователей на специальном сайте и на основании полученного массива данных формирует предложения. При этом "ЖД Сваха" учитывает не только город или номер поезда, но и интересы пользователей. Подход к определению предпочтений пользователя на базе Big Data постепенно вытесняет традиционный метод анкетирования, который применялся на заре сервисов онлайн-знакомств. Эксперты считают, что анализ поведения человека в интернете дает более точное представление о его характере, существенно повышая вероятность того, что предложенный приложением мэтч будет удачным.
Такой качественный рывок в работе дейтинговых платформ был бы невозможен без машинного обучения. Алгоритмы первые несколько дней исследуют поведение нового пользователя, его активность, предпочтения и совпадения. В случае Tinder на основании этих данных система присваивает юзеру специальную оценку, которую использует как маркер для последующих мэтчей. Учитывается как биографическая информация (пол, возраст, геолокация или образование), так и рейтинг, полученный от людей, с которыми образовалась пара. Оценивается также количество свайпов для выявления злоупотреблений.
Информационный партнер
Получить информацию об интересах пользователя для обучения нейросетей сервисы онлайн-знакомств могут из сторонних приложений, таких как Facebook и Instagram, а также от стриминговых платформ, интернет-магазинов, поисковиков и сайтов cookies. Анализируется и поведение пар после удачного мэтча - система распознает тональность и смысл контента в текстовых и аудиосообщениях.
Таким образом, приложения онлайн-знакомств собирают огромные объемы данных о своих пользователях для того, чтобы как можно точнее подобрать возможных кандидатов. В качестве наглядного примера можно вспомнить историю с журналисткой газеты The Guardian, которая запросила у Tinder всю информацию о себе и получила подробный отчет на 800 страниц А4.
Неудивительно, что некоторые пользователи стали выражать недовольство контролем за процессом выбора со стороны машин. На просторах интернета публикуются лайфхаки, позволяющие обмануть алгоритмы сервисов и получить доступ ко всем профилям, зарегистрированным на платформах. Однако это вряд ли повлияет на дальнейшее использование нейросетей для поиска романтического партнера, считает Илья Душин.
"Проблема быстрого подбора партнера - одна из самых актуальных для пользователей, и именно по этому критерию они решают, на каком из множества приложений остановить свой выбор", - заключил Илья Душин.
Аферист из Tinder
Число пользователей дейтинговых сервисов значительно возросло на фоне пандемии. Так, 2020 год стал самым загруженным периодом для Tinder. По данным экспертов, количество сообщений между пользователями возросло на 19%, а сами беседы стали на 32% дольше. Более того, сервис отметил рекордные 3 млрд свайпов в день в марте 2020-го. С тех пор эта цифра стала для Tinder нормой.
Но сколько бы ни был автоматизирован процесс онлайн-знакомств, финальное решение все равно остается за человеком. Алгоритмы не могут защитить от мошенников, которые умело манипулируют чувствами людей.
Параллельно увеличилось и число случаев недобросовестного использования дейтинговых платформ. В США и Великобритании рост подобных преступлений составил более 20%, убытки достигли порядка 600 млн долларов. По оценкам Group-IB, в России аферисты только одной преступной группы (из 22 выявленных) украли в прошлом году около 18 млн рублей на фейковых свиданиях.
Ярким примером дейтингового мошенничества стала история израильтянина Шимона Хаюта, который представлялся на сайтах знакомств сыном алмазного магната. Саймон Леваев, как себя называл Хают, очаровывал женщин в интернете и выманивал у них сотни тысяч долларов. В конце января на Netflix появился документальный фильм о его похождениях - "Аферист из Tinder". Лента моментально стала хитом. По словам трех героинь, Хают получил от них более 800 000 долларов. Израильские издания утверждают, что всего с 2017 по 2019 год аферист "заработал" на своих жертвах 10 млн долларов. Хаюта разыскивают в нескольких странах, а его профили были наконец удалены с сайтов.
Этот и многие другие материалы на сайте ©IPQuorum - первого в России издания о креативных индустриях и интеллектуальной собственности. IPQuorum - это новый формат работы международного бренда, который с 2017 года организует все самые яркие события мира интеллектуальной собственности и креативных индустрий в России, включая рынок LegalTech и сферы институтов развития. IPQuorum исповедует доказательную редакционную политику и показывает на достоверных фактах и судьбах, что сегодня инновации возникают на пересечении разных идей и индустрий.