Известно, что любые наборы данных - это пища для ума, основа для развития и обучения искусственного интеллекта (AI): чем больше данных, тем более точно машина сможет помочь спрогнозировать какие-либо процессы.
- Без обработки больших данных сложно сегодня представить бизнес. Можно согласиться с оценкой ряда экспертов прироста ВВП на уровне одного процента в год за счет развития технологий BD и AI, - поясняет Сергей Гатауллин, ведущий научный сотрудник департамента информационной безопасности Финансового университета при Правительстве РФ.
Понятно, что первые сливки с новой технологии уже сняли маркетологи и рекламисты - ошибки тех, кто подготавливает почву для запуска новых продуктов на рынок, стоят слишком дорого. Да и вся электронная торговля сегодня построена на этой технологии, которая позволяет не только рекомендовать новый товар, например, но и вернуть покупателя в магазин за повторной покупкой.
В частности, компания "Магнит" в июне сообщила о завершении тестов первых кампаний, сделанных с помощью BD. За счет запуска инструментов CVM (Customer Value Management - управление потребительской ценностью) сеть существенно увеличила эффективность индивидуальных покупательских промопредложений, поясняет Сергей Радченко, директор по развитию Hoper IT.
Дело будущего - дальнейшая оптимизация закупочного процесса в компании - автоматизация формирования заявок на закупки, а также автоматическое резервирование товара на складах дистрибьюторов, прогнозирует Елена Суховей, генеральный директор B2B-маркетплейса "Максмарт".
Еще одно активно растущее направление - геоаналитика. Этот инструмент позволяет построить максимально полное представление о той или иной локации и на основе этого принять решение, стоит ли в этом месте развивать свой розничный бизнес, дополняет Елена Фесенко, коммерческий директор Platforma.
Конечно, применение технологии не ограничивается одной лишь торговлей или информационной безопасностью. Инструменты BD активно используются на крупных промышленных предприятиях, на которых созданы целые центры математического анализа и моделирования.
Главный же поставщик больших данных сегодня - это государство, и именно оно в дальнейшем будет главным потребителем их анализа. Государству большие данные от сотовых операторов помогают прогнозировать перемещения людей и планировать, например, развитие транспортной сети, которое будет лучше удовлетворять потребностям людей, поясняет Алексей Сутягин, разработчик Gett. В частности, московские власти еще с 2019 года применяют их при проектировании и строительстве транспортной инфраструктуры, для регулирования пассажирских тарифов и обеспечения безопасности дорожного движения, напоминает Ринальд Садыков, генеральный директор Terabit Digital.
В дальнейшем количество собираемых данных будет только увеличиваться. А значит, и государство станет еще более важным игроком на этом поле.
Понятно, что данные, подходящие для анализа, сегодня есть у большинства активных рыночных игроков.
- Последние несколько лет крупные российские компании активно собирают самые разные данные о своих клиентах. Однако далеко не всегда компании понимают, что с этими данными делать и зачем они вообще им нужны. Многие так и не научились правильно их обрабатывать и использовать. При этом стоимость хранения данных постоянно растет. На мой взгляд, в ближайшее время компании будут пересматривать свои подходы. Тренд на осознанное накопление и использование данных будет набирать силу, - поясняет Никита Назаров, технический директор HFLabs.
Одна из проблем дальнейшей интеграции новой технологии в нашу повседневную жизнь - традиционная: не у всех желающих хватает средств на ее использование. И если у большого бизнеса на большие цифры деньги есть, то у науки их, как всегда, не хватает.
Другая сложность - аспект времени. Использование и развитие любой новой технологии обусловлены конкуренцией на рынке, когда любое преимущество приносит прибыль.
- Обработка больших данных, как и любая другая сложная работа, используется в бизнесе, когда выгода от ее выполнения превышает затраты. В основном это происходит, когда существуют конкуренция и риски. Высокой конкуренции на российском рынке, на мой взгляд, в ближайшее время ждать не стоит, - поясняет эксперт Николай Янковский, product manager Volkswagen Digital Solutions.
Традиционной проблемой развития технологии становится и кадровая. В части развития компетенций в области BD и AI в отрасли сейчас есть только общая теоретическая база, тогда как рынку нужны специалисты с прикладными навыками, сетует Алексей Богомолов, директор практики "Стратегия трансформации" компании "Рексофт Консалтинг". По мнению эксперта, генерировать кадровый потенциал можно только внутри компании. Хороший пример такого внутреннего развития практики - опыт Счетной палаты, полагает эксперт. Ведомство провело тематические хакатоны, где выбрала наиболее перспективных специалистов и продолжает развивать, создавая курсы и решая задачи совместно с бизнесом, параллельно формируя внутреннее сообщество.
По данным экспертов GenerationS, регулирование BD в России уже пережило несколько стадий. Так, в 2013 году появились первые пилоты по внедрению технологии, в 2019 году создан кодекс саморегулирования рынка, а в 2021 году утвержден первый национальный стандарт. При этом российский рынок больших данных пока еще не так велик, как мировой, который в прошлом году оценивался в 215,7 миллиарда долларов. Согласно подсчетам Ассоциации больших данных в 2021 году, отечественный рынок только к 2024 году вырастет до 300 миллиардов рублей. Важным этапом развития является регулирование в сфере хранения данных компаниями. Минцифры согласовало законопроект, предполагающий штрафы за утечку персональных данных пользователей в размере одного-трех процентов годовой выручки компании. В этом отношении российское законодательство следует общемировому тренду регулирования BD.?Такие меры призваны убедить компании в необходимости перманентного развития технологии хранения данных, ставя в приоритет конфиденциальность пользователей.
Евгений Зараменских, профессор Высшей школы бизнеса НИУ ВШЭ:
- Дальнейшему развитию рынка могло бы поспособствовать наличие единого оператора больших данных, которым могли бы стать консорциум коммерческих участников рынка или государственная организация. Государство обладает уникальными наборами данных, их использование в связке с коммерческими данными российских предприятий позволило формировать датасеты на основании запросов разработчиков систем искусственного интеллекта. Созданный оператор смог бы осуществлять их анонимизацию и обезличивание, а также обеспечить создание и эксплуатацию инфраструктуры доступа к государственным и коммерческим наборам данных, а также решать, какие данные можно предоставлять тому или иному заказчику.