Можно ли обмануть искусственный интеллект нейросети с помощью "плаща-невидимки"

Шпионский свитер, который стал сенсацией соцсетей, это, по сути, довольно примитивный фейк, сказал "РГ" доцент кафедры радиоэлектроники и прикладной информатики МФТИ Андрей Леус. Напомним, что по утверждению авторов сенсации, им удалось с помощью размытых рисунков людей на одежде человека сбить с толку искусственный интеллект (ИИ), который распознает образы. Нейросеть не в силах понять, где картинка, а где реальность, и впадает в ступор. А значит, вполне реально создать аналог "плаща-невидимки", который позволит человеку стать незамеченным в мире, напичканном устройствами слежения и определения личности. Что, к примеру, дает шанс для тех, кого разыскивают правоохранительные органы.
Обрабатывая индивидуальные точки на лице, нейросеть распознает человека.
Обрабатывая индивидуальные точки на лице, нейросеть распознает человека. / iStock

- Мы этот "шпионский" свитер прокрутили через нашу нейросеть. И она очень легко распознала человека в свитере. Это фейк в явном виде. Не пойму, зачем сейчас его раскрутили в сети, - сказал Андрей Леус. По его словам, этот свитер уже "засветился" несколько лет назад. Его представили как "волшебное" средство, которое делает человека на изображении невидимым. Но если действовавшие тогда системы распознавания могли "невидимку" пропустить, то современные нейросети 3-5 поколений, ловят его элементарно.

Распознавание образов и прежде всего лиц - один из самых модных трендов последнего времени. С ним связаны и большие надежды, и большие опасения. С одной стороны, такие нейросети могут помочь правоохранителям в поиске разыскиваемых преступников, с другой - активно внедряются в частную жизнь человека.

Рынок таких нейросетей растет стремительно, приближаясь к 8 миллиардам долларов при ежегодном росте в 16 процентов. Что неудивительно, учитывая области возможного применения. Это и криминалистика, и медицина, и финансовые сферы, и образование, и биометрия и т.д. А если учесть, что разработчики обещают научить нейросети распознавать не только сами лица, но и мимику, настроение, эмоции, то список можно продолжить. Например, уже есть сообщения, что нейросети могут определить политические взгляды человека и его сексуальную ориентацию.

Как нейросеть распознает лицо

Если не вдаваться в сложные детали современных нейросетей, то принцип их работы выглядит так. Система состоит из двух нейросетей. Первая обрабатывает поток изображений с видеокамеры и определяет, есть ли там лица. Каждое из них она "вырезает" и "выравнивает".

- В идеале для распознавания лицо должно смотреть прямо в камеру, но такая удача бывает редко, особенно если речь идет о распознавании человека в толпе, - говорит Леус. - Поэтому изображение надо выровнять, устранить поворот и наклон головы. Что обычно и делается, чтобы получить четкий фронтальный снимок. Это существенно повышает качество распознавания.

Современные нейросети способны проверять по базе данных 1 миллиард изображений менее чем за полсекунды с точностью, близкой к 100 процентам

Затем в дело вступает вторая нейросеть. Она расставляет на каждом лице индивидуальные особенности, по которым впоследствии и будут вычисляться индивидуальные характеристики человека: разрез глаз, форма носа, подбородка, расстояние между ними и прочее. Таких признаков может быть много, вплоть до нескольких тысяч. Они обрабатываются по определенному алгоритму. В итоге получается набор чисел (их называют векторами в признаковом пространстве) фиксированной длины. Они характерны только для данного конкретного человека, как рисунок линий на его руке. Если нейросеть занимается поиском преступников, скажем, при проходе на стадион, то каждое обработанное нейросетью изображение зрителя проверяется по базе правоохранителей. При совпадении объект выявлен.

Прежде чем выпустить нейросеть в люди на очень ответственную работу, ее предварительно обучают на десятках миллионов изображений. И судя по всему, учат неплохо. По сообщениям авторов нейросетей, с 2016 по 2020 год точность распознавания лиц улучшилась в 50 раз: коэффициент ошибок составил 0,8%.

Среднестатистический человек может идентифицировать знакомое лицо в толпе с точностью 97,53%, а мощные нейросети добились точности 99,8% еще в 2014 году. А сейчас они способны проверять по базе 1 миллиард изображений менее чем за полсекунды с точностью, близкой к 100%. Правоохранители периодически сообщают, что им удалось на массовых мероприятиях, скажем, на одном из чемпионатов мира, выявить более 100 разыскиваемых преступников.

Количество видеокамер наблюдения только в Москве достигло 200 тысяч, в Китае счет идет уже на сотни миллионов. Словом, в "распознавательной" сфере царит оптимизм. Но если все так великолепно, то, к примеру, все разыскиваемые преступники должны сидеть в тюрьме?

- Многие показатели по точности распознавания и коэффициентам ошибок, которые называют авторы, в том числе и в СМИ, - это лукавые цифры, - говорит Андрей Леус. - Скажем, сообщается, что на таком-то чемпионате выявили 100 преступников. Отлично! Нейросеть всесильна, враг не проскочит. Но никто не говорит, а сколько пропустили? Без этих данных число выявленных объектов бессмысленно. Если ищем в Москве одного человека и 10 миллионов проходят перед камерами, то постоянно будут сыпаться ложные срабатывания.

Авторы таких систем, приводя впечатляющие цифры по точности, не афишируют вторые - по ложным срабатываниям. Реклама - двигатель торговли. Правда, известно, что одна известная американская нейросеть внесла в список разыскиваемых правонарушителей сразу 28 конгрессменов.

По словам Леуса, в реальной жизни результаты распознавания отличаются от задачи к задаче. Он зависит как от самой задачи, так и от множества различных факторов - качества и разрешающей способности входного потока изображений, мощности вычислителя, на котором "трудятся" нейросети, состояние оптики, погоды, освещенности, числа лица на изображении и т.д.

Арсенал обманок постоянно пополняется

Попытки обмануть ИИ предпринимались много раз. В дело идут самые разнообразные уловки: цветные патчи на лице и 3D-маски, силикон и скотч, специальный макияж, подобранный по принципу антисходства, парики с длинными волосами и головные уборы, пластыри, усы и т.д. А еще рядом с объектом помещают специальные стикеры, объемные фигуры или картины, которые должны были сбить нейросеть с толку.

Но авторы нейросетей утверждают, что их "питомцы" способны отловить самые разные ухищрения. Парик, усы, очки несильно снижают точность распознавания. Боевая раскраска - например, футбольных фанатов - тоже не сбивает систему с толку. Ведь большая часть признаков относится к строению лица, а не к дополнительным атрибутам. Одна из американских фирм обещает, что ее технология с вероятностью более 70% сможет распознать человеческое лицо даже в медицинской маске. Для этого ей не нужны ни нос и ни рот, так как способна определять личность исключительно по глазам.

- Здесь опять много лукавства, - говорит Леус. - Сегодня ситуация такая. Если нейросеть запомнила ваше лицо, то изменение одного или двух признаков, бороды или прически, мало повлияет на результат распознавания. Но если вы хотите обмануть систему, измените много признаков, скажем, используете парик, очки, отпустите бороду и т.д., то шанс распознать в пределах одного кадра резко падает.

А "антиразнаватели" идут дальше. Так, японские специалисты разработали очки, которые по виду не отличить от обычной оправы. Но встроенные инфракрасные светодиоды подсвечивают важные для идентификации участки лица - глаза и нос, делая человека незаметным для нейросети.

Эта борьба щита и меча, которая давно идет во многих сферах, в задачах распознавания по большому счету только начинается. Пока нейросети работают с переменным успехом, где-то дают очень высокий результат, где-то "сыпят" ошибками. Что вполне естественно, ведь это новая, очень сложная технология. Ей нужно время. Но главное, что она стремительно совершенствуется, каждая новая версия нейросетей успешно справляется с задачами распознавания, на которых еще вчера спотыкалась. А значит, нам надо готовиться, что совсем скоро эти нейросети станут такой же привычной частью нашей жизни, как фотокамеры в мобильных телефонах.

Справка "РГ"

Где применяют системы распознавания

Криминалисты, полиция и спецслужбы используют автоматизированные системы биометрической идентификации для поиска преступников, доказательства преступлений и их предотвращения - например, терактов или мошенничества с документами.

Камеры с распознаванием лиц применяют для обеспечения безопасности на массовых мероприятиях, для прохождения контроля в аэропортах, контроля доступа в различных организациях. Системы помогают находить пропавших детей, людей, которых держат в рабстве, и т.д.

Системы распознавание лиц в больницах и домах престарелых может отслеживать, принимают ли пациенты лекарства и следить за их состоянием. Технология распознавания помогает идентифицировать клиента и предотвратить мошенничество во время покупки в магазине, анализировать поведение покупателей и оптимизировать сервис так, чтобы увеличить продажи.

С помощью онлайн-биометрии можно открыть счет и получить кредит, а также снять деньги в банкомате. В России биометрию планируют внедрить во всех крупнейших банках вместо обычной идентификации.

Кстати

Учеными МФТИ разработана нейросеть, которая распознает животных, чьи изображения фиксируются в фотоловушках. Сегодня она позволяет зоологам по всей стране отслеживать их перемещение и делать выводы о жизни и миграции самых разных популяций. Более того, эта нейросеть уже может узнавать конкретных тигров из огромной базы данных.

Один из промежуточных этапов распознавания животных нейросетью, созданной учеными МФТИ. Фото: Предоставлено МФТИ