КомментарийОбщество

Улыбайтесь, вас уже распознали

Почему власти РФ не нуждаются в помощи западного BigTech для создания технологии распознавания лиц

Улыбайтесь, вас уже распознали

Камера наружного видеонаблюдения на фоне башни исторического музея в Москве, 26 января 2020 года. Фото: Шамиль Жуматов / Reuters / Scanpix / LETA

Financial Times — газета, призванная следить за инвестиционными идеями в обществе, — опубликовала статью о том, как «Amazon нарушила британские санкции против России».

В чем именно нарушила? «Незаконно предоставила свою технологию распознавания лиц российским службам госбезопасности» (illegal supply of facial recognition technology to the Russian state security services). В какой форме нарушила? «Заключила в 2020 году сделку с российской компанией VisionLabs, которой предоставила свою технологию распознавания лиц через, по всей видимости, подставную компанию в Нидерландах…»

Этот информационный вброс невозможно воспринимать серьезно:

  • поставка чего угодно по договору, заключенному в 2020 году, никак не может нарушать санкции, введенные двумя годами позже;
  • голландская компания VisionLabs B.V. является не «подставной», а головной компанией, у которой десятки филиалов (в том числе и в Москве), а ее продукция используется в 60 странах мира;
  • идея поставки системы распознавания лиц (СРЛ) «Амазоном» (Rekognition) компании VisionLabs выглядит нелогично, потому что VisionLabs сама поставляет миру и собственные программные решения СРЛ (Luna Platform, Luna SDK), и собственные программно-аппаратные комплексы (Luna POS Terminal, Luna Ace, Luna Ace Mini, Luna Ace 2). Сказать, что продукция VisionLabs как минимум не хуже Amazon Rekognition, — сделать большой реверанс в адрес американской компании. Предположение, что Amazon поставила своему прямому конкуренту не готовый продукт, а какие-то элементы технологии, выглядит и вовсе оскорблением здравого смысла и логики любого бизнеса;
  • заявление о поставке СРЛ «российским службам госбезопасности» демонстрирует непонимание того, как устроены системы распознавания лиц в принципе. Непонимание и «бывшим сотрудником Amazon», с чьих слов это писалось, и двумя журналистками Financial Times, которые это транслировали. Чуть ниже я подробнее объясню читателям, почему поставка СРЛ из Amazon в руки ФСБ является нонсенсом.

Ключевой элемент текста Financial Times — перевод журналистками стрелок на бывшего сотрудника AWS (Amazon Web Services — подразделение Amazon.com Inc) Чарльза Форреста (Charles Forrest), которого выгнали из компании за «грубое нарушение трудовой дисциплины» после того, как он «отказался выполнять свои контрактные обязательства, не присутствовал на собраниях и не отвечал на электронные письма».

Форрест обратился в суд за компенсацией, однако, понимая, что ни пенса из нарушения трудового соглашения высосать не получится, извлек самый бронебойный аргумент — нарушение антироссийских санкций. А для верности связал Amazon напрямую с чекистами.

Напрасно представители Amazon отбивались от Financial Times фразами вроде: «Судя по имеющимся доказательствам и отчетам о выставлении счетов, AWS не продавала сервисы Amazon Rekognition компании VisionLabs» — дело было сделано: статью британской газеты растиражировала вся мировая пресса. Мейнстримные СМИ, разумеется, задвинули на галерку сюжетную линию с показаниями в суде «бывшего уволенного работника», а на первый план вывели связь Amazon с российскими спецслужбами.

Пример распознавания лиц. Фото:  NTechLab

Пример распознавания лиц. Фото: NTechLab

Все это бесконечно печально, так как подобное отношение прессы к информации давно стало нормой. Насколько я себе представляю, ничего изменить в этом паттерне невозможно, поэтому предлагаю не тратить впустую время и заняться делами по-настоящему полезными.

Я использовал инфоповод от Financial Times для того, чтобы привлечь внимание читателей к самой технологии СРЛ, которая демонизируется всеми без исключения, варьируя лишь по мере безнравственности, цинизма и зловредности институции и структуры, которые СРЛ злоупотребляют.

Предлагаю начать с краткого экскурса в историю. Технологии распознавания лиц (СРЛ) — это часть более широкого спектра научных изысканий, известных как биометрия. Биометрия — это использование поведенческих и биологических характеристик человека с целью дальнейшего распознавания и идентификации. Соответственно, распознавание лиц — это биометрия, связанная — простите за трюизм — с лицом человека.

Распознавание лиц стоит в одном ряду с другими направлениями биометрии: исследование зрачка глаза, отпечатков пальца, голоса и линий ладони. Однако

в последнее два десятилетия СРЛ заняли ключевую позицию, поскольку позволяют выполнять дистанционную и бесконтактную идентификацию.

Для опознания по пальцу, ладони или голосу требуется физический контакт, для зрачка глаз необходимо приблизиться к датчику вплотную, и только распознавание лиц может вестись на очень большом расстоянии (сотни метров и даже десятки километров, если наблюдение ведется камерами со спутников).

Научные изыскания в области СРЛ начались в 60-е годы в Америке, в 90-е почти целиком сосредоточились в военных ведомствах (программа FERET, которую курировали Defense Advanced Research Project Agency, DARPA и Army Research Laboratory, ARL). Одновременно случился массовый исход технологий в коммерческое пространство (аналогично самому Интернету и Web). Три первых крупных компании в сфере СРЛ — Vision Corporation, Miros Inc Visage Technologies.

В последующие 20 лет технологиями СРЛ обзавелись практически все государства мира, обладающие высоким научным потенциалом. Сегодня насчитывается более 600 компаний, которые прямо или косвенно связаны с технологиями распознавания лиц.

В контексте сюжета статьи будет небезынтересно отметить, что российские разработки к середине 20-х годов вошли в число мировых лидеров именно в плане создания математических моделей и расчетных алгоритмов для СРЛ. Объяснение тому лежит на поверхности: исторически высокий (если не лучший в мире) уровень математической школы, которую удалось раздербанить лишь после последовательного и планомерного выдавливания лучших умов из страны.

В РФ возникли десятки частных компаний, предлагающих технологии СРЛ в разных форматах, из которых можно выделить четыре с мировым именем: NtechLab, Vocord, 3Divi и VisionLabs.

Полицейский на входе в московское метро. Фото: Шамиль Жуматов / Reuters / Scanpix / LETA

Полицейский на входе в московское метро. Фото: Шамиль Жуматов / Reuters / Scanpix / LETA

После того как в 2015-м продукт Vocord (FaceNSmall) обошел конкурентов, включая фаворита Google, и был признан самой эффективной в мире СРЛ по результатам тестирования на эталонной выборке MegaFace университета Вашингтона, родное государство решило, что кабанчик созрел (MegaFace — общедоступный набор данных, который используется для оценки эффективности алгоритмов распознавания лиц с участием до миллиона «отвлекающих факторов», т. е. до миллиона человек, не входящих в тестовый набор — прим. авт.). В результате хорошо отлаженных и проверенных маневров одна за другой ключевые частные компании, разрабатывающие СРЛ, перешли под госконтроль.

Хозяевами самой успешной российской компании NtechLab стали «Ростех» и РФПИ. Сегодня NtechLab — главный подрядчик государственных проектов, связанных с идентификацией граждан.

Контрольный пакет в VisionLabs сначала получил «Сбербанк», а затем «АФК Система». Сегодня VisionLabs создает, среди прочего, систему FacePay, позволяющую оплачивать поездку в московском метро в прямом смысле слова собственным лицом.

Самый громкий голос в хоре 3Divi принадлежит венчурному фонду Национальная технологическая инициатива, созданная по личному распоряжению Путина.

В свете сказанного резонно усомниться, что российское государство и российские спецслужбы испытывают интеллектуальный голод в области создания и эксплуатации систем распознавания лиц.

Выше, однако, я упомянул и сугубо технологический аспект СРЛ, который делает абсурдной саму идею «продажи СРЛ продукта Amazon российским службам госбезопасности».

Объясню, как говорится, like we are five (как будто нам пять лет).

Система распознавания лиц складывается из шести компонентов.

Компонент 1. Для того чтобы что-то распознавать, нужно это что-то иметь. В нашем контексте: прежде чем распознавать лица, их нужно собрать. В огромном количестве. Причем это должны быть не абы какие лица, а только те, которые предполагается распознавать в будущем. Было бы странно коллекционировать фотографии нигерийцев или лапландцев для того, чтобы потом отлавливать на улицах Москвы беглецов от мобилизации.

Компонент 2. Собранные коллекции фотографий нужно привести в стандартный вид (убрать из кадра весь фон, «лишние» лица справа и слева и т. п.)

Компонент 3. Из общего массива лиц нужно вычленить т. н. векторы признаков — стандартизированные характеристики (форма носа, рта, овал лица, контур глаз, текстура кожи и т. п.)

Компонент 4. Совокупность векторов признаков и стандартизированных характеристик нужно структурировать в реляционной базе данных, которая впоследствии и будет использоваться на этапе распознавания. Эффект достигается за счет соединения в базе внутренних данных с внешней информацией (ФИО, место проживания, возраст, место работы и проч.)

Компонент 5. Необходимо построить нейросеть, в которой на входные узлы будет подаваться «сырой материал» (распознаваемые новые лица), а на выходе будут векторы признаков, которые затем можно идентифицировать по ранее созданной базе данных.

Компонент 6. Непосредственная процедура распознавания во всей совокупности сугубо инженерных решений (оптика, камера, датчики, модули, способные анализировать эмоциональные состояния, искажающие черты лица, тепловизор, трехмерная реконструкция и море еще всякого разного).

Поддержать независимую журналистикуexpand

Теперь мы представляем в общих чертах устройство СРЛ, и можно слегка модифицировать вопрос: «Что в продукте Amazon Rekognition заинтересовало "российские органы"»?

Предположим, заинтересовал компонент 6. С учетом традиционного советского способа разживаться западными технологиями покупка чего бы то ни было у Amazon напрямую — это не самый оптимальный (потому что самый затратный!) способ заполучить «буржуйский видеомагнитофон» для последующей его разборки и попытки наладить собственное производство с использованием всех доступных компонентов.

Компоненты с 1 по 4 так или иначе связаны с базами данных, которые банально не совпадают у Amazon и РФ. К тому же, здесь у «российских органов» все давно в шоколаде: после государственной унификации пользовательских баз российских банков и мобильных операторов (закон о создании в РФ единого федерального информационного регистра) и централизации данных, поступающих с миллионов камер видеонаблюдения (нацпроект «Экономика данных»), шансов остаться не идентифицированными у российских верноподданных нет.

Остается компонент 5 — детали архитектуры обучаемой нейросети, лежащей в основе алгоритмов распознавания продукта Amazon Rekognition, — и тут совсем просто: в страшном сне невозможно представить, чтобы CEO любой компании в мире согласился в здравом уме поделиться know-how такого уровня, тем более с конкурентами, да еще и спецслужбами страны, находящейся под санкциями.

Вывод можно сделать только один: сказки про продажи Amazon в РФ — не более чем уловка уволенного Форреста в борьбе за денежную компенсацию. Усилиями недобросовестной прессы эта мелочь превратилась в очередной жупел борьбы с теми, с кем не страшно бороться.

Я бы мог предложить журналистам Financial Times гораздо более увлекательную тему: порассуждать, например, как так случилось, что РФ в мае 2024 года обошла по объемам продаж США и вновь стала самым крупным поставщиком газа в европейские страны. Или, может быть, все-таки не стала?..

Дело в том, что информацию, которую транслирует авторитетный ресурс Oilprice (№ 1 Source for Oil and Energy News), поставило агентство ZeroHedge, которое специализируется на фейках, импонирующих публике, поехавшей на конспирологии. Чем не роскошное журналистское исследование? Ан нет, это слишком сложно. Гораздо легче запустить утку о нарушении санкций Amazon.

Но бог с ними, с поставками нефти. Нам бы с СРЛ разобраться. В конце концов, обывателям нет дела ни до Amazon, ни до самих научных технологий. Обывателю нужно понять, как ему реагировать на последствия, которыми чревато применение СРЛ на практике.

Первое, что нужно накрепко зарубить на носу:

технологии распознавания лиц не имеют никакого отношения к мерзостям вроде отлавливания участников несанкционированных митингов, которыми занимаются, надо так понимать, правительства всех стран,

— с разной, разумеется, степенью мерзости и тяжестью последствий для отловленных.

СРЛ — это такой же инструмент, как печатная машинка, трактор, мультиварка, смартфон, ноутбук и т. д. Иными словами, СРЛ совершенно нейтрален. Все зависит исключительно от того, в чьи руки СРЛ попадает.

Для полноты картины хочу напомнить, в каких сферах человеческой деятельности применяются сегодня технологии распознавания лиц:

  • медицинская диагностика;
  • повышение общественной безопасности и эффективности работы системы правопорядка;
  • предотвращение краж в розничной торговле, особенно в магазинах без продавцов;
  • мгновенная дистанционная идентификация (например, в аэропортах);
  • идентификация владельцев счетов в банковском секторе;
  • помощь в поиске пропавших людей;
  • наблюдение за правилами дорожного движения (любимое занятие дорожной полиции в Китае, делегировавшей свои функции миллионам дронов).

И да — разумеется! — преследование инакомыслящих, отлов политических оппозиционеров и вообще всех, кого государство не любит и хочет наказать и загнобить.

Муляжи камер видеонаблюдения на автобусной остановке в рамках проекта «Иллюзия присутствия» художника Романа Богданова на Московском международном биеннале молодого искусства, 11 декабря 2020 года. Фото: Максим Шеметов / Reuters / Scanpix / LETA

Муляжи камер видеонаблюдения на автобусной остановке в рамках проекта «Иллюзия присутствия» художника Романа Богданова на Московском международном биеннале молодого искусства, 11 декабря 2020 года. Фото: Максим Шеметов / Reuters / Scanpix / LETA

Показательно, что даже самая одиозная сфера применения СРЛ сама по себе абсолютно нейтральна. Виновата ли СРЛ в отлове уклоняющихся от мобилизации на улицах Москвы? Виновата ли СРЛ в отлове уклоняющихся от мобилизации на улицах Киева?

Поэтому предлагаю оставить технологии в покое и выяснять отношения не с ними, а с родными государствами.

В практической плоскости вопрос звучит так: «Как нам защититься от неправомерного применения СРЛ со стороны государства?»

Идеальный ответ звучит так: «Жить в государстве, которое пытается поработить своих подданных максимально гуманным образом». Здесь не должно быть иллюзий: любое государство заинтересовано в той или иной мере порабощения своих подданных. Просто потому, что это его modus vivendi.

Разница лишь в том, что некоторые государства этим занимаются с соблюдением видимости уважения прав личности, а другие давно забили на все условности.

Полученный «идеальный ответ» безусловно балансирует на грани пошлого резонерства. Потому что подавляющее большинство обитателей планеты привязано к родным местам (и государствам) несчетными связями и скрепами, и любая смена локации для них находится за гранью реального.

Трагедия в том, что только наш «идеальный ответ» и создает перспективу оптимистичного сценария. Если нет возможности сменить государство, то у вопроса «Как нам защититься от неправомерного применения СРЛ со стороны государства?» есть только один ответ: «Никак!»

От современных СРЛ уберечься невозможно никак. Современные СРЛ умеют распознавать даже лица, закрытые медицинской маской. До появления нейросетей последнего поколения еще хоть как-то получалось обмануть систему распознавания нанесением на лицо специального грима, ношением одежды с замысловатыми рисунками или хитроумными фигурами на месте прически. Пытались даже закрывать лицо инфракрасным излучением. Сегодня не помогает ничего.

Кому-то может прийти в голову радикальный способ: нацепить плотную трехмерную маску на всю голову (типа той, что носят грабители банков в кинофильмах). С учетом, однако, количества установленных в мире камер (200 миллионов в Китае, 50 миллионов в США, 14 миллионов в РФ, 5,2 млн в Германии, 5 млн в Великобритании — и это данные допотопного 2020 года, так что сегодня цифры можно смело умножать на 2, если не больше) маску придется надевать еще до выхода из дома и снимать, только затворив за собой дверь после вылазки в город.

Вынужден огорчить: плотная трехмерная маска создаст вам больше проблем, чем ее отсутствие. Современные СРЛ мгновенно распознают наличие такой маски на лице и сразу же рапортуют кому надо о подозрительном пациенте, поэтому вас отловят гораздо раньше, чем вы успеете вернуться домой.

Я был бы счастлив, если бы мог как фокусник достать из цилиндра спасительного зайца. Увы, зайцев больше не осталось. Мы построили тот мир, который построили, и теперь пожинаем плоды рук своих.

В ситуации, когда практических решений проблемы злоупотребления СРЛ со стороны Большого Брата не проглядывается, нам все-таки остается последняя уловка на уровне красивой символической метафоры:

всякий раз, выходя на улицу, мы должны прямо с порога постоянно и широко улыбаться! Желательно во весь рот — от уха до уха.

Не подумайте, что я издеваюсь. Дело в том, что подобная широкая улыбка генерирует самый высокий уровень шума, способного искажать алгоритмы успешного распознавания лиц. До недавнего времени широкая улыбка позволяла снижать эффективность СРЛ на порядок!

Сегодня это уже вряд ли поможет. Однако мы по крайней мере будем уверены, что нас скрутят и повяжут посреди улицы с правильным выражением лица победителя, а не в печали и недоумении.

pdfshareprint
Главный редактор «Новой газеты Европа» — Кирилл Мартынов. Пользовательское соглашение. Политика конфиденциальности.