В гостях у программы «Утро в Петербурге» Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН.

Людмила Ширяева, ведущая: Представьте ситуацию: вам по видеосвязи звонит близкий человек и просит перевести ему деньги, а вы точно уверены, что это именно он. Кибермошенники всё чаще прибегают к использованию нейросетей, так называемых дипфейков – точных цифровых копий изображения людей.

Ильдар Абитов, ведущий: С помощью них аферисты оформляют займы, вымогают деньги. Качество таких фальшивок с каждым годом становится практически неотличимым. На помощь пришли петербургские учёные: они обучили нейросеть выявлять дипфейки, которые используют злоумышленники в видеозвонках.

Людмила Ширяева, ведущая: На чём основан принцип выявления дипфейков? Как он работает?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: Принцип выявления дипфейков основан на нейросетевом подходе: мы обучаем модель. Нейросеть – это такая модель, сравнимая с ребёнком: показываем, что это дипфейк, что это не дипфейк, и когда много таких изображений показано, она начинает обучаться. Дальше идут математические технологии, которые позволяют это обучение интеллектуализировать.

Ильдар Абитов, ведущий: С этой разработкой шло несколько этапов: на первом этапе вы создали базу данных с лицами. Кто вошёл в эту базу? Откуда она?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: Мы взяли свободно распространяемые базы данных лиц из интернета и различные нейросети, существующие для смены лиц. Взяли, например, 10 тысяч изображений одних лиц и 10 тысяч других, поменяли лица и получили 10 тысяч дипфейков. Брали несколько генераторов дипфейков, чтобы обучаться не на конкретном генераторе, а на рынке дипфейков в целом.

Людмила Ширяева, ведущая: Продемонстрируем сейчас, как это работает.

Ильдар Абитов, ведущий: У нас есть три фотографии: две – реальных людей, третья – сгенерированная нейросетью. По каким признакам ваша нейросеть поняла, что это фальшивка?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: Точность составила более 95%. Признаки группы разные. Мы вкладывали экспертные признаки: расстояние между глазами, расстояние между глазами и носом, между глазами и ртом, объём лица – эти признаки помогают нейросети ориентироваться, существует ли такое лицо в реальности. Если генератор допускает ошибки, которые глаз не видит, нейросеть их распознаёт. Есть также признаки по цветам и по плотности пикселей: математически оценивается, насколько реалистична текстура изображения.

Людмила Ширяева, ведущая: Пиксели понятны для фотографий. А как быть с видео и голосом? Как нейросеть определит подделку?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: С видео есть два основных подхода. Первый – распознавать последовательность кадров: если кадры дипфейки, значит и видео дипфейк. Второй – проверять, как меняется лицо при повороте: можно вычислить, правильно ли меняются расстояния между глазами при повороте. Если нет – это признак подделки.

Ильдар Абитов, ведущий: За сколько времени по нашим картинкам нейросеть поняла, что фото фальшиво?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: С фотографии – доля секунды. С видео сложнее, там много кадров.

Людмила Ширяева, ведущая: Как это применить на практике? Обычный человек получил фото или видео и хочет проверить. Как действовать?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: Сейчас немного готовых сервисов для обычных людей с высокой точностью, куда можно зайти и загрузить файл. Мы работаем над созданием такого сервиса и надеемся предложить его в ближайшем будущем.

Ильдар Абитов, ведущий: То есть это может быть интернет-бот: загрузил фотографию – получил ответ «да» или «нет».

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: Мы сейчас занимаемся фото. Видео – область, требующая дальнейших исследований.

Ильдар Абитов, ведущий: Есть ли способы защитить свои биометрические данные и самому не стать дипфейком?

Алексей Кашевник, старший научный сотрудник лаборатории интегрированных систем автоматизации Санкт-Петербургского федерального исследовательского центра РАН: Самый действенный способ – публиковать как можно меньше своих фотографий и видео в соцсетях. Но уже поздно.