В гостях у программы «Утро в Петербурге» Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков.
Людмила Ширяева, ведущая: Телефонные мошенники совершенствуют схемы обмана. Они начали использовать голосовые технологии. Под видом соцопросов злоумышленники звонят людям, ведут якобы безобидные беседы, а на самом деле записывают ваш голос. Достаточно 20-ти секунд вашей речи, чтобы потом создать фейковую аудиозапись от имени жертвы.
Василий Киров, ведущий: А дальше звонки родственникам, обман в банках, попытки получить доступ к данным. Как защититься?
Людмила Ширяева, ведущая: Как обычно выглядит сценарий атаки в данном случае?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Сценарий атаки довольно простой: злоумышленник звонит, заводит разговор, пытается вызвать разные эмоции, чтобы записать голос. Эта запись потом используется для синтеза голоса, очень похожего на голос жертвы.
Василий Киров, ведущий: Достаточно ли 20-ти секунд, чтобы сделать эту запись?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Чем больше времени, тем, конечно, будет качественнее. Чем меньше времени жертва говорит, тем запись будет менее качественная. То есть мы с вами сейчас в зоне риска.
Людмила Ширяева, ведущая: Что происходит после того, как голос получен?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: После того как голос получен, можно уже оказывать психологическое давление на родственников, друзей, знакомых. Когда мы слышим знакомый голос – в аудиосообщении или по телефону – мы становимся более уязвимыми и склонны поверить, что происходящее действительно опасно или требует срочных действий.
Людмила Ширяева, ведущая: Мы можем сейчас провести эксперимент, мы заранее записали мой голос, а потом после него сгенерировали возможное мошенническое сообщение. Мы использовали самый обычный генератор голоса. Как вы оцениваете данную работу?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: На мой взгляд, очень неплохо сделано.
Василий Киров, ведущий: Как от этого защититься? Как понять, что это ненастоящее сообщение?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Понять, что перед нами не настоящий человек, можно, если задать вопрос, на который машина не сможет ответить. Если это якобы знакомый, можно переспросить что-то личное, связанное с прошлым опытом, если есть подозрение.
Василий Киров, ведущий: То есть мы понимаем, что это записанное сообщение, оно не может генерироваться в режиме реального времени.
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Можно соединить этот синтезатор голоса с большой языковой моделью, и она начнёт с вами общаться. Более того, злоумышленник может сидеть и текстом генерировать сообщение. То есть это достаточно сложно реализуемо в режиме реального времени, но вполне возможно.
Василий Киров, ведущий: То есть самый простой способ – начать диалог и спросить что-то такое, что мошенник точно не знает?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Да. Если вы получили аудиосообщение в мессенджере, всегда можно перезвонить этому человеку и уточнить, действительно ли он его отправлял. То есть проверить через другой канал связи.
Людмила Ширяева, ведущая: Есть ли программы, с помощью которых можно проверить голос на фейковость?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Да, конечно, в институте мы сейчас работаем над такими системами. Готового приложения пока нет, так как генераторы уже достаточно точны, и отличить их сложно. Мы занимаемся дипфейками, чтобы научиться их распознавать. Более того, этим занимаются и многие другие научные группы.
Василий Киров, ведущий: Вы сказали, что фактически мы никак не защищены. Как мы можем защитить себя от записи наших голосов?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Мне кажется, что сейчас защититься практически невозможно, потому что наши голоса уже записаны. Например, у блогеров много видео на YouTube, и их голоса доступны. Их могут использовать для генерации. А вот у тех, у кого голосов в открытом доступе нет, конечно, ситуация лучше. Лично я, когда беру трубку, стараюсь сначала послушать, что скажет собеседник, чтобы понять, кто это.
Василий Киров, ведущий: Как понять, что позвонили мошенники?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: Если звонят из автосервиса и говорят, что машина готова, я вступаю в диалог, потому что знаю, что сдавал её сегодня. А если звонят с соцопросом или из поликлиники, или с Госуслуг, то не вступаю в диалог.
Людмила Ширяева, ведущая: Что должно насторожить в предложении пройти соцопрос?
Алексей Кашевник, старший научный сотрудник Санкт-Петербургского Федерального исследовательского центра РАН, специалист по обнаружению дипфейков: На мой взгляд, сейчас соцопросы намного проще проводить в интернете, нежели звонить. То есть, наверное, их проводят, но мне кажется, что это неэффективно, всё-таки много мошенничества.