Исследователи из Университета штата Пенсильвания создали компактный радарный датчик, способный перехватывать телефонные разговоры на расстоянии до трех метров. Устройство анализирует микровибрации корпуса смартфона и с помощью искусственного интеллекта преобразует их в текстовые стенограммы. Результаты исследования были представлены на 18-й конференции ACM по безопасности и конфиденциальности в беспроводных и мобильных сетях.
Технология основана на улавливании незаметных вибраций корпуса телефона, которые возникают при воспроизведении звука через динамик. Миллиметровый радарный датчик, аналогичный тем, которые используются в беспилотных автомобилях и сетях 5G, фиксирует эти колебания. Полученные данные обрабатывает адаптированная версия Whisper — открытой модели распознавания речи на основе ИИ.
«Когда мы разговариваем по телефону, мы обычно не замечаем вибрации корпуса, вызванные звуками из динамика», — пояснил ведущий автор исследования Суредай Базак, аспирант компьютерных наук. Ученый подчеркнул, что цель работы — помочь людям лучше понимать потенциальные риски безопасности.
Для создания экспериментального устройства исследователи соединили серийный радарный датчик с одноплатным компьютером. Авторы подчеркивают, что устройство создавалось исключительно в исследовательских целях. Они адаптировали модель Whisper для работы с «зашумленными» радарными данными методом низкоранговой адаптации. Этот подход позволил настроить только 1% параметров модели вместо ее полного переобучения.
Во время тестирования радарный датчик размещали на расстоянии до полуметра от телефона. Система достигла точности распознавания текста до 60%. Точность можно повысить путем ручной корректировки расшифровки с учетом контекста разговора.
Подписывайтесь на Mediasat в Telegram: здесь самые интересные новости из мира технологий
Эксперименты показали, что устройство способно улавливать вибрации в радиусе до трех метров, хотя точность распознавания при этом значительно снижается. Это существенный прогресс по сравнению с предыдущей версией исследования 2022 года, которая могла распознавать только отдельные слова.
Соавтор исследования Махант Гоуда, научный руководитель Базака, сравнил возможности технологии с чтением по губам. «Даже частичное распознавание ключевых слов уже полезно с точки зрения безопасности», — отметил ученый. Хотя чтение по губам позволяет уловить только 30-40% слов, люди используют контекст для понимания сути разговора.
Исследователи подчеркивают исключительно научный характер своей работы. Они стремятся повысить осведомленность людей о возможных способах несанкционированного прослушивания. Базак призвал быть более осторожными во время конфиденциальных телефонных разговоров, особенно в общественных местах.
Технология демонстрирует, как современные достижения в области ИИ могут создавать новые вызовы для конфиденциальности. Радарные датчики становятся все более доступными и компактными, что потенциально расширяет возможности для их использования злоумышленниками.
Ранее мы сообщали, что китайцы научились прослушивать помещения через которые проходят оптоволоконные кабели.
