Дослідники з Університету штату Пенсільванія створили компактний радарний датчик, здатний перехоплювати телефонні розмови на відстані до трьох метрів. Пристрій аналізує мікровібрації корпусу смартфона і за допомогою штучного інтелекту перетворює їх у текстові стенограми. Результати дослідження були представлені на 18-й конференції ACM з безпеки та конфіденційності в бездротових і мобільних мережах.
Технологія базується на вловлюванні непомітних вібрацій корпусу телефону, які виникають під час відтворення звуку через динамік. Міліметровий радарний датчик, аналогічний до тих, що використовуються в безпілотних автомобілях та мережах 5G, фіксує ці коливання. Отримані дані обробляє адаптована версія Whisper — відкритої моделі розпізнавання мови на основі ШІ.
«Коли ми розмовляємо через телефон, ми зазвичай не помічаємо вібрації корпусу, що породжуються звуками з динаміка», — пояснив провідний автор дослідження Суредай Базак, аспірант комп’ютерних наук. Науковець підкреслив, що мета роботи — допомогти людям краще розуміти потенційні ризики безпеки.
Для створення експериментального пристрою дослідники з’єднали серійний радарний датчик з одноплатним комп’ютером. Автори підкреслюють, що пристрій створювався виключно в дослідницьких цілях. Вони адаптували модель Whisper для роботи з «зашумленими» радарними даними методом низькорангової адаптації. Цей підхід дозволив доналаштувати лише 1% параметрів моделі замість її повного перенавчання.
Під час тестування радарний датчик розміщували на відстані до пів метра від телефону. Система досягла точності розпізнавання тексту до 60%. Точність можна підвищити шляхом ручного коригування розшифровки з урахуванням контексту розмови.
Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому
Експерименти показали, що пристрій здатний вловлювати вібрації в радіусі до трьох метрів, хоча точність розпізнавання при цьому значно знижується. Це суттєвий прогрес порівняно з попередньою версією дослідження 2022 року, яка могла розпізнавати лише окремі слова.
Співавтор дослідження Махант Гоуда, науковий керівник Базака, порівняв можливості технології із читанням з губ. «Навіть часткове розпізнавання ключових слів вже корисне з погляду безпеки», — зазначив науковець. Хоча читання з губ дозволяє вловити лише 30-40% слів, люди використовують контекст для розуміння суті розмови.
Дослідники підкреслюють виключно науковий характер своєї роботи. Вони прагнуть підвищити обізнаність людей про можливі способи несанкціонованого прослуховування. Базак закликав бути обережнішими під час конфіденційних телефонних розмов, особливо в публічних місцях.
Технологія демонструє, як сучасні досягнення у галузі ШІ можуть створювати нові виклики приватності. Радарні датчики стають дедалі доступнішими та компактнішими, що потенційно розширює можливості для їх використання зловмисниками.
Раніше ми повідомляли, що китайці навчилися прослуховувати приміщення через які проходять оптоволоконні кабелі.
