Компании, специализирующиеся на сборе открытых данных из интернета для обучения моделей искусственного интеллекта (ИИ), все активнее привлекают к этому процессу владельцев смарт-телевизоров. В частности, выяснилось, что ряд приложений для Smart TV содержит код компании Bright Data — оператора глобальной прокси-сети для веб-скрапинга, — сообщает TechSpot.
Bright Data позиционирует свою технологию как систему «доставки данных» и предлагает разработчикам инструмент под названием Bright SDK. Он позволяет встраивать прокси-функциональность непосредственно в приложения — в том числе и для Smart TV. Взамен пользователи получают стимулы для участия в сети, например, уменьшенный объем рекламы или бесплатный доступ к стримингу. Рекламные материалы компании утверждают, что технология обеспечивает «100%» монетизацию пользователей с сохранением привычного опыта просмотра.
Как только пользователь соглашается на участие, через интернет-соединение его устройства начинает проходить внешний веб-трафик. Собранные данные поступают на серверы Bright Data, где их продают ИИ-компаниям для обучения больших языковых моделей. Главный операционный директор Bright Data Ариэль Шульман уверял на отраслевом вебинаре, что SDK не отслеживает пользователей напрямую — код якобы работает анонимно в фоновом режиме. Впрочем, из-за распределенного характера IP-соединений активность краулеров сложно отследить самому пользователю.
Представительница компании Дженнифер Бернс подчеркнула, что участие добровольное и отказаться от него можно в два шага. По ее словам, SDK инициирует сбор данных только тогда, когда локальные вычислительные и сетевые ресурсы не испытывают существенной нагрузки. Несмотря на эти заверения, пользователи фактически не имеют возможности отследить, сколько фонового трафика проходит через их соединение, пока SDK активен.
Подписывайтесь на Mediasat в Telegram: здесь самые интересные новости из мира технологий
Крупные технологические платформы уже начинают ограничивать подобную практику. В частности, Google запретила приложениям запускать постоянные фоновые SDK-процессы, а Amazon заблокировал приложения с прокси-интеграциями Bright SDK. В то же время на платформах Tizen OS и webOS, по имеющимся сведениям, сотни приложений могут содержать подобную функциональность. Некоторые разработчики, которым задавали вопросы об этой практике, отказались от комментариев или удалили прокси-интеграцию из своих продуктов.
Bright Data утверждает, что ее прокси-сеть охватывает около 150 миллионов устройств пользователей — не только смарт-телевизоров, но и компьютеров и смартфонов. Критики сравнивают эту бизнес-модель с IPIDEA — резидентной прокси-сетью с китайскими корнями, которую Google ликвидировала, заблокировав по судебному распоряжению десятки ее доменов и серверов. По их мнению, подобные распределенные сети могут использоваться в злонамеренных целях. Сама Bright Data настаивает, что ее платформа предназначена исключительно для законного сбора данных и научных исследований.
Практика скрытого сбора данных через смарт-телевизоры все больше привлекает внимание регулирующих органов. В частности, недавно прокуратура штата Техас подала иск против пяти крупнейших производителей — Sony, Samsung, LG, Hisense и TCL, обвинив их в незаконном сборе и продаже данных пользователей.
