З’явився перший штучний інтелект, навчений у даркнеті

DarkBERT може досліджувати даркнет, аби виявляти та позначати потенційні загрози для кібербезпеки, зокрема – витік даних та програми-вимагачі.

Дослідники з Корейського інституту науки й передових технологій (KAIST) в рамках спільного проєкту з організацією аналізу даних S2W представили DarkBERT – генеративну мовну модель штучного інтелекту, яка була навчена виключно на наборах даних, отриманих із так званої темної мережі або даркнету.

- Реклама -

Метою проєкту було створення не чогось, подібного до ChatGPT або Bard, а інструменту, здатного аналізувати набори даних та давати відповіді на конкретні запити. DarkBERT може перевірити, чи дозволить використання даркнету як набору даних інструментам штучного інтелекту краще розуміти мову, яка використовується в цих мережах, що потенційно робить його цінним помічником для фахівців з проблем кібербезпеки та співробітників  правоохоронних органів.

Дослідники використали Tor для навчання моделі штучного інтелекту

Для того, аби оптимізувати процес адаптації DarkBERT до мови, яка використовується в даркнеті, команда дослідників створила масштабну базу даних, скануючи мережу віртуальних тунелів Tor. Команда також застосувала дедуплікацію, фільтрацію даних і попередню обробку, аби усунути етичні проблеми, пов’язані використанням контенту з «темної мережі», адже він часто містить конфіденційну інформацію.

Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому

Протягом 16 днів модель «годували» даними з двох наборів. При цьому ці дані було попередньо відредаговано, аби вилучити з них назви організацій-жертв, деталі витоку даних, заяви про загрози та нелегальні зображення. Понад тисяча сторінок з цього набору даних належала до категорії розваг для дорослих.

З огляду на потенційно ризикований характер матеріалів даркнету, DarkBERT найближчим часом не буде доступний для широкої громадськості. Однак, наразі можна надсилати запити на використання цієї моделі штучного інтелекту в академічних цілях.

- Реклама -

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

Борис Скуратівський
Борис Скуратівський
Журналіст, медіа-експерт та «літописець» історії українського радіо. За освітою – філолог (мав навчати діточок розмовляти, читати й писати англійською мовою, а також – любити українську мову та літературу, але так вже склалося, що несу знання дорослим і поважним людям, інформуючи їх про новини зі світу радіо, телебачення та суміжних технологій). За розвитком телебачення і радіо в Україні уважно слідкую з 1990-го року (коли почали з’являтися перші недержавні мовники) – спочатку робив це як пасивний спостерігач, а з лютого 1997 року, коли на шпальтах кіномузичного тижневика «П’ятниця» вперше вийшла моя рубрика «Новини радіо», - вже в якості журналіста. Згодом в різні роки співпрацював з газетою «Хрещатик», а також галузевими журналами «Телерадіокур’єр», «Телемир», «Медиа-Эксперт» та низкою інших видань. З 1998 по 2001 рік працював на радіостанції «Радіо РОКС – Україна», де вперше отримав можливість вивчати життя радіо, так би мовити, «зсередини». Згодом протягом певного часу працював редактором-наповнювачем сайту радіостанції «ХІТ FM», а потім співпрацював ще з низкою радіостанцій в якості копірайтера. З 1999 року веду власний інтернет-портал ProRadio.Org.Ua – один з перших україномовних ресурсів для фахівців в Україні, який став продовженням моєї газетної рубрики «Новини радіо» і повністю присвячений темі радіомовлення в Україні. Люблю класичний хард-рок, ціную оригінальність та нестандартність. Цікавлюсь історією, лінгвістикою, сучасним українським кінематографом та психологією.
- Реклама -

Читайте також

Starlink опустив тисячі супутників ближче до Землі для пришвидшення інтернету

Starlink переводить тисячі супутників з орбіти 550 км на 480 км. Це скоротить затримку передачі даних до менш як 20 мс і поліпшить якість сигналу для абонентів.

«Київстар» назвав можливі моделі комерціалізації Starlink Direct to Cell

«Київстар» назвав можливі моделі комерціалізації Starlink D2C для голосових дзвінків і мобільного інтернету. Деталі оголосять у третьому кварталі 2026 року.

«Київстар» заплатив 420 млн грн за кіровоградського провайдера Shtorm

«Київстар» придбав інтернет-провайдера Shtorm на Кіровоградщині за 420 млн грн. Таку суму озвучив президент оператора Олександр Комаров.

«Київстар» планує вийти на ринок цифрового банкінгу

«Київстар» веде діалог з НБУ щодо виходу на ринок цифрового банкінгу. Оператор ще вирішує, яку роль відігравати в сегменті та який тип ліцензії обрати.

ЄКА розгорнуло в Андах станцію лазерного супутникового зв’язку зі швидкістю 10 Гбіт/с

ЄКА завершило випробування лазерної станції в Андах. Установка забезпечує зв'язок із супутниками зі швидкістю 10 Гбіт/с і розпочне роботу навесні 2026 року.