Internet Archive досяг позначки в один трильйон збережених веб-сторінок

Некомерційний цифровий архів Internet Archive подолав історичну позначку — трильйон збережених веб-сторінок. За цим досягненням — майже три десятиліття безперервної роботи з архівування інтернет-контенту, повідомляє Popular Science.

Організацію засновано 1996 року з місією формувати «постійний літопис еволюції інтернету». Спеціалізовані пошукові роботи автоматично обходять загальнодоступні сайти, а користувачі завантажують матеріали самостійно — від рідкісних книг до аудіозаписів. Потреба в такій роботі очевидна — цифровий контент надзвичайно недовговічний і зникає, щойно хтось перестає його підтримувати.

- Реклама -

Нині сховище налічує понад 866 млрд веб-сторінок і близько 41 млн текстових матеріалів. Щодня архів поповнюється приблизно на 500 млн сторінок, а загальний обсяг даних уже сягнув 100 тис. терабайтів.

Утім, проєкт має серйозну проблему. Великі медіакомпанії дедалі частіше закривають доступ до свіжих публікацій — вони побоюються, що матеріали використають для навчання генеративних систем штучного інтелекту (ШІ). Це суттєво ускладнює архівування сучасного вебу й загрожує збереженню цифрової спадщини.

Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому

В Internet Archive, проте, дивляться в майбутнє з оптимізмом. Там сподіваються, що питання доступу до контенту врегулюється, а проєкт зможе іти вперед — назустріч другому трильйону збережених сторінок.

- Реклама -

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

- Реклама -

Читайте також

YouTube тестує автоматичну швидкість відтворення та режим «На ходу» для Premium-підписників

YouTube тестує для підписників Premium автоматичну зміну швидкості відео та режим «На ходу». Тест триватиме до 27 квітня — потім Google вирішить їхню долю.

AT&T зазнала збитків на $82 млн через крадіжки мідних кабелів у 2025 році

AT&T у 2025 році зафіксувала понад 10 000 крадіжок мідних кабелів із збитками $82 млн. Найбільше постраждала Каліфорнія — 7 300 інцидентів на $54 млн.

Tubi став першим стримінговим сервісом, інтегрованим у ChatGPT

OpenAI інтегрувала сервіс Tubi у ChatGPT — він став першою відеоплатформою в екосистемі чатбота. Шукати фільми можна за описом настрою без точних назв.

YouTube дозволив створювати ШІ-аватари з голосом і вставляти їх у Shorts

YouTube дозволив вбудовувати реалістичні ШІ-аватари у Shorts. Для створення двійника достатньо зробити кілька селфі та прочитати кілька рядків тексту.

Amazon Leo розпочне комерційну роботу в середині 2026 року

Amazon Leo стартує для широкої аудиторії у середині 2026 року. Сервіс обіцяє нижчу ціну за Starlink і глибоку інтеграцію з хмарними сервісами AWS для бізнесу.