Internet Archive достиг отметки в один триллион сохраненных веб-страниц

Некоммерческий цифровой архив Internet Archive преодолел историческую отметку — триллион сохраненных веб-страниц. За этим достижением — почти три десятилетия непрерывной работы по архивированию интернет-контента, сообщает Popular Science.

Организация основана в 1996 году с миссией формировать «постоянную летопись эволюции интернета». Специализированные поисковые роботы автоматически обходят общедоступные сайты, а пользователи загружают материалы самостоятельно — от редких книг до аудиозаписей. Потребность в такой работе очевидна — цифровой контент чрезвычайно недолговечен и исчезает, как только кто-то перестает его поддерживать.

- Реклама -

В настоящее время хранилище насчитывает более 866 млрд веб-страниц и около 41 млн текстовых материалов. Ежедневно архив пополняется примерно на 500 млн страниц, а общий объем данных уже достиг 100 тыс. терабайт.

Впрочем, у проекта есть серьезная проблема. Крупные медиакомпании все чаще закрывают доступ к свежим публикациям — они опасаются, что материалы будут использованы для обучения генеративных систем искусственного интеллекта (ИИ). Это существенно затрудняет архивирование современного веба и угрожает сохранению цифрового наследия.

Подписывайтесь на Mediasat в Telegram: здесь самые интересные новости из мира технологий

В Internet Archive, однако, смотрят в будущее с оптимизмом. Там надеются, что вопрос доступа к контенту будет урегулирован, а проект сможет двигаться вперед — навстречу второму триллиону сохраненных страниц.

- Реклама -

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

- Реклама -

Читайте также

YouTube тестирует автоматическую скорость воспроизведения и режим «На ходу» для подписчиков Premium

YouTube тестирует для подписчиков Premium автоматическую регулировку скорости воспроизведения видео и режим «На ходу». Тестирование продлится до 27 апреля — после чего Google примет решение об их дальнейшей судьбе.

AT&T понесла убытки в размере 82 млн долларов из-за краж медных кабелей в 2025 году

В 2025 году компания AT&T зафиксировала более 10 000 краж медных кабелей, ущерб от которых составил 82 млн долларов. Больше всего пострадала Калифорния — 7 300 инцидентов на сумму 54 млн долларов.

Tubi стал первым стриминговым сервисом, интегрированным в ChatGPT

OpenAI интегрировала сервис Tubi в ChatGPT — он стал первой видеоплатформой в экосистеме чат-бота. Фильмы можно искать без указания точных названий.

YouTube разрешил создавать ИИ-аватары с голосом и вставлять их в Shorts

YouTube разрешил встраивать реалистичные ИИ-аватары в Shorts. Чтобы создать двойника, достаточно сделать несколько селфи и прочитать несколько строк текста.

Amazon Leo начнёт коммерческую эксплуатацию в середине 2026 года

Amazon Leo запустят для широкой аудитории в середине 2026 года. Сервис обещает более низкую цену по сравнению со Starlink и тесную интеграцию с облачными сервисами AWS для бизнеса.