Каталог архивированных сайтов в Национальном цифровом архиве

Актуальный каталог всех архивированных сайтов в национальном цифровом архиве

Структура CSV файла:

id - уникальный идентификатор ресурса

collection - наименование/код коллекции

domain - домен

filename - наименование файла

filesize - размер файла

date_modified - дата изменения

public_url - общедоступная ссылка для выгрузки

Также в списке присутствуют технические файлы использованные при архивации - WARC файлы метаданных, базы ссылок, вспомогательные файлы grab-site и wpull.

Всего 2559 доменов

Data and Resources

Additional Info

Field Value
Source https://ruarxive.org
Author Иван Бегтин
Maintainer Иван Бегтин
Version 1.0
Last Updated December 16, 2020, 12:17 (UTC)
Created December 16, 2020, 12:16 (UTC)
creation_date 2020-12-16
funding_source Другое