mètode per combinar diversos recursos digitals en un fitxer d'arxiu agregat juntament amb informació relacionada From Wikipedia, the free encyclopedia
El format d'arxiu WARC (Web Archive) especifica un mètode per combinar diversos recursos digitals en un fitxer d'arxiu agregat juntament amb informació relacionada. El format WARC és una revisió del format de fitxer ARC_IA d'Internet Archive que s'ha utilitzat tradicionalment per emmagatzemar "exploracions web" com a seqüències de blocs de contingut recollits de la World Wide Web. El format WARC pretén generalitzar un format per donar suport millor a les necessitats de recollida, accés i intercanvi de les organitzacions d'arxiu. A més del contingut principal registrat en el moment, la revisió inclou contingut secundari relacionat, com ara metadades assignades, esdeveniments de detecció duplicats abreujats (vegeu §7.6 "revisita") i transformacions posteriors. El format WARC s'inspira en fluxos HTTP/1.0, amb una capçalera similar i l'ús de CRLF com a delimitadors, el que el fa molt propici per a les implementacions de rastrejadors.[1][2][3][4][5] [6][7][8]
Tipus | web archive file format (en) , format de fitxer i format de contenidor digital |
---|---|
Extensió | warc |
MIME | application/warc |
Estàndard | WARC Format 1.1 specification (en) i WARC Format 1.0 specification (en) |
Més informació | |
Wiki del format de fitxer | WARC |
LocFDD | fdd000236 |
PRONOM | fmt/289, fmt/1355 i fmt/1281 |
Especificat per primera vegada el 2008, WARC és ara reconegut per la majoria dels sistemes de biblioteques nacionals com l'estàndard a seguir per a l'arxiu de pàgines web.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.