Archivéiert gëtt an Zukunft alles, wat ëffentlech zougänglech ass, also iwwer eng Sichmaschinn wéi Google oder Bing ka fonnt ginn. De Webarchiv ass aus rechtlechen Ursaachen nëmmen an der Nationalbibliothéik selwer ze consultéierten, also net iwwer Internet. De Michel Delage huet sech mam Ben Els vun der Nationalbibliothéik iwwer déi nei Initiativ ënnerhalen.
Michel Delage: Wéi eng digital Contenue gi genee gesammelt an archivéiert?
Ben Els: Fir de gréissten Deel ass et fir all Domänen, déi am .lu sinn oder Säiten, déi mir fonnt hunn an an engem aneren Domän sinn, awer zu Lëtzebuerg publizéiert gi sinn oder vu Lëtzebuerger am Ausland. Am Fong alles, wat fir de Lëtzebuerger Patrimoine interessant ass, wëlle mir domat preservéieren an och den Accès zu deene Websitten oprecht erhalen.
Grad déi Säiten, déi net am .lu leien, si fir eis schwéier ze fannen. Leit, déi sech Suerge maachen, wéi hire Contenu kann um Internet behale bleiwen, solle roueg hir Säite bei eis eraginn. Da kënne mir déi op d'Lëscht setzen, fir an den Archiv opzehuelen.
Wéi eng Dokumenter sinn dat dann? Bloggen, Säite vu Veräiner ...?
Jo, mir probéieren esou inklusiv wéi méiglech ze sinn. Mir ginn elo net de Contenu vun engem Site bewäerten, ob méi oder manner wichteg. Bei eise breede "crawlen" huele mir wierklech eng grouss Foto vun allem, wat zu Lëtzebuerg op de Websitten ass. Hei am Land ass dat nach ze realiséieren. Déi däitsch Nationalbibliothéik, beispillsweis, kann net den Usproch erhiewen, den .de-Domän ofzedecken, well dat vill ze vill Websitte sinn.
Huet d'BNL schonn eng ongeféier Anung, wéi eng Mass un Dokumenter do mussen archivéiert ginn? Oder loosst dir iech an enger éischter Phas emol iwwerraschen, wat do alles zesummekënnt?
D'Limitte vun eisem Sammele sinn technesch a budgetär. All sechs Méint kënne mir ëm déi zéng Terabyte eroflueden. Dat geet mat Sécherheet net duer fir all Website. Et si graff ëm déi 100.000 Adressen, déi mir siche ginn, an et geet net duer, fir alles a perfekter Qualitéit ze archivéieren.
"80 Prozent vun de Contenue verschwannen no engem Joer"
Et gi Säiten, déi si méi liicht oder méi schwiereg ze archivéieren. Alles wat dynamesche Contenu ass oder eng Interaktioun vum Benotzer erfuerdert, kann eise Crawler (also Roboter) net esou einfach eroflueden. Dat heescht, et ka sinn, datt déi Säiten am Archiv herno manner gutt funktionéieren.
Et gëtt jo gesot, den Internet wier eppes Flüchteges. De Webarchiv liwwert eigentlech de Géigebeweis: eppes wat um Internet publizéiert ass, kann elo archivéiert ginn an ass Deel vun enger Memoire ...
Ganz richteg. Am Fong ass et e bëssen eng falsch Suppositioun, datt den Internet net géif vergiessen, oder alles wat online ass fir ëmmer géif bleiwen. Et ass eigentlech just de Géigendeel: Publikatiounen op engem physesche Support si vill méi nohalteg wéi Verëffentlechungen um Internet. 80 Prozent vun de Contenuen, déi een haut kann um Internet fannen, si bannent engem Joer entweder ganz verschwonnen oder just nach an enger anerer Form ze fannen. Dat heescht, de Wiessel ass vill méi rasant wéi op anere Medien.
Et ass scho vill Zäit verluergaangen, net nëmme bei eis, och an anere Länner, déi nach guer kee Webarchiv bedreiwen. Et besti scho grouss Wëssenslacunnen, besonnesch iwwer déi fréi Deeg vum Internet ufanks de 1990er Joren.
An der Europäescher Unioun besteet d'Recht, fir um Internet vergiess ze ginn. Hei geet et ëm de Schutz vun der Privatsphär. A wéi wäit ass dat mam Webarchiv ënner een Hutt ze bréngen?
Sécherlech sinn Informatiounen iwwer Persounen an eisem Archiv ze fannen, vu datt déi op engem Internet-Site ze fanne sinn. Huele mer d'Beispill vun enger Persounen, déi op engem Site schaarf ugegraff géif ginn, mat grave Beleidegungen, mat falsche Fotoen, Harcèlement, asw. Do kéint een higoen a soen, dat wier eng illegal Aktivitéit an datt dee Site net méi an eisem Archiv kann duerchsicht ginn.
Sinn Debatten op Facebook erhalenswäert?
Wann, anerersäits, eng Bibliothéik all Buch misst aus dem Regal huelen, well iergend ee seng Meenung geännert huet, da wieren d'Bibliothéike warscheinlech eidel. Dat heescht, mir kënnen elo keng Internet-Säiten eraushuelen, well Leit soen: "dat huet mir elo net méi gefall, wat ech op deem Site hat". Déi bleiwen an eisem Archiv dran.
E groussen Deel vun der Aktivitéit um Internet spillt sech an de soziale Medien of, ënner anerem op Facebook. Wäert déi Aktivitéit och fir de Webarchiv erfaasst ginn?
De Fokus läit ganz sécher net op de soziale Medien. Déi technesch Schwieregkeete sinn do nach méi grouss, an de Respekt vun der Privatsphär ass do nach méi e schwieregen Theema. Mir plangen, fir méi iwwer Twitter ze sammelen, well dat nach méi en ëffentleche Charakter huet wéi beispillsweis Facebook.
Mir hu schonn e puer Tester gemaach mat Facebook, mat de Campagnë fir déi lescht Gemengen- a Chamberwalen. Punktuell hu mer do Säite gesammelt vun de Parteien a vun de Kandidaten, déi ugetruede sinn, an Ofstëmmung mat de Parteien.
D'Leit brauchen elo keng Angscht ze hunn, datt hir perséinlech Profiller géife gesammelt ginn. Dat ass technesch net ze realiséieren, an et ass och net am Interêt vum digitale Patrimoine, fir déi Saachen ze versuergen.
Doriwwer léisst sech awer streiden. Ëmmerhi lafe vill ëffentlech Debatten iwwer déi sozial Medien, oder?
Dat ass eng grouss Diskussioun: wat ass derwäert, archivéiert ze ginn? Wat ass vun nationaler Wichtegkeet a misst versuergt ginn? Mir kënne schwéier aschätzen, wat eng Kéier fir d'Geschichtsfuerschung wäert relevant oder interessant ginn. Eng Debatt an engem sozialen Netzwierk huet éischter de Charakter vun engem Telefonsgespréich oder enger privater Ënnerhalung. Dat ass e ganz schmuele Grad, an déi Diskussioun ass nach laang net ofgeschloss. An et wäerten nach vill Ännerungen op eis duerkommen, den Internet respektiv d'Utilisatioun vun de Leit wäerte sech weider entwéckelen.