archive.org - das Monster hinter der Netlabel-Szene


Diesmal ist eine Institution dran, ohne die es einen Großteil der Netlabels, vielleicht sogar die gesamte Szene gar nicht gäbe: archive.org
Neben scene.org ist das Internet Archive das Projekt, auf dessen Webspace die meisten Daten aller Netlabels weltweit liegen – so auch die von Zufall.
Wie jedoch folgende kurze Selbstbeschreibung andeutet kann das Archiv noch einiges mehr:

The Internet Archive is building a digital library of Internet sites and other cultural artifacts in digital form. Like a paper library, we provide free access to researchers, historians, scholars, and the general public.

1996 gegründet, beinhaltete das Archiv im März 2007 geschätzte drei Petabyte (= 3 Mio. Gigabyte) an copyright-freien Daten, die alle allgemein zugänglich sind, und wächst angeblich jeden Monat um ca. 20 Terabyte.

Der Bereich der Netlabels ist nur ein kleiner Unterbereich der Audio Library, die zum Zeitpunkt des Verfassens dieses Artikels 135.615 Aufnahmen umfasste. Denn nicht nur Labels können hier ihre Musik archivieren und veröffentlichen, sondern z.B. auch einzelne Künstler und Bands ihre Aufnahmen und Live-Mitschnitte. Daneben gibt es u.a. Radiosendungen, Interviews, Hörbücher, religiöse und spirituelle Lehrreden, usw.

Was sonst noch so archiviert wird hier?

Film: Die bunte Mischung von opensource-Produktionen und aus Altersgründen copyright-freiem Material umfasst Animationen, Musikvideos, Dokumentar-, Spiel-. und Kurzfilme, Video-logs, Sportvideos oder auch Videospiele.

Texte: 191,434 E-Books (meist pdf), mit copyright-freien Texten, zusammengefasst aus verschiedenen Bibliotheksarchiven in allen möglichen Sprachen.

Software: Tucows Software Library, die größte Freeware/Shareware-Sammlung im Internet – und CLASP, eine noch eher kleine Sammlung von Klassikern aus den 70ern und 80ern.

Und Internet! Das erstaunlichste zum Schluss: archive.org archiviert Internet. Tagtäglich werden hunderttausende Seiten gespeichert, die über die sogenannte Wayback Machine jedermann zugänglich sind – das macht bis März 2007 ungefähr 85 Milliarden Seiten. Hier ein Beispiel: Die Zufall-Seite vom 19. August 2004
Zwar fehlt die eine oder andere Unterseite oder Grafik, für den Bekanntheitsgrad, den Zufall damals hatte, ist das aber doch schon sehr erstaunlich.

Viel Spaß beim Suchen alter Schätze!

Comments

webspace

mit webspace bezeichnet man für normal einen account auf einem shared-hosting-server (also sowas wie wir kleinen fische im internet für unsere websites um 1 bis 5€ im monat anmieten), bei IA würde ich eher von einer server-farm oder einem rechen- oder datenzentrum sprechen. mich würde interessieren, wieviel platzman für diese 3PB in der realen welt braucht.