Bestand
C02-Bestand Intranetarchivierung (Bestand)
Form und Inhalt: Das Intranet des Bayerischen Rundfunks als elektronische Unternehmenspublikation gehört zum Sammlungsprofil des Historischen Archivs als Unternehmensarchiv. Das BR-Intranet gibt es seit 1998, damals noch von der IT alleine betrieben. 2003/2004 übernahm die Unternehmenkkommunikation die Betreung.
Die Archivierung erfolgt auf zwei Wegen: jährliche Vollspiegelungen, um das "look and feel" des Intranets im Laufe der Jahre zu dokumentieren, sowie tägliche Speicherungen einzelner bewerteter Artikel als PDFs, um die Inhalte des Intranets recherchierbar zu machen. Im Laufe der Jahre erfolgten mehrere Systemwechsel, so dass auch die Vollspiegelungen angepasst werden mussten.
2014 erfolgte der Umstieg des Intranets von Webgate Anywhere auf Sophora und SharePoint (für die Abteilungsseiten). Im Rahmen eines Projekts mit der Firma ... wurden die Inhalte von 2004 bis 2014 gesichert und sich mittels der Solr-Suchmaschine im Volltext recherchierbar. Das Artikelarchiv ist im Intranet zu finden unter: http://itmu-solr91/.
Seit März 2004 werden einzelne Intranetseiten - bis auf wenige Ausnahmen etwa zu Steuerkarten - als PDFs gespeichert und mit der Signatur PER.BR.108.E in das Digitale Langzeitarchiv des Historischen Archivs ingestiert. Dabei werden aus den html-Seiten die bereits in Sophora vergebenen Metadaten, wie Autor*in, übernommen. Beim Ingest werden zudem die Metadaten "Titel" und "Datierung" aus dem gespeicherten Dateinamen in den FAUST-Datensatz eingelesen. Derzeit (Stand Februar 2021) wurden bereit 12.000 einzelne Artikel archiviert. Die Dateien können in FAUST oder über den Medienbroker oder im Digitalen Lesesaal recherchiert werden.
Parallel dazu wird seit 2012 in jährlichem Rhythmus an einem Stichtag das gesamte Intranetangebot gecrawlt. Dazu wird die Software Heritrix des Internet Archivs eingesetzt. Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, das 1996 gegründet wurde. Gestartet als reines Webarchiv, wurde es schon 1999 um weitere Archive erweitert. Heute umfasst es Sammlungen von Texten und Büchern, Audiodateien, Videos, Bildern und Software. Es hat sich die Langzeitarchivierung digitaler Daten in frei zugänglicher Form zur Aufgabe gemacht und legt dabei Wert auf Zugangsmöglichkeiten für blinde oder anders eingeschränkte Nutzer. (Quelle: Wikipedia). Heritrix ist ein sogenannter Webcrawler, der unter anderem vom Internet Archive entwickelt wurde, um Webseiten zu archivieren. Webcrawler sind eine spezielle Art von Bots, also Computerprogrammen, die weitgehend automatisch sich wiederholenden Aufgaben nachgehen. (Quelle: Wikipedia) Im Fall des Intranetarchivs folgt der Webcrawler einmal jährlich den Linkstrukturen und speichert die von ihm gefundenen Inhalte in einem Archivformat (WARC) ab.
Die einzelnen Spiegelungen können über die Suchmaschine Wayback Machine angesehen werden. Sie sind unter der Signatur PER.BR.BR.109.E in der Objektart "Historische Dokumentation" als einzelne Datensätze erfasst, mit Größen- und Umfangsangaben sowie den Inhalten der jeweiligen Spiegelung und den Links.
Die Warc-Files liegen auf einem Server der IT.... (Tom: wo genau, hier noch weitere technische Details)
Literatur:
- Nicole Sachmann, Das OAIS-Referenzmodell in der Praxis: Ein Konzept zur Archivierung des BR-Intranets, Unterhaching 2010;
- Reference number of holding
-
PER.BR.108.E; PER.BR.109.E
- Extent
-
jährliche Vollspiegelungen, 12.000 Datensätze, 1 Artikelarchiv
- Context
-
BR, Historisches Archiv (Archivtektonik) >> Tektonikgruppe C = Sammlungsgut >> C02 Bestandsgruppe Periodika PER.BR. >> C02-Bestand Intranetarchivierung
- Date of creation of holding
-
2004 -
- Other object pages
- Online-Beständeübersicht im Angebot des Archivs
- Last update
-
10.06.2025, 10:23 AM CEST
Data provider
BR, Historisches Archiv. If you have any questions about the object, please contact the data provider.
Object type
- Bestand
Time of origin
- 2004 -