Skip to content
Snippets Groups Projects
user avatar
root authored
29d18952
History

Bitstreamarchivierung für Mediathek

Automatisierte Abgabe und Wiederherstellung der Archivpaket für die Archivierung über die Datensicherung (IBMSpectrum Protect). Ein Archivpaket besteht aus einem Digitalisat und wird als gepacktes Archivpaket (Format: tar) an die Datensicherung zur Archivierung übergeben bzw. aus dem Bitstreamarchiv wiederhergestellt.

Archivierung

Über ein Ingestverzeichnis wird das zu archivierende Digitalisat in einem Verzeichnis von der Fachabteilung eingestellt. Das Verzeichnis wird nach der Signatur des Digitalisat benannt und dem entsprechenden Service (mediathek; z.B. mediathek_fon_sn_0002). In einem Unterordner docs2archive wird von der Fachabteilung die Archivierungsanforderung angelegt. Die Archivierungsanforderung ist eine leere Datei, die wie der Ablageordner mit der Signatur des zu archivierenden Digitalisat und dem entsprechenden Servicenamen benannt und gespeichert wird. Das Hauptscript search4archivejobs.sh sucht in dem Verzeichnis docs2archive nach Archivierungsanforderung und startet bei vorhandener Archiviernungsanforderung das Script docs2archive.sh. Dieses übernimmt die Verarbeitung:

  • packt das Digitalisat in ein gepacktes Archivpaket
  • startet den Datensicherungsclient und übergibt das Archivpaket. Dabei werden vorhandenen Archivierungsanforderungen sequentiell abgearbeitet. Eine in Abarbeitung befindliche Archivierngsanforderung wird mit einer Tilde vor dem Dateinamen gekennzeichnet.

Wiederherstellung

Die Fachabteilung legt eine Wiederherstellungsanforderung in das Verzeichnis docs2retrieve. Die Wiederherstellungsanforderung ist eine leere Datei mit der Signatur als Dateinamen. Das Hauptscript search4archivejobs.sh sucht in dem Verzeichnis docs2retrieve nach Wiederherstellungsanforderungen und bei Vorhandensein einer Anforderung wird das Script docs2retrieve.sh gestartet. Das Script docs2retrieve.sh startet den Datensicherungsclient zur Wiederherstellung. Das wiederhergestellte Archivpaket wird in den Ordner retrieved entpackt abgelegt und kann dort von der Fachabteilung abgeholt werden.

Aufräumarbeiten

Die im Ingestverzeichnis abgelegten Digitalisate werden über das Script checkarchive2remove.sh gelöscht. Dazu wird durch das Script geprüft, ob die Archivpakete erfolgreich im Bistreamearchiv abgelegt wurden. Ist dies erfolgt, wird im Ingestverzeichnis das Archivpaket gelöscht.

Logging

Alle prozessierten Schritte werden in einer Logdatei /var/log/jobs/archive/$(hostname)archive_processingdate +%Y%m%d.log mitgeschrieben. Diese Logdateien werden nicht gelöscht.

Alle anderen Fehlermeldungen werden in folgedner Logdatei mitgeschrieben: /var/log/server/$(hostname)_date +%Y%m%d.log.

Vorraussetzung

  • Datensicherungsclient: ISP-Cient neuste Version
  • Access Rechte auf SDVARCHIV Node der Datensicherung
  • Anbindung NAS Speicher, Zugriffsrechte für den Server
  • Zugang zum Git der SLUB

Start Scripte

search4Archivejobs.sh <Ingestverzeichnis> <tsm_optfile>

docs2archive.sh <Ingestverzeichnis> <Signatur> <tsm_optfile> <archivierungsanforderngsverzeichnis>

docs2retrieve.sh <Ingestverzeichnis> <Signatur> <tsm_optfile>

Installation

Anbindung NAS Speicher an Server

Edit /etc/fstab:

### Mediathek

212.201.62.107:/vol/archivierung_processing_02     /media/nfs-mounts/sdvnas12/archiv/mediathek      nfs rw,vers=3

### Archivierungslogdateien

212.201.62.107:/vol/archivierung_log_01/archive_processing      /var/log/jobs/archive                                   nfs rw,vers=3

### Logdateien fuer Server

212.201.62.73:/vol/linux_server_logs/sdv23varchive08            /var/log/server                                         nfs rw,vers=3

Mount auf der Kommandozeile:

skug@sdv23archive05:/opt/scripts# sudo mount -a

Ablage Scripte

Clone aus GIT der SLUB:

root@sdv23archive08:/#cd /opt

root@sdv23archive08:/opt#sudo git clone https://git.slub-dresden.de/krug/bitstreamarchivierung_mediathek.git`

Anlegen Cronjobs

Edit Crontab:

root@sdv23archive08:/#crontab -e

* * * * * /opt/scripts/search4archivejobs.sh /media/nfs-mounts/sdvnas12/archiv/mediathek /opt/tivoli/tsm/client/ba/bin/dsm-archive.opt docs2archive>/dev/null 2>&1

oder

root@sdv23archive08:/#cp /opt/bitstreamarchivierung_fotohek/crontab.backup /var/spool/cron/crontabs

Konfiguration Datensicherungsclient

Kopieren der Konfigurationsdateien:

root@sdv23archive08:/#cp /opt/bitstreamarchivierung_mediathek/dsm.sys dsm-archive.opt /opt/tivoli/tsm/client/ba/bin/

Einmaliges Anmelden:

root@sdv23archive08:/#cd /opt/tivoli/tsm/client/ba/bin/
root@sdv23archive08:/#dsmc -optfile=dms-archive.opt

Sequentielle Bearbeitung

Wird ein Archvipaket oder Weiederherstellungsanfrage bearbeitet, wird in diesem Verzeichnis eine Datei mit Prozess ID abgelegt. Damit ist gewährleistet, dass nur ein Prozess bearbeitet wird. Im Fehlerfall (z.Bsp. Datensicherungsclient ist nicht erreichbar), wird dieser Lock nicht gelöscht und es kann weder eine Archiveirung noch eine Wiederherstellung passieren. Dieser Lock muss nach Fehlerbehebung manuell gelöscht werden.

Erstelle ein Verzeichnis locks:

root@sdv23archive08:/#cd /var
root@sdv23archive08:/#mkdir locks

Start und Stop

Stop

Auskommentieren Cronjobs in der Crontab über die Kommandozeile auf dem Server: crontab -e

Start

Entfernen Auskommentierungen in der Crontab: crontab -e