Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Löschmechanismus für regelmässige "manuelle" Löschungen #5

Open
2 tasks
oschihin opened this issue Aug 25, 2015 · 2 comments
Open
2 tasks

Löschmechanismus für regelmässige "manuelle" Löschungen #5

oschihin opened this issue Aug 25, 2015 · 2 comments
Assignees

Comments

@oschihin
Copy link

Problem

Bei OAI-Repositories, die keine Informationen über Löschungen publizieren (siehe http://www.openarchives.org/OAI/openarchivesprotocol.html#DeletedRecords), können regelmässig oder unregelmässig Listen mit zu löschenden Records erstellt werden. Aktuell besteht ein Mechanismus, der diese Listen auf CBS einstellt, damit die Records dort gelöscht werden. Die Records verbleiben dabei aber im Rohdatenspeicher / MongoDB. Diese enthält damit weiterhin eigentlich gelöschte Sätze.

Task

  • Erstelle einen Mechanismus, der basierend auf einer Liste mit Identifiern die entsprechenden Sätze entweder physisch aus Mongo löscht, oder diese als gelöscht markiert.
  • Stelle sicher, dass die entsprechenden Löschmeldungen auch an CBS geschickt werden.

Hinweise

Akut ist der Fall SNL. Wir erhalten monatlich eine Liste mit n Aufnahmen des Status deleted:
Zwei Records per Mail

Record ID: 732319
Username: yb
Timestamp: 15-JUL-2015 09:29:46
Bibliographic Level: m
Record Type: a
Record State: Deleted

Record ID: 1787785
Username: sib
Timestamp: 15-JUL-2015 11:10:58
Bibliographic Level: m
Record Type: a
Record State: Deleted

Daraus erstellte delete-Liste für CBS
(Skript zur Erstellung dieser xml-Struktur liegt im internen Repo 'cbs')

<collection>
<record><header status="deleted"><identifier>vtls001708042</identifier></header></record>
<record><header status="deleted"><identifier>vtls001771693</identifier></header></record>
</collection>
@guenterh
Copy link
Member

guenterh commented Oct 2, 2015

@oschihin

  • feature branch wurde in master gemerged
  • deployscripte für coai1 / coa2 angepasst
  • neue sourcen auf coai1 und coai2 verteilt
  • Konfigurationen für 'alle' repositories erweitert. Auch für Alex repository auf coai2 (zur Zeit nicht aif coai1) Hintergrund, warum für alle erweitert: Die Impementierung ist generell und erwartet ein bestimmtes Konfigurationstag, auch wenn der Mechanismus für das Repository gar nicht angewendet wird. Dies könnte man durch vererbbare Konfigurationen vereinfachen. Erfordert aber eine Erweiterung
  • crontab auf coai1 eingerichtet. Es wird täglich ein Prozess gestartet (20:00). Dieser ist aktuell so konfiguriert, dass er für snb und ecod nach files im konfigurierten Verzeichnis mit IDs zum Löschen sucht. Wie von uns beiden getestet.

Günter

@oschihin
Copy link
Author

@guenterh @witzigs
Das Outputformat für die Löschungen in CBS ist noch nicht korrekt:

  • Präfix 'vtls' fehlt
  • Systemnummern noch nicht neunstellig

Das Verfahren ist deshalb in der crontab auf coai1 ausgeschaltet

@oschihin oschihin reopened this Mar 10, 2016
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants