Vortragsfolien für https://bid2022.abstractserver.com/program/#/details/presentations/28
Über 50 Jahre nach Erfindung des “Machine-Readable Cataloging” werden in Bibliotheken Metadaten noch immer primär in MARC oder verwandten feldbasierten Formaten (PICA, MAB2, ASEQ, allegro) verwaltet. Die Verarbeitung dieser, außerhalb des Bibliothekswesens praktisch irrelevanten Datenformate erfordert mitunter spezielle Werkzeuge. Mit wachsender Verfügbarkeit größerer Datenbestände bis zu Big Data und mit zunehmender Verbreitung von allgemeinen Data Science Verfahren ist in den letzten Jahren auch der Bedarf an Möglichkeiten zur flexiblen Analyse von Bibliotheksdaten gestiegen. Die Analysen reichen von einfachen Statistiken über Prozesse zur Datenanreicherung und Qualitätskontrolle bis zu Visualisierungen und komplexen Verfahren des Machine-Learning. In den letzten Jahren sind deshalb eine Reihe von offenene Werkzeugen für Bibliotheksdaten entstanden, über die im Rahmen dieses Vortrags ein Überblick gegeben werden soll. Im Gegensatz zu früheren Anwendungen lassen sich die vorgestellten Kommandzeilen- oder Browser-basierten Werkzeuge gut in allgemein Data Science Workflows integrieren. Der Einsatz von Analysewerkzeuge von der Idee bis zum Ergebnis wird am Beispiel des an der DNB entwickelten GND-Dashboard illustriert.
- Online unter https://jakobib.github.io/bibtag2022/
- PDF-Version unter https://jakobib.github.io/bibtag2022/slides.pdf
cataloging.jpg: https://commons.wikimedia.org/wiki/File:Room_100,_including_card_catalogs_(3110117236).jpg New York Public Library 1923
tools.jpg https://commons.wikimedia.org/wiki/File:DIY_means_choosing_the_right_tool_for_the_purpose_-_a_watchmaker%27s_nightmare.jpg CC-BY-SA 4.0 Franz van Duns
ephesus-library.jpg: https://commons.wikimedia.org/wiki/File:Ephesus_Celsus_Library_Fa%C3%A7ade.jpg CC-BY-SA 3.0 Benh LIEU SONG