OpenBibBlog

Das Blog zu OpenBib und OPAC 2.0
Optionen:

DRM – alles halb so schlimm?

Genau so einen Eindruck kann man bekommen, wenn man Dörte Böhners Blog-Artikel Ein (kleines) DRM-Missverständnis-Grummel-Posting liest. Genüsslich werden Breitseiten gegen “schwarz-weiss-denkende” DRM-Gegner geschossen:

DRM – Defective by Design – mit diesem Slogan operieren Gegner des Digital Right Mangaments (DRM) sehr gerne. Übersetzt wird DRM auch ganz gerne mit Digital Restriction Management. Ach liebe DRM-Gegner, Einfallsreichtum alleine kann das Unverständnis für das, was Digital Rights Management ist, nicht überdecken.[...]Bitte einmal laut aufschreien, DRM-Gegner!

Und die Probleme des Käufers – sorry – Lizenznehmers? Sind halt leider eben da. Lediglich hartes DRM (technische Einschränkungen) wird ansatzweise im Rahmen der Nutzungshürden problematisiert, weiches DRM (Wasserzeichen) sei sowiso breit akzeptiert. Ich bin schon etwas erschrocken so eine Argumentation aus bibliothekarischen Fach-Kreisen zu hören, wo dort doch der ungehinderte (“un”restricted) Zugang zu Informationen immer gefordert wurde.

Wenigstens werden nicht wieder die alten Kamellen der DRM-Befürworter durchgekaut, wie “Und wer denkt denn an die Künstler?”. Um es klar zu sagen – Werkschaffende sollen angemessen entlohnt werden. Typischerweise wird das Problem deren gerechter Entlohnung aber auf die potentiellen Käufer/Tauschbörsennutzer übertragen, und nicht – wie die DRM-Gegner immer wieder betonen – auf die Verteilungsseite der bestehenden Einnahmen. Ich sage nur Total-Buy-Out-Verträge oder Wissenschaftliches Publizieren hinter Pay-Walls.

Abnehmende Umsätze im CD-Bereich haben laut Rechteinhabern maßgeblich ihre Ursache in den Tauschbörsen. Dass, anders als in meiner Generation, das vorhande Geld eben nicht mehr nur in Musik auf LP/CD’s gesteckt wird, sondern sich auf alle möglichen Konsumgüter verteilt – vom Smartphone, Tablet, Mobilfunkverträge, DSL, CD’s, DVD’s usw. – und damit die effektiv verfügbare Menge für Musik abnimmt, wird bewusst ignoriert, Studien über vermehrte Kaufaktivitäten tauschender Nutzer sowiso.

Einseitige Gesetzgebung und Rechtsprechung

Die einschlägige Gesetzgebung folgt hier ganz klar den Rechteinhabern: Vom nicht vorhandenen Internetanschluss raubkopiert? Schuldig (zweitinstanzlich inzwischen aufgehoben, aber wer weiss). Zugriff auf Klarnamen zur IP-Adresse nur bei schweren Straftaten (Vorratsdatenspeicherung)? Egal. Als Eindruck bleibt: Der Rechteinhaber bekommt immer Recht.

Die Politik versucht zwanghaft in Form der Statuierung von immer neuen Exempeln des Problems Herr zu werden. Ich möchte aber meinen: Zu welchem Preis? Die USA zeigen, wohin die Reise geht: Existenzvernichtung für wie auch immer überführte Tauschbörsennutzer. Anders kann ich Strafen von 25.000 bis 250.000 US$ – pro Song/Film – nicht interpretieren.

Das nimmt inzwischen schon skurrile Züge an. Heutzutage wird ein Tauschbörsennutzer, der Lieder von Michael Jackson tauscht härter bestraft (in Deutschland bis zu 5 Jahre Haft, in den USA mehr), als der Arzt, der für seinen Tod rechtskräftig verurteilt wurde (4 Jahre Haft). Noch Fragen? Die Relationen stimmen einfach nicht mehr.

Welche allgemeinen Risiken und Nebenwirkungen resultieren für den ehrlichen Käufer bezogen auf DRM in diesem Umfeld?

Als ausschließlicher Linux-Anwender sieht die Konsumwelt für mich durch hartes DRM bereits deutlich eingeschränkter aus. E-Books laufen hierzulande meist ausschließlich über Adobe Digital Editions, für das es keine Linux-Version gibt. Onleihe ebenso. Diverse Anbieter gestatten den Download von legal erworbener Musik nur durch Windows-only Download-Programme. Streaming-Dienste funktionieren nur mit Silverlight-DRM-Erweiterungen, Moonlight unter Linux muss wieder passen. Dazu kommen die bekannten Nutzungseinschränkungen (Verleih an Freunde, Verkauf, Vererben, …), und das auch noch bei Preisen, die nahe bei den Preisen der “physikalischen Voll-Version” (Soft/Hardcover oder CD/DVD) liegen.

Warum sollte ich für eine digitale Version ähnlich viel Geld ausgeben wie für die physikalische Voll-Version, kann aber nur einen Bruchteil damit machen? Wenn beim Versuch der Rettung des analogen Geschäftsmodells die Technik nur noch dazu degradiert wird, die “Fehler” des analogen Mediums (eben Verleih, Verkauf, Vererben) auszumerzen und damit den zahlenden Kunden zu übervorteilen, dann zeugt das nicht gerade von Weitsicht, sondern Stillstand.

Anders sähe es sicherlich bei einer angepassten Preisgestaltung aus im Sinne: “You pay for what you get”. Das wären dann Preise von maximal 2 bis 4 EUR pro E-Book, Musik-Album oder Film. So ein System kann funktionieren, wie es im Spielebereich Steam mit seinen Rabattaktionen zeigt. Die konsequente Fortführung des Lizenzensierungsgedankens mündet IMHO damit aber zwangsläuftig in all-you-can-hear-or-see Flatratemodellen wie Spotify, Watchever, Lovefilm, Maxdome usw. bei entsprechend nach unten angepassten Preisen. Unabhängig davon bleiben die grundsätzlichen Nachteile von “lizensieren” vs. “besitzen”.

Dem Schlagwort ‘Defective by Design’ möchte ich noch hinzufügen ‘Obsolescence by Design’. Der Rechteinhaber kann de-facto technisch entscheiden, wie lange ein bezahlter Inhalt nutzbar ist. Schaltet der Rechteinhaber seine Lizenz-Server (z.B. wie Microsoft mit Zune)  oder Spiele-Server (z.B. XBox-Live für XBox der 1. Generation) ab, dann kann die Beschränkung bis zur Nicht-Benutzbarkeit bezahlter Inhalte führen. Gerade im Spielebereich mit Online-Zwang et al greift diese Benachteiligung des Nutzers immer weiter um sich. Jenseits der PC-Spiele wird wohl auch die nächste Konsolengeneration (XBox 720 bzw. PS4)  eine Abwärtsspirale der Nutzer-Rechte mit sich bringen. Das ist ganz klar im Sinne der Anbieter, aber eben nicht der Käufer.

Weiches DRM – alles besser?

Dörte Böhner bemerkt zu weichem DRM:

Die Teile des DRM, die uns helfen, rechtssicher und urheberrechtskonform zu handeln, mit denen können wir leben. Kein Mensch stört sich heute mehr daran, dass in den MP3s von Apple oder Amazon Wasserzeichen eingebettet sind, die das Auffinden von Urheberrechtsverletzern vereinfachen sollen.

Als dankbarer Käufer, der dann in Einzelfällen mal gerade nicht durch hartes DRM gegängelt wurde, sah ich das früher ähnlich und habe dementsprechend auch oft zahlend zugegriffen: E-Books von O’Reilly, MP3-Alben von Amazon/Saturn, Musik-Abo bei eMusic, E-Paper-Abo bei der Zeit. Inzwischen sehe ich die Konsequenzen von weichem DRM – gerade im oben skizzierten Gesamtkontext – aber als potentiell gefährlich an.

Denn dadurch wird dem zahlenden Kunden eine nicht zu vernachlässigende Sorgfaltspflicht aufgehalst, die es z.B. beim rippen einer legal erworbenen CD nicht gibt. Wenn die legal gekauften MP3-Dateien irgendwie ihren Weg ins Netz finden, dann ist man dran – und das nicht zu knapp.  Das klingt erstmal unspektakulär und vielleicht abwegig, was aber, wenn der eigene MP3-Player, das Smartphone, das Tablet irgendwo vergessen oder gar gestohlen wird? Wie weit kann ich meinen Kindern vertrauen, dass sie ihren MP3-Player nicht irgendwo liegen lassen – oder vom Familienrechner “betanken”? Vor diesem Hintergrund ist hartes DRM plötzlich sogar wieder wünschenswert, wenn es denn technisch funktionieren würde…

Inzwischen kaufe ich grundsätzlich keine digitalen Inhalte mehr, sondern nur noch die physikalische Voll-Version. Ebenso sind alle digitalen Abo’s abbestellt. Letztlich muss aber jeder selbst sein individuelles Fazit – gerade im Bereich Risiken und Nebenwirkungen -  in Sachen DRM ziehen. Die “Schmerzgrenzen” sind hier sehr unterschiedlich – wenn man sich denn überhaupt Gedanken über die Problematik gemacht hat. Ich als technikbegeisterter Käufer bin jedenfalls sehr ernüchtert, und mache das einzig mögliche, wenn es schon politisch und gesetzgeberisch nichts positives zu erwarten gib und es wohl nur noch schlimmer als legaler Konsument wird: Ich stimme mit meinen Füßen und meinem Geldbeutel ab und verzichte ggf. auf Konsum. Beim CD-Kopierschutz war das damals sehr erfolgreich. Den gibt es heutzutage fast nicht mehr…

Neben aller Kritik möchte ich Dörte Böhner ausdrücklich für ihren provokanten Artikel danken. Das Thema geht immer mehr Nutzer an und muss deutlich breiter diskutiert werden.

Update:

Inzwischen hat Dörte Böhner einen zweite Teil rund um DRM nachgeschoben, diesmal aus Sicht eines DRM-Gegners. Ihrer Analyse von DRM, allgemein sowie speziell bezogen auf die Verlagswelt und Bibliotheken ist von meiner Seite vollständig zuzustimmen. Gut, dass dadurch mein Schreck über den ersten Artikel wieder verflogen ist :-)

Die grundlegende Fragestellung nach dem Auffinden geeigneter Literatur in einem Katalog ist “Und wie komme ich denn jetzt da dran?“.

Ist das Medium überhaupt entleihbar und noch nicht von anderen entliehen, so dass ich es ausleihen und mit nach Hause nehmen kann? Ist es vielleicht sogar online verfügbar, so dass ich idealerweise direkt an meinem Arbeitsplatz darauf zugreifen kann. Oder ist es lediglich einsehbar, z.B. im Lesesaal oder einer Präsenzbibliothek – im aufwändigsten Fall gar erst nach Bestellung?

Informationen dieser Art werden normalerweise über den Medienstatus in den Titelaufnahmen angezeigt. Vorhandene Inhaltsverzeichnisse und E-Books werden im KUG bereits in der Trefferliste angezeigt, so dass direkt von dort darauf zugegriffen werden kann. Sind solche Informationen auch hilfreich, so können sie doch dazu führen, dass Trefferlisten als unübersichtlich empfunden werden. Christian Hauschke hatte in seinem sehr lesenswerten Artikel “Wie Nutzer unsere Kataloge sehen” verschiedene neuralgische Punkte in einem Katalog identifiziert – u.a. zu lange und zu volle Trefferlisten .

Hier im KUG auch noch den Ausleihstatus mit auszugeben wäre sicherlich zu viel des Guten gewesen. Stattdessen bieten wir seit heute im KUG eine zusätzliche Facette “nach Zugriff” an, in der die Treffermenge nach ausleihbar, online verfügbar bzw. nur einsehbar weiter eingegrenzt werden kann. Damit wird einerseits die eigentliche Trefferliste von den Verfügbarkeitsinformationen entlastet, zusätzlich aber mit der Funktion “Suchverfeinerung”, z.B. auf online zugreifbare Medien, über eine reine Statusanzeige hinausgegangen. Gerade hier wünschten sich unsere Nutzer eine suggestivere Recherchemöglichkeit nach Online-Medien wie E-Books. Bisher konnte dies zwar bereits über die Facette nach dem Medientyp “digital” vorgenommen werden, allerdings erschloss sich das anscheinend keinem Nutzer…

Eingrenzung der Treffermenge nach Zugriffsmöglichkeiten

Eingrenzung der Treffermenge nach Zugriffsmöglichkeiten

Die Umsetzung der neuen Facette war in zwei Tagen zwar relativ schnell technisch vollzogen, allerdings war sie auch geprägt von ständigen Abwägungen. Zusätzlich erschwerend kam die hochgradig heterogene Bibliothekslandschaft an der Universität hinzu. Da sind

  • die reinen Präsenzbibliotheken,
  • eigentlich Präsenzbibliotheken, die dennoch eine rudimentäre Ausleihe via Zettelwirtschaft zulassen,
  • offizielle Ausleih-Bibliotheken mit Ausleihinformationen (=gefüllte Buchdatenblätter) für alle Titel im Bibliothekssystem,
  • offizielle Ausleih-Bibliotheken mit Ausleihinformationen für nur einen Teil der Titel im Bibliothekssystem sowie
  • externe Bibliotheken, von denen der Status unbekannt ist oder bei denen wir keinen Zugriff auf deren Ausleihinformationen haben.

Schon die Begrifflichkeit ist in diesem Kontext nicht einfach. Wir haben uns für eine “grobe” Einordnung mit keinen zusätzlichen Varianten (z.B. sofort ausleihbar, ausleihbar nach Bestellung usw.) oder Hierarchien (einsehbar -> einsehbar nach Bestellung) entschieden, nicht zuletzt, weil anderenfalls auch der Nutzer überfordert und der Eingrenzungsprozess dadurch verkompliziert würde.

Da die Zugriffsinformationen für eine Eingrenzung in den Suchmaschinenindex wandern müssen, spielt aber auch das verwendete Bibliothekssystem und seine Funktionalität eine entscheidende Rolle – insbesondere was seine “Bereitschaft” angeht, die Ausleihinformationen und deren Änderung preis zu geben. Wünschenswert wäre z.B. ein Ausleih-Aktions-Log, in dem alle Ausleihen, Bestellungen und Rückgaben fortlaufend vermerkt werden. So könnten zeitnah punktuelle Änderungen in den Suchindizes durchgeführt werden. Leider bietet unser Bibliothekssystem so etwas nicht an, so dass wir uns auf einen Komplett-Export der Buchdatentabelle des Systems stützen müssen.

Hier mussten wir abwägen, ob es ausreicht, diese Informationen nächtlich zu aktualisieren, oder ob wir auch während des Tages ggf. mehrfach die verschiedenen Suchindizes bzgl. des Zugriffsattributs aktualisieren müssen. Wir haben uns (erst einmal) für die nächtliche Aktualisierug im Rahmen des ohnehin stattfindenden Katalogupdates entschieden und die damit verbundene “Unschärfe” billigend in Kauf genommen.

Solche “Unschärfen” sind ohnehin ein Charakteristikum eines jeden Katalogs. Nur ein paar Beispiele:

  • Der Nutzer geht davon aus, dass alle Bücher der Bibliothek elektronisch erfasst sind. Das ist leider bei vielen unserer Institutsbibliotheken überhaupt nicht der Fall. Wieviele Titel konkret in einem Katalog vorhanden sind dürfen wir nicht anzeigen, da dadurch eine Arbeitskontrolle möglich wäre. Ob die Bereitstellung von prozentualen Abdeckungsgraden – also das Verhältnis zwischen katalogisierten Titeln und Gesamtbestand der Bibliothek – zulässig ist, müssen wir noch erruieren.
  • Der Nutzer geht davon aus, dass mit einem Schlagwort einheitlich alle entsprechenden Titel thematisch erschlossen sind. Das ist leider ebenso nicht der Fall. Die USB katalogisiert nach RSWK, die Institute individuell und viele ohnehin gar nicht. Die Verschlagwortungsquote reicht von 0 bis fast 80 Prozent. Von einer einheitlichen Verschlagwortung kann der Nutzer nur träumen. Diesen suboptimalen Zustand konnten wir durch die zentrale Anreicherung mit Schlagworten aus allen Katalogen deutlich abmildern, aber nur für Titel mit ISBN.
  • Der Nutzer geht davon aus, dass jeder Titel eines Verfassers mit genau einem Personen-Normdatensatz verbunden ist. Die Realität sieht da ernüchternd aus. Oft sind die Titel eines Verfassers auf mehrere Normdatensätze verteilt, egal ob diese individualisiert sind oder nicht.
  • Der im Bibliothekssystem ersichtliche Ausleihstatus – auch sekundenaktuell, wie in der Volltitelanzeige des KUG – hat oft nicht die erhoffte praktische Relevanz. Bis der Nutzer in der jeweiligen Bibliothek am Standort des Buches ist, kann dieses bereits durch einen anderen entliehen, genutzt oder verstellt worden sein. Oder es ist wie bei unserem Selbstausleihbereich nicht entliehen, steht aber nicht am Stand, sondern liegt an verschiedenen Ablageplätzen, um von dort wieder korrekt eingestellt zu werden. Oder es ist gerade zurückgekommen, kurzzeitig entleihbar, muss dann aber wegen Beschädigung zum Buchbinder und ist damit für den Nutzer erstmal unerreichbar. Oder es ist zwar ausleihbar, aber nur für Nutzer in bestimmten Benutzergruppen, was sich aber erst beim Bestellversuch heraustellt. Oder es ist schlicht noch kein Ausleihsatz im Bibliothekssystem angelegt und es kann dementsprechend kein Status verarbeitet werden. Dann können wir lediglich “nur einsehbar” setzen.

Diese Liste lässt sich problemlos fortführen. Dennoch überlegen wir schon, wie wir die Aktualität der Ausleihinformationen weiter verbessern können.

Jetzt, wo die (Nach)Arbeiten an der Entwicklung und Umstellung auf den neuen KUG mit OpenBib 3 vollzogen sind, können wir uns endlich auch wieder alten und neuen Desideraten zuwenden. Den Anfang machte nun die Zugriffsfacette.

 

Neuer KUG mit OpenBib 3

Zusammen mit der Umstellung auf die komplett überarbeitete OpenBib-Version 3 hat der Kölner UniversitätsGesamtkatalog KUG sein Gesicht verändert und endlich das Design-Konzept für die Corporate Identity der Universität zu Köln umgesetzt. Zentrale Voraussetzung dafür war die Umstellung der CSS-Klassen auf das YAML-Framework im neuen OpenBib 3.

Einher damit ging eine Entschlackung und Neukonzeption des Benutzer-Interfaces. Für den KUG als Rechercheportal wurde seine Kernfunktion in Form eines einheitlichen und durchgängigen Suchfeldes in den Mittelpunkt gestellt. Die alte Hauptnavigation wurde aufgelöst und zum Teil in den Suchbereich (Themengebiete, erweiterte Suche, Suchhistorie) bzw. die Toplevel-Navigation (RSS, Merkliste, Mein KUG, Anmeldung) verlagert.

Startseite des neuen KUG

Neue Startseite des KUG

Neue Startseite eines Instituts-Portals

Neue Startseite eines Instituts-Portals

Suchradius statt Katalogauswahl

Im bisherigen KUG – sowohl bezogen auf den Menu-Punkt Katalogauswahl in den Instituts-Portalen (dessen Bedienung diverse Nutzer überforderte…) als auch bezogen auf die erweiterte Suche im allg. KUG-Portal – mit der Auswahl aus einer ellenlangen Liste von Katalogen und der Profil-Auswahl  konnten wir folgendes Fazit ziehen:

Der Menu-Punkt Katalogauswahl oder die integrierte Vollauswahl verwirren bzw. überfordern die Benutzer, sorgen für Unübersichtlichkeit und sollten daher entfernt werden. Durch Ihren Wegfall war eine Neuausrichtung notwendig:

Speziell für die Instituts-Portale wurde stattdessen der neue Mechanismus Suchradius eingeführt, mit dem ein Nutzer ausgehend von der lokalen Bibliothek seine Recherche hierarchisch ausweiten kann:

  • Katalog des Instituts,
  • Kataloge der zugehörigen Fakultät,
  • alle Kataloge.

Der Suchradius kann direkt bei der Recherche angegeben werden. Ebenso kann in der Ergebnisliste nachträglich der Suchradius für die jeweilige Suchanfrage – parallel zu der Facettierung – geändert werden. Dieser Mechanismus dürfte für die Vielzahl der Institute die unkomplizierteste Lösung sein. Zusätzlich kann weiterhin natürlich jede Fakultät gezielt nach Literatur durchsucht werden.

Eine nachträgliche Eingrenzung auf einen konkreten Katalog – bei entsprechend ausgeweitetem Suchradius – kann über die Katalog-Facette erfolgen.

Alle individuellen Katalogzusammenstellungen für eine Recherche sind eben … individuell … und können weiterhin von jedem Nutzer nach Anmeldung in Mein KUG als eigene Suchprofile definiert werden und sie erscheinen dann automatisch in der Profilauswahl der Recherchemaske.

Integrierte Rechercheergebnisse

Die sicherlich augenfälligste Änderung ist die Darstellung der Rechercheergebnisse. Bisher wurden die Ergebnisse der einzelnen Kataloge blockweise nacheinander angezeigt mit jeweils eigener Seitennummerierung. Nun erscheinen sie in einer einzigen Trefferliste in der gewählten Sortierung und mit nur noch einer Seitennummerierung.

Trefferliste im KUG-Portal der Informatik

Trefferliste im KUG-Portal der Informatik

Verbesserte Navigation

Für die bessere Orientierung im KUG wurde eine neue durchgängige hierarchische Breadcrum-Navigation (Brotkrümelpfad) integriert. Diese erlaubt einen schnellen Zugriff auf die vorangegangenen Hierarchiestufen bis hin zur Startseite – die aber, wie generell üblich, auch per Klick auf das (Universitäts-)Logo erreicht werden kann.

Stehen in einer Hierarchie-Ebene mehre Informationsstränge zur Auswahl, können diese durch eine Sidebar-Navigation schnell erreicht werden.

Brotkrümel- und Seitennavigaton (orange)

Breadcrumb- und Sidebar-Navigaton (orange)

Die bisher angesprochenen Änderungen waren vor allem im Bereich Nutzerführung und Design zu finden. Dort wurden die generellen Ziele Suggestivere Bedienung, Verschlankung sowie Navigierbarkeit angestrebt. Selbstverständlich ist dies ein fortwährender Prozess.

Verglichen mit den Änderungen im Unterbau von OpenBib sind die Bereiche Nutzerführung und Design jedoch eher marginal.

Umfassender interner Umbau von OpenBib

Generelles Ziel von OpenBib 3 war der grundlegende Umbau der internen Architektur. Viele Aspekte werden in dem Blog-Artikel “Das Recherche-Portal ist der WebService” eingehender erläutert. Zusammengefasst:

  • Umstellung der Anwendung auf etablierte Software/Web-Frameworks.

Mit der Umstellung auf etablierte Frameworks wie CGI::Application, DBIx::Class, YAML, jquery.mobile und einen URL-Dispatcher wird OpenBib deutlich modularer und damit wart- und erweiterbarer.

  • Umsetzung zentraler Mechanismen von REST und Semantic Web.

Durch die Umstellung auf abstrakte “Cool URI’s” für die Kennzeichnung jeglicher Informationen (und Diensten) und deren Trennung von den eigentlichen konkreten Repräsentationen wird die OpenBib Plattform selbst zu einem Web-Service, über den alle Funktionen und Daten für eine externe Vernetzung bereitgestellt werden können.

Vereinheitlichung der Recherche-Backends

Die Recherche-Backends wurden auf

  • die Xapian Suchmaschine (default)
  • die ElasticSearch Suchmaschine (experimentell)
  • sowie die Suche in entfernten Katalogen via API für die Elektronische Zeitschriftenbibliothek EZB, das Datenbank-Informationssystem DBIS sowie BibSonomy

vereinheitlicht. Das bisherige SQL-Backend wird zugunsten der Suchmaschinen für die Recherche aufgegeben.

Zusammen mit korrespondierenden Katalog-Backends können nun strukturell auch beliebige andere Suchmaschinen bzw. Zugriffs-APIs integriert werden. Dazu müssen lediglich entsprechende Methoden in den neuen OpenBib::Catalog- sowie OpenBib::Search-Klassen geeignet spezialisiert werden.

Umstellung auf etablierte Frameworks

Wesentlich für die Modularisierung war die Umstellung auf das Web-Applikationsframework CGI::Application und dort vor allem das konfigurierbare URL-Dispatching via CGI::Application::Dispatch. Alle Aktionen sind nun in eigene Methoden der jeweiligen OpenBib::Handler::Apache-Klassen verteilt, auf die ausgehend vom konkret aufgerufenen URL die Anfrage entsprechend einer Dispatch-Tabelle und der Methode (GET,POST,PUT,DELETE) verteilt werden.

An die Stelle selbstoptimierter Stylesheets treten das CSS-Framework YAML. Neben jQuery und jQuery UI findet jQuery.mobile für mobile Seiten Anwendung.

Umstellung auf eine resourcenorientiere Infrastruktur und REST

Jede Resource erhält einen dedizierten URI. Zu den Resourcen korrespondierende konkrete Repräsentationen sind unter einem getrennten (aber vom Resourcen-URI abgeleiteten) URL erreichbar. Es sind dies derzeit:

  • HTML für die Zugriff durch den Endanwender
  • JSON für den Zugriff und die Einbindung in andere technische Infrastrukturen
  • RDF für die Bereitstellung der Daten im Semantic Web
  • RSS für die Bereitstellung von Informationen als Feed
  • INCLUDE für die Bereitstellung von (typischerweise HTML-)Informations-Schnipseln zur Integration in andere Anwendungen, speziell Webseiten in einem Content Management System.
  • MOBILE für den Zugriff durch den Endanwender über ein mobiles Gerät (Smartphone, Tablet)

Gibt es für einen URL andere Repräsentationen, so wird das dem Nutzer durch entsprechende Icons im rechten Bereich der Breadcrumb-Navigation angezeigt. Derzeit sind das die Repräsentationen JSON, RDF und RSS.

Für die intelligente Weiterleitung via Redirect von den Resourcen-URIs zu den entsprechenden “vollqualifizierten” Repräsentations-URLs wird Content-Negotiation sowie Language- und Browser-Detection eingesetzt.

Über die Browser-Detection werden mobile Endgeräte identifiert. Momentan arbeiten wir noch an einer Konzeption für eine mobile KUG-Variante. Speziell stellt sich die Frage, ob wir den Spagat zwischen Jeder URI hat eine mobile Repräsentation und der Vereinfachung des Nutzerinterfaces auf das Wesentliche schaffen. Denkbar wäre ein vereinfachtes Web-Interface mit der sinnvollen Reduzierung des Funktionsumfangs und der Navigation ausgehend von der Startseite, parallel aber eine mobile Repräsentation aller anderen Seiten, von denen aus man lediglich auf den mobilen Kernbereich verweist.

Jeglicher Zugriff und die Änderung aller Resourcen ist über ein JSON-REST-API auf Grundlage der allgemeinen Resource-URIs möglich. Insbesondere können damit Systemfunktionen und Administrationseinstellungen in andere Infrastrukturen eingebettet werden. Das USB-Portal setzt beispielsweise seit August 2012 das JSON-API einer damals eingefrorenen Beta-Version von OpenBib 3 für die Recherche in den Profilen USB und Uni produktiv ein und kann seitdem auch Facetten in den Ergebnislisten anbieten.

Der für den Endnutzer wesentliche Vorteil der neuen resourcenorientierten Infrastruktur ist der Wegfall des artifiziellen Konstrukts “PermaLink”, wie es im alten KUG und diversen anderen Rechercheportalen genutzt wird. Im neuen KUG ist jeder aufgerufene URL automatisch sowie vollintegriert ein PermaLink und kann direkt im Browser gebookmarkt werden. Ein Cut-and-Paste irgendwelcher unzusammenhängend angezeigter Hilfs-URLs entfällt.

Gerade das Design eines einheitlichen und konsistenten Systems an Resource-URIs hat einige Zeit benötigt und war immer geprägt von verschiedenen Abwägungen wie

  • Welches Schema? Singular, Plural, mit ‘id’ oder ohne, Vermeidung von Mehrdeutigkeiten
  • Hackability. Ist die Struktur der URI’s unmittelbar verständlich, so dass man ohne API-Dokumentation sofort andere URIs ausprobieren kann
  • Cachability und nutzerspezifische Resourcen: Eine eigene Repräsentation für Seiten mit nutzerspezifischen Inhalten (z.B. Auswahlliste der eigenen Literaturlisten usw.) bei allgemeinen Resourcen vs. eine individualisierte Resource
  • Struktur von allgemeinen, nutzerspezifischen und administrationsspezifischen Resourcen
  • Mehrdeutigkeiten in URI-Pfaden. Sollen verschiedene Wege zum gleichen Ziel führen?
  • Funktions-URIs vs. reine Lehre
  • Integration von Resource-Finder-URIs, die bei Aufruf fallspezifisch weiterleiten
  • Tag mit eigener numerischer Id für den eigenen (Schlagwort)Namen eines spezifischen Titels in einem spezifischen Katalog vs. Verallgemeinerung eines Tags lediglich über seinen (Schlagwort)Namen als id

Erfahrungen von anderen Implementierungen zu finden, die dann auch noch auf die konkrete Situation passen war nicht einfach. Dennoch gibt es verschiedene gute Artikel, die ein Gefühl für das URI-Design vermitteln:

Ebenso nicht zu vernachlässigen waren Unzuläglichkeiten im HTML(5) Standard, die eine Übernahme der REST-Aktionen via HTTP-Methoden in eine Endnutzer Web-Anwendung erschweren. Denn PUT und DELETE sind nicht im HTML-Standard definiert (waren es anscheinend einmal kurzzeitig, sind dann aber wieder herausgeflogen) und damit müssen diese Methoden etwas suboptimal durch GET oder POST getunnelt werden.

Umstellung der Datenbanken

Mit OpenBib 3 wurde die Umstellung von MySQL auf PostgreSQL als zugrundeliegendes RDBMS vollzogen. Für den Zugriff auf die Datanbanken wird auf den Objekt-Relationalen-Mapper DBIx::Class und SQL::Abstract zurückgegriffen, für das Connection-Pooling auf die zentrale Systemdatenbank hält pgbouncer Einzug.

Clusterbetrieb

Durch die Umstellung auf eine resourcenorientierte Infrastruktur und REST sowie den Einsatz von Cookies konnte für den KUG mit OpenBib 3 der Betrieb in einem Cluster eingeführt werden. Die Konfiguration der Cluster und die Zuordnung der einzelnen Server erfolgt über die Web-Administration.  Als Webproxy-Software wird haproxy genutzt und OpenBib entsprechend um eine Kommunikationsschnittstelle zu diesem Proxy erweitert. Derzeit läuft der KUG auf zwei Clustern zu jeweils 2 Servern, wobei jeweils ein Cluster für Recherchen und das Portal aktiv ist und das andere parallel die Katalog aktualisiert.

Bei dem erfolgten Umbau zu OpenBib 3 konnten sehr viel Code-Bestandteile 1:1 in die neue Infrastruktur übernommen werden. Mit dem Standardisierungsprozess durch den Einsatz der angesprochenen Frameworks wird OpenBib sicherlich für zukünftige Entwicklungen gerüstet sein. Und verglichen mit dem jetzt alten KUG hat der Neue durch die Umstellung auf die Corporate Identity der Universität wieder ein zeitgemäßes Aussehen…

Wieviel Cloud braucht das Land

Ausgelöst durch die Produktplanungen der großen Hersteller von Lokal- und Verbundsystemen beschäftigen sich derzeit landauf, landab deren Kunden in Konferenzen und AG’s mit der wolkigen Zukunft.

Bereits im März gab es eine Konferenz des GBV zu diesem Themenkomplex:

http://www.gbv.de/Termine/2012/gbv-workshop-die-zukunft-der-lokalen-bibliothekssysteme

Hier ist speziell die Übersichts-Präsentation von Kirstin Kemner-Heek interessant, u.a. mit den Optionen ‘Kommerzielle Systeme’ vs. ‘Open Source Systeme’.

Einen umfassenderen Überblick unter Einbeziehung auch der derzeit existierenden Nicht-Cloud-Systeme bietet ihr Band 64 aus den Kölner Arbeitspapieren zur Bibliotheks- und Informationswissenschaft: Konzeption und Angebot zukünftiger Bibliotheksmanagementsysteme: Bestandsaufnahme und Analyse

http://www.fbi.fh-koeln.de/institut/papers/kabi/volltexte/band064.pdf

Daneben gibt es auf der GBV-Workshopseite verschiedene Firmen-Vortragsfolien aus beiden Lagern, die die jeweiligen Cloud-Strategien sehr gut illustrieren.

Und schließlich lohnt auch ein Blick auf die Vortragsfolien von Herrn Diedrichs ‘Lokalsysteme in der Cloud – Architektur der nächsten Generation‘ vom 101. Bibliothekartag

http://www.opus-bayern.de/bib-info/volltexte//2012/1227/

sowie Herrn Scheuerls ‘Die Zukunft der Lokalsysteme in der Verbundumgebung

http://sv.ub.uni-bayreuth.de/ssv/AG/SAT/sat_20120522/Scheuerl_Zukunft_Lokalsysteme_20120522.pdf

Es wird Zeit, dass sich Bibliotheken und Verbünde klar in der zentralen Frage positionieren:

Ist ein Cloud-System – egal welchen Anbieters – im Interesse von
Bibliotheken und Verbünden? Ist die derzeitige Entwicklung dahin tatsächlich so gewollt?

Lesenswerte kritische Stimmen, die den Cloud-Hype hinterfragen, gibt es bereits hier und da:

http://jakoblog.de/2012/03/27/wer-cloud-sagt-muss-auch-bullshit-sagen/

Es ist nachvollziehbar, dass die Hersteller die Entwicklung ihrer jeweiligen Systeme vereinheitlichen, zentralisieren und letztlich unnötige Kosten in Parallelentwicklungen (und Sonderanpassungen für die Bibliotheken ) einsparen möchten. In Bezug auf die vorhandenen Funktionalitäten wird dabei gerne von ‘entschlacken’ gesprochen.

Insofern profitieren die Anbieter zuallererst selbst von einer Cloud-Lösung – wo aber Bibliotheken, Verbünde und deren Nutzer ihren konkreten Mehrwert gegenüber den bestehenden Lösungen ziehen, muss thematisiert und klarer dargestellt werden.

Gleiches gilt für ihren Markteintritt in das [SP]aa[SP]-Segment, das den jeweiligen Entscheidern mit den Argumenten eines steigenden ‘Kosten- und Rechtfertigungsdruckes’ in den Bibliotheken nahegebracht wird.

Offene Fragen bleiben:

  • Kann das Cloud-System mit den derzeitigen Systemen und ihren Anpassungen an die Erfordernisse der jeweiligen Bibliotheken mithalten? Was wird ‘Basis-Funktionalität’ sein und wieviel an derzeit real existierenden ‘betriebsrelevanten’ Funktionalitäten werden fehlen oder ‘an die Kunden durch den App-Baukasten outgesourced’. Zentral scheint mir hier der Satz von Herrn Diedrichs zu sein:

Open Source ist zu prüfen, da „ohnehin alle Systeme künftig ein erhebliches Engagement der Anwender erwarten“

  • Was ist von den versprochenen Schnittstellen zu halten, um ‘Apps’ für das jeweilige Cloudsystem zu erstellen? Sind diese”vollständig”, sinnvoll nutzbar, performant und frei (an Kunden derselben Cloud) weiterverteilbar oder sind Behinderungen durch die Hersteller zu erwarten, um potentielle Konkurrenz-Apps zu eigenen Produkten zu erschweren – ala Apple App Store. Auch die Erfahrungen mit SLNP und XSLNP oder die Kopplung von Discovery Indexen an den Einsatz/Kauf der Portal-Software des zugehörigen Herstellers bleiben hier unschön in Erinnerung.
  • Wie “frei” und manövrierfähig werden Bibliotheken/Verbünde bei ihren Entscheidungen in der Cloud noch sein? Wie sieht es z.B. mit der Kombinierbarkeit von lokalen, eigenen und Dritt-Produkten aus? Oder werden die Bibliotheken in der Cloud ihrers jeweiligen Anbieters eingeschlossen sein? Auch dies hat Herr Diedrichs treffend auf den Punkt gebracht:

„before you get in, ask how to get out“

  • Wie ändert sich die Stellung der Bibliotheken und Verbünde? Von ihrer Grundkonzeption ist die jeweilige (Hersteller) Cloud “der Verbund” und jeglicher deutscher Bibliotheksverbund wäre in voller Konsequenz obsolet. Dies ließe sich aber wohl eher nicht von den Herstellern durchsetzen. Also gibt es das arbiträre Konstrukt ‘lokaler Cloud-Knoten’, um deren Hosting nun die Verbünde wetteifern dürfen – und damit selbst den Weg in Richtung (Hersteller)Cloud weiter forcieren. Hinzu kommt die Aussicht auf die Programmierung von Verbund-Apps, mit denen die Verbünde dann ihre Existenzberechtigung sichern könn(t)en.
  • Welchen Einfluss haben die deutschen Bibliotheken und Verbünde in einer multinationalen Cloud auf deren (Weiter-)Enwicklung, z.B. bzgl. lokaler Besonderheiten/Erfordernisse – oder werden sie in der Masse aller teilnehmenden Bibliotheken plus Eigeninteressen des Anbieters untergehen?
  • Wem gehören die Informationen, Titelaufnahmen usw., die von einer einzelnen Bibliothek in das Cloud-System eingegeben wurden – sei es durch Neuaufnahme oder Ansigeln? Kann diese ihren kompletten Bestand wieder herausziehen und z.B. als Open Data unter CC0 bereitstellen, oder werden die Daten bereits in der Cloud selbst “vergemeinschaftet” und dort damit eingeschlossen?
  • Wie sieht es mit dem Datenschutz bei einem externen Anbieter in der Cloud aus? Reicht eine einfache vertragliche Zusicherung oder ist diese letztlich nur pro forma, wenn sie z.B. durch “höherliegende” Interessen wie den “Patriot act” ausgehebelt werden kann. Nach dem Motto “Sage mir was Du liest und ich sage Dir, ob Du einreisen darfst”.
  • Was ist mit Cloud-Lösungen jenseits der Hersteller-Clouds? Macht es Sinn stattdessen z.B. auf eine nationale Open Source Cloud zu setzen, die eine bereits bestehende Open Source Lösung auswählt und bei denen die Verbünde arbeitsteilig die noch fehlenden Funktionalitäten hinzuentwickeln. Eine komplette Neuentwicklung als “deutscher Sonderweg” wäre sicherlich nicht zielführend. Könnte eine solche Lösung eventuell ‘offener’ und ‘flexibler’ als die Hersteller-Clouds sein? Bis dato fließt das Know How der deutschen Bibliothekslandschaft fast ausnahmslos in Form von Anforderungsbeschreibungen, Pflichtenheften usw. zu den etablierten Herstellern, deren Produkte davon profitieren. Wäre es nicht an der Zeit dieses Know How selbst zu nutzen und umzusetzen?

Vor dem Hintergrund dieser offenen Fragen sollte bald eine Postitionierung erfolgen.

A Diese kann auch ein Votum für eine kommerzielle Cloud-Lösung sein. Dann jedoch gilt es sich dort konsequent einzubringen (falls überhaupt möglich), um schon bestehende “must-haves” in die jeweilige Cloud-Lösung herüber zu retten.

B Anderenfalls muss den Herstellern unmissverständlich klargemacht werden, dass sie keine Kunden für ihr Cloud-Produkt bekommen und eine Abkündigung ihrer konventionellen Produkte zurückgenommen werden muss.

C Ebenso könnte durch Kooperation im OpenSource-Bereich (s.o.) ein geeignetes Produkt entsprechend den konkreten Anforderungen ‘fit’ für einen Produktionsbetrieb gemacht werden.

Noch ist zu allem Zeit. Eine Nicht-Positionierung jedoch ist de-facto eine Entscheidung für A und der Umstieg darauf wäre später potentiell alternativlos.

Mehr aus den Daten in Katalogen herausholen

Unter dem Titel Zwischen Wunsch und Wirklich­keit: Bibliotheksdaten und Bibliothekskataloge – Fünf Thesen hat Prof. Heidrun Wiesenmüller von der Hochschule der Medien Stuttgart in den vdB-Mitteilungen einen sehr inspirierenden Artikel über die Verbesserung von Bibliothekskatalogen – insbesondere ausgehend von deren bibliographischen Daten – veröffentlicht.

Dieser Artikel zeigt anhand vieler praktischer Beispiele, wie sehr es sich für eine erfolgreiche Recherche-Erfahrung lohnt, einen Blick darauf zu werfen, was man an Daten zur Verfügung hat, welche Unzulänglichkeiten im Kontext eines Bibliothekskatalog zu umgehen sind und wie mit einer intelligenteren Verarbeitung der Daten weitere Hilfen für den Nutzer angeboten werden können.

Oft steckt die Tücke der Benutzung der Kataloge in der korrekten Erfassung nach RAK. Ein gutes Beispiel ist das Schiller-Räuber-Problem, bei dem der Nutzer erfolglos nach “Schiller Räuber” recherchiert, weil “Schiller” in der Hauptaufnahme “Werke” und “Räuber” in der Unterordnung zu finden sind – ohne Personenangabe “Schiller”.  Durch eine Anreicherung mit den Verfassern der Überordnung lässt sich diese Problem – wie in OpenBib – schnell erledigen. Ähnlich gelagert ist die Problematik, die sich aus der Umstellung von der ISBN10 auf die ISBN13 ergab.

Prof. Wiesenmüller gibt weitere Beispiele für unnötig fehlgeschlagende “known-item searches”.

  • Recherchen nach einem bestimmten Jahrgang einer Zeitschrift laufen ins Leere, weil dort die Kategorie Erscheinungsjahr korrekterweise nicht besetzt ist. Stattdessen ist der Erscheinungsverlauf besetzt, der dem Nutzer aber immer noch nicht wirklich weiterhilft, da ihn eigentlich nur der Bestandsverlauf interessiert – also jene Titel, die in der Bibliothek (oder elektronisch) tatsächlich verfügbar sind. Nach einer Analyse der Bestandsverläufe werden in der nächsten OpenBib daher nun alle Jahreszahlen für die Recherche angereichert, aus “2008 -” wird nun also “2008 2009 2010 2011 2012″.
  • Copy-and-paste Recherchen scheitern u.a. aufgrund von verwendeten Abkürzungen (z.B. Verl. anstelle Verlag). Hier wird eine “ungenauere” Recherche vorgeschlagen. Aus meiner Sicht bringt das jedoch weitere Probleme mit sich, da dann eventuell generell mehr gefunden wird – besser gesagt die Trefferlisten länger und unübersichtlicher werden – und der Nutzer nicht durchschaut, warum bestimmte Titel denn eigentlich dort auftauchen. Aus meiner Sicht ließe sich das Problem gezielter durch die Verwendung von Synonym-Wörterbüchern innerhalb der jeweils verwendeten Suchmaschine lösen. Generelle Abkürzungen oder Akronyme sollten in so einer Datei gesammelt und der Suchmaschine bereitgestellt werden, also z.B. Verl. und Verlag bzw. c# und c sharp.

Ein weiterer Schwachpunkt in Katalogen ist das Fehlen wichtiger Informationen – insbesondere die schlechte Sacherschließung (im SWB ist die Sacherschließungsrate gerade einmal 31,8 Prozent – in anderen Verbünden erwarte ich ähnliche Raten), die sich in begrenztem Maße durch Übernahme aus anderen Katalogen oder Manifestationen verbessern lässt. Gerade hier zeigen sich die Vorteile der Open Bibliographic Data-Bewegung, da nun für jedermann eine Anreicherung der eigenen Daten mit externen Sacherschließungsinformationen erst möglich wird. Nach wie vor lassen sich aber auch unter Zuhilfenahme etablierter Schnittstellen (Z39.50/SRW/…) Daten lokal anreichern. An der USB Köln wurde zur Anreicherung unseres Bestandes mit Sacherschließungsinformationen eine Webanwendung erstellt, mit der Titel mit bisher fehlender Basisklassifikation (und derzeit experimentell auch bei fehlender Verschlagwortung) von unseren Fachreferenten gezielt bearbeitet und zugehörige Vorschläge aus anderen Verbünden automatisch übernommen werden können.

Demgegenüber werden tatsächlich vorhandene Informationen oft nicht sinnvoll genutzt. Als Beispiel werden durch Lebensjahre individualisierte Personen-Normdateneinträge sowie Thesaurusrelationen und speziell Ländercodes genannt. Letztere können zur Bildung von geographischen Facetten verwendet werden, wie im Artikel “Mehr aus der Schlagwortnormdatei herausholen” von Wiesenmüller, Maylein und Pfeffer in B.I.T.online 14 (2011) Nr. 3.

Leider steckt auch in der Individualisierung der Einträge in Personen-Facetten durch die zugehörigen Lebensjahre die eine oder andere Tücke. So sind uns nach der Integration dieser Funktionalität in die kommende OpenBib-Version verschiedene konkrete Probleme aufgefallen:

  • Die Anzahl von Personen-Normdaten mit Lebensjahr-Angabe ist erschreckend gering. Beispiel “Schmitz, Wolfang” im hbz Verbundkatalog: Zu ihm gibt es in der Personen-Normdatei 15 Einträge. Davon haben lediglich 5 Einträge die Jahresangaben und von diesen wiederum sind jeweils 2 dublett.
  • Die Personen-Normdaten sind mit den entsprechenden Titeln nicht immer richtig oder konsequent verknüpft. So sind die Werke “unseres” Wolfgang Schmitz auf die Personen-Normdatensätze mit und ohne Jahresangaben verteilt. Damit aber läuft die Suggestion einer durch Jahresangaben vollqualifizierten Personen-Facette in Leere. Der Nutzer denkt mit der Facette “Schmitz, Wolfgang (1949 -)” alle seine Werke auszuwählen, obwohl einige nur mit der unqualifizierten Facette “Schmitz, Wolfgang” erreicht werden können. Diese Problematik begleitet uns beim KUG schon etliche Jahre. Ursprünglich wurden Personen-Normdaten mit den Titeln vollqualifiziert durch deren ID in den Trefferangaben verlinkt in der – wie wir inzwischen wissen – irrigen Annahme, das die Verknüpfungen korrekt sind und wirklich alle zugehörigen Titel dadurch erreicht werden. Schmerzhaft mussten wir aber lernen, dass dem nicht so ist. Typischerweise gibt es mindestens 3 Normdaten-Einträge mit der gleichen Ansetzungsform, mit denen mal 4, mal 5, mal kein Titel verknüpft ist. Aus diesem Grund wurde die Verknüpfung durch die Personen-Normdaten-ID im KUG aufgegeben und zukünftig wird nur noch direkt über die Ansetzungsform recherchiert.
  • Ist die Verwendung der “vollqualifizierten Personen-Facetten” in nur einem Katalog (s.o.) schon ein Problem, so vergrößert es sich noch mehr bei der Recherche in mehreren Datenquellen. Das ist z.B. in der USB bei der gleichzeitigen Suche in den vielen Institutskatalogen der Fall.  Denn in den Institutskatalogen werden quasi nie Jahresangaben in die Personen-Normdaten eingepflegt. In all diesen Katalogen wäre es grundsätzlich sinnvoll durch Abgleich mit frei verfügbaren bibliographischen Daten eine Anreicherung der Personen-Normdaten mindestens mit PND/GND-Nummern und zusätzlich den Jahresangaben vorzunehmen.
  • Jenseits der Personen-Facetten stellt sich schließlich die Frage, wie denn in Trefferlisten und Einzeltreffern die Personen verlinkt werden sollen – mit Jahresangaben qualifiziert oder unqualifiziert.

Wesentlich für einen Katalog wird jenseits der Recherche das “Browsing” und “unentdeckte Suchen” gefordert. Beides zeigen verschiedene Kataloge (E-LIB, Heidi, beluga) und gehört zu der Grundphilosophie von KUG und OpenBib. Seit jeher versuchen wir die Vernetzung mit thematisch passenden weiteren Titeln oder Informationen (intern wie auch extern) zu maximieren. Dazu bedienen wir uns verschiedener Techniken wie Data-Mining, Kataloganreicherung oder Mashups. Gerade in einem Verbund vieler getrennten Kataloge wie dem KUG ist dies eine besondere Herausforderung.

Der Artikel schließt mit der Forderung nach mehr Kooperation in der Katalogentwicklung – kommerziell wie open source. Dem möchte ich mich uneingeschränkt anschließen. Gerade durch offenen Erfahrungsaustausch, der offenen Dokumentation von Best-Practices, der Verwendung offener (lizenzfreier) Schnittstellen, offen einseh- und nachnutzbaren Beispiel-Implementationen, offenen Kolaborationswerkzeugen usw. kann die Katalogentwicklung noch transparenter und erfolgreicher werden. “Offen” ist hier wesentlich und keine unnötigen Schutzzäune durch notwendige Zeitschriften-Abos, Interlectual property (z.B. von Schnittstellen), Monopolisierung sowie Abschottung guter Ideen oder dergleichen.

Fazit: Die Auseinandersetzung mit seinen bibliographischen Daten lohnt sich.

 

PaperC als eigener Katalog

Seit März 2010 werden Fachbücher in allen Katalogen des KUG durch Verweise auf die gegebenenfalls vorhandene Online-Version bei PaperC angereichert. So können unsere Nutzer bei ausgeliehenem Bestand – oder wenn gerade dringend etwas nachgeschlagen werden muss – direkt am Bildschirm nach einer kostenfreien Registrierung lesend auf das Buch zugreifen.

Das Herunterladen von Seiten, Kapiteln oder des ganzen Buches ist nicht kostenfrei, bei Gesamtdownloads mancher Bücher sogar recht teuer. Das Buch Mastering Perl kostet z.B. bei PaperC 38 EUR verglichen mit 31.99 US$ direkt bei oreilly.com. Demgegenüber sind Kauf und Download beliebiger einzelner Seiten zu “Copy-Shop-Preisen” a 10 Cent bei anderen Anbietern in der Regel erst gar nicht möglich.

Bisher erscheinen Verweise zu PaperC lediglich für bereits im KUG nachgewiesene Fachbücher. Ist das Buch nicht im Bestand oder noch nicht elektronisch für den KUG erfasst, so laufen unsere Nutzer mit ihren Recherchen ins Leere.

Aus diesem Grund bieten wir jetzt den Gesamtbestand der mehr als 14.000 Fachbücher von PaperC als eigenen Katalog sowohl im KUG als auch – per Schnittstelle zum KUG – in der Standard-Recherche des USB-Portals an.

Ermöglicht wird dies durch eine gegenüber 2010 deutlich erweiterte Export-Datei von PaperC. Neben der Hinzunahme wesentlicher bibliographischer Informationen wird nun auch ein Export im XML-Format (derzeit 14.5 MB) angeboten. Dieser lässt sich relativ einfach in das Metadatenformat des KUG mit einem Konvertierunsprogramm für generische XML-Daten sowie einer zugehörigen Parametrisierung für die PaperC XML-Daten umwandeln und dann einspielen.

Insgesamt bieten wir mit diesem neuen Katalog in beiden Recherche-Portalen – neben den bereits vorhandenen Katalogen unserer lizensierten “E-Books” – für unsere Nutzer einen bequemen Zugriff auf die von ihnen benötigte Literatur. Solange dieser Mehrwert durch das Angebot von PaperC in der derzeitigen Form für unsere Nutzer besteht ist die Bereitstellung des Katalogs eine sinnvolle Erweiterung unseres Rechercheangebots.

Thematischer Zugang zum Katalog revisited

Seit der Beschäftigung mit diesem Thema vor knapp 2.5 Jahren und einer Integration in den Kölner UniversitätsGesamtkatalog KUG hat sich einiges getan.

Einen interessanten Überblick verschiedener Herangehensweisen und die exemplarische Erarbeitung einer eigenen fachlichen Facette für einen Bibliothekskatalog liefert die als CC-NC-ND veröffentlichte Bachelor-Arbeit  Konzeption einer fachlichen Facette für einen Bibliothekskatalog am Beispiel der Universitätsbibliothek Mannheim von Julian Frick.

Zitat des Abstact:

Eine in vielen Bibliothekskatalogen bislang nicht verwirklichte Recherchefunktion ist die gezielte Suche nach Literatur aus bestimmten Fachgebieten. Recherchen mit Notationen der im Katalog verwendeten Klassifikation oder mit Schlagwörtern können den Anspruch an eine fachgebietsumfassende Suche meist nicht erfüllen. Eine mögliche Lösung ist die Erstellung einer bibliotheksspezifischen fachlichen Facette, in der jeder Titel über seine sachlichen Erschließungsdaten einem oder mehreren Fächern zugeordnet wird.

In der vorliegenden Arbeit wird nach einem Überblick über bereits vorhandene fachliche Facettierungsmöglichkeiten in verschiedenen Bibliothekskatalogen eine fachliche Facette für den Bibliothekskatalog der Universitätsbibliothek Mannheim konzipiert. Hierbei werden im Besonderen die vorliegenden Sacherschließungsdaten sowie die fachlichen Schwerpunkte der Medienbestände der Universitätsbibliothek Mannheim berücksichtigt. Das Ziel ist die Definition und die Zusammenstellung von Fächern, die im Bibliothekskatalog in unterschiedlichen Varianten umgesetzt und verwendet werden können.

Als zentrale Merkmale für eine thematische Einordnung werden SWD, DNB und RVK herangezogen. Das zeigt sehr eindringlich, wie vorteilhaft es ist, wenn diese thematischen Merkmale im  entsprechenden Katalog vorhanden sind. Für fast alle Kataloge des KUG – gerade im Instituts- und Seminarbereich, und das sind mehr als 130 – bestehen z.B. keine solchen Merkmale. Daher sind wir damals den Weg über die Kataloganreicherung mit der Basisklassifikation aus dem USB-Katalog gegangen.

Durch die Öffnung der Bibliothekskataloge im Rahmen von Open Bibliographic Data ergeben sich nun aber viele neue Möglichkeiten für eine inhaltliche thematische Einordnung der Titel eines Katalogs. Lokal eventuell nicht vorhandene Merkmale können fortan durch Abgleich mit andernorts veröffentlichten Katalogdaten mit eben jenen Merkmalen angereichert werden.

Interessant ist dabei – neben den bereits mit dem hbz geöffneten Katalogen – insbesondere die Veröffentlichung des B3Kat von BVB und KOBV, der sich für solches Data-Mining nutzen lässt. Ebenso lohnen sich die offenen Daten aus dem SWB.

Denn die Datenqualität ist dort schon beachtlich. Das hat sich eindrucksvoll gezeigt, als ich test- und spielenderweise einen Schwung von knapp 1 Mio. MARC-Titeln der Universitätsbibliothek Tübingen in eine lokale out-of-the-box VuFind-Installation eingeladen habe. Die direkt in VuFind vorhandene Möglichkeit im Bestand nach Signatur-(=Fach)Gruppen, Sprache und Format zu stöbern – und das ohne Vorbehandlung der Daten bzw. Anpassung in VuFind selbst – ist auf Grundlage dieser Daten vorbildlich.

Nach wie vor hat die thematische Bündelung der Informationsressourcen einer Bibliothek (Katalogtitel, EZB, DBIS, Literaturlisten, etc.) einen hohen Nutzwert für die Recherchierenden. Die Bachelor-Arbeit macht jedenfalls Lust, sich mal wieder mit diesem Thema zu beschäftigen.

Update:

Und hier noch ein Link auf einen Artikel im gleichen Kontext:

Wiesenmüller, Heidrun ; Maylein, Leonhard ; Pfeffer, Magnus (2011) Mehr aus der Schlagwortnormdatei herausholen – Implementierung einer geographischen Facette in den Online-Katalogen der UB Heidelberg und der UB Mannheim B.I.T. online 14 (2011) Nr. 3, S. 245-252

Die Wikipedia beinhaltet sein jeher viele Informationen, die sich – gerade wegen des offenen Charakters und der Zugänglichkeit aller Daten als Vollabzug – für eine Integration in einen Katalog eignen. Sehr interessant sind die zugehörigen Literaturnachweise mit ISBNs in den einzelnen Artikeln als Startpunkt für eine weitere Beschäftigung mit dem jeweiligen Thema.

Vor mehr als vier Jahren haben wir im KUG damit begonnen einzelne Titel mit den Namen der sie referenzierenden Artikel aus der Wikipedia anzureichern. Für den Nutzer liegen die Vorteile auf der Hand. Er bekommt ausgehend von einem einzelnen Titel einen zielgenauen Einsprung in die thematisch passenden Artikel der Wikipedia. Darüber hinaus wird auch die Recherche mit den zugehörigen Artikelnamen angereichert. Somit wird die Menge an Suchbegriffen, unter denen ein Titel gefunden werden kann sinnvoll erweitert. Ein gutes Beispiel ist der Titel Vergleichende Primatologie von Thomas Geissmann, den man auch finden kann, wenn man eine der vielen Affenarten sucht, die in den bibliographischen Daten nicht genannt wurden und die nur durch die Wikipedia für die Recherche angereichert werden konnten.

Diese von der Wikipedia bereitgestellten Literaturlisten in den einzelnen Artikeln bilden zusätzlich aber auch – gerade wegen ihres relativ engen Themen-Fokus – eine recht gute Grundlage für die Vernetzung eben jener Titel in einem Katalog. Durch sie können neue thematische Verbindungen zwischen verschiedenen Titeln nachträglich angereichert werden und den Nutzer auf andere relevante Literatur verweisen.

Nach einer einfachen Literaturanalyse in der Wikipedia werden OpenBib und KUG mit diesem Netz an Literaturverweisen angereichert, das beim Aufruf eines einzelnen Titels in Echtzeit mit dem davon tatsächlich vorhandenen Bestand im aktuellen Katalog abgeglichen wird. Die Grundlage bildet das bereits für die Artikel- und Recherche-Anreicherung verwendete Programm wikipedia2enrich.pl, welches nur geringfügig erweitert werden musste, um die Mengen thematisch benachbarter Titel per ISBN in einer neuen Tabelle related_isbn der Anreicherungsdatenbank abzulegen.

Die Schritte zur Bestimmung der ISBN-Mengen sind:

  1. Bestimme die Artikelnamen, in denen eine gegebene ISBN referenziert wird
  2. Fasse alle weiteren in diesen Artikeln genannten ISBNs zusammen
  3. Kopple diese gefundenen ISBNs zur gegebenen ISBN zur Anfragezeit mit dem lokalen Bestand

Während 1 und 2 durch wikipedia2enrich.pl durchgeführt werden, ist die Rückkopplung in den lokalen Bestand im Modul OpenBib::Record::Title angesiedelt.

Sicherlich lässt sich diese Analyse der Literaturnennungen in der Wikipedia weiter verfeinern, aber auch so sind die Ergebnisse für unsere Nutzer vielversprechend, wie z.B. folgende Beispieltitel zeigen:

 

Ein Katalog als E-Book

oder: Wie aus dem Verzeichnis eines Künstlerlebenswerks in einem Katalog ein ausdruckbares Werkverzeichnis wurde

Im Jahr 2010 erhielt die USB Köln einen Großteil des künstlerisches Lebenswerkes des Kölner Graphikers, Illustrators und Pressendruckers Eduard Prüssen als Vorlass. Die Illustrationen und Bücher wurden daraufhin in einem Katalog aufwändig erfasst.

Wie schon bei vielen anderen Sammlungen der USB Köln wurde auch diese durch ein eigenes Sammlungs-Portal besonders hervorgehoben und gewürdigt:

Der Kölner Graphiker, Illustrator und Pressendrucker Eduard Prüssen zählt zu den bedeutendsten Buchillustratoren in Deutschland. Zahlreiche Bücher der Weltliteratur wurden von ihm illustriert, darunter Werke von Heinrich Böll, Guy de Maupassant, Pearl S. Buck, Franz Kafka und Theodor Fontane. Graphik und Buchkunst bestimmen das Hauptwerk des Künstlers, der überdies auch als Verleger mit seinen “Donkey-Press” Handdrucken Erfolge feiern konnte.

Im Jahr 2010 übergab Eduard Prüssen der Universitäts- und Stadtbibliothek Köln einen Großteil seines künstlerisches Lebenswerkes als Vorlass.

Die Sammlung Prüssen besteht vorwiegend aus Illustrationen in druckgraphischer Technik als Holz- und Linolschnitte und als Radierungen. Sie umfasst im Wesentlichen Buch- und Presse-Illustrationen sowie Plakate, Exlibris, Werbe-Illustrationen und Handpressendrucke. Mit der “Prüssen-Bibliothek” stellte der Künstler der USB überdies eine Anzahl von Büchern zur Verfügung, die von ihm illustriert worden sind. Besonders wertvoll ist, dass die Sammlung Eduard Prüssens graphisches Werk von der ersten Skizze über die Entwürfe bis zum veröffentlichten Buch oder Plakat umfasst. Das erlaubt der USB Köln, dem interessierten Nutzer einen tiefen Einblick in die Entstehungsweise, die Anwendung verschiedener Techniken und auf die zeitgenössische Graphik und Buchkunst zu ermöglichen.

Zusätzlich zu diesem Portal sollte – mit vertretbarem Aufwand – ein Werkverzeichnis der Sammlung im Rahmen der elektronischen Schriftenreihe der USB Köln als eigene Publikation im PDF-Format erscheinen.

Da die erfassten Daten im Rahmen des Sammlungs-Portals bereits in die OpenBib-Plattform eingespielt wurden, konnte auf sie von dort bequem strukturiert zugegriffen werden. Mit einem einfachen Programm und zwei Ausgabe-Templates (Gesamtdokument,Titelaufnahme) war eine automatische Erzeugung des E-Books direkt aus der Katalogdatenbank über das Textsatzsystem LaTeX möglich.

Für eine zusätzliche Print-Ausgabe wurde dieses E-Book um einige Grafiken und einen handgefertigten Einband durch die Buchbinderei der USB Köln ergänzt. Die Katalogdaten selbst wurden – entsprechend der Open Data Strategie der USB Köln – unter CC0 freigegeben.

Das fertige Dokument ist frei über den Hochschulschriftenserver der Universität zu Köln zugreifbar.

Sammlungen revisited

Seit der Erstellung der ersten Sammlungs-Portale wurde konzeptionell an einer Verbesserung des allgemeinen Sammlungsauftritts an der USB Köln gearbeitet. Problematisch war insbesondere, dass die Sammlungen quer über die Homepage verstreut waren. Einige fanden sich unter “Suchen & Bestellen”, andere unter “E-Medien”, wieder andere unter “Wir über uns” wieder.

Daher war sehr schnell klar, dass alle Sammlungen der USB Köln zukünftig an einer zentralen und prominenten Stelle auf der Homepage gebündelt und vereinheitlicht werden müssen. Eine Übersicht aller Sammlungen ist nun sowohl alphabetisch wie auch systematisch unter dem zentralen Sammlungseinstieg “Sammlungen” direkt von der Startseite aus erreichbar.

Die eigenständigen Sammlungs-Portale haben weiterhin den bekannten einheitlichen Aufbau:

  • Die Startseite fasst alle wesentlichen Informationen zur Sammlung kurz und prägnant zusammen, so dass ein Blättern auf der Seite vermieden wird und der gesamte Inhalt auf einen Blick ersichtlich ist. Weitere Informationen zur Sammlung auf zusätzlichen Seiten sind von dort aus verlinkt. Links neben den Informationen ist jeweils ein Bild zur Illustration der Sammlung dargestellt.
  • Der Banner-Bereich umfasst links ein sammlungsspezifisches Logo mit dem Titel der Sammlung sowie rechts ein Logo der beteiligten/besitzenden Institution.
  • Jedes Sammlungs-Portal wird über einen eigenen “Visitenkarten”-URL aufgerufen, wie z.B. http://richterbibliothek.ub.uni-koeln.de/, http://schmalenbach.ub.uni-koeln.de/, http://abklatschsammlung.ub.uni-koeln.de/
  • Der Inhalt jeder Sammlung wird neben einer sammlungsspezifischen Recherche u.a. auch über Wortwolken und Register weiter inhaltlich erschlossen.
  • Wenn eine Sammlung durch ein eigenes Projekt erschlossen wurde, sind die zugehörigen Informationen im zusätzlichen Hauptmenü-Eintrag “Projekt” gebündelt.
  • Anhand der Hintergrundfarbe werden die verschiedenen Sammlungsarten unterschieden. Zum Altbestand gehörige Sammlungen (Dante, Landschaftsbilder) werden z.B. hell-beige und moderne Sammlungen (LeFort, Prüssen) weiß dargestellt.



Auf diese Weise wird erreicht, dass jede Sammlung aus der Anonymität des USB-Katalogs herausgelöst und mit ihren vielen Informationen wie in einer “Sonderausstellung” präsentiert wird. Mit dieser individuellen Präsentation möchten wir unserer Wertschätzung einer jeden Sammlung und eines jeden Sammlers Ausdruck verleihen und unsere Nutzer auf diese verborgenen Schätze aufmerksam machen.

Funktionell entspricht jedes Sammlungs-Portal dem Kölner UniversitätsGesamtkatalog KUG mit Suchmaschinentechnologie, Tagging, Literaturlisten usw.

Zusätzlich zu den bereits damals vorgestellten Sammlungen wurden für viele neue (und alte) Sammlungen Portale in einheitlicher Struktur erstellt.

Es sind dies bisher:

Die Dante Sammlung

unter: http://dante.ub.uni-koeln.de/

 

Die Bibliothek Herbert von Dirksen

unter: http://dirksen.ub.uni-koeln.de/

 

Die Thomas a Kempis-Sammlung

unter: http://kempis.ub.uni-koeln.de/

 

Die Digitale Sammlung Europäische Städte- und Landschaftsdarstellungen des 16. und 17. Jahrhunderts

unter: http://landschaftsbilder.ub.uni-koeln.de/

mit fachspezifischen Facetten bei der Recherche

 

Die Poetica-Sammlung

unter: http://poetica.ub.uni-koeln.de/

 

Die Portraitsammlung

unter: http://portraitsammlung.ub.uni-koeln.de/

 

Die Sammlung Prüssen

unter: http://pruessen.ub.uni-koeln.de/

 

Die Virtuelle Bibliothek Elise und Helene Richter

unter: http://richterbibliothek.ub.uni-koeln.de/

 

Die Bibliothek Eugen Schmalenbach

unter: http://schmalenbach.ub.uni-koeln.de/

 

Die Syndikatsbibliothek

unter: http://syndikatsbibliothek.ub.uni-koeln.de/

 

Die Totenzettel-Sammlung

unter: http://totenzettel.ub.uni-koeln.de/

mit sammlungsspezifischer Kurztrefferanzeige und Facetten

 

Die Digitale Umschlagsammlung

unter: http://umschlagsammlung.ub.uni-koeln.de/

 

Die Bibliothek Franz Ferdinand Wallraf

unter: http://wallraf.ub.uni-koeln.de/

 

Die Digitale Kölner Sammlung von Zeitungsausschnitten 1840-1969

unter: http://zeitungsausschnitte.ub.uni-koeln.de/

 

Die bibliographischen Daten einer jeden Sammlung sind zusätzlich – gesondert von den Gesamtdaten des USB Katalogs – als Open Data unter CC Zero durch die USB Köln bereitgestellt worden.