Bei der Entwicklung des KUG ist – analog zur Vernetzung gleichgesinnter Nutzer im Web 2.0 – die Vernetzung der Titel im Katalog eines unserer Hauptziele.

Nachdem ein Nutzer durch seine Suchanfrage bei einem passenden Titel gelandet ist, kann er sich von dort durch Empfehlungen, Literaturlisten, Tags, Personen, Schlagworte, Systematiken usw. thematisch treiben lassen und so auf andere interessante Titel stoßen – frei nach dem beluga-Zitat: Ich möchte auch finden, was ich gar nicht gesucht habe.

Eine zentrale Rolle nimmt hier die Systematisierung der Titel ein – sowohl um andere Titel eines Themengebiets zu finden, als auch zur Bereitstellung eines hierarchischen Browsings über Themengebiete.

Gerade im KUG mit seinen vielen teilnehmenden Instituten hat sich das jedoch als ein Problem herausgestellt, denn nur ein Bruchteil der Institute systematisiert überhaupt ihre Titel. Dazu kommt dann noch ein genereller Nachteil an Systematiken: Es gibt so viele davon – und diese finden tatsächlich bei den wenigen systematisierenden Katalogen im KUG auch Anwendung.

Die Universitäts- und Stadtbibliothek Köln (USB) verwendet z.B. die Basisklassifikation BK, das eine Institut die DDC, das andere die RVK, wieder eines eine fachspezifische Klassifikation aus Saarbrücken. Selbstverständlich wird dadurch eine katalogübergreifende Einheitlichkeit, vor allem auch im Interesse der Nutzer, nicht gerade gefördert. Aus meiner Sicht sollte das aber gerade ein zentrales Ziel für einen Katalog höherer Zählung sein.

Für die Vereinheitlichung haben wir uns für den KUG erst einmal auf die Basisklassifikation BK geeinigt – nicht zuletzt weil der große USB-Katalog sofort als Fremddatenquelle genutzt werden kann – und reichern über unsere zentrale Anreicherungsdatenbank alle Kataloge im KUG automatisch damit an. Das Schöne an der BK ist, dass

  • sie recht überschaubar ist. Geordnet in zwei Hierarchie-Ebenen kommt man in der zweiten Ebene derzeit auf etwa 2086 Gebiete. Diese Hierarchisierung kommt auch den Nutzern zugute.
  • für alle BK’s ausführliche Beschreibungen verfügbar sind und auch angezeigt werden. Dazu  haben wir eine YAML-Datei mit den Beschreibungen erstellt, die wie alle Teile von OpenBib gerne nachgenutzt werden kann.
  • auch die Möglichkeit von Fremddatenübernahmen existiert.

Als allgemeine Voraussetzungen für den Einsatz einer Systematik für einen Katalog 2.0 sehe ich nach den Erfahrungen im praktischen Einsatz mit der BK beim KUG:

  • Sie sollte hierarchisch sein. So kann sie vom Nutzer auch über einen Browsing-Einstieg angeboten werden.
  • Sie sollte übersichtlich sein. Es macht keinen Sinn, wenn im Extremfall alle real existierenden abermillionen Themen eine Entsprechung in der jeweiligen Systematik finden.
  • Neben kryptischen Themenkürzeln soll auch immer eine grobe Beschreibung des Themengebiets ausgegeben werden. Kein Nutzer kann etwas mit 12.34 oder 123.456 anfangen.
  • Es sollten Möglichkeiten der Fremddatenübernahme existieren, bzw. Mappings von anderen Systematiken

Die aber wirklich zentrale Grundvoraussetzung für den Einsatz ist jedoch die vollkommen freie Nutzung der Systematik (genauer: free as in free speech and not free beer). Es macht z.B. keinen Sinn Open Access zu fordern und bei der Erfassung eines Open Access-Werkes dann aber eine proprietäre Systematik zu verwenden, bei der irgendwelche Nutzungsmöglichkeiten erst lizensiert (und bezahlt) werden müssen – wenn sie nicht sowiso grundsätzlich verboten sind.

Gerade hier hat sich im KUG  dann auch ein großes praktisches Problem im Einsatz der DDC herausgestellt.

Zwei der Institute im KUG setzen die DDC lokal ein – nur sagen dem Nutzer die Nummern leider überhaupt nichts (s.o.). Was liegt also näher als bei den Katalogaufnahmen, Quantitäts-Aufschlüsselungen in Wortwolken usw. zusätzlich die textlichen Beschreibungen mit auszugeben – sie vielleicht sogar für die Recherche auch noch zu indexieren. Bei der BK machen wir das, technisch ist das also kein Problem.

Hier kommt nun aber leider der proprietäre Charakter der DDC zum Tragen, der eine vollständige Verwendung der Beschreibungen nicht erlaubt. Maximal die ersten drei Stellen sollen möglich sein. Vor dem Hintergrund, dass die DDC in ihren Toplevel-Kategorien jedoch nur den Wissensstand des 19. Jahrhunderts widerspiegelt – unsere beiden Institute aber im Bereich Informationstechnologie angesiedelt sind und die DDC-Kodierungen dieser Themengebiete dementsprechend lang sind – dürfen wir die Beschreibungen also erst gar nicht ausgeben. Viele sehen daher die DDC als „no go“ an und suchen nach Alternativen.

Ein interessanter Vorstoß ist in diesem Zusammenhang die Open Shelves Classification (OSC), die auf einen Vorschlag von Tim Spalding zurück geht – auch wenn der Fokus hier mehr auf öffentlichen und nicht unbedingt wissenschaftlichen Bibliotheken liegt. Auch hier war die Lizenzproblematik der DDC ein wesentlicher Ausgangsgrund. Tim Spalding’s Anwort auf einen negativen Kommentar zum o.g. OSC-Blogeintrag sagt eigentlich alles:

Mr. Ronald, I note that you omitted all mention of „free.“ This is at the core of the project’s goals. I—and many others—object to public libraries being constrained by a classification system that is (1) copyrighted, (2) trademarked, (3) licensed, (4) expensive. You cannot with safety make changes to DDC and circulate them around to other interested libraries—this would violate both copyright and trademark. (Some have done so, admittedly.) You cannot publish detailed schedules for your patrons to understand your system and how it maps to your books—again, copyright and trademark. You can’t get a full schedule in digital form, but have to subscribe to a „service“ that gives it out in dribs and drabs, reinforcing your dependency. OCLC holds the reins so tightly that it famously sued a hotel that dared to number its rooms by DDC, filling them with appropriate books. They even hold trademark on Dewey’s first name.

Ebenso stellt sich natürlich auch immer die Frage, in wieweit sich lokale Themengebiete in anglo-amerikanischen Systematiken wiederfinden – ansonsten wird in wissenschaftlichen Bibliotheken dort vor dem Hintergrund der Aufstellung überwiegend die Library of Congress Classification (LCC) verwendet. Die LCC wiederum ist in ihrer Nutzung wirklich frei, also potentiell auch ein geeigneter Kandidat.

Aber warum unbedingt in die Ferne schweifen? Auch im deutschsprachigen Raum gibt es mit der Basisklassifikation BK (verwendet im GBV, ursprünglich aus den Niederlanden) und der Regensburger Verbundklassifikation RVK (verwendet im BVB) geeignete Systematiken. Bei der BK hat man zwei Hierarchieebenen, wobei in der ersten Ebene mehr Gebiete als in der RVK zu finden sind, sich diese auch nochmal in 5 Gruppen zusammenfassen lassen. Dafür hat die RVK mit ihren Haupt-, Unter- und Feingruppen gleich drei Hierarchieebenen, zu denen dann u.a. noch eine Verschlüsselung des Autorennamens kommt.

Weder die BK noch die RVK muss lizensiert werden, anders als die DDC, und beide erfüllen damit die von mir geforderte zentrale Grundvoraussetzung für einen Einsatz. Es wäre zu begrüßen, wenn beide Klassifikationen gerade im Bereich Katalog 2.0 vermehrt eingesetzt werden – und sich auch aktiv dafür positionieren. Bei einer internationalen Ausrichtung wäre die Auswahl an geeigneten Systematiken sicherlich eine andere und man würde sich u.a. LCC und OSC, wenn letztere denn mal fertig ist, genauer anschauen.

Die proprietäre DDC jedoch – auch wenn sie de facto die am meisten verbreitete Systemtik darstellt – ist aufgrund ihrer Lizenzproblematik nach meinem Dafürhalten nicht geeignet als thematischer Grundpfeiler für einen Katalog 2.0 – gerade weil es dort genau um eine verbesserte Usability des Katalogs geht und die Lizenzbedingungen (und etwaige Kosten) dieser massiv im Weg stehen.

Es wäre interessant zu hören, wie andere das sehen bzw. welche Schritte schon anderenorts in Richtung eines thematischen Zugangs gegangen wurden – und welche Systematiken dort Verwendung finden.