28 Jun
von Oliver Flimm - Kategorie: Allgemein, Einblicke und Konzepte
Entsprechend einer Mail von Lukas Rieder stellt PaperC nun einen CSV-Export mit rudimentären Metadaten aller dort verfügbaren E-Books unter
für eine weitere interne Verarbeitung in anderen Plattformen – wie z.B. dem KUG mit OpenBib – zur Verfügung.
In dieser CSV-Datei befindet sich die ISBN13 der E-Book- und Print-Ausgabe (die Print-ISBN leider noch nicht überall), der Titel und der URL des Buches bei PaperC. Damit lässt sich PaperC nun noch einfacher für eine Anreicherung der lokalen Katalogdaten im KUG nutzen. Obwohl die Titel weiterhin in der PaperC-Webseite selbst nicht – weder mit der ISBN10, noch mit der ISBN13 der Print-Ausgabe – über das Suchfeld in einem URL der Form
http://paperc.de/search?query=0596002068&commit=Suchen
auffindbar sind, so kann nun zumindest über das PaperC JSON-API mit der ISBN13 die Existenz der Print-Ausgabe verifiziert werden:
http://paperc.de/9780596002060.json
Für einen Mashup rein über JavaScript reicht dies aus. Im Artikel PaperC im KUG habe ich einen anderen Weg skizziert, der ohne JavaScript auskommt, der aber von der Recherchierbarkeit des Titels in PaperC mit der ISBN aus den lokal erfassten bibliographischen Daten abhängt. Das ist weiterhin nicht möglich.
Bei der Entwicklung des KUG verfolgen wir seit jeher die Strategie, dass jede Funktion auch ohne aktiviertes JavaScript nutzbar sein soll. Die jeweilige Funktion im KUG ist dann zwar gegebenenfalls nicht ganz so bedienungsfreundlich eingebunden wie die JavaScript-Variante, prinzipiell aber immer verfügbar.
Vor diesem Hintergrund der weiterhin nicht mehr funktionierenden Einbindung via Recherche-URL der Print-ISBN, kommt der CSV-Export gerade Recht.
Jetzt können wir aus der Export-Datei die PaperC-URL der jeweiligen Titel mit den verfügbaren ISBNs einfach in unsere Zentrale Anreicherungsdatenbank zu den dort bereit vorhandenen Inhalten einspielen. Dafür verwenden wir ein einfaches Skript paperc2enrich.pl, mit dem wir über einen Cron-Job die PaperC-Daten alle 14-Tage automatisch aktualisieren. Zusätzlich musste dann nur noch das entsprechende Ausgabe-Template angepasst werden. Wenn ein PaperC-URL in der Kategorie E4122 (in der steckt der PaperC-URL des Titels) vorhanden ist, dann wird das bereits bekannte “PaperC-Verfügbarkeits-Bild” ausgegeben.
Konkret verwenden wir nun diesen Abschnitt im Template
[% IF normset.${"E4122"} %]
<p>
<a href=”[% config.get('redirect_loc') %]/[% sessionID %]/512/[% normset.${"E4122"}.first.content %]” target=”_blank” title=”Online Lesen bei PaperC”><img src=”/images/openbib/paperc.png” alt=”Bei PaperC vorhanden” border=”0″ /></a><br/>
</p>
[% END %]
anstelle von
<p>
<a href=”[% config.get('redirect_loc') %]/[% sessionID %]/512/http://paperc.de/search?query=[% isbn %]&commit=Suchen” target=”_blank” title=”Online Lesen bei PaperC”><img src=”[% config.get('connector_availabilityimage_loc') %]?action=lookup;id=[% isbn %];target=paperc” alt=”Bei PaperC vorhanden?” border=”0″ /></a><br/>
</p>
Für die Bereitstellung der PaperC-Informationen aus unserer Anreicherungsdatenbank für andere lokale Dienste, wie unser USB-Portal, bieten wir diese zusätzlich mit dem SeeAlso-Abfrageprotokoll über unseren SeeAlso-Konnektor an. Für die ISBN10 des Beispiel-Titels lautet die Abfrage
http://kug.ub.uni-koeln.de/portal/connector/seealso/isbn2paperc?id=0-596-00206-8&format=seealso
Durch die automatische Anreicherung eines jeden Titels in den verschiedenen KUG-Katalogen, der eine Print- oder E-Book-ISBN aus dem PaperC Export enthält, haben wir wieder eine funktionierende Einbindung von PaperC für unsere Nutzer – und auch der Beispiel-Titel Programming Web-Services with Perl aus dem vorangegangenen Blog-Artikel zu PaperC zeigt die Verfügbarkeit dort wieder richtig an.
Vielen Dank an Lukas Rieder für die Bereitstellung der CSV-Exporte!
4 Kommentare
Thomas Berger
28|Jun|2010 1[URL, "Title in PaperC", URL] ist aber eine für OpenSearchSuggestions / SeeAlso eher ungünstige Response. Ich hätte eher
[Titel, "Title in PaperC", URL] oder ["Title in PaperC", Titel, URL] erwartet…
Oliver Flimm
28|Jun|2010 2Ich stimme Ihnen zu, dass die von Ihnen vorgeschlagenen Tripel-Varianten sicherlich schöner aussehen.
Die dazu notwendige zusätzliche Verarbeitung des Titelfeldes in unserer Anreicherungsdatenbank erschien mir allerdings vor dem Hintergrund, dass die einzig sinnvolle Verwendung des Dienstes die Lieferung einer URL zu einer ISBN ist, den erhöhten Aufwand erst einmal nicht wert – zumal diese ISBN aus den bibliographischen Daten einer Katalogaufnahme stammt, die gewöhnlich einen Titel enthält.
An welchen weiteren praktischen Nutzen denken Sie, wenn der Titel zusätzlich mit ausgegeben wird? In der derzeitigen Form war der Implementierungsaufwand für den Dienst quasi nichtexistent – bestehenden Abschnitt kopieren, Dienstname und Kategorie ändern, fertig.
Thomas Berger
29|Jun|2010 3Praktisch wäre es, die Standardlibrary http://cpansearch.perl.org/src/VOJ/SeeAlso-Server-0.57/client/ von Jakob Voss nutzen zu können, ohne die Ausgabe über Setzen von itemHTML tweaken zu müssen. Sprich: In der ersten Komponente (“Label”) des Ergebnis-Tripels sollte keine URL, sondern ein als Linktext nutzbarer Text stehen, das zweite Element (“Description”) wird von der Library als Tooltip genutzt und darf leer sein.
Eine für SeeAlso optimierte Response wäre damit z.B.:
["0-596-00206-8",["Online lesen mit PaperC"],[""],["http://paperc.de/documents/5243-programming-web-services-with-perl-9780596516413"]]
Gelesen in Biblioblogs (26. KW) « Lesewolke's Blog
05|Jul|2010 4[...] OpenBibBlog beschäftigt sich mit den neuen Möglichkeiten des CSV-Exports der E-Book-Metadaten von PaperC als [...]
Kommentar schreiben
Blog durchsuchen
Kategorien
Tags
E-Books Kataloganreicherung KUG Linked Open Data Literaturlisten Mashups OpenBib Open Bibliographic Data Open Data PaperC QR-Code Sammlungen Systematiken Thematischer Zugang WikisourceBlogroll
Kalender