<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OpenBibBlog &#187; Einblicke und Konzepte</title>
	<atom:link href="http://blog.openbib.org/category/einblicke-und-konzepte/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.openbib.org</link>
	<description>Das Blog zu OpenBib und OPAC 2.0</description>
	<lastBuildDate>Mon, 28 Jun 2010 11:02:56 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>PaperC jetzt mit CSV-Gesamtexport</title>
		<link>http://blog.openbib.org/2010/06/28/paperc-jetzt-mit-csv-gesamtexport/</link>
		<comments>http://blog.openbib.org/2010/06/28/paperc-jetzt-mit-csv-gesamtexport/#comments</comments>
		<pubDate>Mon, 28 Jun 2010 10:59:15 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[CSV-Export]]></category>
		<category><![CDATA[PaperC]]></category>
		<category><![CDATA[Zentrale Kataloganreicherung]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=208</guid>
		<description><![CDATA[Entsprechend einer Mail von Lukas Rieder stellt PaperC nun einen CSV-Export mit rudimentären Metadaten aller dort verfügbaren E-Books unter http://paperc.de/documents/export.csv für eine weitere interne Verarbeitung in anderen Plattformen &#8211; wie z.B. dem KUG mit OpenBib &#8211; zur Verfügung. In dieser CSV-Datei befindet sich die ISBN13 der E-Book- und  Print-Ausgabe (die Print-ISBN leider noch nicht überall), [...]]]></description>
			<content:encoded><![CDATA[<p>Entsprechend einer Mail von Lukas Rieder stellt PaperC nun einen CSV-Export mit rudimentären Metadaten aller dort verfügbaren E-Books unter</p>
<blockquote><p><a title="Export des PaperC-Bestandes im CSV-Format" href="http://paperc.de/documents/export.csv" target="_blank">http://paperc.de/documents/export.csv</a></p></blockquote>
<p>für eine weitere interne Verarbeitung in anderen Plattformen &#8211; wie z.B. dem KUG mit OpenBib &#8211; zur Verfügung.</p>
<p>In dieser CSV-Datei befindet sich die ISBN13 der E-Book- und  Print-Ausgabe (die Print-ISBN leider noch nicht überall), der Titel und der URL des Buches bei PaperC. Damit lässt sich PaperC nun noch einfacher für eine Anreicherung der lokalen Katalogdaten im KUG nutzen. Obwohl die Titel weiterhin in der PaperC-Webseite selbst nicht &#8211; weder mit der ISBN10, noch mit der ISBN13 der Print-Ausgabe &#8211; über das Suchfeld in einem URL der Form</p>
<p><a title="Suche mit der Print-ISBN10 " href="http://paperc.de/search?query=0596002068&amp;commit=Suchen" target="_blank">http://paperc.de/search?query=0596002068&amp;commit=Suchen</a></p>
<p>auffindbar sind, so kann nun zumindest über das <a title="PaperC API" href="http://blog.paperc.de/api/" target="_blank">PaperC JSON-API</a> mit der ISBN13 die Existenz der Print-Ausgabe verifiziert werden:</p>
<p><a title="Titel mit Print-ISBN13 über das PaperC-API" href="http://paperc.de/9780596002060.json" target="_blank">http://paperc.de/9780596002060.json</a></p>
<p>Für einen Mashup rein über JavaScript reicht dies aus. Im Artikel <a title="Blog-Artikel PaperC im KUG" href="http://blog.openbib.org/2010/03/02/paperc-im-kug/" target="_blank">PaperC im KUG</a> habe ich einen anderen Weg skizziert, der ohne JavaScript auskommt, der aber von der Recherchierbarkeit des Titels in PaperC mit der ISBN aus den lokal erfassten bibliographischen Daten abhängt. Das ist weiterhin nicht möglich.</p>
<p>Bei der Entwicklung des KUG verfolgen wir seit jeher die Strategie, dass jede Funktion auch ohne aktiviertes JavaScript nutzbar sein soll. Die jeweilige Funktion im KUG ist dann zwar gegebenenfalls nicht ganz so bedienungsfreundlich eingebunden wie die JavaScript-Variante, prinzipiell aber immer verfügbar.</p>
<p>Vor diesem Hintergrund der weiterhin nicht mehr funktionierenden Einbindung via Recherche-URL der Print-ISBN, kommt der CSV-Export gerade Recht.</p>
<p>Jetzt können wir aus der Export-Datei die PaperC-URL der jeweiligen Titel  mit den verfügbaren ISBNs einfach in unsere <a title="Blog-Artikel zur Zentralen Kataloganreicherung im KUG" href="http://blog.openbib.org/2008/06/18/zentrale-kataloganreicherung/" target="_blank">Zentrale Anreicherungsdatenbank</a> zu den <a title="Inhalte in der zentralen Anreicherungsdatenbank" href="http://wiki.openbib.org/index.php?title=Zentrale_Kataloganreicherung" target="_blank">dort bereit vorhandenen Inhalten</a> einspielen. Dafür verwenden wir ein einfaches Skript paperc2enrich.pl, mit dem wir über einen Cron-Job die PaperC-Daten alle 14-Tage automatisch aktualisieren. Zusätzlich musste dann nur noch das entsprechende Ausgabe-Template angepasst werden. Wenn ein PaperC-URL in der Kategorie E4122 (in der steckt der PaperC-URL des Titels) vorhanden ist, dann wird das bereits bekannte &#8220;PaperC-Verfügbarkeits-Bild&#8221; ausgegeben.</p>
<p>Konkret verwenden wir nun diesen Abschnitt im Template</p>
<blockquote><p>[% IF normset.${"E4122"} %]<br />
&lt;p&gt;<br />
&lt;a href=&#8221;[% config.get('redirect_loc') %]/[% sessionID %]/512/[% normset.${"E4122"}.first.content %]&#8221; target=&#8221;_blank&#8221; title=&#8221;Online Lesen bei PaperC&#8221;&gt;&lt;img src=&#8221;/images/openbib/paperc.png&#8221; alt=&#8221;Bei PaperC vorhanden&#8221; border=&#8221;0&#8243; /&gt;&lt;/a&gt;&lt;br/&gt;<br />
&lt;/p&gt;<br />
[% END %]</p></blockquote>
<p>anstelle von</p>
<blockquote><p>&lt;p&gt;<br />
&lt;a href=&#8221;[% config.get('redirect_loc') %]/[% sessionID %]/512/http://paperc.de/search?query=[% isbn %]&amp;commit=Suchen&#8221; target=&#8221;_blank&#8221; title=&#8221;Online Lesen bei PaperC&#8221;&gt;&lt;img src=&#8221;[% config.get('connector_availabilityimage_loc') %]?action=lookup;id=[% isbn %];target=paperc&#8221; alt=&#8221;Bei PaperC vorhanden?&#8221; border=&#8221;0&#8243; /&gt;&lt;/a&gt;&lt;br/&gt;<br />
&lt;/p&gt;</p></blockquote>
<p>Für die Bereitstellung der PaperC-Informationen aus unserer Anreicherungsdatenbank für andere lokale Dienste, wie unser USB-Portal, bieten wir diese zusätzlich mit dem <a title="Informationen zu SeeAlso Abfrageprotokoll" href="http://wiki.openbib.org/index.php?title=SeeAlso_Abfrageprotokoll" target="_blank">SeeAlso-Abfrageprotokoll</a> über unseren <a title="Wiki-Seite zum SeeAlso-Konnektor von OpenBib" href="http://wiki.openbib.org/index.php?title=Konnektor:_SeeAlso" target="_blank">SeeAlso-Konnektor</a> an. Für die ISBN10 des Beispiel-Titels lautet die Abfrage</p>
<p><a title="SeeAlso-Abfrage zur ISBN10" href="http://kug.ub.uni-koeln.de/portal/connector/seealso/isbn2paperc?id=0-596-00206-8&amp;format=seealso" target="_blank">http://kug.ub.uni-koeln.de/portal/connector/seealso/isbn2paperc?id=0-596-00206-8&amp;format=seealso</a></p>
<p>Durch die automatische Anreicherung eines jeden Titels in den verschiedenen KUG-Katalogen, der eine Print- oder E-Book-ISBN aus dem PaperC Export enthält, haben wir wieder eine funktionierende Einbindung von PaperC für unsere Nutzer &#8211; und auch der Beispiel-Titel <a title="Beispieltitel mit Verfügbarkeit bei PaperC" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/inst006/6588/1/kug/index.html" target="_blank">Programming Web-Services with Perl</a> aus dem vorangegangenen Blog-Artikel zu PaperC zeigt die Verfügbarkeit dort wieder richtig an.</p>
<p>Vielen Dank an Lukas Rieder für die Bereitstellung der CSV-Exporte!</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2010/06/28/paperc-jetzt-mit-csv-gesamtexport/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Schnellere Kataloge mit YSlow</title>
		<link>http://blog.openbib.org/2010/06/11/schnellere-kataloge-mit-yslow/</link>
		<comments>http://blog.openbib.org/2010/06/11/schnellere-kataloge-mit-yslow/#comments</comments>
		<pubDate>Fri, 11 Jun 2010 14:38:00 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[Frontend]]></category>
		<category><![CDATA[Optimierung]]></category>
		<category><![CDATA[YSlow]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=173</guid>
		<description><![CDATA[Manchmal verwundert es, warum sich die eine oder andere Web-Anwendung oder -Seite so langsam, geradezu zäh &#8220;anfühlt&#8221;. Für Kataloge gilt das gleiche. Welche Gründe das haben &#8211; und wie man mit wenig Aufwand die gefühlte Performance für den Endanwender verbessern kann, hat Steve Souders für die Platform Engineering Group von Yahoo bereits vor einigen Jahren [...]]]></description>
			<content:encoded><![CDATA[<p>Manchmal verwundert es, warum sich die eine oder andere Web-Anwendung oder -Seite so langsam, geradezu zäh &#8220;anfühlt&#8221;. Für Kataloge gilt das gleiche.</p>
<p>Welche Gründe das haben &#8211; und wie man mit wenig Aufwand die gefühlte Performance für den Endanwender verbessern kann, hat Steve Souders für die Platform Engineering Group von Yahoo bereits vor einigen Jahren bei den Top 10 Web-Sites in den USA untersucht und in seinem Buch &#8220;<a title="Das Buch kostenlos lesen bei PaperC" href="http://paperc.de/5336-high-performance-web-sites-9780596517922" target="_blank">High Performance Web Sites</a>&#8221; zusammengefasst. Inzwischen gibt es in Buchform  bereits den Nachfolger &#8220;<a title="Noch nicht bei PaperC, aber beim Verlag" href="http://oreilly.com/catalog/9780596522308/" target="_blank">Even faster Web Sites</a>&#8221; mit noch mehr Optimierungs-Tips.</p>
<p>Sein Fazit: Schuld an der Zähigkeit vieler Seiten ist selten das Backend mit dem die Inhalte generiert werden, sondern das Frontend, also die Auslieferung und die Art, wie Seiten aufgebaut sind und im Browser gerendert werden. Nach seiner Erfahrung entfallen durchschnittlich nur 20 Prozent der Gesamtzeit auf das Backend, aber 80 Prozent auf das Frontend.</p>
<p>Optimierungen des Backends sind typischerweise mit viel Aufwand verbunden, erreichen dann aber doch meist nur Beschleunigungen im 1-stelligen Prozentbereich. Demgegenüber kann man mit vernachlässigbarem Einsatz die 80 Prozent in großen Teilen reduzieren. Selbstverständlich gilt das nur, wenn man nicht das langsamste Recherche-Backend aller Welten hat, wie es bei Recherchen in klassischen SQL-basierten Katalogen bei Begriffen wie &#8220;Deutschland&#8221; oder &#8220;Geschichte&#8221; auch heute manchmal immer noch der Fall ist &#8211; mal abgesehen, wie sinnlos so eine Recherche eigentlich ist&#8230;</p>
<p>Aufbauend auf dem angesprochenen Buch gibt es ein Firefox-Add-on von Yahoo! mit dem sinnigen Namen <a title="Add-On bei Yahoo!" href="http://developer.yahoo.com/yslow/" target="_blank">YSlow</a> &#8211; &#8220;Why Slow?&#8221;, das in das beliebte Firebug-Add-on integriert ist.</p>
<p>Nach der Installation des YSlow Add-ons kann man es auf eine beliebige Webseite, sei sie aus einer statischen Web-Präsenz oder einem Bibliothekskatalog anwenden. Entsprechend der Optimierungsbereiche aus dem erstgenannten Buch wird der jeweiligen Webseite zunächst eine erreichte Bewertungs-Punktzahl und eine allgemeine Note von A (sehr gut) bis F (sehr schlecht) gegeben. Darauf folgen die &#8220;Einzelwertungen&#8221; in den jeweiligen Bereichen. Wie im Buch sind die Bereiche von &#8220;bringt viel&#8221; bis &#8220;bringt auch noch etwas&#8221; von oben nach unten geordnet &#8211; daraus gibt sich dann automatisch die Reihenfolge, mit der man potentielle Defizite angehen kann.</p>
<p>Sehr gelungen ist hier, dass neben den Bewertungen unter &#8220;Read more&#8221; direkt per Mausklick weitergehende Informationen auf den Webseiten von Yahoo!s Developer Network mit einer Kurzfassung der Tips aus dem Buch angeboten werden.</p>
<p>Nach Lektüre des Buches habe ich dann auch sofort YSlow installiert und auf den KUG und weitere Kataloge losgelassen. Das Ergebnis war dann jedoch etwas enttäuschend. Gerade mal ein D-E hatte der KUG erreicht. Angemäkelt wurde insbesondere folgendes</p>
<ul>
<li>Weniger HTTP-Request machen</li>
<li>Ein Content Delivery Network verwenden</li>
<li>Für viele statische Inhalte langlebige Expires-Header hinzufügen</li>
<li>Auslieferung mit gzip komprimieren</li>
<li>ETags konfigurieren</li>
</ul>
<p>Bei vielen anderen Bibliothekskatalogen, die ich mir mit YSlow angeschaut habe, sind es oft die gleichen Optimierungsbereiche. Die Behebung der gravierendsten Mängel war danach sehr einfach, auch wenn wir uns z.B. nicht in ein CDN wie Akamai mit dem KUG einkaufen werden&#8230;</p>
<p>Zuerst haben wir CSS- und JavaScript Files reduziert und so gut es ging zusammenfasst. Die Verwendung von CSS-Sprites für die Icons steht noch aus, da hier auch noch der Bereich Barrierefreiheit mit bedacht werden muss.</p>
<p>Für den KUG verwenden wir ein Setup mit gestaffelten Web-Servern. Das eigentliche Applikations-Backend bildet ein Apache2. Vor diesen haben wir einen weiteren Web-Server postiert, der alle statischen Inhalte ausliefert, also Stylesheets, JavaScript, Bilder usw. Alle Anfragen an die KUG-Anwendung werden per ProxyPass an den Apache2 weitergereicht. Auf diese Weise muss sich der &#8220;dicke&#8221; Apache2 mit mod_perl</p>
<ol>
<li>nicht mit den statischen Anfragen abplagen und kann</li>
<li>seine Inhalte schnell an den vorgeschalteten Webserver ausliefern. Damit wird er nicht von Anfragen über langsame Datenverbindungen blockiert.</li>
</ol>
<p>Als vorgeschaltete Web-Server setzen wir hier teils noch den Apache 1.3, teils lighttpd ein. Dementsprechend müssen dort die weiteren Optimierungen erfolgen.</p>
<p><strong>Expires</strong></p>
<p>Da wären dann die Expires-Header für die statischen Inhalte. Diese sollten auf mehr als 30 Tage gesetzt werden.</p>
<p>Bei Apache 1.3 geht das mit mod_expire und den Direktiven</p>
<blockquote><p>&lt;IfModule mod_expires.c&gt;<br />
&lt;LocationMatch &#8220;^/(js|styles|images)/&#8221;&gt;<br />
ExpiresActive on<br />
ExpiresDefault &#8220;access plus 30 days&#8221;<br />
&lt;/LocationMatch&gt;<br />
&lt;/IfModule&gt;</p></blockquote>
<p>Bei lighttpd mit:</p>
<blockquote><p>server.modules   += ( &#8220;mod_expire&#8221; )</p>
<p>expire.url = ( &#8220;/images/&#8221; =&gt; &#8220;access plus 30 days&#8221;, &#8220;/styles/&#8221; =&gt; &#8220;access plus 30 days&#8221;, &#8220;/js/&#8221; =&gt; &#8220;access plus 40 days&#8221; )</p></blockquote>
<p><strong>Komprimierte Auslieferung</strong></p>
<p>Ein weiterer Bereich ist die komprimierte Auslieferung der Daten mit gzip.</p>
<p>Bei Apache 1.3 geht das sehr einfach mit mod_gzip:</p>
<blockquote><p>&lt;IfModule mod_gzip.c&gt;<br />
mod_gzip_on                   Yes<br />
mod_gzip_can_negotiate        Yes<br />
mod_gzip_static_suffix        .gz<br />
AddEncoding              gzip .gz<br />
mod_gzip_update_static        No<br />
mod_gzip_command_version      &#8216;/mod_gzip_status&#8217;<br />
mod_gzip_temp_dir             /tmp<br />
mod_gzip_keep_workfiles       No<br />
mod_gzip_minimum_file_size    500<br />
mod_gzip_maximum_file_size    500000<br />
mod_gzip_maximum_inmem_size   60000<br />
mod_gzip_min_http             1000<br />
mod_gzip_handle_methods        GET POST<br />
mod_gzip_item_exclude         reqheader  &#8220;User-agent: Mozilla/4.0[678]&#8221;<br />
mod_gzip_item_include         file       \.html$<br />
mod_gzip_item_include         file       \.js$<br />
mod_gzip_item_include         file       \.css$<br />
mod_gzip_item_include         file       \.pl$<br />
mod_gzip_item_include         handler    ^cgi-script$<br />
mod_gzip_item_include         mime       ^text/html$<br />
mod_gzip_item_include         mime       ^text/plain$<br />
mod_gzip_item_include         mime       ^text/css$<br />
mod_gzip_item_include         mime       ^application/javascript$<br />
mod_gzip_item_include         mime       ^application/x-javascript$<br />
mod_gzip_item_include         uri       ^/styles/<br />
mod_gzip_item_include         uri       ^/js/<br />
mod_gzip_item_exclude         mime       ^image/<br />
mod_gzip_dechunk              Yes<br />
LogFormat                     &#8220;%h %l %u %t \&#8221;%V %r\&#8221; %&lt;s %b mod_gzip: %{mod_gzip_result}n In:%{mod_gzip_input_size}n -&lt; Out:%{mod_gzip_output_size}n = %{mod_gzip_compression_ratio}n pct.&#8221; common_with_mod_gzip_info2<br />
CustomLog                     /var/log/apache/mod_gzip.log common_with_mod_gzip_info2<br />
mod_gzip_add_header_count     Yes<br />
mod_gzip_send_vary            On<br />
&lt;/IfModule&gt;</p></blockquote>
<p>Entsprechendes geht bei lighttpd mit mod_compress und</p>
<blockquote><p>compress.cache-dir          = &#8220;/var/cache/lighttpd/compress/&#8221;<br />
compress.filetype           = (&#8220;text/plain&#8221;, &#8220;text/html&#8221;, &#8220;application/x-javascript&#8221;, &#8220;text/css&#8221;, &#8220;application/javascript&#8221;)</p></blockquote>
<p>Diese Direktiven stehen so bereits in der Konfigurationsdatei lighttpd.conf und müssen dort nur aktiviert werden.</p>
<p><strong>ETags</strong></p>
<p>Weiter geht es mit der Konfiguration von ETags. Hier bietet es sich an, diese komplett zu deaktivieren</p>
<p>In Apache 1.3 geht das mit:</p>
<blockquote><p>&lt;LocationMatch &#8220;^/(js|styles|images)/&#8221;&gt;<br />
FileEtag None<br />
&lt;/LocationMatch&gt;</p></blockquote>
<p>Entsprechend in lighttpd:</p>
<blockquote><p>static-file.etags = &#8220;disable&#8221;</p></blockquote>
<p>Mit diesen wenigen Maßnahmen konnten wir uns von D-E im KUG auf eine Bewertung von B steigern. Auf unserem Entwicklungssystem für die nächste KUG-Version konnten wir die HTTP-Request weiter minimieren und haben es sogar auf ein A geschafft.Und das alles durch minimale Konfigurationsänderungen, die nicht wirklich Arbeit gekostet haben.</p>
<p>Selbstverständlich gibt es auch Bereiche, wo man mehr oder weniger machtlos ist, weil man z.B. externe Cover einbindet und der Lieferant keine Expires setzt oder nicht komprimiert oder &#8230; Manchmal kann man aber auch selbst dann noch optimieren. So ist bei uns auf allen Rechercheseiten der BIX-Zählpixel eingebunden, der natürlich prompt angemäkelt wurde. Da dieser aber ohnehin nur für einen definierten Zeitraum von wenigen Wochen pro Jahr aktiv ausgewertet wird, haben wir dessen Integration in die KUG-Seiten einfach parametrisiert. So wird er jetzt nur noch im Auswertungszeitraum aktiviert und erscheint sonst auf unseren Seiten nicht mehr.</p>
<p><a href="http://blog.openbib.org/wp-content/uploads/2010/06/yslow-kug.png"><img class="alignnone size-medium wp-image-174" title="Der KUG unter der Lupe von YSlow" src="http://blog.openbib.org/wp-content/uploads/2010/06/yslow-kug-300x165.png" alt="" width="300" height="165" /> </a></p>
<p>Insgesamt hat das YSlow Add-on bei der Optimierung des KUG als Beispiel für einen Bibliothekskatalog gute Dienste geleistet. Gerade durch die Adressierung konkreter Optimierungsbereiche und seine Evaluationmöglichkeiten deckt es den Frontendbereich sehr gut ab. Weitere Blog-Artikel zu YSlow finden sich <a title="Using YSlow to optimize web site perfomance" href="http://blog.shadypixel.com/using-yslow-to-optimize-web-site-performance/" target="_blank">hier</a> und <a title="Fortsetzung" href="http://blog.shadypixel.com/using-yslow-to-optimize-web-site-performance-continued/" target="_blank">hier</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2010/06/11/schnellere-kataloge-mit-yslow/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>PaperC im KUG</title>
		<link>http://blog.openbib.org/2010/03/02/paperc-im-kug/</link>
		<comments>http://blog.openbib.org/2010/03/02/paperc-im-kug/#comments</comments>
		<pubDate>Tue, 02 Mar 2010 09:39:46 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[E-Books]]></category>
		<category><![CDATA[PaperC]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=112</guid>
		<description><![CDATA[Hinweis: Seit dem 11.3.2010 werden in PaperC nicht mehr die ISBNs der Print-Ausgabe indexiert. Damit sind die Titel aus einem Bibliothekskatalog &#8211; wo eben diese vorhanden ist &#8211; nicht mehr auffindbar. Lukas Rieder von PaperC hat jedoch angekündigt, dass die Print-ISBNs zukünftig wieder erfasst werden sollen. Der Online-Dienst PaperC (Pay-per-Copy) bietet seinen Nutzern die Möglichkeit [...]]]></description>
			<content:encoded><![CDATA[<blockquote><p><strong>Hinweis:</strong> Seit dem 11.3.2010 werden in PaperC nicht mehr die ISBNs der Print-Ausgabe indexiert. Damit sind die Titel aus einem Bibliothekskatalog &#8211; wo eben diese vorhanden ist &#8211; nicht mehr auffindbar. Lukas Rieder von PaperC hat jedoch angekündigt, dass die Print-ISBNs zukünftig wieder erfasst werden sollen.</p></blockquote>
<p>Der Online-Dienst <a title="Startseite von PaperC" href="http://paperc.de/" target="_blank">PaperC</a> (Pay-per-Copy) bietet seinen Nutzern die Möglichkeit kostenlos Fachbücher im Internet zu lesen und wurde mit dieser Idee &#8220;Startup des Jahres&#8221;. Will der Nutzer Seiten aus einem Fachbuch weiter verarbeiten, so zahlt er dafür 10 Cent pro Seite  und kann fortan laut PaperC-Startseite</p>
<ul>
<li>Seiten herunterladen und ausdrucken</li>
<li>Textstellen einfach kopieren und zitieren</li>
<li>eigene Notizen anfügen und online verwalten</li>
</ul>
<p>Für Rechercheplattformen wie dem KUG mit seinen Nutzern ist PaperC damit ein sehr nützlicher Dienst, stellt er doch eine interessante Alternative zu teuer erworbenen E-Books dar. Gerade in der letzten Woche  schlug der Dienst in der Blogsphäre einige <a title="PaperC und die Verbünde" href="http://andreaarndt.wordpress.com/2010/03/01/paperc-mal-wieder/" target="_blank">Wellen</a>, als der Verlag O&#8217;Reilly 600 Bücher zu PaperC beisteuerte und die Einbindung von PaperC in Verbundkataloge thematisiert wurde. Sehr erfreulich ist die Bereitschaft von PaperC seine Metadaten zur Kataloganreicherung zu liefern. Ebenso wurde auf <a title="API-Wunsch im Feedback Forum" href="http://feedback.paperc.de/forums/7110-paperc-feedback/suggestions/300640-api-f-r-mashups?ref=title" target="_blank">breiten Wunsch</a> ein API fertig gestellt, dass allerdings bisher noch nicht öffentlich im Blog dokumentiert ist.</p>
<p>Um unseren Nutzern die Vorteile von PaperC schon jetzt anbieten zu können &#8211; und weil die Implementierung eine Sache von knapp 3 Minuten war &#8211; zeigt der KUG nun bei den Vollanzeigen derjenigen Titeln, die in PaperC vorhanden sind, deren Verfügbarkeit direkt an &#8211; wie im Beispiel-Titel &#8220;<a title="PermaLink zum Beispieltitel im KUG" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/inst006/6588/1/kug/index.html" target="_blank">Programming web services with Perl</a>&#8220;.</p>
<p><a href="http://blog.openbib.org/wp-content/uploads/2010/03/paperc-example1.png"><img class="alignnone size-medium wp-image-124" title="paperc-example" src="http://blog.openbib.org/wp-content/uploads/2010/03/paperc-example1-300x178.png" alt="" width="300" height="178" /></a></p>
<p>Der schon für die Einbindung von Google Books verwendete Mashup-Mechanismus im KUG ist sehr einfach und verzichtet bewusst auf die Verwendung von JavaScript. Stattdessen wird lediglich ein Bild mit einem URL verlinkt, der die Recherche bzw. den Einsprung in den jeweiligen Dienst (über die in der Titelaufnahme enthaltene ISBN) aufruft. Im Fall von PaperC ist das einfach</p>
<pre><a title="Recherche-Link des Titels in PaperC" href="http://paperc.de/search?query=0596002068&amp;commit=Suchen" target="_blank">http://paperc.de/search?query=0596002068&amp;commit=Suchen</a></pre>
<p>Das &#8220;Verfügbarkeits-Bild&#8221; wird dynamisch über einen <a title="Konnektor zur Erzeugung des Verfügbarkeitsbildes" href="http://cvs.berlios.de/cgi-bin/viewvc.cgi/openbib/openbib/portal/perl/modules/OpenBib/Handler/Apache/Connector/AvailabilityImage.pm?view=log" target="_blank">Konnektor</a> erzeugt. Dieser überprüft &#8211; ebenfalls über eine einfache Recherche &#8211; die Verfügbarkeit. Ist der jeweilige Titel bei PaperC enthalten, so wird das PaperC-Bild ausgegeben und der Recherche-Link ist nutzbar, falls nicht wird stattdessen ein transparenter Pixel ausgegeben und der Link ist unsichtbar.</p>
<p>Wichtig ist bei dieser Art der Nutzung  für den konnektorseitigen Aufruf &#8211; z.B. bei Google Books &#8211; die Weiterreichung der IP des aufrufenden Nutzers über den auch in Proxies gesetzten X-Forwarded-For-Header, um einem generellen Blocking der IP des Portal-Rechners zu entgehen. Da bei PaperC darüber hinaus ein Buch nicht über seine korrespondierende ISBN13 recherchierbar zu sein scheint, falls nur die ISBN10 ursprünglich vorhanden ist,  konnten wir für den Konnektor nicht die sonst übliche Normierung auf ISBN13 nutzen, sondern mussten 1:1 die in der KUG Titelaufnahme enthaltene ISBN10 verwenden.</p>
<p>Stehen später dann irgendwann einmal die Metadaten oder das API wirklich zur Verfügung, kann für den KUG im Hintergrund problemlos &#8211; und für den Nutzer weitgehend unsichtbar &#8211; eine Umstellung darauf erfolgen.</p>
<p><strong>Update 2.3.2010</strong>: Nach einer Anregung in einem <a title="PaperC Anfrage" href="http://twitter.com/paper_c/status/9870029936" target="_blank">Tweet</a> geht aus dem PaperC-Verfügbarkeitsbild nun eindeutig hervor, dass die Lehrbücher kostenlos gelesen werden können.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2010/03/02/paperc-im-kug/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>Verweise auf aktuelle Zeitschriftenartikel mit TicTocs im KUG</title>
		<link>http://blog.openbib.org/2009/12/10/verweise-auf-aktuelle-zeitschriftenartikel-mit-tictocs-im-kug/</link>
		<comments>http://blog.openbib.org/2009/12/10/verweise-auf-aktuelle-zeitschriftenartikel-mit-tictocs-im-kug/#comments</comments>
		<pubDate>Thu, 10 Dec 2009 22:13:22 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[SeeAlso]]></category>
		<category><![CDATA[TicTocs]]></category>
		<category><![CDATA[Zeitschriftenartikel]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=64</guid>
		<description><![CDATA[Der TicTocs Journal Tables of Contents Dienst wurde konsortial unter Führung der University of Liverpool Library erschaffen, um den Nutzern mit wenig Aufwand eine Übersicht der zuletzt in einer Zeitschrift veröffentlichten Artikel zu geben. Der Nutzer sucht zunächst nach den ihn interessierenden Zeitschriften und kann diese dann mit nur einem &#8220;Tic&#8221; anhaken und dauerhaft abonnieren. [...]]]></description>
			<content:encoded><![CDATA[<p>Der <a title="TicTocs Webseite" href="http://www.tictocs.ac.uk/" target="_blank">TicTocs Journal Tables of Contents Dienst</a> wurde konsortial unter Führung der University of Liverpool Library erschaffen, um den Nutzern mit wenig Aufwand eine Übersicht der zuletzt in einer Zeitschrift veröffentlichten Artikel zu geben. Der Nutzer sucht zunächst nach den ihn interessierenden Zeitschriften und kann diese dann mit nur einem &#8220;Tic&#8221; anhaken und dauerhaft abonnieren.</p>
<p>Kernstück dieses Dienstes sind RSS-Feeds der entsprechenden Zeitschriften auf Verlagsseite, die die gewünschten Informationen zum Artikel wie Titel, URL zum Volltext sowie Abstract bereitstellen. In diesem Sinne werden im TicTocs-Dienst eben jene RSS-Feeds zu möglichst vielen Zeitschriften gesammelt. Derzeit umfasst der Dienst die aktuellsten Inhaltsverzeichnisse zu 12719 Zeitschriften von 448 Verlagen.</p>
<p>Interessant wird dieser Dienst für einen Katalog, wie z.B. den Kölner UniversitätsGesamtkatalog (KUG), dadurch, daß die Betreiber des TicTocs-Dienstes die von ihnen gesammelten RSS-Feeds für jedermann als Tabulator-separierte Tabelle unter <a title="RSS-Feeds mit Informationen" href="http://www.tictocs.ac.uk/text.php" target="_blank">http://www.tictocs.ac.uk/text.php</a> zur weiteren Nutzung bereitstellen.</p>
<p>Sehr vorteilhaft ist dabei, daß zu den Feeds &#8211; wenn immer möglich &#8211; sowohl die ISSN der Printausgabe wie auch der elektronischen Ausgabe mitgeliefert werden. Edlef Stabenau hatte bereits im März im netbib-Weblog darüber <a title="TicTocs für den eigenen Katalog" href="http://log.netbib.de/archives/2009/03/18/tictocs-fur-den-eigenen-katalog/" target="_blank">berichtet</a>, aber leider hatte ich das damals wohl überlesen und bin erst vor drei Wochen auf diesen Dienst gestoßen&#8230;</p>
<p>Die Integration in den KUG war dann schnell erledigt. Die Anreicherung der Titelaufnahmen geschieht &#8211; wie immer &#8211; katalogübergreifend in unserer zentralen Anreicherungsdatenbank, wobei der Identifizierungsschlüssel diesmal die ISSN ist. Die Einspielung der RSS-Feeds zu den ISSN&#8217;s in diese Datenbank übernimmt unser Skript <a title="Programm im CVS" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/conv/enrichmnt/tictocs2enrich.pl" target="_blank">tictocs2enrich.pl.</a> Der Aufruf dieser Feeds und die Anzeige in den Titelaufnahmen kann auf verschiedene Weisen erfolgen. Am ehesten Web 2.0-artig ist sicherlich die Einbindung ausschließlich via JavaScript mit dem JQuery-Plugin <a title="jFeed-Plugin" href="http://plugins.jquery.com/project/jFeed" target="_blank">jFeed</a> (funktioniert wegen der JavaScript-Sandbox aber nur mit Proxy) oder mit <a title="AJAX Feed API von Google" href="http://code.google.com/intl/de-DE/apis/ajaxfeeds/" target="_blank">Googles AJAX Feed API</a>.</p>
<p>Stattdessen haben wir den noch fehlende RSS-Reader mit effektiv 2 Zeilen Perl-Code in einer eigenen Methode <a title="Utilities-Klasse zur Nutzung in Templates" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/portal/perl/modules/OpenBib/Template/Utilities.pm" target="_blank">load_rss_feed</a> für die Nutzung in unserem Templating-System realisiert: So können wir für die JavaScript-Nutzer alles via AJAX anbieten, für die anderen &#8211; mit aus Sicherheitsgründen deaktiviertem JavaScript &#8211; die Informationen aber dennoch einfach als weitere Seite verlinken. Die eigentliche Ausgabe übernimmt das Informations-Template <a title="Template sowohl für die Ausgabe des Feeds" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/portal/perl/templates/info_62" target="_blank">info_62</a>, das sowohl die Ausgabe via AJAX, wie auch als eigenständige Webseite übernimmt.</p>
<p>Hier nun zwei konkrete Beispiel im KUG.</p>
<p>Zunächst die Zeitschrift <a title="PermaLink des Titels im KUG" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/inst001/6396839/1/kug/index.html" target="_blank">Remote Sensing</a></p>
<div class="mceTemp">
<dl id="attachment_69" class="wp-caption alignnone" style="width: 310px;">
<dt class="wp-caption-dt"><a href="http://blog.openbib.org/wp-content/uploads/2009/12/tictocs-remotesending.png"><img class="size-medium wp-image-69" title="tictocs-remotesending" src="http://blog.openbib.org/wp-content/uploads/2009/12/tictocs-remotesending-300x216.png" alt="Die Zeitschrift Remote Sensing" width="300" height="216" /></a></dt>
</dl>
</div>
<p>und danach die Zeitschrift <a title="PermaLink des Titels im KUG" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/inst001/79794/1/kug/index.html" target="_blank">Nature</a></p>
<div class="mceTemp">
<dl id="attachment_68" class="wp-caption alignnone" style="width: 310px;">
<dt class="wp-caption-dt"><a href="http://blog.openbib.org/wp-content/uploads/2009/12/tictocs-nature.png"><img class="size-medium wp-image-68" title="tictocs-nature" src="http://blog.openbib.org/wp-content/uploads/2009/12/tictocs-nature-300x215.png" alt="Die Zeitschrift Nature" width="300" height="215" /></a></dt>
</dl>
</div>
<p>Mit der Integration von TicTocs können wir unseren Nutzern fortan sinnvolle Zusatzinformationen zu den abgedeckten Zeitschriften geben. Gemessen an dem geringen Integrationsaufwand wünschen wir TicTocs den Einzug in möglichst viele weitere Kataloge.</p>
<p><strong>Update 21.12.2009:</strong></p>
<p>Damit andere Interessierte den TicTocs-Dienst noch einfacher als Mashup in ihre eigenen Kataloge einbinden können &#8211; unter anderem auch wir selbst mit unserem <a title="USB Portal = Integration Webseiten und Rechercheanwendung" href="http://www.ub.uni-koeln.de/" target="_blank">USB-Portal</a> &#8211; bieten wir ihn selbst via <a title="SeeAlso Abfrageprotokoll" href="http://wiki.openbib.org/index.php?title=SeeAlso_Abfrageprotokoll" target="_blank">SeeAlso-Protokoll</a> an. Der Dienst hat den Namen <em>issn2tictocs</em> und kann sehr einfach mit einem Formatparameter <em>seealso</em> sowie dem Namen einer optionalen Callback-Funktion aufgerufen weden. Als Standard-Darstellung wir JSON zurückgeliefert.</p>
<p>Hier beispielsweise der Aufruf für die Zeitschrift <a title="SeeAlso Aufruf mit Callbackfunktion callme" href="http://kug.ub.uni-koeln.de/portal/connector/seealso/issn2tictocs?id=2072-4292&amp;format=seealso&amp;callback=callme" target="_blank">Remote Sensing</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2009/12/10/verweise-auf-aktuelle-zeitschriftenartikel-mit-tictocs-im-kug/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Kataloganreicherung mit Schlagworten</title>
		<link>http://blog.openbib.org/2009/11/09/kataloganreicherung-mit-schlagworten/</link>
		<comments>http://blog.openbib.org/2009/11/09/kataloganreicherung-mit-schlagworten/#comments</comments>
		<pubDate>Mon, 09 Nov 2009 17:07:56 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[Datenaustausch]]></category>
		<category><![CDATA[Kataloganreicherung]]></category>
		<category><![CDATA[Schlagworte]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=34</guid>
		<description><![CDATA[Ein bekanntes Problem der Zusammenführung vieler Katalogbestände unter einer Rechercheoberfläche &#8211; egal, ob als klassische föderierte Suche oder als Suchmaschine mit einem/mehreren Indizes realisiert &#8211; ist für den Nutzer die z.T. hohe Heterogenität der erfassten Daten und ihrer inhaltlichen Erschließung. Dazu gehört z.B. die Vergabe von Medientypen, die Systematisierung oder die Verschlagwortung. Daher besteht eine [...]]]></description>
			<content:encoded><![CDATA[<p>Ein bekanntes Problem der Zusammenführung vieler Katalogbestände unter einer Rechercheoberfläche &#8211; egal, ob als klassische föderierte Suche oder als Suchmaschine mit einem/mehreren Indizes realisiert &#8211; ist für den Nutzer die z.T. hohe Heterogenität der erfassten Daten und ihrer inhaltlichen Erschließung. Dazu gehört z.B. die Vergabe von Medientypen, die Systematisierung oder die Verschlagwortung. Daher besteht eine der zentralen Aufgaben in der Architektur und den Funktionen eines Recherche-Portals gerade darin, hier konkrete Lösungen zu finden, um dieser Heterogenität einigermaßen Herr zu werden &#8211; und vielleicht sogar einen Nutzen daraus zu ziehen. Kurz gesagt also nichts weniger, als auf Grundlage der zur Verfügung stehenden Daten möglichst automatisiert eine Homogenität zu erzeugen, wo ürsprünglich eigentlich gar keine ist.</p>
<p>Hier sind Recherche-Portale mit eigener Datenhaltung &#8211; wie z.B. <a title="Bielefeld Academic Search Engine" href="http://www.base-search.net/" target="_blank">BASE</a>, <a title="Testversion von Beluga" href="http://beluga.sub.uni-hamburg.de/" target="_blank">beluga</a>, <a title="Heidi Katalog" href="http://heidi.ub.uni-heidelberg.de/" target="_blank">Heidi</a> oder der <a title="Kölner UniversitätsGesamtkatalog" href="http://kug.ub.uni-koeln.de/" target="_blank">KUG</a> &#8211; ganz klar im Vorteil, da erst dort datenbestandsübergreifend einheitliche Analysen sowie Anreicherungen vorgenommen werden und diese auch wieder in den Datenbestand zurückfließen können. Die erweiterten oder angepassten Daten stehen dann für die Recherche und die Anzeige also wieder zur Verfügung. Eine standardisierte Zugriffsschnittstelle auf entfernte Daten kann so etwas nicht leisten.</p>
<p>Vor einiger Zeit erhielt ich die Kopie einer Arbeit über den KUG im Rahmen des MALIS-Studiengangs an der FH Köln mit dem Titel &#8220;<em>Der Kölner UniversitätsGesamtkatalog (KUG) &#8211; Analyse der praktischen Inhaltserschließung</em>&#8220;. In dieser Arbeit wurden sehr viele der Probleme angesprochen, mit denen wir uns wegen eben jener ausgesprochenen Heterogenität der Ausgangsdaten für den KUG herumschlagen müssen und darüber hinaus sehr viel Feedback geliefert, worüber ich ausgesprochen dankbar bin.</p>
<p>Problematisiert wurde insbesondere die bereits angesprochene unterschiedliche sachliche Erschliessung mit Schlagworten bei gleichen Titeln in unterschiedlichen Katalogen. Entsprechend der Verschlagwortungsvorlieben der jeweiligen InstitutsbibliothekarInnen (die nicht nach RSWK verschlagworten &#8211; was allerdings nicht notwendigerweise ein Nachteil ist) werden im besten Fall verschiedene, im schlimmsten Fall gar keine Schlagworte vergeben. Einmal abgesehen von der uneinheitlichen Erscheinungsform des Titels in der Vollanzeige für den Recherchierenden &#8211; was notfalls noch zu verschmerzen wäre &#8211; kann dieser den Titel in einem Katalog eventuell über die Suche nach dem entsprechenden Schlagwort finden, im anderen aber gerade nicht. Das ist definitv ein Problem.</p>
<p>Als finaler Denkanstoß war dieser Artikel Grund genug sich im Rahmen des KUG etwas eingehender mit diesem konkreten Problem im Bereich Verschlagwortung zu beschäftigen und nach einfach zu realisierenden Lösungsansätzen zu suchen. Sehr schnell hat sich herauskristallisiert, dass sich dieses Problem sehr gut mit dem bereits bestehenden Toolset des KUG angehen lässt. Wie schon bei anderen Maßnahmen zur katalogübergreifenden Homogenisierung von Daten im KUG greifen wir auch hier auf das Konzept der <a title="Zentrale Kataloganreicherung im KUG" href="http://blog.openbib.org/2008/06/18/zentrale-kataloganreicherung/" target="_blank">Zentralen Kataloganreicherung</a> zurück.</p>
<p>Dazu werden in einem ersten Schritt beim nächtlichen Update eines jeden Katalogs im KUG die dort vergebenen Schlagworte mit der zugehörigen ISBN als Zugriffsschlüssel (unter einer neuen Kategorienummer) in unserer zentralen Anreicherungsdatenbank abgelegt. Das geschieht durch ein sehr einfaches Anreicherungsprogramm <a title="Programm im CVS" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/conv/enrichmnt/swt2enrich.pl?view=log" target="_blank">swt2enrich.pl</a>. Damit wurde bereits folgendes erreicht:</p>
<ol>
<li>Jeder Titelaufnahme mit der jeweiligen ISBN stehen alle korrespondierenden &#8220;angereicherten&#8221; Schlagworte jenseits der (etwaig vorhandenen) lokalen Verschlagwortung zur Verfügung.</li>
<li>Darüber hinaus wird durch die Anreicherungdatenbank ein Verknüpfungsnetz von Titeln &#8211; identifiziert durch alle ISBNs zum jeweiligen Schlagwort &#8211; quasi unsichtbar über den aktuellen (Teil-)Katalog gelegt. Auf diese Weise lassen sich zu jedem so angereicherten Schlagwort auch weitere thematisch gleich eingeordnete Titel <em>im aktuellen Katalog</em> finden und verknüpfen &#8211; auf Grundlage der Verschlagwortung des Titels <em>in einem anderen Katalog</em>.</li>
</ol>
<p>Im KUG werden diese &#8220;angereicherten Schlagworte&#8221; mit entsprechender Verknüpfung in der Einzeltrefferanzeige im Block &#8220;<em>Entdecken Sie weitere Treffer über:</em>&#8221; als &#8220;<em>Verschlagwortung aus anderen Katalogen</em>&#8221; angezeigt &#8211; für den Recherchierenden bewusst getrennt von den sonstigen bibliographischen Daten.</p>
<p>In einem zweiten Schritt werden nun nur noch durch entsprechende Parametrisierung die &#8220;angereicherten Schlagworte&#8221; mit in den Suchindex des jeweiligen Katalogs übernommen und sind so neben den &#8220;normalen&#8221; Schlagworten recherchierbar. Ein so mit weiteren Schlagworten angereicherter Titel profitiert unmittelbar von dieser Anreicherung explizit dadurch, dass die Wahrscheinlichkeit steigt, dass er &#8220;<em>mit den Suchworten des Recherchierenden</em>&#8221; auch gefunden wird. Die Grundannahme ist also: Je größer die Wortbasis der intellektuell verschlagwortenden BibliothekarInnen, desto größer auch die Wahrscheinlichkeit, dass der Nutzer mit einem davon rechierchiert und dadurch den Titel findet.</p>
<p>Ein gutes Beispiel für diese Kataloganreicherung mit Schlagworten ist der Titel &#8220;<a title="PermaLink zu diesem Titel" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/inst201/44212/1/kug/index.html" target="_blank"><strong>Die materielle Polizeipflicht des Zustandsstörers und die Kostentragungspflicht nach unmittelbarer Ausführung und Ersatzvornahme &#8211; dargestellt am Beispiel der Altlasten-Problematik</strong></a>&#8221; aus dem Katalog der Fachbibliothek Rechtswissenschaft.</p>
<div id="attachment_47" class="wp-caption alignnone" style="width: 308px"><a href="http://blog.openbib.org/wp-content/uploads/2009/11/swtenrich1.png"><img class="size-medium wp-image-47" title="swtenrich1" src="http://blog.openbib.org/wp-content/uploads/2009/11/swtenrich1-300x168.png" alt="Anreicherung des Titels mit weiteren Schlagworten" width="298" height="166" /></a><p class="wp-caption-text">Anreicherung des Titels mit weiteren Schlagworten</p></div>
<p>Dieser Titel wurde lokal mit den Worten <em>Altlasten, Kostenpflicht und Polizeipflicht</em> verschlagwortet. Durch die Anreicherung kommen nun noch die Begriffe <em>Altlastsanierung, Störer, Zustandshaftung und Gefahrenabwehr</em> hinzu. Gleichzeitig ist dieser Titel auch im Katalog des Instituts für Öffentliches Recht und Verwaltungslehre vorhanden (PermaLink <a title="PermaLink dieses Titels" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/inst213/1938/1/kug/index.html" target="_blank">hier</a>).</p>
<div id="attachment_48" class="wp-caption alignnone" style="width: 310px"><a href="http://blog.openbib.org/wp-content/uploads/2009/11/swtenrich2.png"><img class="size-medium wp-image-48" title="swtenrich2" src="http://blog.openbib.org/wp-content/uploads/2009/11/swtenrich2-300x175.png" alt="Anreicherung mit Schlagworten bei einem lokal nicht verschlagworteten Titel" width="300" height="175" /></a><p class="wp-caption-text">Anreicherung mit Schlagworten bei einem lokal nicht verschlagworteten Titel</p></div>
<p>Dort ist der Titel überhaupt nicht verschlagwortet und er profitiert maximal von der Anreicherung. Mehr noch &#8211; wie bereits angesprochen können alle Titel durch den Nutzer <em>in diesem Katalog</em> erreicht werden, die auch <em>in anderen Katalogen</em> vorhanden sind und dort entsprechend verschlagwortet wurden &#8211; z.B. mit dem Schlagwort <em>Gefahrenabwehr</em> ergeben sich so 5 zusätzlich vernetzte Titel.</p>
<div id="attachment_49" class="wp-caption alignnone" style="width: 310px"><a href="http://blog.openbib.org/wp-content/uploads/2009/11/swtenrich3.png"><img class="size-medium wp-image-49" title="swtenrich3" src="http://blog.openbib.org/wp-content/uploads/2009/11/swtenrich3-300x177.png" alt="Titel zur Gefahrenabwehr im lokalen Katalog entsprechend der Verschlagwortung in anderen Katalogen" width="300" height="177" /></a><p class="wp-caption-text">Titel zur Gefahrenabwehr im lokalen Katalog entsprechend der Verschlagwortung in anderen Katalogen</p></div>
<p>Die Kataloganreicherung mit Schlagworten ist ein gutes Beispiel dafür, wie mit relativ wenig Aufwand für den Recherchierenden ein deutlicher Mehrwert im Bereich Recherchierbarkeit sowie thematische Titelvernetzung geschaffen werden konnte. Dieser Mehrwert ließe sich noch weiter steigern, wenn es zu einem freien Austausch dieser (und weiterer) Informationen mit anderen Katalogen bzw. Katalogprojekten kommen könnte. So überlegen wir derzeit z.B. ob und wie wir weite Teile unserer Anreicherungsdatenbank frei verfügbar machen können, so dass sie von anderen interessierten Katalogen genutzt werden können. Solch ein Austausch würde insbesondere im Bereich der &#8220;social web&#8221;-Inhalte wie z.B. bei Tags, Literaturlisten usw.  in Katalogen, die jeder für sich unterhalb einer kritischen Masse von Nutzern agieren, einen gangbaren Weg darstellen, um eben jene kritische Masse durch Zusammenarbeit dennoch zu erreichen.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2009/11/09/kataloganreicherung-mit-schlagworten/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>DFG-Viewer für Wikisource im KUG</title>
		<link>http://blog.openbib.org/2009/08/21/dfg-viewer-fur-wikisource-im-kug/</link>
		<comments>http://blog.openbib.org/2009/08/21/dfg-viewer-fur-wikisource-im-kug/#comments</comments>
		<pubDate>Thu, 20 Aug 2009 22:23:37 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[DFG-Viewer]]></category>
		<category><![CDATA[METS]]></category>
		<category><![CDATA[unAPI]]></category>
		<category><![CDATA[Wikisource]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=30</guid>
		<description><![CDATA[Im Bestreben die Digitalisate von Wikisource &#8211; jenseits des schon erfolgten Nachweises im KUG &#8211; für unsere Nutzer noch einfacher zugänglich zu machen, haben wir die Idee von Jakob Voss, diese über den DFG-Viewer zu erschließen, weiter verfolgt und nun für den KUG umgesetzt. Der DFG-Viewer benötigt die Strukturinformationen des Digitalisats im METS-Format, wie es [...]]]></description>
			<content:encoded><![CDATA[<p>Im Bestreben die Digitalisate von Wikisource &#8211; jenseits des schon erfolgten Nachweises im KUG &#8211; für unsere Nutzer noch einfacher zugänglich zu machen, haben wir die <a title="Wikisource im DFG-Viewer dank Schnittstellen" href="http://jakoblog.de/2008/03/31/wikisource-im-dfg-viewer-dank-schnittstellen/" target="_blank">Idee von Jakob Voss</a>, diese über den <a title="DFG-Viewer Homepage" href="http://dfg-viewer.de/" target="_blank">DFG-Viewer</a> zu erschließen, weiter verfolgt und nun für den KUG umgesetzt.</p>
<p>Der DFG-Viewer benötigt die Strukturinformationen des Digitalisats im <a title="zvdd/DFG-Viewer METS-Profil" href="http://dfg-viewer.de/fileadmin/groups/dfgviewer/METS_Anwendungsprofil_2.0.xml" target="_blank">METS-Format</a>, wie es auch vom Zentralen Verzeichnis Digitalisierter Drucke <a title="zvdd Homepage" href="http://www.zvdd.de/" target="_blank">zvdd</a> verwendet wird. Da Jakob für Wikisource bereits einen <a title="wsource2mets.pl von Jakob Voss" href="http://jakoblog.de/wp-content/uploads/2008/03/wsource2metspl.txt" target="_blank">Proof-Of-Concept-Code</a> veröffentlichte, habe ich diesen mit seiner Erlaubnis erst einmal als Grundlage für unsere Umsetzung genommen und ihn dann sukzessive überarbeitet.</p>
<p>Ausgehend von der Indexseite der jeweiligen Digitalisate, die alle mit <em>Index:</em> beginnen, können dort &#8211; ähnlich den Personen- und Textdaten für die bibliographischen Daten in der deutschen Wikisource &#8211; z.T. strukturiert vorliegende rudimentäre Metadaten des Digitalisats aus dem XML-Dump von Wikisource entnommen werden. Diese sehen normalerweise so aus:</p>
<pre>|BILD=[[Datei:Kafka Der Prozess 1925.jpg|200px]]
|AUTOR=[[Franz Kafka]]
|TITEL=[[Der Process]]
|VERLAG=Verlag die Schmiede
|JAHR=1925
|ORT=[[Berlin]]
|QUELLE=[http://anno.onb.ac.at/cgi-content/anno-buch?apm=0&amp;aid=318 ÖNB-ANNO]
|SEITEN=[[Seite:De Kafka Prozeß I.jpg|I]]</pre>
<p>Für den DFG-Viewer sind hier insbesondere die Informationen AUTOR, TITEL, JAHR, ORT und vor allem SEITEN interessant. Die Namen aller im zugehörigen Werk digitalisierten Seiten beginnen mit <em>Seite:</em> gefolgt von der effektiven Seitenzählung, die mit Pipe abgetrennt ist. Leider verfügen nicht alle Einträge über solche Metadaten, die über die Seiten-Verweise hinausgehen. In diesem Fall muss man sie den Textdaten der zugehörigen Wikisource-Seite entnehmen und einfach alle Verweise einsammeln die mit <em>Seite:</em> beginnen. Manchmal wird auch das Container-Format DJVU für Digitalisate verwendet. Dieses können wir bisher leider noch nicht verarbeiten.</p>
<p>Die Kunst ist nun zu den Seiten-Verweisen ala</p>
<pre>[[Seite:De Kafka Prozeß I.jpg|I]]</pre>
<p>die effektiven Dateinamen und -urls zu bestimmen, die für die METS-Datei benötigt werden. Hier hätte ich aus Effizienzgründen, und um Wikisource nicht allzusehr zu belasten, gerne einen geeigeneten Wikimedia-Dump herangezogen, konnte aber keinen finden. Daher muss man zwingend das Wikimedia-API verwenden, bei dem man zudem an die Beschränkungen der maximalen Request-Menge denken muss.</p>
<p>Eine solche Abfrage hat z.B. folgende Form:</p>
<p>http://de.wikisource.org/w/api.php</p>
<p>?format=json&amp;action=query∝=imageinfo&amp;iiprop=url&amp;iiurlwidth=1000&amp;titles=Image<br />
 <img src='http://blog.openbib.org/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /> e Kafka Prozeß I.jpg|Image:De Kafka Prozeß II.jpg|Image:De Kafka Prozeß 001.jpg|Image:De Kafka Prozeß 002.jpg</p>
<p>Zurückgeliefert bekommt man dann alle benötigten Datei-Informationen im JSON-Format und kann diese sehr einfach weiter verarbeiten.</p>
<p>Wichtig ist hier die Forderung des DFG-Viewers nach einer Standardauflösung von 1000 bis 1500 Pixel für die Breite der Bilder, die über den CGI-Parameter <em>iiurlwidth</em> konfiguriert wird. Mit den Metadaten des Digitalisats, den Labeln für die effektive Seitenzählung, den URLs für die Bilder in der geforderten Standard- sowie maximal möglichen Auflösung, hat man nun alle Informationen an der Hand, um die METS-Beschreibung zu erstellen.</p>
<p>Geplant war zuerst die Katalogeinträge im KUG um eine Kategorie zu erweitern und in diese dann die in XML kodierten METS-Informationen abzulegen. Just in diesem Moment haben wir aber bemerkt, daß der DFG-Viewer die METS-Daten von Jakob gar nicht mehr anzeigen kann. Die Seite bleibt einfach weiß &#8211; eine Fehlermeldung gibt es nicht und auch der <a title="Validator für den DFG-Viewer" href="http://dfg-viewer.de/profil-der-metadaten/validator/" target="_blank">Validator</a> für den DFG-Viewer bescheinigte späteren METS-Kodierungen von uns Korrektheit &#8211; nur der DFG-Viewer zeigte nichts an. An dieser Stelle möchte ich darauf hinweisen, daß der DFG-Viewer anscheinend mindestens für einen Tag die METS-Daten eines Digitalisats zwischenspeichert &#8211; für jeden fehlerhaften Versuch muss man sich also ein neues Digitalisat suchen&#8230;</p>
<p>An diesem Punkt habe ich die Idee mit der fertig abgespeicherten METS-Beschreibung aus Flexibilitätsgründen sehr schnell verworfen, um auch später noch schnell Anpassungen im geforderten METS-Derivat vornehmen zu können. Dazu erfolgte mit unserem <a title="wikisource2meta.pl" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/conv/wikisource/wikisource2meta.pl?view=log" target="_blank">Konvertierungsprogramm</a> eine Serialisierung der wesentlichen Basisinformationen (Metadaten, URLs, Label, usw.) in ein Set an neu geschaffenen Kategorien. Aus diesen Kateogorien generieren wir dann erst später über unser Templating-System, dem <a title="Template Toolkit für Perl" href="http://www.template-toolkit.org/" target="_blank">Template Toolkit</a>, im Template <a title="METS-Template" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/portal/perl/templates/connector_unapi_mets?view=log" target="_blank">connector_unapi_mets</a> die für den DFG-Viewer geeignete METS-Beschreibung.</p>
<p>Konkret haben wir zur Lieferung der METS-Beschreibung die schon vorhandene unAPI-Schnittstelle um das METS-Format erweitert. Da wir aber noch nicht genau wissen, ob der Hauptnutzer dieser Schnittstelle &#8211; Zotero &#8211; eventuell Probleme mit diesem zusätzlichen Format hat, wird es erst einmal bei unAPI-Anfragen nicht explizit &#8220;beworben&#8221; und muss explizit mit <em>format=mets</em> spezifiziert werden (<a title="METS für Kafka's Prozess via unAPI" href="http://kug.ub.uni-koeln.de/portal/connector/unapi?id=wikisource_de%3A1834&amp;format=mets" target="_blank">Beispiel)</a>.</p>
<p>Die Verlinkung zum DFG-Viewer erfolgt im KUG in den Vollanzeigen der jeweiligen Katalogaufnahme, wie z.B. beim gewählten Beispiel von <a title="PermaLink des Titels im KUG" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/wikisource_de/1834/1/kug/index.html" target="_blank">Kafka&#8217;s Prozeß</a>.</p>
<p><a href="http://blog.openbib.org/wp-content/uploads/2009/08/dfgviewer.png"><img class="alignnone size-medium wp-image-31" title="dfgviewer" src="http://blog.openbib.org/wp-content/uploads/2009/08/dfgviewer-300x148.png" alt="Mit dem DFG-Viewer verlinkter Titel im KUG" width="300" height="148" /></a></p>
<p><a href="http://blog.openbib.org/wp-content/uploads/2009/08/dfgviewer1.png"><img class="alignnone size-medium wp-image-32" title="dfgviewer1" src="http://blog.openbib.org/wp-content/uploads/2009/08/dfgviewer1-300x175.png" alt="Das Buch im DFG-Viewer" width="300" height="175" /></a></p>
<p>Oft ist hier das gesamte Buch verlinkt &#8211; dieses ist üblicherweise via INDEXSEITE in den Textdaten spezifiziert, falls Artikelnamen differieren &#8211; und man muß erst den durch die Katalogaufnahme beschriebenen Aufsatz darin finden. Aber dafür gibt es ja normalerweise ein Inhaltsverzeichnis &#8211; falls vorhanden..</p>
<p>Schön wäre es aber dennoch, sofort passgenau zur entsprechenden Seite zu springen &#8211; bisher konnten wir die dazu benötigten Informationen aus den Wikisource-Artikel aber noch nicht extrahieren bzw. verarbeiten.</p>
<p>Es gibt hier also auch noch einiges zu tun.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2009/08/21/dfg-viewer-fur-wikisource-im-kug/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Integration von Wikisource in den KUG</title>
		<link>http://blog.openbib.org/2009/08/08/integration-von-wikisource-in-den-kug/</link>
		<comments>http://blog.openbib.org/2009/08/08/integration-von-wikisource-in-den-kug/#comments</comments>
		<pubDate>Sat, 08 Aug 2009 20:58:02 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[Wikisource]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=28</guid>
		<description><![CDATA[Im Artikel Nachweise freier Inhalte in den OPAC hatte ich vor knapp 2 Monaten bereits Überlegungen angestellt, dass man die Inhalte von Wikisource für die Recherchen der Nutzer in einem OPAC erschließen könnte. Dazu werden Metadaten zu den Digitalisaten benötigt. Im Folgenden skizziere ich exemplarisch den Weg, den wir für die deutschen Wikisource-Bestände gegangen sind, [...]]]></description>
			<content:encoded><![CDATA[<p>Im Artikel <a title="Artikel-Link" href="http://blog.openbib.org/2009/06/03/nachweise-freier-inhalte-in-den-opac/" target="_blank">Nachweise freier Inhalte in den OPAC</a> hatte ich vor knapp 2 Monaten bereits Überlegungen angestellt, dass man die Inhalte von Wikisource für die Recherchen der Nutzer in einem OPAC erschließen könnte.</p>
<p>Dazu werden Metadaten zu den Digitalisaten benötigt. Im Folgenden skizziere ich exemplarisch den Weg, den wir für die deutschen Wikisource-Bestände gegangen sind, um sie in den KUG zu integrieren.</p>
<p>Anstatt den Weg über die Index-Seite des zugehörigen Text-Eintrags zu gehen &#8211; wie ihn Jakob Voss in seinem Artikel <a title="Blog-Artikel von Jakob Voss" href="http://jakoblog.de/2008/03/31/wikisource-im-dfg-viewer-dank-schnittstellen/" target="_blank">Wikisource im DFG-Viewer dank Schnittstellen</a> skizziert, analysieren wir dazu den gesamten <a title="XML-Abzug der deutschen Wikisource-Site" href="http://dumps.wikimedia.org/dewikisource/" target="_blank">Wikisource-Dump dewikisource</a> im XML-Format.</p>
<p>Die benötigten Metadaten zu den jeweiligen Digitalisaten befinden sich direkt in deren Seite in einem Template mit dem Namen <em>Textdaten</em>. In ihm sind entsprechend der zugehörigen Informationsseiten <a title="Artikel-Link" href="http://de.wikisource.org/wiki/Vorlage_Diskussion:Textdaten" target="_blank">Vorlage_Diskussion:Textdaten</a> sowie <a title="Artikel-Link" href="http://de.wikisource.org/wiki/Wikisource:Metadaten" target="_blank">Wikisource:Metadaten</a> &#8211; letztere wieder unter Federführung von Jakob Voss &#8211; folgende Felder definiert:</p>
<pre>|VORIGER=
|NAECHSTER=
|AUTOR=
|TITEL=
|SUBTITEL=
|HERKUNFT=
|HERAUSGEBER=
|AUFLAGE=
|ENTSTEHUNGSJAHR=
|ERSCHEINUNGSJAHR=
|ERSCHEINUNGSORT=
|ÜBERSETZER=
|ORIGINALTITEL=
|ORIGINALSUBTITEL=
|ORIGINALHERKUNFT=
|WIKIPEDIA=
|BILD=
|QUELLE=
|KURZBESCHREIBUNG=
|SONSTIGES=
|BEARBEITUNGSSTAND=</pre>
<p>Wie schon Jakob Voss in Wikisource:Metadaten ausführt, wären weitere Kategorien sehr wünschenswert. Die vorhandenen sind aber schon ganz brauchbar &#8211; speziell wenn man sie mit den Metadaten anderer Wikisource-Bestände, wie z.B. der englischen vergleicht. Dort wird das Template <em>header2</em> verwendet und dieses kennt an katalogrelevanten Kategorien gerade mal Autor und Titel:</p>
<pre> | title    =
 | author   =
 | section  =
 | previous =
 | next     =
 | notes    =</pre>
<p>Problematisch und undefiniert sind die Trenner zwischen mehreren Verfassern. Mal wird das HTML-<em>BR</em>, mal <em>und</em>, mal ein Komma verwendet. Mit den entsprechenden regulären Ausdrücken für den Trenner kann man aber schon sehr weit kommen und viel auflösen. Dennoch wäre eine verbindliche Definition des Trenners in Wikisource aus meiner Sicht sehr sinnvoll, z.B. Leerzeichen Semikolon Leerzeichen.</p>
<p>Unser Mapping für die Daten aus dem Textdaten-Template zu unserem internen MAB2-basierten Zwischen-Format für den KUG ist in der Konfigurationsdatei <a title="Konfiguration für den Konverter" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/conv/wikisource/conf/wikisource_de.yml?view=log" target="_blank">wikisource_de.yml</a> im YAML-Format definiert. Als numerische Identifikationsnummer eines Wikisource-Digitalisats verwenden wir die zugehörige interne Id-Nummer des Artikels im Wikisource-Dump.</p>
<p>Neben dem Textdaten-Template verwendet die deutsche Wikisource Textsammlung darüber hinaus auch ein Template <em>Personendaten</em>. In diesem sind folgende Informationen enthalten:</p>
<pre>|NACHNAME=
|VORNAMEN=
|ALTERNATIVNAMEN=
|SORTIERUNG=
|PERSON=
|KURZBESCHREIBUNG=
|SONSTIGES=
|GEBURTSDATUM=
|GEBURTSORT=
|STERBEDATUM=
|STERBEORT=
|BILD=
|WIKIPEDIA=
|WIKIQUOTE=
|COMMONS=
|PND=</pre>
<p>Fast alle dieser Verfasser-Kategorien übernehmen wir auch für den Import in den KUG. Problematisch und erst einmal nicht abbildbar auf <em>einen</em> Verfasser-Normdateneintrag in einem Katalog wird es, wenn in einem Wikisource-Artikel mehr als ein Personendaten-Template verwendet wird &#8211; wie z.B. beim Artikel zu den Brüdern Grimm.</p>
<p>Bei den gelieferten Metadaten &#8211; Text- und Personendaten &#8211; stellt sich sofort die Frage, wie dort mit Verlinkungen &#8211; sei es zu anderen Artikeln aus dem Wikipedia-Universum oder zu externen Webseiten umzugehen ist. Aus unserer Sicht stellen diese Links für unsere Nutzer einen wesentlichen Wert dar. Darüber hinaus ist es speziell bei den Quellenangaben eine reine Selbstverständlichkeit auch auf die Ursprungsdigitalisate direkt zu verweisen &#8211; wenn die Information denn da ist und maschinell ausgewertet werden kann.</p>
<p>Daher wandeln wir Verweise durch unser <a title="wikisource2meta.pl" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/conv/wikisource/wikisource2meta.pl" target="_blank">Konvertierungsprogramm</a> aus der Wikisprache in explizite, vollqualifizierte HTML-Links um. Der Titel und die Verfasser sind davon allerdings ausgenommen, da diese für die Navigation innerhalb des KUG benötigt werden.</p>
<p>Mehr war für die Integration nicht zu tun.</p>
<p>Die deutschen Wikisource-Daten befinden sich im KUG in einem externen Katalog mit dem Namen<em> E-Texte / Wikisource deutsch (Online-Vollzugriff)</em> und umfassen derzeit 10448 Titel. Darüber hinaus bieten wir ihn auch einzeln vorausgewählt in einer <a title="Katalogsicht aufrufen" href="http://kug.ub.uni-koeln.de/portal/lastverteilung?view=wikisource" target="_blank">eigenen Katalogsicht</a> an.</p>
<p>Ein gutes Beispiel für die Integration der Wikisource-Daten in den KUG ist der Text <a title="PermaLink" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/wikisource_de/26797/1/wikisource/index.html" target="_blank">Elementargeister von Heinrich Heine</a>.</p>
<p>Zusätzliche Erweiterungen sind geplant. So wollen wir z.B. untersuchen, inwieweit man die Kategorie-Bezeichnungen der Wikisource-Artikel auswerten und daraus Schlagworte für den Katalog generieren kann. Denkbar wäre auch eine automatische Weiterleitung aus dem KUG an den DFG-Viewer auf Grundlage von MODS. In wieweit wir es wagen sollen auch die Digitalisate anderssprachiger Wikisource-Sammlungen in den KUG zu integrieren ist aufgrund der mageren Metadaten noch nicht final entschieden.</p>
<p><strong>Update 11.9.2009:</strong> Im <a title="Integration von Wikisource in den Kölner UniversitätsGesamtkatalog" href="http://www.finanzer.org/blog/index.php/2009/08/09/integration-von-wikisource-in-den-koelner-universitaetsgesamtkatalog/" target="_blank">Finanzer Blog</a> gibt es als Reaktion auf meinen Artikel einen interessanten Verweis auf das Wikimedia-API. Mit diesem ließe sich der Bestand von Wikisource sicherlich auch sehr gut via AJAX oder für eine föderierte Suche einbinden. Da wir im KUG keine klassische föderierte Suche einsetzen, sondern unseren Mehrwert durch die Verarbeitung der gesamten Quelldaten schöpfen, ist das für uns nicht direkt anwendbar &#8211; für andere Katalogarchitekturen könnte das aber ein guter Weg sein.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2009/08/08/integration-von-wikisource-in-den-kug/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Thematischer Zugang über Systematiken im Katalog 2.0</title>
		<link>http://blog.openbib.org/2009/07/01/thematischer-zugang-uber-systematiken-im-katalog-20/</link>
		<comments>http://blog.openbib.org/2009/07/01/thematischer-zugang-uber-systematiken-im-katalog-20/#comments</comments>
		<pubDate>Wed, 01 Jul 2009 19:13:13 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[Basisklassifikatin BK]]></category>
		<category><![CDATA[DDC]]></category>
		<category><![CDATA[Library of Congress Classification LCC]]></category>
		<category><![CDATA[Open Shelves Classification OSC]]></category>
		<category><![CDATA[Regensburger Verbundklassifikation RVK]]></category>
		<category><![CDATA[Systematiken]]></category>
		<category><![CDATA[Thematischer Zugang]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=23</guid>
		<description><![CDATA[Bei der Entwicklung des KUG ist &#8211; analog zur Vernetzung gleichgesinnter Nutzer im Web 2.0 &#8211; die Vernetzung der Titel im Katalog eines unserer Hauptziele. Nachdem ein Nutzer durch seine Suchanfrage bei einem passenden Titel gelandet ist, kann er sich von dort durch Empfehlungen, Literaturlisten, Tags, Personen, Schlagworte, Systematiken usw. thematisch treiben lassen und so [...]]]></description>
			<content:encoded><![CDATA[<p>Bei der Entwicklung des KUG ist &#8211; analog zur Vernetzung gleichgesinnter Nutzer im Web 2.0 &#8211; die Vernetzung der Titel im Katalog eines unserer Hauptziele.</p>
<p>Nachdem ein Nutzer durch seine Suchanfrage bei einem passenden Titel gelandet ist, kann er sich von dort durch Empfehlungen, Literaturlisten, Tags, Personen, Schlagworte, Systematiken usw. thematisch treiben lassen und so auf andere interessante Titel stoßen &#8211; frei nach dem beluga-Zitat: <em>Ich möchte auch finden, was ich gar nicht gesucht habe</em>.</p>
<p>Eine zentrale Rolle nimmt hier die Systematisierung der Titel ein &#8211; sowohl um andere Titel eines Themengebiets zu finden, als auch zur Bereitstellung eines hierarchischen Browsings über Themengebiete.</p>
<p>Gerade im KUG mit seinen vielen teilnehmenden Instituten hat sich das jedoch als ein Problem herausgestellt, denn nur ein Bruchteil der Institute systematisiert überhaupt ihre Titel. Dazu kommt dann noch ein genereller Nachteil an Systematiken: Es gibt so viele davon &#8211; und diese finden tatsächlich bei den wenigen systematisierenden Katalogen im KUG auch Anwendung.</p>
<p>Die Universitäts- und Stadtbibliothek Köln (USB) verwendet z.B. die Basisklassifikation BK, das eine Institut die <a title="Weitere Informationen zur DDC direkt vom Lizenzgeber" href="http://www.oclc.org/dewey/" target="_blank">DDC</a>, das andere die RVK, wieder eines eine fachspezifische Klassifikation aus Saarbrücken. Selbstverständlich wird dadurch eine katalogübergreifende Einheitlichkeit, vor allem auch im Interesse der Nutzer, nicht gerade gefördert. Aus meiner Sicht sollte das aber gerade ein zentrales Ziel für einen Katalog höherer Zählung sein.</p>
<p>Für die Vereinheitlichung haben wir uns für den KUG erst einmal auf die Basisklassifikation BK geeinigt &#8211; nicht zuletzt weil der große USB-Katalog sofort als Fremddatenquelle genutzt werden kann &#8211; und reichern über unsere zentrale Anreicherungsdatenbank alle Kataloge im KUG automatisch damit an. Das Schöne an der BK ist, dass</p>
<ul>
<li>sie recht überschaubar ist. Geordnet in zwei Hierarchie-Ebenen kommt man in der zweiten Ebene derzeit auf etwa 2086 Gebiete. Diese Hierarchisierung kommt auch den Nutzern zugute.</li>
<li>für alle BK&#8217;s ausführliche Beschreibungen verfügbar sind und auch angezeigt werden. Dazu  haben wir eine <a title="bk.yml aus dem OpenBib CVS-Baum" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/portal/perl/conf/bk.yml?view=log" target="_blank">YAML-Datei</a> mit den Beschreibungen erstellt, die wie alle Teile von OpenBib gerne nachgenutzt werden kann.</li>
<li>auch die Möglichkeit von Fremddatenübernahmen existiert.</li>
</ul>
<p>Als allgemeine Voraussetzungen für den Einsatz einer Systematik für einen Katalog 2.0 sehe ich nach den Erfahrungen im praktischen Einsatz mit der BK beim KUG:</p>
<ul>
<li>Sie sollte hierarchisch sein. So kann sie vom Nutzer auch über einen Browsing-Einstieg angeboten werden.</li>
<li>Sie sollte übersichtlich sein. Es macht keinen Sinn, wenn im Extremfall alle real existierenden abermillionen Themen eine Entsprechung in der jeweiligen Systematik finden.</li>
<li>Neben kryptischen Themenkürzeln soll auch immer eine grobe Beschreibung des Themengebiets ausgegeben werden. Kein Nutzer kann etwas mit <em>12.34</em> oder <em>123.456</em> anfangen.</li>
<li>Es sollten Möglichkeiten der Fremddatenübernahme existieren, bzw. Mappings von anderen Systematiken</li>
</ul>
<p>Die aber wirklich zentrale Grundvoraussetzung für den Einsatz ist jedoch die <strong>vollkommen freie Nutzung der Systematik</strong> (genauer:<em> free as in free speech and not free beer</em>). Es macht z.B. keinen Sinn Open Access zu fordern und bei der Erfassung eines Open Access-Werkes dann aber eine proprietäre Systematik zu verwenden, bei der irgendwelche Nutzungsmöglichkeiten erst lizensiert (und bezahlt) werden müssen &#8211; wenn sie nicht sowiso grundsätzlich verboten sind.</p>
<p>Gerade hier hat sich im KUG  dann auch ein großes praktisches Problem im Einsatz der DDC herausgestellt.</p>
<p>Zwei der Institute im KUG setzen die DDC lokal ein &#8211; nur sagen dem Nutzer die Nummern leider überhaupt nichts (s.o.). Was liegt also näher als bei den Katalogaufnahmen, Quantitäts-Aufschlüsselungen in Wortwolken usw. zusätzlich die textlichen Beschreibungen mit auszugeben &#8211; sie vielleicht sogar für die Recherche auch noch zu indexieren. Bei der BK machen wir das, technisch ist das also kein Problem.</p>
<p>Hier kommt nun aber leider der <a title="DDC Deutsch FAQ: Zu rechtlichen Aspekten" href="http://www.ddc-deutsch.de/allgemeines/faq.htm" target="_blank">proprietäre Charakter der DDC</a> zum Tragen, der eine vollständige Verwendung der Beschreibungen nicht erlaubt. Maximal die ersten drei Stellen sollen möglich sein. Vor dem Hintergrund, dass die DDC in ihren Toplevel-Kategorien jedoch nur den Wissensstand des 19. Jahrhunderts widerspiegelt &#8211; unsere beiden Institute aber im Bereich Informationstechnologie angesiedelt sind und die DDC-Kodierungen dieser Themengebiete dementsprechend lang sind &#8211; <em>dürfen wir die Beschreibungen also erst gar nicht ausgeben</em>. Viele sehen daher die DDC als &#8220;<em>no go</em>&#8221; an und suchen nach Alternativen.</p>
<p>Ein interessanter Vorstoß ist in diesem Zusammenhang die <a title="Blog Artikel: Build the Open Shelves Classification " href="http://www.librarything.com/thingology/2008/07/build-open-shelves-classification.php" target="_blank">Open Shelves Classification</a> (OSC), die auf einen Vorschlag von Tim Spalding zurück geht &#8211; auch wenn der Fokus hier mehr auf öffentlichen und nicht unbedingt wissenschaftlichen Bibliotheken liegt. Auch hier war die Lizenzproblematik der DDC ein wesentlicher Ausgangsgrund. Tim Spalding&#8217;s <a title="Kommentar von Tim Spalding" href="http://www.librarything.com/talktopic.php?topic=40858" target="_blank">Anwort auf einen negativen Kommentar</a> zum o.g. OSC-Blogeintrag sagt eigentlich alles:</p>
<blockquote><p>Mr. Ronald, I note that you omitted all mention of &#8220;free.&#8221; This is at the core of the project&#8217;s goals. I—and many others—object to public libraries being constrained by a classification system that is (1) copyrighted, (2) trademarked, (3) licensed, (4) expensive. You cannot with safety make changes to DDC and circulate them around to other interested libraries—this would violate both copyright and trademark. (Some have done so, admittedly.) You cannot publish detailed schedules for your patrons to understand your system and how it maps to your books—again, copyright and trademark. You can&#8217;t get a full schedule in digital form, but have to subscribe to a &#8220;service&#8221; that gives it out in dribs and drabs, reinforcing your dependency. OCLC holds the reins so tightly that it famously sued a hotel that dared to number its rooms by DDC, filling them with appropriate books. They even hold trademark on Dewey&#8217;s first name.</p></blockquote>
<p>Ebenso stellt sich natürlich auch immer die Frage, in wieweit sich lokale Themengebiete in anglo-amerikanischen Systematiken wiederfinden &#8211; ansonsten wird in wissenschaftlichen Bibliotheken dort vor dem Hintergrund der Aufstellung überwiegend die      <span lang="en-US">Library of Congress Classification</span> (LCC) verwendet. Die LCC wiederum ist in ihrer Nutzung wirklich frei, also potentiell auch ein geeigneter Kandidat.</p>
<p>Aber warum unbedingt in die Ferne schweifen? Auch im deutschsprachigen Raum gibt es mit der <a title="Wikipedia Eintrag zur BK" href="http://de.wikipedia.org/wiki/Basisklassifikation" target="_blank">Basisklassifikation BK</a> (verwendet im GBV, ursprünglich aus den Niederlanden) und der <a title="Vortrag: Vergleich RVK - DDC" href="http://www.bibliothek.uni-regensburg.de/ubr/ink/pdf/Systematiken.pdf" target="_blank">Regensburger Verbundklassifikation RVK</a> (verwendet im BVB) geeignete Systematiken. Bei der BK hat man zwei Hierarchieebenen, wobei in der ersten Ebene mehr Gebiete als in der RVK zu finden sind, sich diese auch nochmal in 5 Gruppen zusammenfassen lassen. Dafür hat die RVK mit ihren Haupt-, Unter- und Feingruppen gleich drei Hierarchieebenen, zu denen dann u.a. noch eine Verschlüsselung des Autorennamens kommt.</p>
<p>Weder die BK noch die RVK muss lizensiert werden, anders als die DDC, und beide erfüllen damit die von mir geforderte zentrale Grundvoraussetzung für einen Einsatz. Es wäre zu begrüßen, wenn beide Klassifikationen gerade im Bereich Katalog 2.0 vermehrt eingesetzt werden &#8211; und sich auch aktiv dafür positionieren. Bei einer internationalen Ausrichtung wäre die Auswahl an geeigneten Systematiken sicherlich eine andere und man würde sich u.a. LCC und OSC, wenn letztere denn mal fertig ist, genauer anschauen.</p>
<p>Die proprietäre DDC jedoch &#8211; auch wenn sie de facto die am meisten verbreitete Systemtik darstellt &#8211; ist aufgrund ihrer Lizenzproblematik nach meinem Dafürhalten nicht geeignet als thematischer Grundpfeiler für einen Katalog 2.0 &#8211; gerade weil es dort genau um eine verbesserte Usability des Katalogs geht und die Lizenzbedingungen (und etwaige Kosten) dieser massiv im Weg stehen.</p>
<p>Es wäre interessant zu hören, wie andere das sehen bzw. welche Schritte schon anderenorts in Richtung eines thematischen Zugangs gegangen wurden &#8211; und welche Systematiken dort Verwendung finden.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2009/07/01/thematischer-zugang-uber-systematiken-im-katalog-20/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>565.000 Digitalisate aus der Open Library im KUG nachgewiesen</title>
		<link>http://blog.openbib.org/2009/06/09/565000-digitalisate-aus-der-open-library-im-kug-nachgewiesen/</link>
		<comments>http://blog.openbib.org/2009/06/09/565000-digitalisate-aus-der-open-library-im-kug-nachgewiesen/#comments</comments>
		<pubDate>Tue, 09 Jun 2009 19:13:29 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[Internet Archive]]></category>
		<category><![CDATA[Open Library]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=22</guid>
		<description><![CDATA[In der vergangenen Woche habe ich im Artikel Nachweise freier Inhalte in den OPAC bereits davon berichtet, dass wir über Möglichkeiten der Integration von Nachweisen der Digitalisate des Internet Archivs in den KUG nachdenken. Seither habe ich rund um das Auffinden und Aufarbeiten der Digitalisate des Internet Archives in lokalen Katalog-Anwendungen recherchiert und fasse das [...]]]></description>
			<content:encoded><![CDATA[<p>In der vergangenen Woche habe ich im Artikel <a title="Nachweise freier Inhalte in den OPAC" href="http://blog.openbib.org/2009/06/03/nachweise-freier-inhalte-in-den-opac/" target="_blank">Nachweise freier Inhalte in den OPAC</a> bereits davon berichtet, dass wir über Möglichkeiten der Integration von Nachweisen der Digitalisate des <a title="Internet Archive" href="http://www.archive.org/" target="_blank">Internet Archivs</a> in den KUG nachdenken.</p>
<p style="text-align: left;">Seither habe ich rund um das Auffinden und Aufarbeiten der Digitalisate des Internet Archives in lokalen Katalog-Anwendungen recherchiert und fasse das Gefundene hier einmal kurz zusammen. Vielleicht kann das ja dem einen oder anderen bei einer möglichen Integration helfen&#8230;</p>
<h3>Feeds &#8230;</h3>
<p style="text-align: left;">Ein großer Teil des Textbestandes im Internet Archiv, insgesamt knapp 565.000 Verweise auf digitalisierte Bücher und Zeitschriften, kann über den Umweg der <a title="Open Library Katalog" href="http://openlibrary.org/">Open Library</a> sehr einfach verarbeitet werden. Anders als das Internet Archiv bietet die Open Library einen <a title="Feed der OpenLibrary-Daten" href="http://openlibrary.org/dev/docs/jsondump" target="_blank">Komplettabzug ihres Datenbestandes im JSON-Format</a> an &#8211; das sind mehr als 20 Millionen Titel- und mehr als 6 Millionen Verfassersätze. Digitalisierte Titel sind über eine vergebene <em>ocaid</em> identifizierbar &#8211; Namensgeber für diese ID ist anscheinend die <a title="Open Content Alliance" href="http://www.opencontentalliance.org/" target="_blank">Open Content Alliance</a> (<a title="OCA in der Wikipedia" href="http://en.wikipedia.org/wiki/Open_Content_Alliance" target="_blank">Wikipedia-Eintrag</a>). Die <em>ocaid</em> geht sowohl beim Internet Archiv wie auch bei Open Library an verschiedenen Stellen in die Struktur von URLs ein, für das Digitalisat von <em>Alice&#8217;s Abenteuer im Wunderland</em> ist sie z.B. <strong>alicesabenteueri00carr</strong>. Zwar sind bei der Open Library an vielen Stellen mehr als 1 Million verfügbare Digitalisate genannt, ein einfaches <em>grep</em> nach <em>ocaid</em> in der Feed-Datei bringt jedoch nur die knapp 565.000 Digitalisate zum Vorschein.</p>
<p style="text-align: left;">Für Update-Zwecke per Bulk-Load und PermaLinks zu den jeweiligen bibliographischen Daten im KUG sind die von Open Library vergebenen numerischen Identifikationsnummern sicherlich hilfreich, die man dann intern übernehmen könnte.</p>
<h3>&#8230; oder OAI?</h3>
<p>Alternativ besteht auch der Weg über einen Abzug der Metadaten via OAI im Internet Archiv, entweder eingeschränkt auf einzelne Sammlungen oder generell über den Medientyp <em>Texts</em>:</p>
<p><a title="OAI-Anfrage nach Identifiern zum Medientyp Texts" href="http://www.archive.org/services/oai.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc&amp;set=mediatype:Texts" target="_blank"><code>http://www.archive.org/services/oai.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc&amp;set=mediatype:Texts</code></a></p>
<p>Immerhin wären so derzeit potentiell 1.432.511 Verweise auf Texte abrufbar. Was alles genau darunter zu fassen ist, wäre auszutesten. Danach müsste man sich dann nach den Identifiern mit <em>GetRecord</em> durchhangeln wie hier bei unserem Beispiel <a title="OAI-Anfrage für die DC-Daten" href="http://www.archive.org/services/oai.php?verb=GetRecord&amp;metadataPrefix=oai_dc&amp;identifier=oai:archive.org:alicesabenteueri00carr" target="_blank">Alice&#8217;s Abenteuer im Wunderland</a></p>
<p>Dieser Identifier besitzt folgende Detail-Anzeige im Internet Archiv: <code><a title="Dateilanzeige Alice im Wunderland" href="http://www.archive.org/details/alicesabenteueri00carr" target="_blank">http://www.archive.org/details/alicesabenteueri00carr</a><br />
</code><br />
Ein großer Nachteil beim Harvesten über OAI ist, daß es damit leider nicht getan wäre &#8211; denn die dort ausgegebenen DC-Metadaten entsprechen nicht dem Umfang eines zugehörigen Open Library-Titels. Also müssten MARC-Daten zusätzlich per HTTP via <em>wget</em> pro Titel z.B. über</p>
<p><a title="Diverse Dateien zum Digitalisat" href="http://www.archive.org/download/alicesabenteueri00carr" target="_blank"><code>http://www.archive.org/download/alicesabenteueri00carr/</code></a></p>
<p>abgeholt und verarbeitet werden. Da aus diesen MARC-Daten aber offensichtlich wiederum die Katalogisate in der Open Library gebildet werden, haben wir uns wegen der deutlich einfacheren Handhabbarkeit der Feed-Dateien für eine Integration des E-Book-Teilbestandes der Open Library entschlossen &#8211; auch wenn damit noch nicht das theoretische Maximum an Digitalisaten ausgeschöpft wird. Insgesamt ist der Download der Feed-Dateien sicherlich deutlich leichtgewichtiger als der Weg über OAI und <em>wget</em>. Die Erstellung des zugehörigen <a title="openlibrary2meta.pl" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/conv/openlibrary/" target="_blank">Konverter-Programms für den KUG</a> war ebenfalls relativ simpel.</p>
<p>Der genannte Beispieltitel entspricht dann z.B. folgender Aufnahme im KUG:</p>
<p><a title="KUG-PermaLink von Alice im Wunderland " href="http://kug.ub.uni-koeln.de/portal/connector/permalink/openlibrary/9803468/1/openlibrary/index.html" target="_blank"><code>http://kug.ub.uni-koeln.de/portal/connector/permalink/openlibrary/9803468/1/openlibrary/index.html</code></a></p>
<p>Somit können wir seit heute den Bestand der knapp 565.000 E-Books aus der Open Library im KUG als weiteren Katalog anbieten. Dieser ist zusätzlich über einen eigenen <a title="Einsprung zum E-Book Bestand der OpenLibrary im KUG" href="http://kug.ub.uni-koeln.de/portal/lastverteilung?view=openlibrary" target="_blank">Einsprung &#8220;OpenLibrary.org / E-Books&#8221;</a> erreichbar. Interessant bei der Integration dieses Katalogs waren für uns auch die im KUG-Kontext verfügbaren Wort-Wolken für Schlagworte, DDC-Systematik und Erscheinungsjahre, um einen groben Überblick der thematischen und zeitlichen Zusammensetzung des Bestandes zu bekommen.</p>
<p><strong>Aktualisierung 13.6.2009:</strong></p>
<p>Anders als Herr Graf, der &#8211; entsprechend seiner <a title="Blog-Artikel: Freie Ebooks im Kölner Gesamtkatalog" href="http://archiv.twoday.net/stories/5754684/" target="_blank">Kritik</a> an unserer Entscheidung für Feeds &#8211; technische Praktikabilität, Umsetzbarkeit und Effizienz bei der Entscheidung Feeds vs. OAI  als Entscheidungskriterium nicht gelten lässt, sind diese für eine tatsächliche Umsetzung dennoch gemeinhin von einer zentralen Relevanz.</p>
<p>Wie er aus einem einfachen <a title="Fähigkeiten der OAI-Schnittstelle des IA" href="http://www.archive.org/services/oai.php?verb=Identify" target="_blank">Identify</a> auf die OAI-PMH-Schnittstelle des Internet Archives leicht hätte entnehmen können, kann diese leider keine Informationen über gelöschte Datensätze weitergeben. Hier die wesentliche Stelle aus der <a title="Spezifikation" href="http://www.openarchives.org/OAI/openarchivesprotocol.html" target="_blank">OAI-PMH-Spezifikation</a>:</p>
<blockquote>
<h3>2.5.1 <a name="DeletedRecords">Deleted records</a><a name="deletion"></a></h3>
<p>If a record is no longer available then it is said to be <em>deleted</em>. Repositories <strong>must</strong> declare one of three levels of support for deleted records in the <code>deletedRecord</code> element of the <a href="http://www.openarchives.org/OAI/openarchivesprotocol.html#Identify">Identify</a> response:</p>
<p><code>no</code> &#8211; the repository does not maintain information about deletions.      A repository that indicates this level of support <strong>must not</strong> reveal      a deleted status in any response.</p></blockquote>
<p>Damit müsste man sich nach der Wahl <em>für OAI</em> nun entscheiden, ob man recherchierbare Verweise ohne tatsächlich auffindbares Digitalisat weiterhin im Katalog belassen möchte &#8211; und damit die berechtigte Kritik der Nutzer auf sich zieht &#8211; oder alle derzeit knapp 1.4 Millionen Datensätze bei jeder lokalen Aktualisierung immer wieder komplett abfragen muss&#8230;</p>
<p>Wie mir scheint sehr aufwändig und unsozial dem Internet Archive gegenüber, wenn z.B. jede Nacht deren Komplettbestand per OAI abgesaugt würde&#8230;</p>
<p>Aus meiner Sicht ein sehr praktischer Grund, warum eine Entscheidung für die OAI-Schnittstelle des Internet Archivs nicht unproblematisch ist. Es bleibt zu hoffen, dass die Open Library selbst nicht via OAI vom Internet Archive gefüllt wird&#8230; <img src='http://blog.openbib.org/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2009/06/09/565000-digitalisate-aus-der-open-library-im-kug-nachgewiesen/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Der KUG &#8211; jetzt auch als OPAC 1.0</title>
		<link>http://blog.openbib.org/2008/11/03/der-kug-jetzt-auch-als-opac-10/</link>
		<comments>http://blog.openbib.org/2008/11/03/der-kug-jetzt-auch-als-opac-10/#comments</comments>
		<pubDate>Mon, 03 Nov 2008 17:58:05 +0000</pubDate>
		<dc:creator>Oliver Flimm</dc:creator>
				<category><![CDATA[Ankündigungen]]></category>
		<category><![CDATA[Einblicke und Konzepte]]></category>
		<category><![CDATA[KUG]]></category>
		<category><![CDATA[KUG light]]></category>
		<category><![CDATA[Template-Kaskadierung]]></category>

		<guid isPermaLink="false">http://blog.openbib.org/?p=10</guid>
		<description><![CDATA[Verkehrte Welt? Bibliothek und OPAC 2.0 sind in aller Munde, was soll da ein konventioneller OPAC der Zählung 1.0? Denn gerade Funktionen, die über diesen hinausgehen, werden heutzutage von den Nutzern erwartet und gefordert. So kommt der KUG in unseren 14-tägigen KUG-Schulungen auch sehr gut bei den Studierenden an. Im direkten Feedback schätzen sie besonders [...]]]></description>
			<content:encoded><![CDATA[<p>Verkehrte Welt? Bibliothek und OPAC 2.0 sind in aller Munde, was soll da ein konventioneller OPAC der Zählung 1.0? Denn gerade Funktionen, die über diesen hinausgehen, werden heutzutage von den Nutzern erwartet und gefordert. So kommt der KUG in unseren 14-tägigen KUG-Schulungen auch sehr gut bei den Studierenden an. Im direkten Feedback schätzen sie besonders die Mächtigkeit des KUG als zentrales Rechercheinstrument. Das hören wir natürlich gern.</p>
<p>Auch viele unserer InstitutsbibliothekarInnen nutzen aktiv die vom KUG bereitgestellten Funktionen. Dies beginnt z.B. mit der Veranschaulichung des eigenen Bestandes durch schlagwortspezifische Wortwolken und endet mit eigens für die Studierenden eingerichteten fachspezifischen <a title="Ethnologie: Lesetipps-Studienanfänger BA" href="http://kug.ub.uni-koeln.de/portal/connector/permalink/245/112/6/kug/index.html" target="_blank">Literaturlisten</a>, die zusätzlich über PermaLinks in eLearning-Plattformen eingebunden werden.</p>
<p>Zu unserer Überraschung werden diese erweiterten Funktionen von einigen unserer InstitutsbibliothekarInnen jedoch auch entschieden missbilligt. RSS Feeds für Neuzugänge? Neumodischer Schnickschnack, den sowiso niemand nutzt. Tagging? Wir machen das eh besser. Literaturlisten? Zu subjektiv. Wikipedia? Unwissenschaftliches Teufelswerk. Und schließlich Coverbilder &#8211; braucht kein Mensch.</p>
<p>Auf den Punkt gebracht scheinen sich einige schlicht mit den neuen Funktionen überfordert zu fühlen, andere lehnen sie kategorisch ab. Mir klingen noch <a title="RE: Google Booksearch Data API: Another blow to library metadata" href="http://serials.infomotions.com/ngc4lib/archive/2008/200809/1121.html" target="_blank">Jesse Ephraims Worte</a> auf der NGC4LIB-Liste im Ohr, aber auch diese &#8211; Neuerungen ablehnende &#8211; Einstellung muss von uns selbstverständlich respektiert werden. Daher macht es durchaus Sinn, solche Strömungen zu integrieren und letztlich auch zu bedienen.</p>
<p>Das machen wir seit letzter Woche im KUG. Seither haben die Institute die Wahl, ob sie für ihre institutsspezifischen Sichten, in denen insbesondere ihr jeweiliger Katalog vorausgewählt ist, den <em>normalen KUG</em> haben möchten oder aber eine um jegliche weitergehenden Funktionen entschlackte Version &#8211; den neuen <em>KUG light</em>.</p>
<p>Ermöglicht wird dies über die von OpenBib bereitgestellte <a title="OpenBib Wiki: Kaskadierungsmechanismus bei Templates und Stylesheets" href="http://wiki.openbib.org/index.php?title=Kaskadierungsmechanismus_bei_Templates_und_Stylesheets" target="_blank">Kaskadierung von Templates</a> in Verbindung mit systemweiten Katalogprofilen, nach denen kaskadiert wird. Jede (Instituts-)Sicht ist genau einem Katalogprofil zugeordnet. Damit lassen sich verschiedene Sichten gruppieren und mit alternativen Templates bestücken. Neben dem normalen <em>Profil KUG</em> gibt es dort nun ein neues <em>Profil KUG light.</em> Über die Webadministration kann mit einem Klick die Zuordnung einer einzelnen Sicht zu einem Profil geändert werden. Damit stellt diese neue Wahlmöglichkeit der Institute auch für uns keinen sonderlichen Mehraufwand dar.</p>
<p>Die Zahl der Templates, die für den KUG light geändert werden musste, ist ebenfalls sehr überschaubar. Lediglich <a title="Templates für KUG light" href="http://cvs.berlios.de/cgi-bin/viewcvs.cgi/openbib/openbib/portal/perl/templates/profile/kuglight/" target="_blank">12 Basis-Templates</a> wurden hierfür entsprechend angepasst. Der Rest wird weiterhin aus dem Pool der Standard-Templates verwendet.</p>
<p>Mit dem gleichen Mechanismus arbeiten wir derzeit auch an einer visuell überarbeiteten nächsten KUG-Version mit verbesserter Nutzerführung, die intern mit dem Kürzel kugng (=KUG next generation) versehen ist und auf die man bereits jetzt <a title="KUGng" href="http://kug.ub.uni-koeln.de/portal/lastverteilung?view=kugng" target="_blank">einen ersten Blick</a> über die gleichnamige Sicht werfen kann.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.openbib.org/2008/11/03/der-kug-jetzt-auch-als-opac-10/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
