Nachdem vor knapp 2 Wochen Rudolf Mumenthaler im Bibliotheksdienst das Fehlen von offenen E-Books in vielen Bibliothekskatalogen monierte und den möglichen Ursachen nachging, haben wir uns einem Bereich zugewandt, bei dem es noch viel düsterer aussieht – der Integration von offenen Lern- und Lehrmaterialien, den Open Educational Resources (OER). Ähnlich wie bei den offenen E-Books existieren zwar inzwischen verschiedene Aggregationsplattformen wie z.B. OERCommons, aber leider stellen diese ihre Metadaten meist nicht offen ins Netz, so dass diese auch nicht geharvestet und in eigene Recherche-Infrastrukturen der Bibliotheken integriert werden können.

Gerade die Bereitstellung der Metadaten ist aber eine wesentliche Voraussetzung dafür, dass die unzähligen über den Globus verteilten Vorlesungs-Materialien auch überall gefunden werden. Hier müssen die OER-Plattformen mit dem Fehlen von Synchronisierungsmechanismen wie OAI-Schnittstellen oder bibliothekarischen Standard-Datenformaten im Vergleich zu den klassischen OpenAccess-Materialen (Hochschulschriften, Institutional Repositories, Pre-Print-Server) noch massiv aufholen. Die Dezentralität von Resourcen wurde im klassischen OA-Bereich bereits vor vielen Jahren gemeistert. So ist eine Aggregation aller vorhandenen OERs in dem Umfang wie es BASE bei klassischen OpenAccess-Materialien macht, im Moment geradezu utopisch.

Der Weg der OERs in die lokalen Recherche-Infrastrukturen ist derzeit also noch etwas steinig. Dennoch gibt es auch bereits jetzt pragmatische Lösungen, um einzelne ausgewählten OER-Bestände zu integrieren – vorausgesetzt, die Metadaten sind verfügbar.

Einzelne Plattformen

Als Aggregator stellt das OpenCourseWare Consortium seine Daten sowohl über eine eigenes API wie auch über eine Excel-Tabelle bereit. Diese Daten sind grundsätzlich brauchbar, auch wenn im Bereich der Personenerfassung klassische Fehler ausgemacht werden können (keine einheitliche Ansetzungsform, Ansetzungsformen verschiedener Personen mit Komma getrennt).

Alternativ steht auch ein RDF-Abzug im Turtle-Format samt SPARQL-Endpoint auf datahub.io bereit – dort sind Personen aber z.T. ins Nichts verlinkt, so dass die regelmäßig aktualisierte Excel-Tabelle hier ganz klar vorzuzuiehen ist. Für den KUG wurde die Excel-Tabelle zunächst mit LibreOffice in eine CSV-Datei umgewandelt und dann mit einer geeigneten Parametrisierung für das Programm simplecsv2meta.pl in einen eigenen KUG-Katalog geladen.

Eine weitere Plattform mit API ist die Khan Academy. Für die Erkundung des API’s wird neben einer Dokumentation eigens ein API-Explorer bereitgestellt. Für eine Integration bietet sich hier insbesondere der topictree-Call an, mit dem sämtliche Inhalte in einer hierarchischen Struktur heruntergeladen werden können. Für die JSON-Inhalten des topictree-Calls haben wir ein eigenes Konvertierungsprogramm und eine Parametrisierung erstellt.

YouTube

Auch wenn viele OER-Plattformen selbst kein API oder Dumps ihrer Metadaten anbieten, so nutzen viele von ihnen aber YouTube als zentralen Dienstleister für die Bereitstellung ihrer Kurs-Videos. YouTube selbst hat die dem Bereich Bildung zugeordneten Videos zentral unter http://youtube.com/edu virtuell zusammengefasst.

YouTube selbst bietet ein API in verschiedenen Versionen an. Version 3 gilt offiziell noch als experimentell, Version 2 des Google Data API für YouTube wird aber  von verschiedenen Programmiersprachen durch entsprechende Programm-Module unterstützt. Die Programmiersprache Perl wird zwar offiziell nicht unterstützt, mit dem Modul WebService-GData steht aber eine gute Umsetzung bereit, die lediglich in Kombination mit der encode_json-Methode aus JSON::XS mit doppeltem UTF8-Encoding patzt. Mit to_json aus dem JSON-Modul wird aber auch UTF8 korrekt umgesetzt.

Wichtig war uns bei einer Integration von OER aus YouTube, dass wir selbst festlegen können, welche Channels wir in den KUG integrieren, denn nicht alle unter youtube.com/edu angebotenen Videos scheinen uns hierfür geeignet. Und selbst bei einzelnen Channels, wie z.B. bei der Stanford University müssen die Kurse erst noch ausgefiltert werden.

Darüberhinaus ermöglicht uns die Übertragung einzelner Channels in einzelne KUG-Recherche-Kataloge das Mischen von OERs aus verschiedenen Quellsystemen. Ein gutes Beispiel hierfür ist die Khan Academy, die zwar ein API und die Daten bereitstellt, aber nur für die englischsprachigen Kurse. Die deutschsprachigen Kurse der Khan Academy sind in diesen Daten gerade nicht enthalten, aber stattdessen im YouTube-Channel KhanAcademyDeutsch. So können wir die Original API Daten der englischen Khan Academy dem zugehörigen YouTube-Channel vorziehen, uns zusätzlich aber des deutschen Channels bedienen und so beide Sektionen der Khan Academy abdecken.

Im Vergleich mit den dedizierten Plattformen wie OCW Consortium oder der Khan Academy stellt YouTube weniger Daten bereit, die zum Set der klassischen bibliographischen Daten gehören. Insbesondere fehlen idR Personeninformationen – einziger author-Name im YouTube-API ist der Username des Channelerstellers. Dennoch sind die Daten selbst gut strukturiert.

Normalerweise wird ein ganzer Kurs als Playlist organisiert, in der die einzelnen Video-Lektionen enthalten sind. Dadurch erst lässt sich die kursspezifische Zusammenfassung der Videos auch 1:1 in den zugeordneten KUG-Katalog übertragen. Dennoch ziehen wir ganz allgemein die potentiell reichhaltigeren originalen Daten ala OCW oder Khan Academy denen von YouTube vor. Bis solche Daten aber irgendwann einmal für alle OER-Quellen bereitgestellt werden, ist YouTube die bestmögliche Lösung, um diese Materialien überhaupt im lokalen Bibliotheksumfeld sichtbar zu machen.

Gestartet sind wir in dem neuen Bereich der OER mit folgenden Katalogen im KUG:

Das sind insgesamt 43.389 Nachweise. Weitere OER-Quellen lassen sich – speziell im Bereich der YouTube-Channels – einfach durch Nennung des Channel-Namens in entsprechenden Parametrisierungsdateien für das generelle Harvesting-Programm youtube2meta.pl festlegen.

Die Sichtung weiterer geeigneter Quellen und Aggregationsplattformen mit vorhandenen Metadaten ist nach wie vor das gravierendste Problem bei der Integration von OERs in die lokalen Recherche-Infrastrukturen. Die allgemeine Zugänglichmachung von Informationen zu solchen OER-Quellen von jedweder Seite würden wir daher sehr begrüßen. Die nächste neue OER-Plattform, die wir uns genauer anschauen werden, ist sicherlich learningregistry.org mit eigenem API.

Update 24.3.2016: Leider hat Google das YouTube-API inzwischen geändert und unterstützt keine Zugriffe mehr mit dessen Version 2 und dem von uns verwendeten Perl-Modul WebService-GData. Da für die API-Version 3 keine Perl-Module existieren, werden wir die bisher von YouTube gewonnenen OER aus unserem Suchindex entfernen.